首页>动态 >内容

GCP用户抱怨服务遭无预警关闭紧急抢救后仍有一小时的资料无法救回

动态2021-02-28 12:05:44
最佳答案

一位Google云端平台的用户,在部落格表布了以「为什么你不该使用Google云端(Why you should not use Google Cloud)」为题的文章,抱怨他们执行在GCP上用于产品阶段的服务,被无预警关闭,该用户还表示,Google完全没有给他们解释机会,就让他们的服务停止运作了几个小时,虽然经过抢救取回了部分资料,但还是损失了约一个小时的资料。

该作者提到,他们在GCP上建构用于监控遍及8个国家,包含数百个风力发电机以及太阳能发电厂的服务,在他们的控制中心有一大面墙的萤幕,全天候显示着电厂状态的监控仪表板,资产管理人员便用这些仪表板,监控风力发电机以及太阳能发电板的健康状况,并在需要时即时请求维护。他们的开发以及预测团队还使用GCP的BigQuery,运作演算法来控制电力的生产,而这些动作都与营收直接相关。

作者提到,他们操作的风能与太阳能,是属于易衰败的商品,也就是说过度生产不只浪费成本,且无法销售与储存,而生产不足的话,还会被罚款。因此他们需要一整天对这些设备进行监控,依照电网的需求以及购电合约进行追蹤调整。

但就在6月28日凌晨,他们收到监控服务Uptime Robot的通知信,警告他们整个网站的服务都已经停止了。同时也收到了来自Google的信件表示,Google发现他们服务存在一些潜在的可疑活动,因此逕行将所有服务关闭。这包括网站、应用程式引擎,连资料库都无法存取,Firebase上的使用权限也被降级。

事件发生当下,所有直接联络Google的管道都没有,线上客户服务关闭也没有电话可以打。他们收到一封电子邮件,要求填写验证表格以修正违规行为,并需上传信用卡照片以及身分证明文件,以证明支付工具的所有权,否则将在3天内删除整个专案。所幸服务付款人是他们的财务长,紧急填写完表格后,Google在20分钟内恢复所有服务,不过这时已经让他们的系统停止运作了数个小时。而这是他们第一次遇到这样的问题,获得几乎一个小时的资料空白。

作者提到,好险他们的财务长当时没有休长假,否则可能整个专案都完蛋了,后果则是数百万美元的损失。他提到,过去他们的专案皆使用AWS的服务,也从没有发生这样的事件,AWS会给他们时间解释,而这个专案是他们第一个用于GCP的服务,Google霸道的终止他们的服务,并且要求立即解释。

这个事件在网路论坛Reddit与Hackernews上引发热烈讨论,多数的网友皆认为Google的作法太过强硬,也有网友认为即便他们公司付出了高额的支援费用给Google,但是获得客服品质仍不尽理想。

免责声明:本文由用户上传,如有侵权请联系删除!