阿里云就6月27日故障发布声明 因运维失误导致

  • 2019-05-01 10:39
  • TechWeb

6月28日消息,昨天也就是6月27日,阿里云服务出现了一些故障情况,由于覆盖范围较大所以造成了一定影响,导致部分客户范围阿里云官网控制台和使用部分产品功能出现问题。对此阿里云声明,故障原因是工程师团队的一个失误导致的。

很多用户反映阿里云控制台访问出现问题,后台无法登陆,图片服务也无法使用,MQ、NAS、OSS等产品的部分功能也发生异常情况,而且手机端和PC端均无法访问,不过阿里云很快就逐步恢复了这些业务。暂时还不清楚这次故障造成了多大影响。

据介绍,工程师团队在上线一个自动化运维新功能中,执行了一项变更验证操作。这个功能在测试环境中没有引发任何问题,但上线之后却出发了一个位置代码BUG,导致仅用了部分内部IP,因此很多产品访问链路不通常。

QQ图片20180628092239

阿里云官方声明原文:

6月27日阿里云故障说明

6月27日下午,我们在运维上的一个操作失误,导致一些客户访问阿里云官网控制台和使用部分产品功能出现问题,引发了大员吐槽。故障于北京时间2018年6月27日,16:21左右开始,16:50分开始陆续恢复。

经过紧急技术复盘,故障原因如下:

当天下午,工程师团队在上线一个自动化运维新功能中,执行了一项变更验证操作。这一功能在测试环境验证中并未发生问题,上线到自动化运维系统后,触发了一个未知代码bug。错误代码禁用了部分内部IP,导致部分产品访问链路不通。后续人工介入后,工程师团队快速定位问题进行了恢复。

受影响范围包括阿里云官网控制台,以及MQ、NAS、OSS等产品功能。对于这次故障,没有借口,我们不能也不该出现这样的失误!我们将认真复盘改进自动化运维技术和发布验证流程,敬畏每一行代码,敬畏每一份托付。

阿里云计算有限公司

原标题:阿里云就6月27日故障发布声明 因运维失误导致|移动互联

头条推荐
图文推荐