推广 热搜: 电子  服装  创业  空调  轴承  家电  GPS  木门  供应  物流 

腾讯云4月8日故障复盘:持续近87分钟,1957个客户报障

   日期:2024-04-21     作者:互联网    浏览:13    评论:0    

4月14日消息,腾讯云4月8日故障复盘及情况说明:4月8日15点23分,腾讯云团队收到告警信息,云API服务处于异常状态;随即在腾讯云工单、售后服务群以及微博等渠道开始大量出现腾讯云控制台登录不上的客户反馈;经过故障定位发现,客户登录不上控制台正是由云API异常所导致;本次故障的原因是云API服务新版本向前兼容性考虑不够,以及配置数据灰度机制不足的问题。

图源:腾讯云官微

云API是云上统一的开放接口集合,客户可以通过API以编程方式管理和操控云端资源,云控制台通过组合云API提供交互式的网页功能。故障发生后,依赖云API提供产品能力的部分公有云服务,也因为云API的异常出现了无法使用的情况,比如云函数、文字识别、微服务平台、音频内容安全、验证码等。此次故障一共持续了近87分钟,期间共有1957个客户报障。

从客户的视角来看,云服务大概可以分为数据面和控制面,数据面承载客户自身的业务,控制面负责操作云上不同产品。比如目前使用最广泛的IaaS服务,基本上都是以直接面向数据面为主,控制面仅在客户购买或需要对资源层面进行调整操作时会涉及。

此次发生故障的控制台和云API是对控制面的影响,而客户已经配置好的服务器等IaaS资源,包括已经部署运行的业务,没有受到云API异常的影响。其他以非云 API 方式提供服务的PaaS和SaaS服务,处于正常服务的状态。

图源:腾讯云官微

本次API升级过程中,由于新版本的接口协议发生了变化,在后台发布新版本之后对于旧版本前端传来的数据处理逻辑异常,导致生成了一条错误的配置数据,由于灰度机制不足导致异常数据快速扩散到了全网地域,造成整体API使用异常。

发生故障后,按照标准回滚方案将服务后台和配置数据同时回滚到旧版本,并重启API后台服务,但此时因为承载API服务的容器平台也依赖API服务才能提供调度能力,即发生了循环依赖,导致服务无法自动拉起。通过运维手工启动方式才使API服务重启,完成整个故障恢复。

故障期间,腾讯云售后团队协助部分客户做了业务容灾预案的实施,将受影响服务做调度以快速恢复客户的业务服务。

 
打赏
本条信息网址: https://www.zyhoo.com/news/show-2796169.html免责声明: 本网站内容来源于网友提供和互联网公开资料等,仅供参考。本网站不对网站所有信息的准确性、可靠性或完整性提供任何保证。若文中涉及有违公德、触犯法律的内容,一经发现,立即删除,作者需自行承担相应责任。涉及到版权或其他问题,请及时联系,我们将在收到通知后第一时间妥善处理。
 
更多>同类新闻资讯
0相关评论

推荐图文
推荐新闻资讯
点击排行
网站首页  |  关于我们  |  联系方式  |  常见问题  |  sitemaps  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报
免费发布信息,上网做生意,就上发吧信息网.发吧,发吧,祝您生意发发!(c)2008-2022 DESTOON B2B SYSTEM All Rights Reserved
本站内容系用户自行发布,其真实性、合法性由发布人负责,发吧信息网(www.zyhoo.com)不提供任何保证,亦不承担任何法律责任