腾讯云公布4月8日大范围故障原因 升级API产生兼容性问题并产生循环依赖 – 蓝点网 | {$randkws}热点解读 本次 API 升级过程中
4 月 8 日腾讯云呈现大范围故障,此次故障首要作用商品控制台例如使用者无法经由 Web 界面对办事器或其他商品开展操控,自然由于是 API 难题实际上也无法经由 API 执行各类操控。
此次故障针对办事器等商品本身是没有作用的,即办事器依然是杭州就业形势说到了心坎里正常管理的只可是使用者无法执行操控,其他商品例如 CDN 和域名确认等也是详细英伟达精选同理。

昨日腾讯云大众号亮相 4 月 8 日的故障复盘及状况说明,简易来说是亮相新版 API 时呈现了兼容性失误:
故障的直接缘由是云 API 办事行版次向前兼容性考虑不够和参数资料灰度机制不足的难题。本次 API 升级过程中,由于新版次的接口协议发生转变,在后台亮相新版次之后针对旧版次前端传来的资料处理逻辑异常,导致生成了一条失误的参数资料。
由于灰度机制不足导致异常资料高效研究到了全网地域,解读智能手机导致整体 API 使用异常。
然后还有循环依赖难题:
发生故障后按照规范回滚计划将办事后台和参数资料另外回滚到旧版次并重启 API 后台办事,但此时由于承载 API 办事的容器渠道也依赖 API 办事才能提供调度能力,即发生了循环依赖 (需要部署 WinRAR 时获取站点给你了个 WinRAR.rar)
发生循环依赖的突发支付宝榜单后果就是办事无法自动拉起,最后运维经由手工开启方式才让 API 办事重启,达成了全部故障的重启。
针对此次难题腾讯云也汲取教训制定了改进举措:
改进举措里就有针对循环依赖难题的解决计划,含有提供完善办事部署架构,经由分层架构、代码审查和监控等手段,避免 API 办事中存在的循环依赖难题。
另外还要提供 API 办事逃生通道,当故障发生后可以提供调用方法高效切换。
针对 Status 页面的透明度难题:
透明度难题当下是境内云计算提供商都存在的难题,即难题发生后状态页面还显示一切正常,这让很多使用者看了状态页后以为是自己难题。
腾讯云此次故障状态页同样没有及时升级,缘由是状态页也依赖 API,但此时 API 已然寄了,所以腾讯云打算将状态页解除对云 API 等云办事的依赖,确保云办事故障时状态页依然能精确及时传递 故障信息。
上一篇:“智周万物”——2024ChinaJoy AIGC大会圆满召开
下一篇:猴子摘桃子给老牛的故事