瑞士北部Azure服务重大中断 | AI生成和翻译

Home 2025.10

瑞士北部区域 Azure 服务中断事件:2025年9月26-27日

本次事件是瑞士北部区域一次影响多个可用区的大范围平台级中断,持续约22小时,从UTC时间9月26日23:54开始,至UTC时间9月27日21:59全面恢复。虽然大部分服务在UTC时间9月27日04:00左右恢复,但部分遗留问题仍需在当日进行人工干预。

根本原因

中断源于对软件负载均衡基础设施中用于授权通信的证书进行的计划配置变更。其中一张新证书存在格式错误的值,且未在验证过程中被发现。该变更通过加急部署通道执行,意外地跨多个区域部署而未触发健康保障机制,导致:

受影响服务

此次中断波及瑞士北部区域托管的大量Azure服务,包括:

依赖这些服务的应用(如自定义应用程序)同样受到影响,导致大范围服务不可用或性能降级。

时间线与缓解措施

连接恢复后大多数资源可自动恢复,但部分资源(如使用自定义扩展的虚拟机)需手动重启以解决启动顺序问题。

经验总结与改进措施

微软初步事件报告强调已实施的改进:

此次事件凸显了共享基础设施中配置变更的风险,但Azure的响应机制有效控制了数据丢失范围并实现了快速大规模恢复。

Azure 状态历史记录


Back

x-ai/grok-4-fast

Donate