mdc-c
前海乐成MDC微模块数据中心集配电系统、UPS系统、精密空调系统、动环监控系统、门禁系统于标准19英寸机柜内,采用模块化设计、标准化生产
IT监控管理
前海乐成MDC微模块数据中心集配电系统、UPS系统、精密空调系统、动环监控系统、门禁系统于标准19英寸机柜内,采用模块化设计、标准化生产
机柜&机架
前海乐成MDC微模块数据中心集配电系统、UPS系统、精密空调系统、动环监控系统、门禁系统于标准19英寸机柜内,采用模块化设计、标准化生产
精密空调
前海乐成MDC微模块数据中心集配电系统、UPS系统、精密空调系统、动环监控系统、门禁系统于标准19英寸机柜内,采用模块化设计、标准化生产
客制化ODM/OEM
解决方案
×

会员登录

0755-2668 5832
sales@drawerkvm.cn
微软发布了主要云服务宕机的初步分析报告
2018-11-28

        微软(Microsoft)发布了Azure云服务遭受重大破坏的初步分析报告,此次破坏从9月4日开始,持续了数天。这次(KVM)宕机最初是由该公司位于德克萨斯州的美国中南部数据中心附近的(机柜显示器)雷击造成的,它影响了世界各地的用户,也影响了Skype和Office 365等微软服务。

        2018年9月4日凌晨,高能风暴袭击了微软Azure美国中南部地区附近的德克萨斯州南部。该地区的多个Azure数据中心看到了跨实用程序提要的电压起伏。美国国际标准时间8点42分,雷电引起(远程数据管理)电力供应活动,导致电压大幅膨胀。这导致一个Azure数据中心从公用事业电力系统转移到发电机,机械冷却系统关闭,“尽管已经安装了浪涌抑制器”。

       “最初,数据中心能够通过在冷却系统中设计的负载依赖热缓冲器来维持其运行温度。”然而,一旦这个热缓冲耗尽,数据中心的温度就会超过安全操作阈值,设备就会自动关闭。虽然关闭是为了保护基础设施和服务器,但“数据中心部分地区的温度上升得如此之快,以至于一些硬件在关闭前就已经损坏了。”大量存储服务器以及少量网络设备和电力单元受损。然后,现场团队将数据中心的其余部分转换为生成器,以稳定电源供应,并开始为存储规模单元恢复Azure软件负载平衡器(SLBs),该单元管理客户和平台服务流量的路由。

         下一步是恢复存储服务器及其上的数据,方法是替换失败的基础设施组件,将客户数据从损坏的服务器迁移到健康的服务器,并验证所有恢复的数据都没有损坏。该公司表示:“这一过程需要时间,因为损坏的服务器数量很大,而且首先要小心维护客户数据的完整性。”在此过程中,Microsoft决定不将故障转移到另一个数据中心,“因为故障转移会由于geo复制的异步特性而导致有限的数据损失。”虽然雷击只影响到了德克萨斯州,但“这一系列特殊问题也对该地区以外的服务造成了连锁影响。”

          除了中南服务器宕机之外,微软还详细列出了6个因宕机而受到影响的不同领域:Azure Service Manager (ASM),它“弹性不足”;Azure Active Directory (AAD),这意味着要重新路由到其他站点,但在身份验证请求增加的速度下,它遇到了困难;Visual Studio Team Services (VSTS),其中一些功能只托管在中南;Azure应用程序洞察,它依赖于Azure Active Directory;Azure订阅管理,它“经历了5个独立的问题”;Azure状态页面,正如我们当时注意到的那样,在大部分停机期间不可用。微软表示,这是因为“流量增加和不正确的自动伸缩配置设置相结合”。


办公地址:
深圳市宝安区留仙三路长丰工业区F3栋B座
Copyright © DrawerKVM. All Rights Reserved
全国统一热线
0755-2668 5832
业务咨询邮箱 sales@drawerkvm.cn