微软承认Azure园区人力安排不足,存储烧毁问题引发关注
更新时间:2023-09-05 09:45:14作者:yidaimei
9 月 5 日消息,微软旗下 Azure 澳大利亚数据中心园区上周经历了一次大规模故障,数据中心的电力供应能力下降导致两个数据大厅的冷却设备断电,由于员工人数“不足”难以应对,最终导致部分存储硬件被烧毁,包括澳大利亚昆士兰银行和捷星航空在内的大型企业客户服务完全中断。
微软承认现场没有足够的工作人员,而且其应急程序也没有考虑到问题的规模。在事故发生时,数据中心只安排了 3 名工作人员,他们都相当尽责地 “执行了记录在案的应急操作程序 (EOP),但最终没取得有成功”。
经过查询得知,两个受影响数据大厅的冷却能力 “由七个冷却器组成,其中五个冷却器处于运行状态,两个冷却器处于备用状态(N+2)”。电源下陷(电压骤降)导致五个运行中的冷却器出现故障。
微软声称,“园区因人员配备不足从而导致了这次事故,在‘更好地了解根本问题并采取适当的缓解措施’之前,工作人员安排数量目前从 3 人临时增至 7 人。”,微软还将调整相关应急预案和日常工作流程,降低此类事件再次发生的可能性。
据悉,这次事故影响了使用 Azure 的七家大型企业客户,其中五家为“标准”级别,两家为“高级”级别,微软表示,装载有企业客户存储内容的硬件“因数据大厅温度过高而损坏”,除了企业客户重大损失外,该数据中心旗下托管的 25 万多个 SQL 数据库也发生了故障,根据微软 PIR 报告,当下相关数据恢复工作已经大致完成。
微软承认Azure园区人力安排不足,存储烧毁问题引发关注相关教程
- 微软Azure高管预测AI将引发就业革命,技术人员饭碗也难保
- 微软Windows、Surface负责人Panos Panay将离职,引发业界猜测与关注
- Win11用户反馈微软KB5031455存在问题:安装失败、游戏崩溃频发
- 微软停止为俄罗斯公司更新许可证,引发关注
- OpenAI董事会保持“惊喜元素”,未告知微软,解雇CEO引发关注
- 微软承认安卓13版Outlook小部件故障并承诺尽快修复
- 博德之门3Xbox版:拉瑞安承诺11月前发布,不让微软粉丝等待
- AMD承诺将开源更多GPU软硬件内容,助力开发者创新研发
- 微软调查关于Copilot聊天机器人的令人不安回应的报告:揭示AI伦理问题的挑战
- 微软、穆迪、OpenAI 合作开发人工智能助手,引领智能助手技术创新
- 显卡升级是AI时代的进步,还是游戏玩家的智商税?揭秘显卡升级的真相
- AMD CL26低时序内存为什么这么抢手?探秘甜点频率的魅力
- 微软史诗级变革:Windows 11正式推行无密码登录,安全性得到提升
- Windows系统编年史:从XP到Win12,谁是你的心中痛点?
- 首张RDNA 4“巨齿鲨”,华硕推出ATS RX 9070 GRE O12G显卡,性能强劲游戏体验升级
- 英伟达CEO黄仁勋2025财年薪酬达4990万美元,创历史新高