有關(guān)Exchange Online(微軟基于云的企業(yè)電子郵件、日歷和聯(lián)系人管理平臺(tái))問(wèn)題的更多詳細(xì)信息,該網(wǎng)站在6月24日(周二)遭遇了長(zhǎng)時(shí)間的停機(jī),這導(dǎo)致一些客戶失去了他們最基本的溝通和協(xié)作方式之一。IT經(jīng)理們涌入Office 365支持論壇尋找答案,發(fā)泄他們的沮喪,因?yàn)樗麄兺V乖谵k公室工作了幾個(gè)小時(shí)。管理員用來(lái)監(jiān)視其云訂閱的服務(wù)運(yùn)行狀況儀表板無(wú)法正確報(bào)告任何問(wèn)題。
微軟在八小時(shí)后恢復(fù)了服務(wù)。然而,這一經(jīng)歷,再加上前一天Lync Online的中斷,引發(fā)了人們對(duì)關(guān)鍵業(yè)務(wù)服務(wù)向云遷移的擔(dān)憂。
重大服務(wù)中斷后,Office 365工程公司副總裁Rajesh Jha轉(zhuǎn)向公司的支持論壇,提供公司的建議。他寫(xiě)道:“首先,我代表Office 365團(tuán)隊(duì),對(duì)由此帶來(lái)的影響和不便表示歉意?!彼a(bǔ)充說(shuō):“電子郵件和實(shí)時(shí)通信對(duì)您的業(yè)務(wù)非常重要,我和我的團(tuán)隊(duì)完全了解我們作為您的合作伙伴和服務(wù)提供商的責(zé)任?!?
Jha承認(rèn),客戶用來(lái)監(jiān)控其微軟云服務(wù)的工具并不令人滿意。他解釋說(shuō),他的公司“在發(fā)布我們的服務(wù)健康儀表板(SHD)的過(guò)程中也遇到了問(wèn)題,這意味著并非所有受影響的客戶都能及時(shí)得到通知。我們意識(shí)到這非常令人沮喪,這個(gè)問(wèn)題已經(jīng)解決了?!?
Jha解釋說(shuō),Exchange Online的故障是由“目錄角色的間歇性故障導(dǎo)致目錄分區(qū)停止響應(yīng)身份驗(yàn)證請(qǐng)求”引起的?!斑@導(dǎo)致少數(shù)客戶無(wú)法訪問(wèn)電子郵件?!?
他聲稱損壞“僅針對(duì)少數(shù)客戶”,并表示缺陷的“獨(dú)特性”導(dǎo)致恢復(fù)時(shí)間延長(zhǎng)。這一問(wèn)題加劇了這一問(wèn)題,并導(dǎo)致“由于以前未知的代碼缺陷導(dǎo)致更廣泛的客戶郵件流延遲,從而在更廣泛的郵件傳遞系統(tǒng)中出現(xiàn)意想不到的問(wèn)題”。
賈(Jha)說(shuō),他的團(tuán)隊(duì)不僅解決了根本問(wèn)題,還更新了系統(tǒng),以防止問(wèn)題再次發(fā)生。他說(shuō):“除了解決根源觸發(fā)因素,我們還在努力進(jìn)一步強(qiáng)化這一模式。”
Lync Online的問(wèn)題開(kāi)始很小,然后迅速升級(jí)。據(jù)Jaha稱,該服務(wù)收到消息稱“我們北美數(shù)據(jù)中心的客戶端連接因外部網(wǎng)絡(luò)故障而暫時(shí)中斷”。問(wèn)題在短短幾分鐘內(nèi)解決后,“隨之而來(lái)的流量激增導(dǎo)致幾個(gè)網(wǎng)元過(guò)載”,讓部分客戶幾個(gè)小時(shí)無(wú)法使用Lync。
微軟已經(jīng)從這次經(jīng)歷中吸取了教訓(xùn),并正在努力建立對(duì)其云服務(wù)的信心。賈哈說(shuō):“雖然我們已經(jīng)解決了問(wèn)題的根源,但我們將借鑒經(jīng)驗(yàn),繼續(xù)完善我們的主動(dòng)監(jiān)測(cè)、預(yù)防、恢復(fù)和縱深防御體系?!?