<pre id="co8k0"><cite id="co8k0"></cite></pre><strike id="co8k0"></strike>
  • <acronym id="co8k0"><cite id="co8k0"></cite></acronym>
  • <nav id="co8k0"></nav>
    <input id="co8k0"><em id="co8k0"></em></input>
  • 又一云廠商因光纜被切出故障,AWS中國近12小時大面積癱瘓


    從昨日凌晨2點到下午1點48分,亞馬遜旗下云服務(wù)商AWS中國區(qū)熬過了漫長的11小時48分。

    作為AWS中國區(qū)的員工,方遠(化名)一早被電話吵醒。一家創(chuàng)業(yè)公司的客戶過來抱怨自家APP連不上服務(wù)器了。

    事情比方遠想象的嚴重。掛完電話,方遠才發(fā)現(xiàn)公司的大小微信群已經(jīng)炸了鍋。

    按照AWS中國的官方聲明,因為隔夜道路施工中有幾處光纜被切斷,導(dǎo)致可用區(qū)無法鏈接Internet,使得AWS中國業(yè)務(wù)大規(guī)模出現(xiàn)故障。

    包括方遠在內(nèi)的員工們也很懵,幾處光纜被切斷怎么會影響整個北京區(qū)域的這么多服務(wù)?

    但這一事故的影響已經(jīng)在不斷發(fā)酵,包括VIPKID、流利說、三星應(yīng)用商店等多個用戶都均受到不同程度的影響。亞馬遜中國官網(wǎng)(www.amazon.cn)的頁面也一度崩潰。

    因為正逢6·18大促,流利說的助教張豐(化名)正忙著推廣自家的促銷信息。這邊張豐剛向?qū)W員介紹完自家的課程計劃,就在微信上被學員告知流利說APP的定制課程已經(jīng)根本打不開。很快,張豐接到公司緊急通知,是因為公司的云計算服務(wù)商AWS出現(xiàn)故障。

    接下來,張豐的工作重點不得不變成安撫各路學員。直到下午1點多,張豐終于開始群發(fā)消息,通知學員們APP“服務(wù)”已經(jīng)逐步恢復(fù)中。

    類似的尷尬在VIPKID的各個家長群同時上演。

    有客戶在微信上評論道:“這是我從業(yè)以來經(jīng)歷最長的一次故障修復(fù)時間,AWS這次事故處理的時間效率太低了,我表示很失望?!?/p>

    為了保障服務(wù)不中斷、數(shù)據(jù)不丟失,一般業(yè)務(wù)系統(tǒng)、數(shù)據(jù)都有多個備份。而在云計算中,為了保障數(shù)據(jù)中心內(nèi)業(yè)務(wù)系統(tǒng)的可用性,數(shù)據(jù)中心基礎(chǔ)設(shè)施也會采取類似的冗余備份,提高系統(tǒng)可用性。

    有業(yè)內(nèi)人士認為,此次AWS光纜被切斷導(dǎo)致近12小時大面積服務(wù)癱瘓是因為沒有做好網(wǎng)絡(luò)冗余設(shè)計。

    網(wǎng)絡(luò)冗余設(shè)計主要通過重復(fù)設(shè)置網(wǎng)絡(luò)鏈路和網(wǎng)絡(luò)設(shè)備冗余措施。網(wǎng)絡(luò)鏈路冗余是指為確保業(yè)務(wù)正常運轉(zhuǎn),除配置主線路外,同時做好第二種、第三種線路的部署。

    主備線路隔的位置比較遠,因此,一旦主線路出現(xiàn)故障,還有其他線路保證網(wǎng)絡(luò)的可用性。例如,接入互聯(lián)網(wǎng)時,同時采用不同電信運營商線路,相互備份且互不影響,但這樣一來,成本也會增大。

    據(jù)悉,AWS北京區(qū)域使用的是光環(huán)新網(wǎng)的數(shù)據(jù)中心,記者多次致電光環(huán)新網(wǎng)客服電話,均無法接通。據(jù)光環(huán)新網(wǎng)官網(wǎng)顯示,該公司在北京擁有酒仙橋、太和橋、光環(huán)新谷、東直門、房山和亦莊6個數(shù)據(jù)中心,每個都擁有高達100G的BGP總出口帶寬,多運營商通信鏈路。

    “本來一個機房,各家運營商鏈路應(yīng)該有自己的連通方式。但是也有可能機房在施工時先匯總各家運營商到一條主干線,到某一節(jié)點之后再分開。但冗余是有成本的,不是所有場景所有環(huán)節(jié)都冗余的。對于云廠商來說,網(wǎng)絡(luò)線路都是租運營商的,都是錢啊?!鄙鲜鰳I(yè)內(nèi)人士指出。

    因為光纜被切斷導(dǎo)致服務(wù)癱瘓的并不少見。2015年,因為當?shù)厥姓ㄔO(shè)施工方挖斷了光纜,支付寶PC網(wǎng)頁和手機客戶端都出現(xiàn)無法登錄、網(wǎng)絡(luò)異常等現(xiàn)象。后來,支付寶改成了冗余設(shè)計。

    2018年9月云棲大會上,螞蟻金服發(fā)布了“三地五中心金融級高可用方案”,并現(xiàn)場演示了“剪網(wǎng)線”,經(jīng)過26秒容災(zāi)切換完成,恢復(fù)業(yè)務(wù)。

    而在2018年7月,因騰訊云廣州一區(qū)的主備兩條運營商網(wǎng)絡(luò)鏈路同時中斷,騰訊云廣州區(qū)域部分用戶出現(xiàn)資源訪問失敗、控制臺登錄異常等情況。

    2019 年3 月,騰訊旗下多項服務(wù)出現(xiàn)服務(wù)器未響應(yīng)問題。隨后,騰訊云發(fā)布公告稱,因上海南匯網(wǎng)絡(luò)光纖因施工被意外挖斷,導(dǎo)致該區(qū)不少互聯(lián)網(wǎng)公司的業(yè)務(wù)受到不同程度的影響。

    由于有備用鏈路,騰訊云隨即啟動流量智能調(diào)度系統(tǒng),將上海地區(qū)公網(wǎng)流量通過騰訊云內(nèi)部T級骨干網(wǎng),引導(dǎo)至騰訊云廣州區(qū)電信出口,再由電信骨干網(wǎng)直達浙江電信。此次光纖故障從發(fā)現(xiàn)到恢復(fù)只有兩分鐘,并且所有流程自動化執(zhí)行,在150秒之內(nèi)就快速恢復(fù)了網(wǎng)絡(luò)。

    不過,即使有冗余備份,對于業(yè)務(wù)也并非毫無影響,“備用鏈路一般會慢一些,而且大家都擁到小路上,自然就擠了,體驗上就是慢?!币辉品?wù)商告訴記者。

    此前,UCloud創(chuàng)始人兼CEO季昕華表示“云計算公司有四大謊言,分別是云計算先服務(wù)于內(nèi)部客戶,再服務(wù)于外部客戶;云計算能保證100%的安全;云計算消耗大量資金;云計算是不盈利的?!?/p>

    “云計算雖然比本地研發(fā)更安全,但不可能是100%。就算微軟、亞馬遜、谷歌、阿里、騰訊一樣都會出問題。所以用戶更愿意使用多家云來服務(wù),多云戰(zhàn)略是未來的重要方向?!彼赋?。

    也有廠商呼吁,隨著云計算和數(shù)據(jù)中心越來越重要,光纜、管道等基礎(chǔ)設(shè)施的保護也需要跟上,現(xiàn)在破壞的成本太低了?!矩熑尉庉?江小白】

    來源:第一財經(jīng)網(wǎng)

    IT時代網(wǎng)(關(guān)注微信公眾號ITtime2000,定時推送,互動有福利驚喜)所有原創(chuàng)文章版權(quán)所有,未經(jīng)授權(quán),轉(zhuǎn)載必究。
    創(chuàng)客100創(chuàng)投基金成立于2015年,直通硅谷,專注于TMT領(lǐng)域早期項目投資。LP均來自政府、互聯(lián)網(wǎng)IT、傳媒知名企業(yè)和個人。創(chuàng)客100創(chuàng)投基金對IT、通信、互聯(lián)網(wǎng)、IP等有著自己獨特眼光和豐富的資源。決策快、投資快是創(chuàng)客100基金最顯著的特點。

    相關(guān)文章
    又一云廠商因光纜被切出故障,AWS中國近12小時大面積癱瘓
    亞馬遜AWS二季度營收61億美元 貢獻全公司過半營業(yè)利潤

    精彩評論