硬盤出故障、機(jī)房(fáng)被雷劈,企業☆→÷≤(yè)如(rú)何避免雲服務故障給自(zì)身(s  •hēn)業(yè)務帶來(lái)損失

2018-08-09 10:48

這(zhè)個(gè)夏天,雲服務日(rì)子(zǐ)都(d≤₹ōu)不(bù)太好(hǎo)過!繼上(shàng✘>βδ)次阿裡(lǐ)雲服務出現(xiàn)技(jì≠÷)術(shù)故障後,騰訊雲服務又(yòu)出了(le)大(↔€<dà)岔子(zǐ)。7 月(yuè) 20 日' (rì),騰訊雲北(běi)京三區(qū)部分®φε(fēn)雲硬盤 IO 異常。類似的(de)故障在各大(dà)雲廠(ch​•"ǎng)商提供的(de)雲服務裡(lǐ),可(kě₩α§)謂是(shì)司空(kōng)見(jiàn)怪,但(dàn)這(z☆₹hè)次因為(wèi)一(yī)家(jiā)名叫&ldquoδ≈;前沿數(shù)控”的(de)創業(yè)公司,這(zhè)個(σ☆gè)事(shì)件(jiàn)重新發酵,引起了(le)熱(r§ ≥±è)議(yì)。

 

雲廠(chǎng)商故障宕機(jī)這(zhè)些(xiē)年(nián)來(★®lái)一(yī)直不(bù)是(shì)什(s≈♦hén)麽新聞:

2018 年(nián) 6 月(yuè) 27®✔ 日(rì),阿裡(lǐ)雲故障,起因:運維操作(zuò)失★‍π誤觸發未知(zhī) bug;

2017 年(nián) 2 月(yuè) 28 日(rì),雲計(jì)算(☆§λsuàn)巨頭 AWS S3 故障,起因:調試時(shí)輸入錯(cuò)誤指&¥<Ω令,意外(wài)移除大(dà)量服務器(qì)導緻 S3 不(bù₽¥•∑)能(néng)正常工(gōng)作(zuò);§£βδ

2017 年(nián) 3 月(yuè) 22 日(rì☆α>>),微(wēi)軟雲服務一(yī)個(gè)月(yu☆γè)內(nèi)出現(xiàn)又(yòu)一(yī)次宕機(jī)(上(♥>shàng)一(yī)次是(shì) 3¶€ 月(yuè) 7 日(rì));

2015 年(nián) 6 月(yuè) 6 ≠ ↕ 日(rì),QingCloud 廣東(dōng) 1 區(>α÷qū)全部硬件(jiàn)設備因遭遇雷暴天氣引發電(diàn)力故 ↑障,造成 QingCloud 官網及控制(zhì)台短(dΩ Ωuǎn)時(shí)無法訪問(wèn)、部署于 GD1 的(de)用(yòngε☆)戶業(yè)務暫時(shí)不(bù)₽₹可(kě)用(yòng)。

 

運維失誤、硬盤出故障、機(jī)房(fánσ ∞g)被雷劈、調試輸入錯(cuò)誤指令,不(bù)同的(de)失誤會(‍βhuì)引起不(bù)同的(de) bu↕ ∞g,最後同樣導緻雲服務故障,造成大(dà)額損失。AWS ↓δ的(de)費(fèi)良宏老(lǎo)師(shī)回↑​☆顧雲計(jì)算(suàn)的(de)發展時(shí)曾說™ (shuō):“我眼裡(lǐ)的(de§‍§)雲計(jì)算(suàn),就(jiù)是(s→φφhì)十年(nián)生(shēng)聚,十年(nián)教訓”。Ω ©§

 

故障,一(yī)直是(shì)雲服務命運的(de)雙λ 生(shēng)子(zǐ),每一(yī)次故障的(de)陣₩↓"≥痛,都(dōu)是(shì)在倒逼雲服務廠(chǎng)商和(hé)用(yòα€>±ng)戶加速成長(cháng),隻是(shì)這(zhè)一(λ∑γ₹yī)次對(duì)于“前沿數(shù)控&r☆→ ↔dquo;這(zhè)家(jiā)創業(y₹≥™è)公司而言過于疼痛了(le)。

 

頭部的(de)雲服務“網紅(hóng)”産品,都(d♥λ∑ōu)不(bù)能(néng)保證百分(fēn)百好(hǎo)用(y©↕∏òng),以至于用(yòng)戶都(dōu)在想,是(shì)不(bù)≈♠是(shì)僅僅購(gòu)買一(yī)家(jiā $)雲服務廠(chǎng)商的(de)服務,都(dōu)沒法保證♥σ<業(yè)務穩定的(de)需求了(le)?

 

甚至有(yǒu)公司,因此想自(zì)建機(jī)房(fáng),∏∏¶₹但(dàn)是(shì)這(zhè)樣會(huì)帶來(lái)巨 ™大(dà)的(de)後期運維成本,大(dà  σ)企業(yè)還(hái)好(hǎo),對(ε¶duì)于中小(xiǎo)企業(yè)尤其是γγλ(shì)初創企業(yè),更是(shì)徒增負 ∞擔。而且雲計(jì)算(suàn)和(hé)自('$zì)建機(jī)房(fáng)相(xiàng)比,很(hěn)明✘<>≤(míng)顯雲計(jì)算(suàn)更安全,水(shuǐ™™)平也(yě)更高(gāo)。對(duì)于很(hě•↔&'n)多(duō)中小(xiǎo)企業(yè),公有(yǒu)雲無疑是(↕"✔shì)最好(hǎo)的(de)選擇。

但(dàn)任何公有(yǒu)雲都(dōu)有(yǒu♦λ₹♦)可(kě)能(néng)發生(shēng)ε<宕機(jī)或數(shù)據丢失的(de☆ ¥π)風(fēng)險,所以一(yī)套完整的 ♣♥£(de)運維服務計(jì)劃就(jiù)顯得(de)尤為→≥§§(wèi)重要(yào)。

 

神州光(guāng)大(dà)的(de)服務即可(kě)以±≈助力企業(yè)上(shàng)雲,又(yòu)可(kě)以提< §≥供安全可(kě)靠的(de)本地(dì)備£​ε₹份及按需使用(yòng)的(de)工(gōng)程師(shī)資源,讓γ♣‍★企業(yè)享受上(shàng)雲的(de)便利和(hé)低(dī)成本 ♦≈©的(de)運維服務,防止自(zì)身(shēnΩ♦¥★)經驗不(bù)足帶來(lái)的(de)風(fēng)險。¥₽

 

對(duì)于企業(yè)而言,IT運維的(de)專業φ↑α✘(yè)化(huà)分(fēn)工(gōng)本質上(shàng)是(shì)•§對(duì)IT運維人(rén)力資源配置的(d₹₽σ∏e)優化(huà)。例如(rú),明(míng)确運維事(sh≥‌ì)件(jiàn)分(fēn)級處理(lǐ)流程,明(míng♠'‌)确運維人(rén)員(yuán)的(de)職責、權限、義務和(h↑×é)績效考核标準。事(shì)實上(shàng)許多(duō)實踐也>€®¥(yě)證明(míng),明(míng)确每種​®<運維事(shì)件(jiàn)的(de)專業(y$♠♠"è)化(huà)分(fēn)工(gōng)處理(lǐ)流程≤$♣,可(kě)以大(dà)大(dà)減少(shǎo)IT運維操作(zuò)®"♠φ的(de)随意性和(hé)混亂性,并能(néng)大(dà)大(dà)<π¥提高(gāo)運維中的(de)人(rén)力資源效率。

 


服務架構

 

 

神州光(guāng)大(dà)IT運維管理(lǐ)↑™服務實施模型

 

 

集中監控平台

 

基本排障流程

 

 

神州光(guāng)大(dà)緻力于幫助企業(y≠™è)解決上(shàng)雲難題,提供可(kě♠  ")靠的(de)災備方案實施,為(wèi)客戶帶來(lái↕☆')長(cháng)期的(de)運維價值,為(wè×✔∞γi)保障數(shù)據安全貢獻力量。