雙11背後的(de)神秘人(rén)!!--原來(lái)是(shì)這(zh±×<☆è)些(xiē)運維人(rén)

2017-11-09 14:40

一(yī)年(nián)一(yī)度的(de)剁手節日(rì)如✘★ (rú)期而至……每逢雙十一(yī)§ §想必那(nà)些(xiē)電(diàn)商網站(zhàn)服務器(qì)的(‌'de)壓力都(dōu)很(hěn)大(dà)φ♥ 

 

 

當然·...運維工(gōng)程師(shī)們的(dγ∏e)壓力更大(dà),各種突發故障都(dōu)可(kě)能(néng)讓業(y×‍'γè)務成交失敗,而查找系統運行(xíng)的(de)πγ 日(rì)志(zhì)又(yòu)特别費(fèi)時(shí)'&∏費(fèi)力。挖故障如(rú)同大(dà)海(hǎi)撈針,這(z© hè)不(bù)僅讓運維人(rén)員(yuán)✔δ急得(de)團團轉,客戶體(tǐ)驗也(yě)将大(dà)大(dà)降>↔ 低(dī),比如(rú)這(zhè)樣:

 

 

更有(yǒu)這(zhè)樣:(⊙o⊙)&he ✘llip;

 

 

今天的(de)內(nèi)容主要(yào)集中在秒(mi✔≈¥ǎo)殺及搶購(gòu)背後的(de) IT 架構及實現(xiàn)&nb₹✘sp;

電(diàn)商秒(miǎo)殺活動的(de)業(yè)務特點↑♥

1、活動波峰波谷狀态明(míng)顯

電(diàn)商通(tōng)過秒(miǎo)殺活Ω↕≈÷動為(wèi)其經營産品造勢,秒(miǎo)殺活動一(yī)般時(¶≥εshí)間(jiān)較為(wèi)固定,活動通(tōng)常需要(yào§σ®)經曆産品發布、秒(miǎo)殺倒計(jì)時(shí)、到(dà☆↕←₽o)點秒(miǎo)殺、優惠券抵扣、用(yòng)戶付款等一(yīΩ↕ )系列流程,在秒(miǎo)殺點前後服務器(↕♠€qì)負載成峰值狀态,服務器(qì)負載随著(zhe)>₽>活動退卻而減少(shǎo)。

 

2、秒(miǎo)殺通(tōng)常涉及不(bù)止一(yī)個(♣α♣∏gè)業(yè)務

電(diàn)商秒(miǎo)殺活動,用(yòng)戶在等待秒('™miǎo)殺的(de)過程中也(yě)為(wèi)電(diàn)商網站(zβ‌☆hàn)帶來(lái)了(le)流量,尤其是(shì)今年(nián),雙€φ十一(yī)前半個(gè)月(yuè)就(jiù)已經開(kāi)始了(≥ le)各種秒(miǎo)殺環節,秒(miǎo)殺活動進行(±≥λxíng)過程中,用(yòng)戶領取優惠券'±≠、身(shēn)份認證、支付業(yè)務也(yě)↓αβ♠會(huì)同時(shí)發生(shēng)。

 

3、時(shí)間(jiān)短(duǎ‌λn)、瞬時(shí)并發量高(gāo)

秒(miǎo)殺活動是(shì)一(yī)個(gè)特别考驗後台β•數(shù)據庫、緩存服務的(de)業(yè)務,₩∞±•對(duì)于數(shù)據庫、緩存的(de)性能(néng)要(y£§ào)求特别嚴格。一(yī)旦後台數(shù)據服務沒有(™↔>÷yǒu)跟上(shàng),秒(miǎo)殺活動将成為(wèi)空(kōng)€‍§談。

 

秒(miǎo)殺背後的(de)技(jì)術(shù)挑戰

1、突增的(de)服務器(qì)及網絡需求

雙 11 這(zhè)個(gè)萬衆狂歡的(de♠α™)節日(rì),對(duì)于電(diàn)商員(yuán)工(gōng'☆§)來(lái)說(shuō),每個(gè)環節都(dō☆πu)面臨前所未有(yǒu)的(de)考驗。 對(duì) IT 運維部≠¥π₹門(mén)來(lái)講,需要(yào)備足₽ $÷充分(fēn)的(de)服務器(qì)和(hé±<σ€)網絡帶寬資源來(lái)應付這(zhè)一(yī)挑戰 βε≤。通(tōng)常情況下(xià),雙 11 的<ε(de)服務器(qì)使用(yòng)是(shì↕±")平時(shí)的(de) 3-5 倍,網絡帶寬是(shì)平時¥↔©(shí) 2-4 倍,如(rú)何在短(duǎn)時(shí∑¥>)間(jiān)應付這(zhè)些(xiē)問(wèn)題,如(r↔↓βú)何讓 IT 投資利用(yòng)最大(dà)化(huà),是€<↑™(shì)擺在電(diàn)商 IT 們面前一(yī)大(dà§♥)難題。

 

2、業(yè)務高(gāo)并發,服務負載重

我們通(tōng)常衡量一(yī)個(gè) Web 系★∑✘₩統的(de)吞吐率的(de)指标是(shì) QPS(Que©£ry Per Second,每秒(miǎo)處理(lǐ)請(qǐngπ ✔↕)求數(shù)),解決每秒(miǎo)數∑↕(shù)萬次的(de)高(gāo)并發場(chǎn‌ g)景,這(zhè)個(gè)指标非常關鍵。

假設處理(lǐ)一(yī)個(gè)業(yè)務請(qǐng)求平均響"≈ ↕應時(shí)間(jiān)為(wèi) 100 ms,同時(shí),系統內​§(nèi)有(yǒu) 20 台 Web 服務器(qì),配置最大®≈(dà)連接數(shù)為(wèi) 500 個(≥∞gè),Web 系統的(de)理(lǐ)論峰值 QPS 為(​φ★wèi)(理(lǐ)想化(huà)的(de)計(jì)算(suàn)"Ω∞方式):100000 (10萬QPS)意味著(zhe) 1 秒(miǎ‌₹o)鐘(zhōng)可(kě)以處理(lǐ)完 10 萬的(de)請©≠×α(qǐng)求,而“秒(miǎo)殺”的(de)那(γ↓∞'nà) 5w/s 的(de)秒(miǎo)殺似乎♦→$是(shì)“紙(zhǐ)老(lǎo)虎&rdq∑ε∏₹uo;。

 

實際情況,在高(gāo)并發的(de)實際場(chǎ™φng)景下(xià),服務器(qì)處于高(gāo)負載 Ω的(de)狀态,網絡帶寬被擠滿,在這(zhè)個( ₽λgè)時(shí)候平均響應時(shí)間(jiān)會(huì)↓Ω✔←被大(dà)大(dà)增加。随著(zhe)用(yò≈σ' ng)戶數(shù)量的(de)增加,數(shù‍β)據庫連接進程增加,需要(yào)處理(lǐ)的(de)上(sh≥§àng)下(xià)文(wén)切換也(yě)越多(duō∑ε),服務器(qì)造成負載壓力越來(lái)越重。

 

3、業(yè)務耦合度高(gāo),引起系統&ldq ☆®uo;雪(xuě)崩”

更可(kě)怕的(de)問(wèn)題是(shìΩ♠☆),當系統上(shàng)某個(gè)應用(yòng)因為(wèi)延遲而變ε↔•φ得(de)不(bù)可(kě)用(yòng),用(← yòng)戶的(de)點擊越頻(pín)繁™↕€↓,惡性循環最終導緻“雪(xuě)崩&r∑ dquo;,因為(wèi)其中一(yī)台服務器(qì)挂了(le),導緻∏​流量分(fēn)散到(dào)其他(tā)正常工(gōng)作(zuò)的(d∏β‍e)機(jī)器(qì)上(shàng)₹€π↕,再導緻正常的(de)機(jī)器(qì)也(yě)挂÷‍‍‍,然後惡性循環,将整個(gè)系統拖垮。

 

電(diàn)商秒(miǎo)殺活動應對(₽©duì)策略 

  1. 彈性資源伸縮,選擇一(yī)個(gè)靠譜的(de)服務商,在緊急情況♠ 下(xià)快(kuài)速響應; 
  2. 轉變IT運維管理(lǐ)工(gōng)作(zuò)方式和(hé)理★§(lǐ)念,強調從(cóng)技(jì)術(shù)型向管理∞ ∏λ(lǐ)型轉變;
  3. 建立完善的(de)內(nèi)部信息共享平台;
  4. 建立例行(xíng)巡查和(hé)應急預案。

 

平台的(de)選擇至關重要(yào) 

選擇一(yī)個(gè)好(hǎo)的(✘π"‍de)服務商對(duì)于企業(yè)至關重要(yào),神州光(guāng)λ≈大(dà)是(shì)中國(guó)最大(dà)的(de)利用(yòng)共享≥¥☆經濟模式,通(tōng)過互聯網平台聚合工(≤©gōng)程師(shī)資源,為(wèi)客戶提供有(yǒu)質ε​​δ量保證的(de)按需使用(yòng)工(gōng)程師(shī)資源α★的(de)IT服務的(de)互聯網平台公司。

 

神行(xíng)雲獸平台始終緻力于服務交付及服務質量管控,神行ε Ω​(xíng)工(gōng)程師(shī)平台&β會(huì)對(duì)工(gōng)程師(shī)在提供服務的(de)全↑≤過程實施嚴格的(de)質量管控,該平台标準化(★↓huà)的(de)服務流程可(kě)進行(xíng)服務過程的(d♥∏♣e)跟蹤記錄。真正實現(xiàn)了(le)“高(↔↑gāo)質量、高(gāo)效率、低(dī ‍​)成本”的(de)服務目标。幫你₹γε®(nǐ)度過每一(yī)次運維困境。