農曆年關將近,隨著景氣復甦,街頭巷尾都能感受到歡愉的氣氛。每年這個時間,公司內部除了忙著結帳算年終的財會部門特別緊張忙碌,其他部門通常是處於輕鬆的狀態,但有個例外,就是企業中負責經營網站的部門。
怎麼說呢?如果經營的是本地市場 ,不論在什麼產業,隨時都需要維持網站服務的穩定。若恰好經營消費產品的電子商務銷售,放年假前及年假期間總不免舉辦促銷活動,網站穩定就非常重要。如果企業的主要市場在國際,那更無所謂國內放假與否,反正國外生意還是得照做。

天啊!!多10,000倍的流量怎麼辦??

天啊!!多10,000倍的流量怎麼辦??

網站或網路服務的穩定性,負責的當然是 IT 人員,不過通常會關心(也應該關心)的則是任何與網路行銷成效有關的部門或個人。一般而言,特定節日和特定事件發生時網站服務中斷的原因,通常是進入網站的使用者太多,造成網站系統無法全部回應瞬間大量的要求。這個情形有點像某個商店太多人進不去需要排隊,差別是在網路上我們看不到其他人在排隊、沒有耐心也不想枯等,反應通常是「網站掛掉了」→「等一下看看」→「算了不買了」。

 

「爆量」或「攻擊」= 服務中斷

湧入瞬間大量的需求,有可能是「受歡迎」或「不受歡迎」,前者通常被形容為「網站塞爆」或「網站爆量」,也就是真的有那麼多使用者想連網站。後者通常會造成「網路攻擊」,有心人士運用技巧創造「虛假」的超大流量,像是一群黑衣惡霸佔商店門口,真正想買東西的人卻進不去,讓你做不成生意。
2010 是很特別的一年,因為不管在本地或國際上,我們看到兩種極端情況單獨發生或同時發生,並且造成消費者、企業、組織甚至社會大規模的經濟損失。
早在十一月初,美國網路界和媒體圈就已經預測,今年 11 月至 12 月的年末購物季(holiday season)的線上銷售成績會創歷史新高,果不其然,最後的數字甚至超乎預期來到 330 億美元,各大線上零售業者皆傳佳績。業績長紅是很好,可是這也代表這些線上零售網站必須承受的起比平常還要多的「購物人潮」在自己的網站上。以美國這樣成熟的購物市場,人潮會增加多少?我們以美國零售龍頭 Walmart.com 來看,根據 Alexa 全球網站排名,可以發現 11、12 兩個月流量明顯增加,在感恩節後的「網路星期一」,網站的到達率(全球平均有多少%使用者連進網站)更是平常的四倍:

網路星期一

網路星期一

 

流量增加 10,000 倍!!? 真的發生了…

熟知網路行銷的朋友會知道,Alexa 並非精確的量測工具,實際的情況可能更誇張。除此之外,這次年末購物季還多了一個變數,因為國際各大信用交易平台(Paypal、Mastercard 和 Visa 等公司)皆封殺維基解密,國際上的網路激進份子揚言並實際對線上零售和交易平台網站展開攻擊,造成的結果超乎許多人的想像。根據 Akamai 公司官方公布的資料,他們量測到幾個重要的線上零售網站,在感恩節前後因為受到大規模分散式的網路攻擊,流量比平常多上10,000 倍!!!

[匿名的線上零售業者]

單位:每秒鐘的請求存取數量 資料來源:Akamai 官方網站

單位:每秒鐘的請求存取數量      資料來源:Akamai 官方網站

10,000 倍以上的流量,多麼可怕的數字!! 可能沒有任何一般企業能夠單靠自己的網路平台就承受如此誇張的流量(除非你是 Google 或 Akamai )。技術上來說,先消除許多變數(資料庫讀取、程式運作…),假設一個企業的網站由 4 台伺服器服務,頻寬購買 50 Mbps,整個系統最多可以同時讓 1,000 名訪客使用,流量 10,000 倍之後則需要台伺服器和多少頻寬??就算技術上可行,一年才遇到一次,花費這樣的資源簡直是天方夜譚。在實體世界你可以請大家排隊,網路世界根本沒有排隊這種事情存在。
一般預估,一個年末購物季可以佔線上零售業者整年業績的 24%,按照這樣去換算,Akamai 運用其雲端平台,光是在 11 月 30 號至 12 月 2 號這三天(美東時間),幫助五家主要的零售業者挽救超過 1,500 萬美元的業績。
不管是真的有那麼大的需求或者是惡意攻擊,網站服務的中斷是非常難避免的,特別是對於本地的國際企業而言,硬體平台全部設置於台灣是最常見的作法,對一般企業來說,建置和支援上也最可行,但單一據點要承受來自全世界不同國家或城市的訪客流量(或攻擊),即使是理論上也非常難做到,這也就是為何連 SkypeTwitter 這種超大型的國際網站都會有服務中斷的時候。

 

服務中斷 = 經濟損失

服務中斷 = 經濟損失

服務中斷 = 經濟損失

服務中斷雖然是 IT 部門的責任,但實際後果因為摸不著也看不到所以通常被忽略,但實質的傷害其實全都落在行銷或業務單位上。從技術角度,一個網站的可利用性(availability,也就是網站正常服務的時間)如果是 99% (聽起來似乎很好),但這意味著一年當中有將近 90 個小時是不正常的。90 個小時,如果是年營收 1 億元台幣的電子商務網站,就代表超過 100 萬的營收損失;如果是銀行或信用交易網站,像這次因維基解密而遭攻擊的Mastercard 網站服務中斷了數小時,損失可能是以百萬甚至千萬美元計算,這還不含商譽上的損失。
看看國內的例子,類似的例子也是層出不窮、許多事件每年都在重複上演:演唱會購票系統被灌爆秒殺iPhone預購網站連不上線上大促銷系統卻無法應付春節買不到高鐵車票…。仔細整理其實名單一大串。傳統的 IT 迷思是「加頻寬能解決這個問題」。但真的能解決問題嗎?看看電信業者也在被塞爆的名單之列,就曉得答案了。頻寬有可能加到比電信業者還大嗎?當然不可能。況且,連電信業者也被塞爆,你就曉得這個問題有多難解了。從財務的角度看,加買頻寬和機器的投資通常無法合理化(沒有人會為了一年一檔的週年促銷將自己的店面擴大 10 倍或 100 倍),更重要的是,仍然無法根本解決問題(就算一個店面擴大了 100 倍,還是無法容納 10,000 倍的人次同時湧入)。最最要命的是,事前沒準備好,真的爆量或受攻擊很嚴重時,所有的辦法都不能馬上就止血,業務單位只能心痛的看著營收損失。

 

掌握「容納力」及「可擴充性」,把負擔丟回雲端

整件事情的真正的關鍵在於網路服務架構的「容納力」(capacity,指是否具備服務 100 倍訪客的能力)及「可擴充性」(scalability,也就是能否輕易從 100 倍長到 10,000 倍的能力),如果是國際企業,還必須考慮到方案能否解決跨國間複雜的網路問題。這也是雲端服務最重要的核心概念—「訪客從雲的四面八方來,企業自己永遠不可能長得像雲一樣大,所以才要把負擔再丟回給雲」。

掌握「容納力」及「可擴充性」,把負擔丟回雲端

掌握「容納力」及「可擴充性」,把負擔丟回雲端

經營網路和經營實體雖然概念可互相比擬,但解決方法卻很不一樣。還是以用經營商店的比喻:雖然實體店面可以發號碼牌叫大夥兒排隊或改天再來,但實體店面的容納能力不可能無限制擴張,然而,運用適當的網路服務和工具,你可以將網站服務的容納能力及可擴充性延展到幾乎無限大,並且在該擴充時自動擴充,不需要時自動縮編。你也應該這麼做,不然客戶就跑走了。對於經營國際市場的本地企業而言,這件事情極為重要,因為總部設在台灣,工作在台灣,很難去思考甚至想像境外的訪客(也就是客戶)如何利用你的網站,他們遇到困難也不會告訴你(除非真的無法忍受了,但卻是以抱怨或上 blog 發表負評的方式出現,也不是企業希望的)。跨國跨地區的網路複雜環境,在台灣加買機器和頻寬幫助也不大。最後的結果就是:原本可以賺的錢就這樣飛走了。
只要思維改變了,其實不難找到適當的工具解決問題 ,建議大家可以一起來換個腦袋:

  • 真的要相信天有不測風雲(誰算的出突然一個維基解密事件就讓零售網站增加 10,000 倍流量?)
  • 即使老天眷顧一切平安,哪天出運了你的網站訪客多出 10 倍(真的爆紅這是很正常的成長量),現在的系統架構有辦法服務這麼多人嗎?
  • 網路世界太大、變數太多,企業本身的服務架構不可能「獨立」承受所有風險和危難
  • 你的網站服務若中斷一小時損失多少營收利潤?這是算的出來也應該被計算出來的。

 

服務中斷參考案例

最後附上近幾年國際上及國內網路服務中斷事件,讓大家參考(是不是多的嚇人?)。如果您在經營網路服務的容納力和擴充力有相關的困擾,我們非常樂意與您一起討論。

[近兩年國內重要網路服務中斷整理]

[近兩年國際重要網路服務中斷整理]