Cloudflare出事考證:認錯的勇氣 專業的體現

博客論壇 07:30 2019/07/05

分享:

2019 年 7 月 1 個星期內,連續兩晚出了兩次網絡大當機!坊間有不同版本的解釋及估算,但美國科技公司的傳統非常良好,出事他們會詳細解釋是甚麼問題,出了甚麼過失,不會遮遮掩掩文過飾非。

先是內容分發網絡(CDN)Cloudflare 出事,(注意其業務不是數據中心),導致香港大量網站不能登入。有業餘但又是「業界專家」一口咬定肯定是有人攻擊,且屬「國家級」攻擊;但話猶未完,Cloudflare 高層立刻在官方部落格清楚解釋問題出在網頁伺服器應用防火牆(WAF)規則的過濾條件更新引致 CPU 滿載,從而影響服務。

管理層諉過「外部勢力」

可能在香港所謂做過幾天管理層的人一向「保守」,在這裏的醬缸文化影響下,總把事故推在「外部攻擊」比較好,因可把黑鍋向外卸,變成「唔關我事」甩難,臭屎密冚。說成是外部攻擊總沒有錯的,對當事人來說,這是理所當然吧! 但在開放源碼(Open Source)運動影響下,美國公司處理網絡事故的態度,一向非常開放,傾向「有碗話碗」,從不諉過於人,說出問題解釋事故,很少做假。這其實有助公司商譽和加強未來客戶的信心 -- 但一來到香港,便狠狠給「估出來」的評論「打面」。

第二晚,輪到 Facebook、Instagram、及 WhatsApp 等網上服務短時間出問題。7 月 3 日晚,用家發現文字信息雖可正常發放及瀏覽,圖片及聲音檔案卻不能顯示或下載,整個服務處於半斷線狀態。當然,又有個別評論再次跳出來說是「攻擊」,今次倒是少了「國家級」這個字眼,且加上「估計」這個頭盔。此文截稿時,Facebook 並無像 Cloudflare 般極細緻描述問題原因,只在 7 月 4 日時,輕描淡寫說是服務故障,沒有指明是「攻擊」導致服務出問題。

沒有從事過網絡保安專業的人,很難明白我們為甚麼執着於這個問題,說是別人攻擊不好嗎?卸走黑鑊不是最好嗎?但其實這是對相關公司的侮辱。

講實話體現專業

今日網絡上每天都有惡意網絡掃描,DDoS 無日無之,對網絡服務供應商來說,被攻擊是常態;缺德一點說,出了事諉過於「遭受外界攻擊」很容易,亦很有說服力,因為絕大部分記錄及證據,外人根本沒有,你怎樣說人家也挑不出毛病。但要老實面對及公開說自己出錯,便需要道德勇氣和決心,值得尊重。

筆者和我們專業從事網絡工作的朋友,看到事件被說成「攻擊」時,禁不得搖頭嘆息。 始終每一行都有其專業,要不斷學習升級。但人力有限,一個人不可能懂得所有東西。 萬能key適用改圖很好,但要用有限的常識評論一件專業的技術事件,其實「萬能 key」是會鬧笑話的。

Cloudflare 作為事件的「第一身」當事人,他們作出的說明詳實可信,亦沒有動機編造假說話,這種自認錯誤的誠實和勇氣值得我們業界尊敬,更值得香港科創公司學習。作為「街外人」的第三者,由於欠第一手數據,更非親身經歷,只靠估計和推論便定性,自然沒有當事人說的可信。

這無關專業,應該是常識吧!

以上內容純屬作者個人意見,並不代表本網立場。

Photo:Robin Hutton

撰文 : 馮德聰( 光子網絡數據中心行政總裁)

緊貼財經時事新聞分析,讚好hket Facebook 專版