昨日,網路出現大規模中斷,許多網站和服務的效能也因此降低。Cloudflare 隨後表示,最初以為是遭受大規模網路攻擊,但後來發現問題是由軟體更新中的「嚴重」錯誤所致。

重點文章
Cloudflare 的解釋
Cloudflare 表示,最初觀察到的模式是連線每隔約五分鐘就會離線,然後恢復,接著再次離線。這種模式讓公司認為他們遭受了超大規模 DDoS 攻擊,因為技術錯誤通常不會自行修復。
根本原因是檔案更新出錯
Cloudflare 後來發現,問題出在機器人管理系統使用的檔案更新出錯。問題的觸發原因是資料庫系統權限的變更,導致資料庫將多個條目輸出到機器人管理系統使用的「特徵檔案」中。該特徵檔案的容量隨之增加了一倍。大於預期的特徵檔案隨後傳播到構成網路的所有機器上。這些機器上執行的軟體會讀取此特徵檔案,以使機器人管理系統及時了解不斷變化的威脅。該軟體對特徵檔案的大小有限制,低於其翻倍後的大小,導致軟體發生故障。
Cloudflare 致歉
該公司發佈了道歉聲明,並稱「其錯誤令人非常痛心。Cloudflare 在網際網路生態系統中扮演著重要的角色,因此任何系統的中斷都是不可接受的。我們的網路有一段時間無法傳輸流量,這讓團隊的每位成員都感到非常痛心。我們知道今天讓大家失望了。」
