Claude Mythos Preview 找 Bugs 神速 開發者來不及修補

anthopic claude

Anthropic 公佈了 Project Glasswing 的首批成果。該公司表示,其 Claude Mythos Preview AI 模型在約 50 個合作夥伴的協助下,已在系統關鍵軟體中發現超過 10,000 個高嚴重性或關鍵嚴重性漏洞。Anthropic 在其網誌文章中指出,Mythos Preview 目前發現安全漏洞的速度,已超越開發團隊驗證、披露及修補漏洞的速度,造成新的安全挑戰。由於業界標準披露時間為 90 天,且多數發現尚不能公開描述以免讓終端使用者面臨風險,因此 Anthropic 暫未公佈具體技術細節。

模型能力獲廣泛驗證

Anthropic 指出,Glasswing 合作夥伴負責運行與建構作為互聯網及其他關鍵基礎設施核心的軟體,每個夥伴都發現了數百個關鍵漏洞,其中幾家更表示其錯誤發現率增長了十倍以上。Cloudflare 表示其標記了 2,000 個錯誤,其中 400 個為高嚴重性或關鍵嚴重性,且其誤報率優於人類測試人員。Mozilla 在 Firefox 150 中發現並修復了 271 個漏洞,是其前身 Claude Opus 4.6 在 Firefox 148 中發現數量的十倍以上。外部評估也證實了這些數字。英國 AI 安全研究機構表示,最新的 Mythos Preview 檢查點是第一個完全解決其兩個內部網路靶場(模擬多階段網路攻擊)的模型。

獨立安全平台 XBOW 稱該模型是所有先前模型的重大突破,並稱其具有「前所未有的精準度」。Anthropic 表示,Mythos Preview 在 ExploitBench 和 ExploitGym 等學術基準測試中也名列前茅,而 GPT-5.5 在大多數這些基準測試中表現接近並已公開可用。根據 Anthropic 的說法,該模型對修補程式數量也產生了影響:Palo Alto Networks 在其最新版本中發佈的修補程式是平時的五倍。Microsoft 表示新修補程式的數量將「在一段時間內持續增長」。Oracle 聲稱其發現並修復漏洞的速度比以前快了數倍。Mythos Preview 除了查找錯誤之外也證明了其價值。Anthropic 表示,在一家合作夥伴銀行,該模型協助攔截了一筆價值超過 150 萬美元的詐騙電匯。

開源項目面臨修補挑戰

除了合作夥伴的工作外,Anthropic 表示,他們還使用 Mythos Preview 掃描了超過 1,000 個開源項目。該模型估計發現了 6,202 個高嚴重性或關鍵嚴重性漏洞,所有嚴重性級別的總發現數為 23,019 個。到目前為止,獨立安全公司(部分也包括 Anthropic 本身)已審查了 1,752 個高嚴重性或關鍵嚴重性發現,其中 90.6% 被證實為真正的漏洞,62.4% 被確認為確實為高嚴重性或關鍵嚴重性。

根據這些分類率,Anthropic 估計 Mythos Preview 已在開源程式碼中發現了近 3,900 個已確認的高嚴重性或關鍵嚴重性漏洞。該公司計劃持續掃描。Anthropic 的網誌文章指出,幾位開源維護者已要求 Anthropic 減緩披露速度,因為「他們需要更多時間來設計修補程式」。平均而言,修復一個高嚴重性或關鍵嚴重性錯誤需要兩週時間。截至目前,已有 530 個此類錯誤向維護者報告,其中 75 個已修補,65 個發佈了公開建議。另有 827 個已確認的漏洞仍在等待披露。更糟的是,維護者已被大量低品質、由 AI 生成的錯誤報告所淹沒。

高風險過渡期挑戰與應對

Anthropic 警告,具備類似網路安全技能的模型很快將會廣泛可用,有些可能已經存在。OpenAI 的 GPT-5.5 符合此類特徵,此外還有一個更專業的變體稱為 GPT-5.5 Cyber,儘管尚不清楚兩者之間確切的區別。無論如何,這些新能力創造了一個過渡時期,在此期間漏洞被發現的速度很快,但修補速度卻很慢。Anthropic 指出,這個差距帶來了新的風險。Mythos 級模型大幅減少了發現和利用漏洞所需的時間和成本。Anthropic 在內的任何公司都尚未建立足夠強大的防護措施,以阻止這些模型的濫用並防止嚴重的損害。從長遠來看,這些模型應該能夠在程式碼發佈之前捕獲錯誤,從而幫助開發人員建構更安全的軟體。目前,Anthropic 建議軟體團隊應縮短其修補週期,並盡可能讓使用者方便地進行更新。網路防禦者應堅持基本原則:多因素身份驗證、強化組態和徹底的日誌記錄。

與 Claude 相關的圖片

加入本站 WhatsApp 頻道最新限免情報立即知。

全新本站官方《限時情報王》 iOS 版 登場。限免已完結?不想錯過重大限免應用,可到本站追蹤 Telegram 頻道FacebookThreads