美國政府以國家安全為由,要求人工智能公司 Anthropic 立即停止向全球用戶提供其最先進的 AI 模型 Claude Fable 5 與 Mythos 5。Anthropic 表示將遵守指令,但同時公開批評此舉基於「誤解」,並正盡快恢復服務。
重點文章
政府指存在破解風險
根據 Anthropic 的說法,美國政府認為已發現繞過 Fable 5 安全措施的方法。然而該公司審視相關示範後指出,所謂的破解技術只能識別「少數已知且影響輕微的弱點」,而這些弱點其他公開模型同樣能夠發現。Anthropic 強調,潛在破解方式僅為要求模型閱讀特定程式碼並修復軟體錯誤,相關能力早已廣泛存在於 OpenAI 的 GPT-5.5 等模型之中。
Anthropic反駁安全標準
Anthropic 指出,在模型發佈前已通過美國政府、英國 AI 安全研究所(UK AISI)及第三方機構合共數千小時測試,安全措施「遠比任何先前模型有效」。沒有任何測試人員找到能全面繞過安全限制的通用破解方法。該公司承認現階段所有模型提供者都無法完全杜絕破解,但認為僅因個別窄域破解便要求召回已部署至數億用戶的商業模型,將開創危險先例。
業界恐面臨新監管陰影
Anthropic 正在遵守指令,但明確反對:「我們不同意僅憑一個窄域潛在破解便應召回已部署至數億用戶的商業模型。」若此標準應用至整個行業,將實質上阻止所有前沿模型的新部署。該公司曾主張政府應透過透明、公平且基於技術事實的法律程序來阻止不安全部署,但目前行動並未符合這些原則。此事件可能成為 Anthropic 與美國政府之間持續衝突的新一章。
