Anthropic Fable 5 獲准恢復　模型重新上線

Anthropic 經過數週與特朗普政府談判後，終於獲准重新啟用其面向消費者的 Mythos 級模型 Claude Fable 5。該公司於 X 平台上宣佈，計劃於週三開始逐步恢復全球用戶在 Claude 平台上的存取權限，並將在不久後重新啟用 AWS、Google Cloud 及 Microsoft Foundry 上的服務，惟未有具體時間表。Anthropic 表示，已收到商務部解除對 Claude Fable 5 及 Mythos 5 出口管制的通知，感謝用戶耐心等待，並將陸續分享更新。

重點文章

出口管制背景

今年 6 月初，特朗普政府因擔心模型存在越獄漏洞，向 Anthropic 發出出口管制指令，禁止任何外國國民（包括企業客戶的非美國成員及許多 Anthropic 自家外籍員工）使用 Mythos 5 或 Fable 5。該漏洞由 Amazon 研究人員發現並通報，促使政府迅速採取行動。為解決問題，Anthropic 在網誌中表示已訓練改良的安全分類器，專門針對並攔截該越獄行為，成功率超過 99%；若請求被攔截，系統會自動將其轉送至 Opus 4.8 模型處理。

政府放行條件

特朗普政府早前已批准 Mythos 5 恢復運作，但僅限於預先核准的組織名單，該名單內的非美國成員及 Anthropic 外籍員工亦獲准存取。隨後 OpenAI 發佈 GPT-5.6 時也採用類似逐步推出模式。Anthropic 表示將持續與政府協調，擴大 Mythos 5 的國內外合作夥伴存取範圍，並在網誌中詳述與政府密切合作的新計劃，包括提供預發佈政府存取與評估、重大越獄或濫用模式發生時的快速資訊共享，以及與其他頂尖 AI 實驗室共同制定自願性安全與評估標準。

未來合作計劃

Anthropic 指出，AI 業界目前缺乏評判越獄嚴重程度的共識，這個問題將隨更多具備強大網絡安全能力的模型推出而加劇。為此，該公司與 Amazon、Microsoft、Google 及其他企業合作，透過 Project Glasswing 計劃草擬越獄評估框架，提出四個分類類別：攻擊者能力提升、能力廣度、武器化難度及可發現性。Anthropic 亦成立專門團隊提供 24/7 監控，並計劃在 HackerOne 上推出漏洞懸賞計劃。該公司坦言，幾乎不可能讓 AI 模型完全免疫於越獄，但將持續透過紅隊測試降低風險。

Anthropic Fable 5 獲准恢復 模型重新上線

重點文章

出口管制背景

政府放行條件

未來合作計劃

相關文章

Anthropic Fable 5 獲准恢復　模型重新上線