Anthropic Fable 5 獲准恢復 模型重新上線

Claude main01 1

Anthropic 經過數週與特朗普政府談判後,終於獲准重新啟用其面向消費者的 Mythos 級模型 Claude Fable 5。該公司於 X 平台上宣佈,計劃於週三開始逐步恢復全球用戶在 Claude 平台上的存取權限,並將在不久後重新啟用 AWS、Google Cloud 及 Microsoft Foundry 上的服務,惟未有具體時間表。Anthropic 表示,已收到商務部解除對 Claude Fable 5 及 Mythos 5 出口管制的通知,感謝用戶耐心等待,並將陸續分享更新。

出口管制背景

今年 6 月初,特朗普政府因擔心模型存在越獄漏洞,向 Anthropic 發出出口管制指令,禁止任何外國國民(包括企業客戶的非美國成員及許多 Anthropic 自家外籍員工)使用 Mythos 5 或 Fable 5。該漏洞由 Amazon 研究人員發現並通報,促使政府迅速採取行動。為解決問題,Anthropic 在網誌中表示已訓練改良的安全分類器,專門針對並攔截該越獄行為,成功率超過 99%;若請求被攔截,系統會自動將其轉送至 Opus 4.8 模型處理。

政府放行條件

特朗普政府早前已批准 Mythos 5 恢復運作,但僅限於預先核准的組織名單,該名單內的非美國成員及 Anthropic 外籍員工亦獲准存取。隨後 OpenAI 發佈 GPT-5.6 時也採用類似逐步推出模式。Anthropic 表示將持續與政府協調,擴大 Mythos 5 的國內外合作夥伴存取範圍,並在網誌中詳述與政府密切合作的新計劃,包括提供預發佈政府存取與評估、重大越獄或濫用模式發生時的快速資訊共享,以及與其他頂尖 AI 實驗室共同制定自願性安全與評估標準。

未來合作計劃

Anthropic 指出,AI 業界目前缺乏評判越獄嚴重程度的共識,這個問題將隨更多具備強大網絡安全能力的模型推出而加劇。為此,該公司與 Amazon、Microsoft、Google 及其他企業合作,透過 Project Glasswing 計劃草擬越獄評估框架,提出四個分類類別:攻擊者能力提升、能力廣度、武器化難度及可發現性。Anthropic 亦成立專門團隊提供 24/7 監控,並計劃在 HackerOne 上推出漏洞懸賞計劃。該公司坦言,幾乎不可能讓 AI 模型完全免疫於越獄,但將持續透過紅隊測試降低風險。

與 Anthropic 相關的圖片

加入本站 WhatsApp 頻道最新限免情報立即知。

全新本站官方《限時情報王》 iOS 版 登場。限免已完結?不想錯過重大限免應用,可到本站追蹤 Telegram 頻道FacebookThreads