Anthropic 警告 AI 可能很快自行進化　無需人類參與

Anthropic 近日發佈一份報告，詳細說明其 AI 模型的進步速度，並警告這項技術可能很快就能在沒有有意義的人類參與下自行改進。這家估值接近 1 兆美元的 AI 實驗室在準備上市的同時，也呼籲業界暫停 AI 開發。

重點文章

遞迴自我改進風險

在這篇引發熱議的網誌文章中，作者 Marina Favaro 與 Jack Clark 指出 Anthropic 的 AI 開發已出現巨大轉變：超過 80% 的合併程式碼現在由 Claude 編寫，工程師每季度提交的程式碼量約為 2025 年之前的八倍。他們認為這條軌跡正朝向「遞迴自我改進」——即 AI 系統自主設計、建構並訓練其後繼者，而無需人類在每個步驟中驅動。作者警告，雖然尚未跨越這道門檻，但「它可能比大多數機構準備好的時間來得更快」，若缺乏適當防護，人類將更難維持對 AI 發展的有效控制。

呼籲暫停開發的爭議

Anthropic 同時倡議暫停 AI 開發，但前提是「多家處於前沿且資源充足的實驗室，在多個國家同意以相同條件停止」。這顯然指向 OpenAI、Google、xAI 與 Meta 等競爭對手。然而這些實驗室正全力競逐開發更強大的 AI 模型，且其中三家面臨 IPO 壓力，業界協調暫停的可能性極低。上週 Anthropic 才提交 IPO 保密文件，並在過去一個月內超越 OpenAI 成為估值最高的 AI 實驗室（9650 億美元）。長期以來 Anthropic 自詡比其他實驗室更重視安全，但 IPO 在即的時機引發部分觀察者質疑其動機是否為上市前炒作。批評者過去也曾指控該公司以安全修辭作為競爭籌碼，前總統顧問 David Sacks 更指責其推行「監管俘獲議程」，藉負責任 AI 之名拖慢對手。

安全承諾前後矛盾

值得注意的是，Anthropic 雖呼籲暫停開發，卻在不久前放棄了一項關鍵安全承諾。二月《時代》雜誌報導，Anthropic 徹底修改了其「負責任擴展政策」，刪除了「除非事先保證安全措施足夠，否則絕不訓練 AI 系統」的核心條款。首席科學官 Jared Kaplan 當時表示，在競爭對手持續推進的情況下單方面停止訓練「實際上不會幫助任何人」。公司稱這項修改是對變化的政治與競爭環境的務實回應，而非向市場壓力屈服。新政策承諾透明並追趕競爭對手的安全措施，但實際上使 Anthropic 受自身規則的約束遠低於以往。週四的貼文明確指出，無論動機如何，Anthropic 認為有意義的 AI 安全討論窗口正在縮小。公司計劃在未來幾個月內召集政策制定者、研究人員與公民社會，共同探討遞迴自我改進所引發的問題。

Anthropic 警告 AI 可能很快自行進化 無需人類參與

重點文章

遞迴自我改進風險

呼籲暫停開發的爭議

安全承諾前後矛盾

相關文章

Anthropic 警告 AI 可能很快自行進化　無需人類參與