Anthropic 近日發佈一份報告,詳細說明其 AI 模型的進步速度,並警告這項技術可能很快就能在沒有有意義的人類參與下自行改進。這家估值接近 1 兆美元的 AI 實驗室在準備上市的同時,也呼籲業界暫停 AI 開發。

重點文章
遞迴自我改進風險
在這篇引發熱議的網誌文章中,作者 Marina Favaro 與 Jack Clark 指出 Anthropic 的 AI 開發已出現巨大轉變:超過 80% 的合併程式碼現在由 Claude 編寫,工程師每季度提交的程式碼量約為 2025 年之前的八倍。他們認為這條軌跡正朝向「遞迴自我改進」——即 AI 系統自主設計、建構並訓練其後繼者,而無需人類在每個步驟中驅動。作者警告,雖然尚未跨越這道門檻,但「它可能比大多數機構準備好的時間來得更快」,若缺乏適當防護,人類將更難維持對 AI 發展的有效控制。

呼籲暫停開發的爭議
Anthropic 同時倡議暫停 AI 開發,但前提是「多家處於前沿且資源充足的實驗室,在多個國家同意以相同條件停止」。這顯然指向 OpenAI、Google、xAI 與 Meta 等競爭對手。然而這些實驗室正全力競逐開發更強大的 AI 模型,且其中三家面臨 IPO 壓力,業界協調暫停的可能性極低。上週 Anthropic 才提交 IPO 保密文件,並在過去一個月內超越 OpenAI 成為估值最高的 AI 實驗室(9650 億美元)。長期以來 Anthropic 自詡比其他實驗室更重視安全,但 IPO 在即的時機引發部分觀察者質疑其動機是否為上市前炒作。批評者過去也曾指控該公司以安全修辭作為競爭籌碼,前總統顧問 David Sacks 更指責其推行「監管俘獲議程」,藉負責任 AI 之名拖慢對手。
安全承諾前後矛盾
值得注意的是,Anthropic 雖呼籲暫停開發,卻在不久前放棄了一項關鍵安全承諾。二月《時代》雜誌報導,Anthropic 徹底修改了其「負責任擴展政策」,刪除了「除非事先保證安全措施足夠,否則絕不訓練 AI 系統」的核心條款。首席科學官 Jared Kaplan 當時表示,在競爭對手持續推進的情況下單方面停止訓練「實際上不會幫助任何人」。公司稱這項修改是對變化的政治與競爭環境的務實回應,而非向市場壓力屈服。新政策承諾透明並追趕競爭對手的安全措施,但實際上使 Anthropic 受自身規則的約束遠低於以往。週四的貼文明確指出,無論動機如何,Anthropic 認為有意義的 AI 安全討論窗口正在縮小。公司計劃在未來幾個月內召集政策制定者、研究人員與公民社會,共同探討遞迴自我改進所引發的問題。