Anthropic 的編碼工具 Claude Code 近期品質下滑引發用戶抱怨。Anthropic 現已證實問題存在,並已確認並修復了三個獨立的錯誤來源,承諾未來將實施更嚴格的品質控制。

重點文章
多重變更導致程式碼品質下降
近一個月來,越來越多用戶回報 Anthropic 的編碼工具 Claude Code 表現明顯變差。Anthropic 在詳細的事後檢討報告中說明,共有三大獨立變更導致普遍感受到的品質下降:Claude Code 本身、Claude Agent SDK 及 Claude Cowork 的調整。
Anthropic 表示 API 並未受影響,所有問題已於 4 月 20 日透過 2.1.116 版本修復。問題的根源始於 3 月 4 日,Anthropic 為降低高模式下的極端延遲而將預設運算努力從「高」降至「中」,但此權衡導致 Claude Code 智能表現下降,該變更已於 4 月 7 日永久回復。
第二個問題是 3 月 26 日發佈的快取最佳化錯誤,原意是在一小時不活動後刪除舊推論區段,以降低恢復會話時的延遲,但編碼錯誤卻導致推論歷史在每次後續操作中被清除。這使得 Claude 逐漸失去語境,用戶發現它有遺忘、重複和奇怪的工具選擇,快取遺失也導致使用限制比預期更快耗盡。此錯誤直至 4 月 10 日才修復。
第三個問題出現於 4 月 16 日,一項旨在抑制 Opus 4.7 冗長性的系統提示指令,在廣泛評估套件測試後發現導致 3% 的品質下降,Anthropic 已於 4 月 20 日回復此變更。
引入嚴格品管流程以重建信任
由於每次變更影響了不同用戶群體,綜合效應導致了模糊而漸進的品質下降,初期難以與正常波動區分。為此,Anthropic 將強化品質控制,更多員工將使用公開版本的 Claude Code 而非內部測試版本。所有系統提示變更都必須通過廣泛的模型專屬評估套件。針對可能影響智能的變更,Anthropic 計畫引入磨合期並逐步推動。作為補償,公司已重置所有訂閱者的使用限制。Anthropic 也設立了 X 帳號 @ClaudeDevs,以更透明地溝通產品決策。
運算成本飆升品質下降
感知的品質下降在 AI 產業中仍是反覆出現的主題。這並非用戶首次抱怨 AI 品質下滑。用戶感知的模型退化通常是工具層或基礎設施的變更所致,而非模型本身。在實際應用中,Claude Code 等框架能引導模型能力並提供正確語境。當這些框架損壞時,反效果便隨之而來。若再加上 Anthropic 等供應商的推論深度調整,其影響會進一步加劇。
這些變更背後的原因日益歸結於全產業的運算資源短缺。Anthropic 的 API 可用性近期僅佔 98.95%,遠低於雲端產業標準的 99.99%。根據 Ornn 運算價格指數,現貨市場上的 GPU 每小時價格上漲了 48%,美國銀行分析師預計需求將至少持續到 2029 年。
OpenAI 正關閉其影片生成應用程式 Sora,以釋放運算資源用於編碼和企業產品。GitHub 也暫停了多個 Copilot 等級的新註冊。
Anthropic 的成長主管最近承認,現有的 Pro 和 Max 方案並非為當前的代理工作負載而設計,因為它們是在像 Claude Code 這樣運算密集型工具出現之前所創建。該公司甚至曾短暫測試取消新 Pro 訂閱者對 Claude Code 的存取權限,但在受到反彈後改變了方向。
