Anthropic 發表 Claude Opus 4.1 模型 應戰 GPT-5

claude opus
Screenshot

Anthropic 宣佈推出其頂級混合語言模型 Claude Opus 4.1 的升級版本。這次更新特別強化了程式設計能力,在程式碼重構、大量數據分析以及代理能力方面展現更優異的性能,意即能夠自主處理複雜的多步驟任務。

部署與性能基準

Claude Opus 4.1 現已向 Claude、Claude Code 的付費使用者提供,並可透過 API、Amazon Bedrock 以及 Google Cloud Vertex AI 取得,價格與先前的 Opus 4 模型維持不變。開發者可使用 claude-opus-4-1-20250805 API 標籤來存取此更新模型。在真實世界程式設計基準測試中,Claude Opus 4.1 在 SWE-bench Verified 基準測試中創下 74.5% 的新紀錄,比 Opus 4 高出約 2 個百分點,領先 OpenAI 的 o 系列約 5 個百分點,而 OpenAI 最新的開源模型則落後更多。此基準測試衡量 AI 模型識別並修復開源程式碼中實際錯誤的能力。除了程式設計,Claude Opus 4.1 在分析和研究任務上也有進步,Anthropic 表示該模型現在更能追蹤細節並進行代理式搜尋。已停止營運的程式設計新創公司 Windsurf 報告指出,Claude Opus 4.1 在其針對初級開發者建立的內部基準測試中,展現了單一標準差的提升,類似於從 Sonnet 3.7 進步到 Sonnet 4 時所見的飛躍。

dced1e451a52da3bcb3807d7a9510b1b5426ace6 3840x2160 1
bde326699c667506c87f74b09a6355961d29eb26 2600x2084 1

為 GPT-5 到來預作準備

Claude Opus 4.1 的發佈時間引人注目,因為 OpenAI 正準備推出其備受期待的 GPT-5 模型。GPT-5 預計將在程式設計、數學和基於代理的任務方面提升標準,儘管它可能不會帶來 GPT-3 到 GPT-4 間那樣的飛躍性進步。

Anthropic 的戰略佈局

由於 GPT-5 預計只會有漸進式提升,Anthropic 的最新更新可能足以保持競爭力。Anthropic 建議所有使用者從 Opus 4 升級到 Opus 4.1,並表示未來幾週內將有「大幅度」的改進。此舉表明 Anthropic 在 GPT-5 即將到來之際,希望繼續在市場上站穩腳跟。

加入本站 WhatsApp 頻道最新限免情報立即知。

全新本站官方《限時情報王》 iOS 版 登場。限免已完結?不想錯過重大限免應用,可到本站追蹤 Telegram 頻道FacebookIG