Anthropic 發佈了其最新的 AI 模型 Claude Opus 4.7。此新版模型專注於進階軟體開發,並延續了 Anthropic 每兩個月更新一次的節奏,確保模型能力持續迭代升級。
重點文章
Opus 4.7 大幅提升軟體工程與視覺能力
Claude Opus 4.7 在進階軟體工程方面相較於 Opus 4.6 有顯著改進,尤其在處理最困難的任務上。使用者表示,他們現在可以自信地將過去需要嚴密監督的複雜程式碼工作交給 Opus 4.7。該模型能嚴謹且一致地處理複雜且耗時的任務,精確遵循指示,並能在回報結果前自行驗證輸出。
此外,Opus 4.7 的視覺能力也大幅增強,能以更高的解析度處理圖像。在完成專業任務時,它展現出更出色的品味和創造力,能生成更高品質的介面、簡報和文件。

Mythos 跑分預覽震撼業界
Anthropic 公布的基準測試顯示,Opus 4.7 在多種用途上(包括代理式編碼和電腦使用)超越了 Opus 4.6、GPT-5.4 和 Gemini 3.1 Pro,僅略遜於能力更全面的 Claude Mythos Preview。值得一提的是,Mythos 目前並未像 Opus 4.7 那樣全面開放,僅供如 Apple 等主要軟體平台供應商使用。
此外,Anthropic 已為 Claude Opus 模型建立起更可預測的直接更新頻率。Opus 4.7 在 Opus 4.6 發佈兩個月後推出,延續了先前每兩個月的更新模式。

強化指令遵循與記憶能力
Anthropic 特別強調 Opus 4.7 在指令遵循、多模態支援、實際應用工作及記憶功能上的改進。該公司指出,Opus 4.7 在使用基於檔案系統的記憶方面表現更佳,能在長時間、多會話的工作中記住重要資訊,並據此推進新任務,從而減少了前期所需的上下文提供。
Opus 4.7 作為 Opus 4.6 的直接升級版,有兩項變更值得注意,因為它們會影響 Token 使用。首先,Opus 4.7 採用了更新的 Tokenizer,改善了模型處理文本的方式,但代價是相同的輸入內容可能會映射到更多的 Token(約 1.0 至 1.35 倍)。其次,Opus 4.7 在更高難度的工作中,尤其是在代理設定的後期階段,會進行更多思考,這提升了其解決困難問題的可靠性,但也意味著它會產生更多的輸出 Token。
