Anthropic 推出 Claude Sonnet 4.5　地上最強 Coding AI

Anthropic 近日宣佈推出其最新 AI 模型 Claude Sonnet 4.5，該模型展示了前所未有的自主運行能力，能連續工作長達 30 小時。這在人工智能領域，特別是在 AI 代理與編程任務方面，代表著一次重大的飛躍。此前，Anthropic 的 Opus 4 模型曾以七小時的自主運行時間引發關注。

重點文章

強化自主編程

Claude Sonnet 4.5 的顯著特點是其強大的自主編程能力。Anthropic 透露，該模型曾連續運行 30 小時，成功編寫了一個類似 Slack 或 Teams 的聊天應用程式，生成了約 11,000 行程式碼，直到任務完成才停止運行。Anthropic 將 Claude Sonnet 4.5 譽為「全球在真實世界代理、編程和電腦使用方面表現最佳的模型」，並強調其在利用電腦方面的市場領先地位，這也呼應了 Anthropic 近一年前推出的「電腦使用」功能。該新模型在網絡安全、金融服務和研究等領域表現尤為突出。其 Beta 測試客戶 Canva 表示，新模型在處理複雜的長上下文任務方面提供了極大幫助，涵蓋從程式碼工程到產品內建功能和研究等多個方面。

introducing claude sonnet 4 5 v0 qly5k6gat4sf1

AI 競爭日益激烈

當前，Anthropic、OpenAI、Google 及其他公司正不斷推出漸進式更新和新功能，使其技術能夠為消費者（如主題研究、安排會議和查詢航班）以及企業和開發者（如製作投影片、協助編程任務和分析試算表）提供助理服務。市場對用戶關注度和依賴度的爭奪幾乎每月都在升溫。幾天前，OpenAI 也宣佈推出 Pulse，這是其 ChatGPT 的最新功能，旨在融入用戶的早晨日常和相關主題研究中。Anthropic 同時表示，新模型將與其他更新同步發佈，以幫助開發者編寫自己的 AI 代理。Anthropic 在一份新聞稿中指出：「我們將模型的發佈與虛擬機器、記憶體、上下文管理和多代理支援的訪問權限結合。這實質上是將驅動 Claude Code 的相同建構區塊打包，使開發者能夠建立自己的尖端代理。」

運行能力已達到「幕僚長級別」

Anthropic 的產品管理主管 Dianne Penn 在一次採訪中表示，該模型在電腦使用能力上的改進甚至讓她感到驚訝。與 Anthropic 去年十月的技術相比，Claude Sonnet 4.5 在瀏覽器導航和電腦使用方面更為熟練，能力提升了三倍多。Penn 提到，團隊採納了早期客戶（如 GitHub 和 Cursor）的意見回饋，並在過去一個月內對模型進行了密集的改進。

Claude.ai 的產品負責人 Scott White 也表示，新模型的運行能力已達到「幕僚長級別」，能夠協調多人的日曆並安排會議、從數據儀表板中提取洞察、根據與直屬下屬的一對一會議撰寫狀態更新等。Penn 還透露，她會利用 Claude Sonnet 4.5 來招聘潛在的新團隊成員：「持續運行一個提示，進行深度網絡搜尋，根據這些參數為我團隊中的特定職位尋找候選人，這真的很有幫助。Sonnet 4.5 在搜尋品質和深度方面表現比以往更好，還能生成包含 LinkedIn 個人檔案的試算表，方便我發送電子郵件」。

Anthropic 推出 Claude Sonnet 4.5 地上最強 Coding AI

重點文章

強化自主編程

AI 競爭日益激烈

運行能力已達到「幕僚長級別」

相關文章

Anthropic 推出 Claude Sonnet 4.5　地上最強 Coding AI