Anthropic 推出 Claude Sonnet 4.5 地上最強 Coding AI

STKB364 CLAUDE A

Anthropic 近日宣佈推出其最新 AI 模型 Claude Sonnet 4.5,該模型展示了前所未有的自主運行能力,能連續工作長達 30 小時。這在人工智能領域,特別是在 AI 代理與編程任務方面,代表著一次重大的飛躍。此前,Anthropic 的 Opus 4 模型曾以七小時的自主運行時間引發關注。

與 Claude 相關的圖片

強化自主編程

Claude Sonnet 4.5 的顯著特點是其強大的自主編程能力。Anthropic 透露,該模型曾連續運行 30 小時,成功編寫了一個類似 Slack 或 Teams 的聊天應用程式,生成了約 11,000 行程式碼,直到任務完成才停止運行。Anthropic 將 Claude Sonnet 4.5 譽為「全球在真實世界代理、編程和電腦使用方面表現最佳的模型」,並強調其在利用電腦方面的市場領先地位,這也呼應了 Anthropic 近一年前推出的「電腦使用」功能。該新模型在網絡安全、金融服務和研究等領域表現尤為突出。其 Beta 測試客戶 Canva 表示,新模型在處理複雜的長上下文任務方面提供了極大幫助,涵蓋從程式碼工程到產品內建功能和研究等多個方面。

introducing claude sonnet 4 5 v0 qly5k6gat4sf1

AI 競爭日益激烈

當前,Anthropic、OpenAI、Google 及其他公司正不斷推出漸進式更新和新功能,使其技術能夠為消費者(如主題研究、安排會議和查詢航班)以及企業和開發者(如製作投影片、協助編程任務和分析試算表)提供助理服務。市場對用戶關注度和依賴度的爭奪幾乎每月都在升溫。幾天前,OpenAI 也宣佈推出 Pulse,這是其 ChatGPT 的最新功能,旨在融入用戶的早晨日常和相關主題研究中。Anthropic 同時表示,新模型將與其他更新同步發佈,以幫助開發者編寫自己的 AI 代理。Anthropic 在一份新聞稿中指出:「我們將模型的發佈與虛擬機器、記憶體、上下文管理和多代理支援的訪問權限結合。這實質上是將驅動 Claude Code 的相同建構區塊打包,使開發者能夠建立自己的尖端代理。」

運行能力已達到「幕僚長級別」

Anthropic 的產品管理主管 Dianne Penn 在一次採訪中表示,該模型在電腦使用能力上的改進甚至讓她感到驚訝。與 Anthropic 去年十月的技術相比,Claude Sonnet 4.5 在瀏覽器導航和電腦使用方面更為熟練,能力提升了三倍多。Penn 提到,團隊採納了早期客戶(如 GitHub 和 Cursor)的意見回饋,並在過去一個月內對模型進行了密集的改進。

Claude.ai 的產品負責人 Scott White 也表示,新模型的運行能力已達到「幕僚長級別」,能夠協調多人的日曆並安排會議、從數據儀表板中提取洞察、根據與直屬下屬的一對一會議撰寫狀態更新等。Penn 還透露,她會利用 Claude Sonnet 4.5 來招聘潛在的新團隊成員:「持續運行一個提示,進行深度網絡搜尋,根據這些參數為我團隊中的特定職位尋找候選人,這真的很有幫助。Sonnet 4.5 在搜尋品質和深度方面表現比以往更好,還能生成包含 LinkedIn 個人檔案的試算表,方便我發送電子郵件」。

加入本站 WhatsApp 頻道最新限免情報立即知。

全新本站官方《限時情報王》 iOS 版 登場。限免已完結?不想錯過重大限免應用,可到本站追蹤 Telegram 頻道FacebookIG