GPT-5.5 API 價格翻倍 強調成本效益更高

openai 7

OpenAI 正式發佈了 GPT-5.5 代理式模型,聲稱其達到了「用於實際工作和驅動代理程式的新一代智能」。這款模型旨在自主執行複雜任務,能夠跨多種工具獨立完成工作,並檢查其自身的輸出。儘管其 API 價格比上一代模型翻倍,但 OpenAI 強調 GPT-5.5 在效率上有所提升。目前,GPT-5.5 已向付費的 ChatGPT 及 Codex 用戶開放。

與 GPT-5 相關的圖片

提升代理式工作流程與長上下文處理能力

OpenAI 表示,GPT-5.5 在程式碼編寫與除錯、網路研究、數據分析、文件與試算表創建,以及軟體操作方面表現突出。該模型能夠獨立地在不同工具之間切換,直至任務完成。OpenAI 指出,GPT-5.5 的主要提升集中在代理式程式設計、電腦使用、知識工作和早期科學研究等四個領域,這些都需要跨情境推理和長時間執行動作的能力。在針對代理式工作流程的 Terminal-Bench 2.0 編碼基準測試中,GPT-5.5 取得 82.7% 的分數,超越前身 GPT-5.4 的 75.1%,同時在困難數學問題上的優勢更為明顯。此外,GPT-5.5 的長上下文處理能力也大幅改善,在 MRCR v2 基準測試中,其在 512K 至 1M Token 的上下文長度下,準確率從 GPT-5.4 的 36.6% 躍升至 74.0%。

gpt 5 5 api pricing twice as expensive as gpt 5 4 v0 yvcpzespmzwg1

優勢並非全面性

然而,GPT-5.5 的優勢並非全面性。在測試實際 GitHub 問題解決能力的 SWE-Bench Pro 基準測試中,Anthropic 的 Claude Opus 4.7 以 64.3% 的分數超越 GPT-5.5 的 58.6%。在由 Scale AI 執行的工具使用基準測試 MCP Atlas 中,GPT-5.5 獲得 75.3%,仍落後於 Claude Opus 4.7 (79.1%) 和 Gemini 3.1 Pro (78.2%)。同時發佈的 GPT-5.5 Pro 型號,旨在作為更強大的「研究夥伴」,特別適合處理大量上下文的複雜工作負載。在網絡安全能力方面,OpenAI 將 GPT-5.5 歸類為「高」,並表示其在 CyberGym 基準測試中相較 GPT-5.4 有所改善,達到 81.8%。

API 價格翻倍但強調成本效益

GPT-5.5 Thinking 目前已對 ChatGPT 的 Plus、Pro、Business 和 Enterprise 用戶開放,而更強大的 GPT-5.5 Pro 則專供 Pro、Business 和 Enterprise 用戶使用。在 API 方面,OpenAI 為 GPT-5.5 設定的價格是每百萬輸入 Token 5 美元,每百萬輸出 Token 30 美元,上下文窗口為一百萬 Token,這正好是 GPT-5.4 價格的兩倍。儘管價格上漲,OpenAI 辯稱 GPT-5.5 的效率更高,在執行相同 Codex 任務時所需的 Token 數量顯著減少,從而降低了總體成本。OpenAI 表示,免費用戶的開放時間尚未公佈,而 API 將「很快」推出。

加入本站 WhatsApp 頻道最新限免情報立即知。

全新本站官方《限時情報王》 iOS 版 登場。限免已完結?不想錯過重大限免應用,可到本站追蹤 Telegram 頻道FacebookThreads