GPT-5.5 API 價格翻倍　強調成本效益更高

OpenAI 正式發佈了 GPT-5.5 代理式模型，聲稱其達到了「用於實際工作和驅動代理程式的新一代智能」。這款模型旨在自主執行複雜任務，能夠跨多種工具獨立完成工作，並檢查其自身的輸出。儘管其 API 價格比上一代模型翻倍，但 OpenAI 強調 GPT-5.5 在效率上有所提升。目前，GPT-5.5 已向付費的 ChatGPT 及 Codex 用戶開放。

重點文章

提升代理式工作流程與長上下文處理能力

OpenAI 表示，GPT-5.5 在程式碼編寫與除錯、網路研究、數據分析、文件與試算表創建，以及軟體操作方面表現突出。該模型能夠獨立地在不同工具之間切換，直至任務完成。OpenAI 指出，GPT-5.5 的主要提升集中在代理式程式設計、電腦使用、知識工作和早期科學研究等四個領域，這些都需要跨情境推理和長時間執行動作的能力。在針對代理式工作流程的 Terminal-Bench 2.0 編碼基準測試中，GPT-5.5 取得 82.7% 的分數，超越前身 GPT-5.4 的 75.1%，同時在困難數學問題上的優勢更為明顯。此外，GPT-5.5 的長上下文處理能力也大幅改善，在 MRCR v2 基準測試中，其在 512K 至 1M Token 的上下文長度下，準確率從 GPT-5.4 的 36.6% 躍升至 74.0%。

gpt 5 5 api pricing twice as expensive as gpt 5 4 v0 yvcpzespmzwg1

優勢並非全面性

然而，GPT-5.5 的優勢並非全面性。在測試實際 GitHub 問題解決能力的 SWE-Bench Pro 基準測試中，Anthropic 的 Claude Opus 4.7 以 64.3% 的分數超越 GPT-5.5 的 58.6%。在由 Scale AI 執行的工具使用基準測試 MCP Atlas 中，GPT-5.5 獲得 75.3%，仍落後於 Claude Opus 4.7 (79.1%) 和 Gemini 3.1 Pro (78.2%)。同時發佈的 GPT-5.5 Pro 型號，旨在作為更強大的「研究夥伴」，特別適合處理大量上下文的複雜工作負載。在網絡安全能力方面，OpenAI 將 GPT-5.5 歸類為「高」，並表示其在 CyberGym 基準測試中相較 GPT-5.4 有所改善，達到 81.8%。

API 價格翻倍但強調成本效益

GPT-5.5 Thinking 目前已對 ChatGPT 的 Plus、Pro、Business 和 Enterprise 用戶開放，而更強大的 GPT-5.5 Pro 則專供 Pro、Business 和 Enterprise 用戶使用。在 API 方面，OpenAI 為 GPT-5.5 設定的價格是每百萬輸入 Token 5 美元，每百萬輸出 Token 30 美元，上下文窗口為一百萬 Token，這正好是 GPT-5.4 價格的兩倍。儘管價格上漲，OpenAI 辯稱 GPT-5.5 的效率更高，在執行相同 Codex 任務時所需的 Token 數量顯著減少，從而降低了總體成本。OpenAI 表示，免費用戶的開放時間尚未公佈，而 API 將「很快」推出。

GPT-5.5 API 價格翻倍 強調成本效益更高

重點文章

提升代理式工作流程與長上下文處理能力

優勢並非全面性

API 價格翻倍但強調成本效益

相關文章

GPT-5.5 API 價格翻倍　強調成本效益更高