OpenAI 已發佈其最新的編碼模型 GPT-5.3-Codex。該公司表示,它結合了 GPT-5.2-Codex 的編碼能力與 GPT-5.2 的推理和知識,同時運行速度快 25%。最值得注意的是,在 Terminal-Bench 2.0 上,它擊敗了剛發佈的 Opus 4.6 達 12 個百分點——以當前的 AI 標準來看是顯著的差距——同時使用的標記比其前身更少。在代理電腦操作基準測試 OSWorld 上,它的分數為 64.7%,而 GPT-5.2-Codex 則為 38.2%。在 OpenAI 用於評估 44 種職業知識型工作任務的基準測試 GDPval 上,它的表現與 GPT-5.2 持平。

重點文章
AI 模型自驅開發效率驚人
OpenAI 還表示,該模型在其自身開發中發揮了作用,團隊使用早期版本來尋找訓練期間的錯誤、管理部署並評估結果。該公司表示,團隊對於 Codex 能夠如此顯著地加速自身開發感到「非常震驚」。


模型現已開放使用
GPT-5.3-Codex 現在可供付費的 ChatGPT 用戶透過 Codex 應用程式、CLI、IDE 擴充功能和網頁版使用。API 存取將隨後開放。OpenAI 已將該模型歸類為其首個「高」網絡安全風險評級的模型,儘管該公司表示這是預防性措施,因為沒有確鑿證據表明此類分類是必需的。