OpenAI 推出全新 AI 模型 GPT-5.2-Codex,旨在作為自主軟體代理處理複雜任務。這款模型不僅提升了長篇對話與程式碼分析的效率,更在圖像處理與 Windows 環境控制方面取得顯著進展,進一步強化了其在自動化軟體開發中的應用潛力。

重點文章
上下文壓縮技術提升處理效率
GPT‑5.2-Codex 以 GPT‑5.2 的優勢為基礎,延續 GPT‑5.1-Codex-Max 在前沿代理編碼與終端操作能力上的表現。透過增強的長篇上下文理解、可靠的工具呼叫、提升的事實準確性,以及原生壓縮能力,GPT‑5.2-Codex 成為長時間程式碼編寫任務中更可靠的合作夥伴,同時在推理過程中維持良好的 Token 使用效率。
GPT‑5.2-Codex 的視覺能力更強,能更準確地解讀在寫程式過程中分享的螢幕截圖、技術示意圖、圖表與使用者介面。在原生 Windows 環境中,GPT‑5.2-Codex 延續 GPT‑5.1-Codex-Max 導入的能力,在代理程式碼編寫方面效率更高、更加可靠。
GPT‑5.2-Codex 在 SWE-Bench Pro 與 Terminal-Bench 2.0 這兩項基準測試中,均達到業界領先水準。這些測試專門評估模型在真實終端環境中,處理多元任務的代理能力。
這些改進共同提升了模型在真實世界軟體工程任務中的整體表現,涵蓋從程式碼儲存庫的瀏覽與重構,到提取要求的建立與審查。


提升網路安全風險保護
隨著程式碼分析能力的提升,OpenAI 將該模型的網路安全風險評級調升至接近「高」等級。為了平衡防禦與攻擊風險,OpenAI 啟動了「信任存取計畫」,讓經過認證的專家能在放寬安全過濾器的情況下,利用模型尋找系統漏洞。例如 Andrew MacPherson 曾利用先前版本發現 React 框架中的多項未知漏洞,證明了 AI 系統能加速安全研究員的工作進度。

支援多種開發環境
目前 GPT-5.2-Codex 已開放給付費的 ChatGPT 用戶使用,開發者可透過指令列、開發環境及雲端平台進行整合。根據 OpenAI 的說明,該模型在解讀技術圖表與使用者介面截圖方面也經過優化,未來將推出第三方供應商介面,以支援更廣泛的自動化流程。