OpenAI 發佈 GPT-5.4 模型　整合編碼與電腦操作能力

OpenAI 正式發佈目前最強大的 GPT-5.4 模型，首次將編碼、電腦操作與推理功能整合於單一系統中。這款模型包含適用於 ChatGPT 的 GPT-5.4 Thinking 以及專為複雜任務設計的 GPT-5.4 Pro，被譽為專業工作領域中效率最高的尖端模型。GPT-5.4 整合了先前版本在編碼上的優勢，並顯著提升了代理工作流（agentic workflows）的表現。

重點文章

跨行業表現超越人類專業人士

在針對美國 GDP 貢獻最大的 44 種職業測試中，GPT-5.4 的得分達到 83.0%，表現與行業專業人士持平甚至更高。特別是在金融投資建模任務中，其準確率從舊型號的 68.4% 大幅提升至 87.3%。此外，OpenAI 透過提升視覺感知能力，讓模型能以高達 1,024 萬像素的解析度處理圖片，進一步降低了文檔解析的錯誤率，使其成為辦公自動化的重要工具。

原生電腦操作功能打破自動化瓶頸

GPT-5.4 是 OpenAI 首款具備原生電腦操作能力的通用模型，能透過螢幕截圖、滑鼠與鍵盤輸入，自主控制網站與軟體。在桌面環境導航測試中，該模型以 75.0% 的成功率首度超越人類受試者的平均表現。針對編碼需求，新加入的快進模式使權杖生成速度提升 1.5 倍，並支援高達 100 萬個權杖的上下文窗口，有助於處理長期的專案規劃與執行任務。

網絡安全評級突破

雖然 GPT-5.4 的 API 定價有所調整，但 OpenAI 表示透過全新的工具搜索技術，可減少近 47% 的權杖消耗，從而抵銷成本。在安全防護方面，GPT-5.4 成為首個在網絡安全領域獲得「高能力」評級的通用推理模型，具備自動化尋找漏洞的潛力。為此，系統內建了兩階段監控機制，由 AI 安全分析師進行即時攔截，在提升效能的同時，也顯著加強了對抗惡意攻擊的防禦能力。

OpenAI 發佈 GPT-5.4 模型 整合編碼與電腦操作能力

重點文章

跨行業表現超越人類專業人士

原生電腦操作功能打破自動化瓶頸

網絡安全評級突破

相關文章

OpenAI 發佈 GPT-5.4 模型　整合編碼與電腦操作能力