OpenAI 發佈 GPT-5.4 模型 整合編碼與電腦操作能力

openai 6

OpenAI 正式發佈目前最強大的 GPT-5.4 模型,首次將編碼、電腦操作與推理功能整合於單一系統中。這款模型包含適用於 ChatGPT 的 GPT-5.4 Thinking 以及專為複雜任務設計的 GPT-5.4 Pro,被譽為專業工作領域中效率最高的尖端模型。GPT-5.4 整合了先前版本在編碼上的優勢,並顯著提升了代理工作流(agentic workflows)的表現。

openai 7

跨行業表現超越人類專業人士

在針對美國 GDP 貢獻最大的 44 種職業測試中,GPT-5.4 的得分達到 83.0%,表現與行業專業人士持平甚至更高。特別是在金融投資建模任務中,其準確率從舊型號的 68.4% 大幅提升至 87.3%。此外,OpenAI 透過提升視覺感知能力,讓模型能以高達 1,024 萬像素的解析度處理圖片,進一步降低了文檔解析的錯誤率,使其成為辦公自動化的重要工具。

screenshot 90

原生電腦操作功能打破自動化瓶頸

GPT-5.4 是 OpenAI 首款具備原生電腦操作能力的通用模型,能透過螢幕截圖、滑鼠與鍵盤輸入,自主控制網站與軟體。在桌面環境導航測試中,該模型以 75.0% 的成功率首度超越人類受試者的平均表現。針對編碼需求,新加入的快進模式使權杖生成速度提升 1.5 倍,並支援高達 100 萬個權杖的上下文窗口,有助於處理長期的專案規劃與執行任務。

screenshot 92
Screenshot

網絡安全評級突破

雖然 GPT-5.4 的 API 定價有所調整,但 OpenAI 表示透過全新的工具搜索技術,可減少近 47% 的權杖消耗,從而抵銷成本。在安全防護方面,GPT-5.4 成為首個在網絡安全領域獲得「高能力」評級的通用推理模型,具備自動化尋找漏洞的潛力。為此,系統內建了兩階段監控機制,由 AI 安全分析師進行即時攔截,在提升效能的同時,也顯著加強了對抗惡意攻擊的防禦能力。

加入本站 WhatsApp 頻道最新限免情報立即知。

全新本站官方《限時情報王》 iOS 版 登場。限免已完結?不想錯過重大限免應用,可到本站追蹤 Telegram 頻道FacebookThreads