ChatGPT 推出 GPT-5.5 Instant 減少幻覺並提升個人化回應

chatgpt

OpenAI 將 ChatGPT 的預設 AI 模型替換為 GPT-5.5 Instant。此更新旨在減少模型的幻覺問題並使回應更精簡。一項名為「記憶來源」的新功能則能讓用戶查看哪些儲存的上下文塑造了特定回覆。

screenshot 899

幻覺大幅減少

GPT-5.5 Instant 取代了 GPT-5.3 Instant,並透過 API 以「chat-latest」提供。OpenAI 在內部測試中指出,GPT-5.5 Instant 在醫學、法律和金融等高風險提示語中,其幻覺聲明比前一代減少了 52.5%。在用戶先前標記為事實錯誤的困難對話中,不準確的聲明下降了 37.3%。OpenAI 舉例說明,在解決一個代數問題時,GPT-5.5 Instant 能夠糾正用戶的計算錯誤並得出正確的結果,而 GPT-5.3 Instant 則未能正確處理。


多項基準測試分數也印證了這一點。在 2026 年 AIME 數學競賽中,準確率從 65.4% 躍升至 81.2%。測試博士級科學推理能力的 GPQA 則從 78.5% 提高到 85.6%。在解釋和推理科學圖表的 CharXiv 基準測試中,準確率從 75.0% 上升至 81.6%。衡量模型處理跨文本和圖像專業級問題能力的 MMMU-Pro,其分數從 69.2% 增長到 76.0%。而用於從複雜文件中提取結構化數據的 OmniDocBench 錯誤率,則從 14.6% 下降到 12.5%。

精簡回應與提升個人化體驗

OpenAI 也致力於精簡模型的回應。公司表示,現在的回覆更簡潔,但內容不失其本質;模型減少了不必要的追問、多餘的表情符號以及過度繁複的格式。OpenAI 指出,新模型在提供相同資訊時,通常比舊模型更具實用性,同時減少了冗詞贅句和過度格式化的情況,避免回覆過長。此外,當用戶開啟相關功能時,該模型能更好地利用過去對話、上傳文件及已連結 Gmail 帳戶的上下文資訊。據稱,GPT-5.5 Instant 在判斷何時提供額外個人化協助方面表現更佳,並且能更快地搜尋之前的對話。
OpenAI 也為所有 ChatGPT 模型推出了「記憶來源」功能。當回覆引用了儲存的上下文時,用戶現在可以查看使用了哪些資訊,無論是已儲存的筆記還是過去的對話。這些條目可以被標記為相關或不相關,並進行編輯或刪除。然而,OpenAI 稱記憶來源不一定會顯示所有影響回覆的因素,例如,模型搜尋的部分對話可能不會顯示為來源。公司計劃未來逐步完善此視圖。記憶來源在對話共享時不會傳遞,臨時對話也不會讀取或更新記憶。

逐步推出至各訂閱方案

OpenAI 表示,GPT-5.5 Instant 正即時向所有 ChatGPT 用戶推出。付費訂閱者在 GPT-5.3 Instant 模型退役前,仍可透過模型設定存取其服務,為期三個月。基於過去對話、文件和 Gmail 的增強型個人化功能,將首先在網頁版上為 Plus 和 Pro 用戶推出,行動裝置版本將稍後提供。免費、Go、Business 和 Enterprise 方案預計將在未來數週內獲得存取權。記憶來源功能將首先向所有網頁版的消費者方案推出,隨後是行動裝置。部分個人化功能可能不會在所有地區提供。OpenAI 最近將 GPT-5.5 Thinking 作為更高階的模型推出,而 GPT-5.5 Instant 則作為 ChatGPT 的日常預設模型。Thinking 版本的功能依然更強大:據稱它在網絡安全任務上能與 Claude Mythos 媲美,並取代了專門的 Codex 編碼模型。

與 ChatGPT 相關的圖片

加入本站 WhatsApp 頻道最新限免情報立即知。

全新本站官方《限時情報王》 iOS 版 登場。限免已完結?不想錯過重大限免應用,可到本站追蹤 Telegram 頻道FacebookThreads