Google 正式發佈了 Gemini 3.1 Pro 模型,這款升級版模型在問題解決能力上實現了重大飛躍。目前該模型已作為預覽版向開發者、企業及一般用戶開放,旨在將原本屬於 Deep Think 領域的複雜任務處理能力普及到日常應用中。與前代相比,Gemini 3.1 Pro 在核心智能表現上顯著增強,特別是在處理科學研究、工程設計與複雜邏輯推理方面展現了卓越的實力。

重點文章
推理性能提升超過兩倍
在針對抽象邏輯任務的 ARC-AGI-2 基準測試中,Gemini 3.1 Pro 取得了 77.1% 的優異成績,與 Gemini 3 Pro 的 31.1% 相比提升超過兩倍。這一數據不僅超越了 Anthropic 的 Opus 4.6(68.8%)與 OpenAI 的 GPT-5.2(52.9%),更鞏固了 Google 在 AI 領域的技術領先地位。除了邏輯推理,該模型在科學知識測試 GPQA Diamond 及多項代理任務基準測試中也表現出色,展現出強大的程式碼編寫與自主操作能力。

加速自動化工作流應用
Google 展示了 Gemini 3.1 Pro 在實際應用中的潛力,例如模型能獨立配置公共遙測數據串流,以視覺化方式呈現國際太空站的軌道,或是直接根據文字指令生成動畫 SVG 與構建完整網站。雖然在多模態測試 MMMU Pro 中,前代型號仍略微領先,且 Anthropic 的模型在某些工具使用效率上仍具優勢,但 Gemini 3.1 Pro 透過更強大的推理能力,有效縮短了複雜 API 與用戶友好設計之間的差距,為自動化工作流提供了更穩定、更智能的支援。
採分層定價策略降低企業成本
目前 Google 已在多個平台同步推出 Gemini 3.1 Pro,開發者可透過 Gemini API、Google AI Studio 及 Android Studio 存取,而企業用戶則可經由 Vertex AI 使用。在定價策略上,API 費用根據提示長度縮放,整體成本顯著低於 Anthropic 的 Opus 模型,具有極高的競爭力。Google 表示將持續根據用戶回饋調整模型,特別是針對具有野心的代理工作流進行優化,以確保未來正式版本能更精準地滿足市場需求。