OpenRouter 推出 Fusion 將多款平價模型組合起來表現跟 Fable 5 看齊

fusion benchmark

OpenRouter 宣布推出新工具 Fusion,主打將多個 AI 模型同時投入同一任務,再由一個「judge model」分析、比較及整合答案。這種做法不再單純依賴單一最強模型,而是讓不同模型各自提出觀點、使用工具搜尋資料,再由系統合成最終回應。OpenRouter 表示,Fusion 特別適合深度研究、複雜分析和需要多角度判斷的任務。

多模型組合表現可超越單一模型

根據 OpenRouter 公布的測試,Fusion 在 DRACO deep research benchmark 的 100 個深度研究任務中取得亮眼成績。其中 Fable 5 + GPT-5.5 經 Opus 4.8 合成後取得 69.0%,高於 Fable 5 單獨使用的 65.3%。另一組由 Opus 4.8、GPT-5.5 及 Gemini 3.1 Pro 組成的面板亦取得 68.3%,顯示多模型協作有機會比單一前沿模型更穩定。

fusion benchmark chart

平價模型組合成焦點

除了高階模型組合外,OpenRouter 亦測試了較低成本的模型面板。由 Gemini 3 Flash、Kimi K2.6 及 DeepSeek V4 Pro 組成的 budget panel 取得 64.7%,高於 GPT-5.5 單獨使用的 60.0% 及 Claude Opus 4.8 的 58.8%。OpenRouter 指出,這組平價模型的成本約為 Fable 5 的一半,但表現只落後不到 1 個百分點,反映多模型策略可能帶來更高性價比。

fusion benchmark cost

AI 競爭走向「模型合議」新方向

Fusion 的出現,反映 AI 產業競爭正由「誰擁有最強單一模型」,逐步轉向「如何有效整合多個模型」。對開發者和企業而言,這種模式或可應用於研究報告、技術分析、產品比較、法律及金融資料整理等場景。不過,Fusion 仍面對成本、延遲、評審模型可靠性,以及不同模型答案互相矛盾時如何判斷等挑戰,實際效果仍需更多應用場景驗證。

加入本站 WhatsApp 頻道最新限免情報立即知。

全新本站官方《限時情報王》 iOS 版 登場。限免已完結?不想錯過重大限免應用,可到本站追蹤 Telegram 頻道FacebookThreads