Google 正式發佈 Gemini 3.5 Live Translate，這是一款可即時轉譯語音的 AI 模型，支援超過 70 種語言。該模型能夠自動偵測說話者的語言，並在翻譯過程中保留原始語調、節奏與音高；同時無需等待句子結束即可連續翻譯，大幅提升對話流暢度。

重點文章

語音翻譯技術特點

根據 Google 說明，Gemini 3.5 Live Translate 的翻譯品質不僅準確，還能模仿原說話者的語氣與情緒。所有生成的音訊都會加入人耳無法察覺的 SynthID 浮水印，便於後續追蹤與驗證。叫車平台 Grab 據傳正在測試這項模型，用於改善司機與乘客之間的多語言溝通。

開發者與企業可用性

目前開發者可透過 Gemini Live API 及 Google AI Studio 取得 Gemini 3.5 Live Translate；企業用戶則能在 Google Meet 中先以預覽版體驗，語種支援從原本的 5 種一舉擴展至超過 70 種，涵蓋 2,000 多種語言組合。Android 與 iOS 版 Google 翻譯應用程式也同步向所有用戶開放此功能。

消息來源

Google 推出 Gemini 3.5 Live Translate 即時翻譯支援 70 種語言

重點文章

語音翻譯技術特點

開發者與企業可用性

相關文章

Google 推出 Gemini 3.5 Live Translate　即時翻譯支援 70 種語言