Google 正式發佈 Gemini 3.5 Live Translate,這是一款可即時轉譯語音的 AI 模型,支援超過 70 種語言。該模型能夠自動偵測說話者的語言,並在翻譯過程中保留原始語調、節奏與音高;同時無需等待句子結束即可連續翻譯,大幅提升對話流暢度。
重點文章
語音翻譯技術特點
根據 Google 說明,Gemini 3.5 Live Translate 的翻譯品質不僅準確,還能模仿原說話者的語氣與情緒。所有生成的音訊都會加入人耳無法察覺的 SynthID 浮水印,便於後續追蹤與驗證。叫車平台 Grab 據傳正在測試這項模型,用於改善司機與乘客之間的多語言溝通。
開發者與企業可用性
目前開發者可透過 Gemini Live API 及 Google AI Studio 取得 Gemini 3.5 Live Translate;企業用戶則能在 Google Meet 中先以預覽版體驗,語種支援從原本的 5 種一舉擴展至超過 70 種,涵蓋 2,000 多種語言組合。Android 與 iOS 版 Google 翻譯應用程式也同步向所有用戶開放此功能。
