Gemini 3.5 Live Translate 登場:即時語音翻譯走進 API、Meet 與 Translate

Google 於 2026 年 6 月 10 日推出 Gemini 3.5 Live Translate,把低延遲語音翻譯帶到 Gemini Live API、Google Meet 和 Google Translate。

Google 在 2026 年 6 月 10 日公布 Gemini 3.5 Live Translate,將接近即時、自然語音翻譯帶到多個產品:開發者可透過 Gemini Live API 和 Google AI Studio 使用 public preview,企業可於本月開始在 Google Meet private preview 測試,一般用戶則會在 Android 和 iOS 的 Google Translate 逐步看到新體驗。

這次更新的重點,是語音翻譯由「一句句處理」走向串流式互動。Gemini 3.5 Live Translate 會在語音輸入持續進來時處理內容,降低等待感,並支援多語言輸入,不需要使用者手動設定語言。Google 亦強調模型在嘈雜和不可預測環境中更穩定,這對真實會議、課堂、直播和客戶支援場景很重要。

在 Google Meet 裏,這項能力會把語音翻譯由過去較有限的語言組合,擴展至 70 多種語言和 2,000 多種語言組合。更關鍵的是,它不再只圍繞英文來回翻譯。對跨地區團隊來說,這會令多語會議更接近自然對話,而不是每個人都要把英文當作中轉站。

對開發者而言,Gemini Live API 是另一個值得留意的入口。即時語音翻譯不只可用於會議,也可以嵌入教育、客服、醫療接待、跨境銷售、活動直播和社群產品。當模型可以處理持續音訊、語言偵測和自然語音輸出,翻譯就不再只是文字功能,而是互動介面的一部分。

企業採用時仍要處理實際邊界。即時翻譯會碰到專業詞彙、口音、背景噪音、私隱、錄音政策和責任歸屬等問題。若用於客戶溝通或內部決策,最好保留人工確認、關鍵摘要和原文記錄,避免把翻譯輸出當作唯一事實來源。

整體而言,Gemini 3.5 Live Translate 顯示多模態 AI 正由內容生成走向溝通基建。當同一模型能力可以進入 API、會議和消費級翻譯工具,語言障礙會逐漸由人工流程問題,變成可嵌入產品和工作流的即時服務。

MODULE.002 //

更多 Insights

分享網站、AI automation、數碼營銷、AI news 和 VMTS 公司新聞。