Google 在 2026 年 6 月 10 日公布 Gemini 3.5 Live Translate，將接近即時、自然語音翻譯帶到多個產品：開發者可透過 Gemini Live API 和 Google AI Studio 使用 public preview，企業可於本月開始在 Google Meet private preview 測試，一般用戶則會在 Android 和 iOS 的 Google Translate 逐步看到新體驗。

這次更新的重點，是語音翻譯由「一句句處理」走向串流式互動。Gemini 3.5 Live Translate 會在語音輸入持續進來時處理內容，降低等待感，並支援多語言輸入，不需要使用者手動設定語言。Google 亦強調模型在嘈雜和不可預測環境中更穩定，這對真實會議、課堂、直播和客戶支援場景很重要。

在 Google Meet 裏，這項能力會把語音翻譯由過去較有限的語言組合，擴展至 70 多種語言和 2,000 多種語言組合。更關鍵的是，它不再只圍繞英文來回翻譯。對跨地區團隊來說，這會令多語會議更接近自然對話，而不是每個人都要把英文當作中轉站。

對開發者而言，Gemini Live API 是另一個值得留意的入口。即時語音翻譯不只可用於會議，也可以嵌入教育、客服、醫療接待、跨境銷售、活動直播和社群產品。當模型可以處理持續音訊、語言偵測和自然語音輸出，翻譯就不再只是文字功能，而是互動介面的一部分。

企業採用時仍要處理實際邊界。即時翻譯會碰到專業詞彙、口音、背景噪音、私隱、錄音政策和責任歸屬等問題。若用於客戶溝通或內部決策，最好保留人工確認、關鍵摘要和原文記錄，避免把翻譯輸出當作唯一事實來源。

整體而言，Gemini 3.5 Live Translate 顯示多模態 AI 正由內容生成走向溝通基建。當同一模型能力可以進入 API、會議和消費級翻譯工具，語言障礙會逐漸由人工流程問題，變成可嵌入產品和工作流的即時服務。

Gemini 3.5 Live Translate 登場：即時語音翻譯走進 API、Meet 與 Translate

更多 Insights

NVIDIA Blackwell 領先 AgentPerf：AI agent 基建開始有專用效能指標

GitHub Copilot metrics：企業開始量度 code-first、agent-first 同 multi-agent 採用

TCS 與 Anthropic 建立全球合作：Claude 正進入受監管行業交付