Google 于 6 月 9 日在官方部落格宣布推出 Gemini 3.5 Live Translate,这是 Gemini Live API 的最新音讯模型,目标是消除即时语音翻译中因等待整句结束而产生的对话停顿。Gemini 3.5 Live Translate 自动侦测 70 多种语言,采用持续生成方式输出翻译。 Gemini 3.5 Live Translate 的已确认技术特性 翻译机制: Gemini 3.5 Live Translate 采用「语音对语音」翻译方式,动态在「等待更多上下文以提升准确度」与「立即输出以跟上说话者」之间即时调整,整体翻译落差为数秒。 语音特征保留: 翻译输出保留说话者的语调(intonation)、节奏(pacing)与音高(pitch),而非以统一机器语音呈现。 与前代的差异(Google 官方确认): 此前的语音翻译系统需等待说话者讲完完整一句才开始翻译,造成对话中断;Gemini 3.5 Live Translate 以持续生成方式取代此等待机制。 三个已确认的同日上线管道 开发者公开预览: Gemini Live API 与 Googl