Gemini 3.5 Live Translate 支持 70 多种语言的实时语音翻译,但它并不是仅限 Gemini 应用的单一功能。Google 正在把这项能力整合到不同场景中,包括 Android 和 iOS 上的 Google 翻译、Gemini Live API 和 AI Studio,以及 Google Meet 私密预览版。访问权限、定价和会议支持取决于你使用的是哪个场景。

示例场景

你正在与圣保罗的一位客户进行视频通话,手机上打开了 Gemini Live,旁边放着笔记本电脑。翻译器确实在工作——Gemini 几乎实时地说出你的葡萄牙语回复。随后客户共享屏幕,带你逐条查看合同条款。Gemini 听不到浏览器标签页里的会议音频。它只能接收到你手机麦克风从桌面对面笔记本扬声器里拾取到的声音。翻译仍在继续。这种体验本质上是一种变通方案。

如果你在研究 Gemini Live 支持哪些翻译语言,你真正需要的是三件事:真实的语言覆盖范围、Google 到底在哪个场景里提供了它,以及对手机应用或预览版工作流在专业会议中会造成哪些缺口的诚实判断。本文会覆盖这些要点,并说明当你需要在视频通话本身中进行翻译时该用什么。

要点总结

Gemini Live 的翻译功能是什么?

Gemini 3.5 Live Translate 是 Google 面向低延迟口语交流推出的较新语音对语音翻译能力。在基于手机的场景中,流程很简单:你用一种语言说话,应用把内容翻译并用另一种语言说出来,对方回应,然后循环继续,直到你结束会话。

关键区别在于产品场景。Google 已宣布可通过 Android 和 iOS 上的 Google 翻译、通过 Gemini Live API 和 AI Studio 的公开预览版,以及 Google Meet 私密预览版提供该功能。Gemini 应用或 Google 翻译的手机流程仍然依赖手机麦克风;而 Meet 的推出则原生适用于会议,但受预览版和账号资格限制。

Gemini Live 与其他 Google 翻译产品有何不同

有三款 Google 产品涉及实时翻译,而且经常被混淆:

弄清楚你正在评估的是哪一款产品很重要。很多“Gemini Live translate”搜索会把手机口译、Google 翻译和 Google Meet 语音翻译混在一起。我们在 Google Meet 翻译语言指南中单独介绍了 Meet 相关层级。

Gemini Live 支持哪些翻译语言

Gemini 3.5 Live Translate 依托 Google 的语音和翻译基础设施。下表展示的是优先测试的一组实用语言,而不是完整的官方清单。Google 已宣布 Gemini 3.5 Live Translate 支持 70 多种语言,但在依赖某个特定语言对之前,你应先核实当前清单和产品场景,因为不同语言在 Google 翻译、Meet、API、AI Studio 和 Gemini 应用中的可用性可能不同。

语言 语音支持状态 备注
英语已支持主要语言;准确度基准最强
西班牙语(拉丁美洲)已支持口译模式有充分文档支持
法语已支持口译模式有充分文档支持
德语已支持口译模式有充分文档支持
意大利语已支持口译模式有充分文档支持
葡萄牙语(巴西)已支持口译模式有充分文档支持
日语已支持清晰音频下质量较好;请测试正式语体
韩语已支持口译模式有充分文档支持
中文普通话(简体)已支持质量较好;请核实专业词汇
印地语已支持请根据说话者方言核实质量
阿拉伯语已支持请测试现代标准阿拉伯语与地区方言
荷兰语扩展中请针对你的具体使用场景测试质量
印度尼西亚语扩展中请针对你的具体使用场景测试质量
波兰语扩展中请针对你的具体使用场景测试质量
土耳其语扩展中请针对你的具体使用场景测试质量
瑞典语扩展中请针对你的具体使用场景测试质量
丹麦语扩展中请针对你的具体使用场景测试质量
挪威语扩展中请针对你的具体使用场景测试质量
芬兰语扩展中请针对你的具体使用场景测试质量

来源:Google 2026 年 6 月公告说明 Gemini 3.5 Live Translate 支持 70 多种语言;上表展示的是常见已文档化语言对的部分选择。扩展中的语言在实时语音中的质量可能会有差异。在高风险会话前,请始终在 support.google.com/gemini 确认覆盖情况。

口译支持最强的语言

上表中的前十一种语言——主要欧洲语言加上日语、韩语、普通话、印地语和阿拉伯语——是需求最高、最值得优先测试的语言对。应把它们视为实用起点,而不是保证 Google 各个场景都提供相同质量或会话限制。

在依赖前需要核实的语言

荷兰语、印度尼西亚语、波兰语、土耳其语以及北欧语言在 2025 年期间扩展进了 Gemini Live 支持。某种语言在 Gemini 的文本界面中表现良好,并不意味着它在实时口语交流中也会同样稳定——尤其是在嘈杂环境或带有强烈地区口音时。若要用于客户会议或医疗预约,请先在低风险对话中测试你的具体语言对,再决定是否依赖它。

需要在 Zoom 或 Teams 会议里直接使用这些语言,而不是在另一部手机上?免费试用 MirrorCaption——它可在桌面版 Chrome 或 Edge 中捕获会议标签页音频,支持 50 多种语言翻译,而且无需安装应用或会议机器人。

如何将 Gemini Live Translate 用作实时口译

步骤 1 — 选择 Google 场景并确认访问权限

先确定你指的是 Google 翻译、Gemini 应用、Gemini Live API 或 AI Studio,还是 Google Meet。Google 翻译的推出、API 预览版、Meet 私密预览版和 Gemini 应用访问权限不一定共享相同的账号、套餐、地区或会话规则。在仅为了翻译而订阅任何付费 Google 套餐之前,请先确认当前要求。

步骤 2 — 打开相关的手机或会议场景

对于基于手机的口译,请打开 Android 或 iOS 上受支持的 Google 应用并选择语言对。将手机放置到麦克风能够清晰拾取双方说话内容的位置。对于 Google Meet 语音翻译,请使用 Meet 控件,并在通话开始前确认你的账号已获得访问权限。

步骤 3 — 轮流说话

说完一句后暂停,Gemini 会把内容翻译并用另一种语言说出来。对方再回应;Gemini 再翻译回来。这个循环会一直持续,直到你点击结束。为了获得最佳效果,请一次只说一句,并在说话者之间清晰停顿。来自开放式办公室或咖啡馆的背景噪音会降低源语言和目标语言的识别质量。

在依赖 Gemini Live 之前需要了解的关键限制

它无法在你的视频会议内部工作

这是专业用途最重要的限制。基于手机的 Google 翻译或 Gemini 应用流程使用的是手机麦克风,因此无法直接听到 Zoom 窗口、Teams 会议或 Google Meet 浏览器标签页中的音频。若要在视频通话旁边使用它们,你必须把手机靠近笔记本扬声器,这会降低质量,并让流程变成一种变通方案,而不是原生会议工作流。

如果翻译需求发生在会议本身——而不是旁边的对话——正确的架构是使用可直接捕获会议标签页音频的浏览器工具。这正是 MirrorCaption 的 Meet 模式所做的:它读取你在桌面版 Chrome 或 Edge 中打开的浏览器会议标签页里的音频,而且不会有机器人加入通话。

访问权限和定价因产品场景而异

不要默认只有一种订阅答案。Google 已宣布 Google 翻译面向所有人推出,而 Gemini Live API、AI Studio、Google Meet 私密预览版和 Gemini 应用访问权限可能有不同的账号或套餐要求。如果你仅为了翻译而评估某个付费 Google 套餐,请先确认该具体场景是否覆盖你的会议工作流。作个对比:MirrorCaption 的 Premium 是一次性 €99 购买,包含 200 小时托管翻译额度,没有 recurring fee。

没有转录或导出

Gemini Live 以语音为先。翻译是说出来的,不会被保存。会话结束后,不会有可搜索的文本记录。如果你需要书面记录——例如合同谈判、法律程序、合规文档,或者只是回顾双方达成了什么——Gemini Live 无法提供这一点。此时应选择支持转录导出的会议翻译工具。

会话时长限制因套餐而异

会话时长、预览版访问权限和使用限制会因产品场景和账号类型而异。在用于长时间对话前,请先查看相关的 Google 应用、API 控制台或 Meet 管理设置。

Gemini Live 翻译 vs. 原生会议工具

下表从最重要的场景维度比较了三种方案:面对面口译、在视频通话中翻译,以及保留书面记录。

功能 Gemini Live / Google 翻译手机流程 Google Meet 语音翻译 MirrorCaption
平台 手机应用场景;API 和 Meet 访问权限不同 Google Meet(Workspace) 桌面版 Chrome 或 Edge 浏览器
可在 Zoom/Teams/Meet 内使用 仅 Meet 可以(浏览器标签页音频捕获)
语音语言对 已宣布 70 多种语言;按场景核实 少量 beta 语言对——见 Google 的列表 50 多种可选语言
语音翻译输出 在受支持的手机场景中可以 在提供语音翻译的地方可以 可以(Speak Translations 功能)
保存文本转录 不保存到转录记录中 可以——可搜索、可导出
需要安装应用 手机流程通常需要 不需要(内置于 Meet) 不需要(浏览器 PWA)
说话者标记 可以
AI 会议摘要 可以
访问 / 定价 取决于 Google 翻译、Gemini 应用、API 或 AI Studio 场景 符合条件的 Google 套餐;受 beta 可用性限制 免费试用;Premium €99 一次性

基于手机的 Google 翻译流程对于日常面对面交流很有效,尤其是当你需要一个快速的口语口译,并且可以把手机放在双方说话者附近时。常见语言对的质量确实不错,但这种工作流与在会议标签页中翻译并不相同。

如果你的对话已经在 Google Meet 中进行、你拥有合适的 Workspace 套餐,而且你的语言对在其当前支持列表中,那么 Google Meet 语音翻译就是正确选择——在假定它覆盖你的语言对之前,请先查看 Google 的文档

当你需要在任何基于浏览器的视频通话中进行翻译、覆盖更广的语言集合、保留可导出的转录,并且以固定成本使用而没有月度绑定时,MirrorCaption 才是正确选择。

每月要翻译的通话超过几次?

在仅为了翻译而付费购买 Google 套餐之前,请先确认该具体场景是否覆盖你的使用需求。基于手机的流程并不等同于 Zoom 或 Teams 标签页音频捕获。MirrorCaption Premium 是一次性 €99 购买:50 多种语言、基于浏览器的会议音频捕获、可搜索转录,以及包含未来所有更新。需要更多时长时可购买 Voice Pack 充值。

免费开始 — 无需信用卡

当 Gemini Live 不适合你的会议时该用什么

示例

一家咨询公司的口译员需要在视频证词中进行实时翻译——法语证人、英语律师。Gemini Live 在手机上适合准备会议。可在正式证词中,公司需要翻译以可搜索文本的形式显示在会议窗口里,并按说话者标注时间戳。把 Gemini 的语音输出放在桌上的手机里并不够。他们改用一款基于浏览器的工具,直接捕获 Zoom 标签页的音频,并在第二个窗口中同时显示转录和翻译——没有机器人加入通话,录制或共享通知仍由会议平台自身设置控制。

MirrorCaption 的 Meet 模式就是为这种场景设计的。在桌面上打开第二个 Chrome 或 Edge 标签页,分享会议标签页音频,它会实时流式输出转录和翻译——逐词显示,延迟低于一秒。说话者识别会标注是谁说了什么。转录和翻译并排显示,并在会话结束时导出为 Markdown 或纯文本。

它支持 50 多种可选语言,包括一些可能超出 Gemini Live 当前语音支持范围的语言,因此更适合跨亚洲、中东或较少见的欧洲语言协作的团队。首小时免费——无需信用卡——因此你可以很容易在下一次通话中测试。查看它与其他 2026 年会议翻译工具的对比,或立即在浏览器中打开

常见问题

Gemini Live 支持哪些语言进行实时翻译?

Gemini 3.5 Live Translate 支持 70 多种语言的语音口译。常见的高需求语言对包括英语、西班牙语、法语、德语、意大利语、葡萄牙语(巴西)、日语、韩语、印地语、阿拉伯语和中文普通话。荷兰语、印度尼西亚语、波兰语、土耳其语、瑞典语、丹麦语、挪威语和芬兰语等语言也可能可用,具体取决于场景和推出状态,但质量会因使用场景而异。对于高风险对话,在依赖某个特定语言对之前,请始终核实准确的产品场景。

Gemini Live 翻译是免费的吗?

这取决于场景。Google 已宣布 Google 翻译广泛可用,而 Gemini 应用、API、AI Studio 和 Meet 的访问权限可能因预览状态、账号、地区和套餐而异。在订阅之前,请先确认你计划使用的具体产品当前属于哪个访问层级。

Gemini Live 能翻译 Zoom 或 Teams 会议吗?

不能直接翻译。基于手机的 Google 翻译或 Gemini 应用流程使用手机麦克风,无法捕获 Zoom、Teams 或 Google Meet 浏览器标签页中的音频。Google Meet 语音翻译是单独的功能,仅适用于符合条件账号的 Meet 内部。如果你需要在 Meet 之外进行会议内实时翻译,像 MirrorCaption 这样的浏览器工具可以直接在桌面版 Chrome 或 Edge 中捕获会议标签页音频,而且不会有机器人加入通话。

Gemini Live 和 Google Meet 翻译字幕有什么区别?

它们是不同的产品。Gemini 3.5 Live Translate 是一种正在整合到多个 Google 场景中的语音翻译能力。Google Meet 翻译字幕会在 Meet 通话中以另一种语言显示文本字幕,但不会生成语音翻译。Google Meet 语音翻译则是 Meet 中的语音功能,拥有自己符合条件的账号和 beta 限制。关于 Google Meet 各翻译层级的详细说明,请参阅我们的 Google Meet 翻译语言指南

Gemini Live 支持中文或日语翻译吗?

普通话和日语是常见的高需求优先测试语言,但可用性仍可能因 Google 场景和推出状态而异。清晰、安静环境下的音频通常效果最好。对于商务用途——尤其是涉及专业词汇、正式语体或带有强烈地区口音的说话者时——请在真正的客户通话前先进行一次测试会话。对于像日语这样语境要求较高的语言,日常对话质量与商务关键质量之间的差距可能很明显。

Gemini Live 实时翻译的准确度如何?

Gemini Live 使用 Google 的 AI 模型,在干净音频和常见语言对上表现良好。在嘈杂环境、重口音,或术语偏离日常口语的专业领域中,准确度会下降。对于那些漏掉细微差别会带来业务后果的会议——合同条款、医疗指示、法律程序——一款能把周边转录上下文输入每次翻译调用的专用会议翻译工具,可能比通用对话式 AI 表现更好。关于不同工具的准确度比较,请参阅我们的 实时翻译准确度指南

需要在会议中直接翻译?

MirrorCaption 可在桌面版 Chrome 或 Edge 中捕获浏览器会议标签页音频。50 多种语言、说话者标记、可导出转录。首小时免费试用——无需信用卡,无需安装。

免费开始

结论

Gemini 3.5 Live Translate 在语音翻译方面很有前景,尤其是在 Google 翻译和基于手机的对话流程中,只要手机麦克风足够用即可。在这些场景下,主流语言对的质量可以相当不错,而且设置很快。

对于专业会议翻译——在 Zoom、Teams 或 Meet 内,带可搜索转录、可预测访问权限以及浏览器标签页音频捕获——手机应用架构通常并不合适。我们的 2026 年会议翻译工具盘点会并排比较主要选项。如果你想直接测试基于浏览器的会议翻译,MirrorCaption 的首小时免费