到 2026 年,你可以在无需插件或机器人的情况下实时翻译 Zoom、Teams 或 Google Meet——最简洁的方案是像 MirrorCaption 这样的浏览器标签页工具(在 Chrome 或 Edge 中打开,不会有任何东西加入你的通话,支持 50+ 可选语言,Premium 一次性 €99)。另外,各平台也提供原生翻译:Zoom 的翻译字幕需要符合条件的主持人套餐或附加组件,Google Meet 语音翻译在上线时仅支持英语配对,而 Teams 的实时翻译字幕则需要 Teams Premium 或 Microsoft 365 Copilot。这三者都会把你锁定在单一平台内。

2026 年 3 月,Google 开始将部分机器人式加入请求分流到更高风险的候厅队列,在机器人进入通话前增加了阻力。Microsoft Teams 为外部自动化会议助手增加了策略控制,默认情况下,检测到的机器人会被路由到候厅等待批准。过去依赖 Fireflies 或 Otter 等工具的团队,几乎在一夜之间就不得不重新考虑他们的设置。

本指南会梳理每一种方案、设置所需条件、成本,以及各自的短板,帮助你一次做出决定,不必反复纠结。

要点总结

为什么机器人在 2026 年越来越容易被拦截

2026 年 3 月,Google 更新了 Meet 的入会流程,将候厅中的参与者分流到不同的风险队列。机器人式记要工具可能会进入“潜在风险”流程,主持人必须在机器人加入前明确选择允许或拒绝。

Microsoft 的 Teams 会议策略文档现在为第三方自动化机器人和会议助手定义了外部机器人访问模式。默认值 RequireApprovalWhenDetected 会将检测到的机器人路由到候厅,等待组织者批准;管理员也可以允许所有机器人或阻止检测到的机器人。

有三种力量叠加放大了这种阻力:

结果就是:对于越来越多的专业场景,基于机器人的翻译正变得不那么可预测。这也是为什么团队越来越多地在寻找不以参与者身份加入通话的会议翻译方案。

MirrorCaption 从不加入你的会议。它在浏览器标签页中与你的通话并行运行。

免费试用 — 1 小时,无需卡

“无机器人”并不等于“无需安装”

当你搜索无机器人会议翻译时,三种不同的技术路径会以同一个营销说法出现。它们实际上差别很大,而如果你的瓶颈是 IT 审批,这种差别就尤为重要。

Chrome 扩展程序(Otter.ai extension、Tactiq)

扩展程序安装在你的浏览器配置文件中,并从当前标签页或麦克风捕获音频。没有机器人加入会议,其他参与者也看不到任何东西。但扩展程序存在于你的浏览器里——必须有人安装并维护它,而且它只能在安装它的浏览器中工作。Firefox 用户以及依赖 Zoom 或 Teams 桌面应用的人都不在适用范围内。

桌面捕获应用(JotMe、SuperIntern)

原生桌面应用会直接从操作系统的音频输出中捕获系统音频。无论你使用哪种浏览器或会议客户端,它都能工作——通话中依然不会出现可见机器人。但它需要下载并安装原生的 Mac 或 Windows 应用,IT 部门在部署前可能仍需审查并批准。

浏览器标签页工具(MirrorCaption)

浏览器标签页工具以网页形式打开。MirrorCaption 在桌面版 Chrome 或 Edge 的一个标签页中运行,与你的会议标签页并行,并使用浏览器内置的显示捕获机制来捕获该标签页的音频——这与浏览器在你进行屏幕共享时共享标签页所使用的 API 相同。无需下载,无需扩展程序,无需桌面客户端。负责翻译的人只需打开一个 URL。其他人什么也看不到,因为没有任何东西以参与者身份加入通话。

方案 示例工具 会安装东西吗? 任何浏览器都能用吗? 对其他人可见吗?
Chrome 扩展程序 Otter extension、Tactiq 是(浏览器扩展) 仅 Chrome/Edge
桌面捕获应用 JotMe、SuperIntern 是(原生应用) 是(任何浏览器/应用)
浏览器标签页工具 MirrorCaption 否(打开一个 URL) Meet 模式需 Chrome/Edge

对于 IT 审批是瓶颈的团队来说,“需要浏览器扩展”与“完全不需要任何东西”之间的区别,比任何功能对比都更重要。一个能在 Chrome 中打开的 URL,通常已经符合大多数企业浏览器策略。而新的浏览器扩展或原生应用通常并不符合。

原生平台翻译实际覆盖什么

如今,每个主流会议平台都提供某种内置翻译。下面是它实际覆盖的内容、成本,以及它止步于何处。

Zoom 翻译字幕

Zoom 的翻译字幕功能允许主持人在会议和网络研讨会中启用实时翻译。它要求主持人使用符合条件的 Zoom Workplace 套餐——Business Plus、Enterprise Essentials、Enterprise Plus、Enterprise Premier——或拥有 Translated Captions 附加组件。Zoom 支持的翻译字幕语言列表很广,包括阿拉伯语、中文、日语、韩语、印地语以及许多欧洲语言。限制并不在于语言覆盖面,而更多在于主持人侧许可、字幕设置,以及该功能只能在 Zoom 内部使用。完整拆解请参见 MirrorCaption 与 Zoom AI Companion 对比

Google Meet AI 语音翻译

Google 于 2025 年在 Meet 中引入了 AI 语音翻译,并在 2026 年面向部分 Workspace 套餐正式开放。截至 2026 年 6 月,Google 列出的双向翻译支持英语与西班牙语、法语、德语、葡萄牙语和意大利语之间的互译,而且每次会议只能启用一种语言对。不在该范围内的语言,包括日语、普通话、韩语、阿拉伯语和印地语,都不受原生语音翻译功能支持。若想详细了解 Meet 覆盖了什么、遗漏了什么,请参见 Google Meet 翻译替代方案页面

Microsoft Teams 实时口译与 Copilot

Teams 标准许可证中包含实时字幕,但这只是转录——字幕显示的是说话者的语言,而不是你的语言。Teams Premium 或 Microsoft 365 Copilot可提供实时翻译字幕。Microsoft 列出了数十种受支持的口语和翻译语言,包括日语、韩语、阿拉伯语、印地语和中文;代价是这些价值仍然局限在 Teams 内,并且依赖符合条件的许可。

平台 原生翻译? 覆盖的语言对 所需套餐 可跨平台使用吗?
Zoom 翻译字幕 广泛的字幕语言列表 需要符合条件的主持人套餐或附加组件 仅 Zoom
Google Meet AI 语音(英语 + 5 种语言) 英语 ↔ 西班牙语/法语/德语/葡萄牙语/意大利语;每次会议仅一种语言对 Workspace + Google AI 附加组件 仅 Meet
Microsoft Teams 通过 Premium/Copilot 提供翻译字幕 数十种字幕语言 Teams Premium(每用户每月 $10,按年付费)或 Microsoft 365 Copilot 仅 Teams
MirrorCaption 实时流式翻译(50+ 语言) 50+ 可选语言 免费 1 小时;Premium 一次性 €99 Zoom、Teams、Meet、Webex(浏览器)

这三种原生方案共有的限制是:每个产品都只能在自己的平台内使用。如果你的团队对外用 Zoom、内部用 Teams,那么你需要为每个环境分别配置许可、设置和用户习惯。这就是平台锁定问题,而任何原生集成都无法解决。

如何在任何会议中获得实时翻译——无需插件

MirrorCaption 围绕一个原则构建:你的翻译层应该属于你自己,而不是会议平台。它在浏览器标签页中运行,不会有任何东西加入会议,设置时间不到一分钟。

实际使用方式如下:

  1. 在桌面版 Chrome 或 Microsoft Edge 中打开 mirrorcaption.com/app 无需下载,无需注册表单——1 小时免费试用会立即开始。
  2. 在另一个标签页中开始你的会议。 使用 Zoom(zoom.us)、Microsoft Teams(teams.microsoft.com)、Google Meet 或 Webex 的浏览器版本。
  3. 选择 Meet 模式并点击“共享标签页音频”。 在浏览器的标签页共享选择器中选中你的会议标签页。屏幕共享所使用的同一浏览器 API 会捕获该标签页的音频流。
  4. 设置源语言和目标语言。 选择说话者在说什么,以及你想阅读什么。MirrorCaption 支持 50+ 可双向选择的语言。
  5. 流式转录和翻译会立即开始。 词语可能在说出后约 500 毫秒内开始出现——快到足以在说话者还在句中时阅读。

其他参与者不会在会议列表中看到新的参会者。因为 MirrorCaption 并没有加入通话或启动平台录制,会议平台不会替你添加机器人参与者、录制横幅或入会等待。翻译是在你这一侧完成的;你仍然需要遵守你所在组织的同意和会议录制政策。

示例流程

跨平台团队站会

柏林的一位 PM 正在与东京的工程师以及上海的一位供应商联系人进行 Google Meet 通话。对话在日语和普通话之间切换。Google Meet 的原生 AI 翻译都不支持这两种语言(截至 2026 年 6 月,它只支持英语、西班牙语、法语、德语、葡萄牙语和意大利语)。

这位 PM 在单独的 Chrome 标签页中打开 MirrorCaption,选择 Meet 模式,并共享 Google Meet 标签页的音频。源语言:日语。目标语言:德语。每句话说出后半秒内,翻译就会以左右并排面板的形式逐词出现。当对话切换到普通话时,PM 无需结束通话或重新加入,只需在 MirrorCaption 中切换源语言即可。会议中没有新增机器人。其他人的设置也完全没有变化。

此流程仅为示例。实际效果取决于音频质量、说话清晰度以及你所在组织的浏览器配置。

需要如实说明的限制是:Meet 模式要求使用会议平台的浏览器版本。Zoom 的浏览器客户端和 Teams 的网页版足以应对大多数常规会议,不过具体功能可用性可能因租户、浏览器和组织策略而异。如果你的组织要求使用 Zoom 桌面应用,那么 Talk 模式可作为备用方案,从你的麦克风捕获音频——通话双方的声音都会通过你的扬声器播放出来,并由 MirrorCaption 实时转录和翻译。

可用于你下一次 Zoom 或 Teams 通话。其他参与者无需安装任何东西。

在浏览器中打开 MirrorCaption

语言支持:平台锁定仍然带来的痛点

不同平台的语言情况并不相同。Google Meet 的原生语音翻译仍然以英语加五种欧洲语言为中心。Zoom 和 Teams 发布了更广泛的翻译字幕语言列表,包括许多亚洲和中东语言,但这些功能仍然取决于正确的套餐、正确的管理员或主持人设置,以及会议必须发生在那个单一平台内。

对于跨境团队来说,问题与其说是“有没有平台支持这种语言”,不如说是“今天这场会议的主持人、套餐、应用和平台是否都支持它?”

MirrorCaption 在同一个浏览器标签页工作流中覆盖这五种语言,以及俄语、希伯来语、泰语、越南语、土耳其语和另外 40+ 种可选语言。优势在于一致性:同一个语言选择器会跟随你从 Google Meet 到 Zoom,再到 Teams 和 Webex,而不是依赖每个平台各自不同的主持人侧功能。

当日本合作伙伴在谈判中途说出“ちょっと難しいです”时,语言学上正确的翻译是“有点困难”——但结合语境,商业上的解读更接近礼貌性的拒绝。实时翻译如果在说话者还在说的时候就到达,你就能同时看到句子和提问澄清的时机。会后转录则两者都给不了。关于 AI 翻译如何处理语境语言的更多内容,实时翻译准确性指南有更深入的说明。

无插件翻译到底要花多少钱

原生平台功能与专用工具之间的价格差距,比大多数对比页面展示的更大,因为原生功能往往被捆绑在基础成本更高的企业套餐中。

工具 方案 语言 价格(2026)
Zoom 翻译字幕 仅 Zoom 广泛的字幕语言列表 需要符合条件的主持人套餐或附加组件
Google Meet AI 翻译 仅 Meet 英语加五种受支持语言 需要 Workspace + Google AI 附加组件
Teams Premium 翻译 仅 Teams 数十种字幕语言 每用户每月 $10 的附加组件(按年付费)或 Microsoft 365 Copilot
JotMe 桌面应用(需安装) 200+ 按年计费每月 $10 起(200 分钟实时翻译)
MirrorCaption 免费版 浏览器标签页(无需安装) 50+ 可试用 1 小时,无需信用卡,一次性
MirrorCaption Premium 浏览器标签页(无需安装) 50+ €99 一次性(200 小时托管额度、所有未来更新、最低 Voice Pack 费率)

关于 MirrorCaption Premium 实际包含什么,需要说明一下:€99 是一次性收费,包含终身套餐访问权、所有未来更新的优先访问权,以及预先提供的 200 小时托管转录额度。它不是无限套餐。当 200 小时用完后,Voice Pack 可按 5 小时(€2.99)或 15 小时(€7.99)的增量补充,需另行购买。Premium 用户可获得最低的每小时 Voice Pack 费率。对于每周进行两小时多语言会议的团队来说,这 200 小时的额度大约能用两年。

把这和每月 $10 的桌面应用年付订阅相比:在同样的两年周期内,总计就是 $240,外加系统托盘里的一个原生应用。某些工具的按月计费更高。2026 年最佳会议翻译工具对比涵盖了各工具完整的价格格局。

常见问题

MirrorCaption 能和 Zoom 桌面应用一起用吗?

Meet 模式需要使用 Zoom 的浏览器版本(在 Chrome 或 Edge 中打开 zoom.us)。如果你需要 Zoom 桌面应用,请改用 Talk 模式:它会从你的麦克风捕获音频,因此通话双方——通过你的扬声器可听到的双方——都会被实时转录和翻译。音频捕获比标签页捕获略微不那么直接,但对大多数使用场景来说,翻译质量是等同的。

其他会议参与者需要安装任何东西吗?

不需要。MirrorCaption 只在你的浏览器标签页中运行。其他参与者无需安装任何东西,不会收到来自 MirrorCaption 的通知,也不会在会议中看到新的参与者。这就是浏览器标签页工具与以可见参会者身份加入会议的机器人之间的关键区别。

没有机器人,会议翻译就更私密吗?

MirrorCaption 不会把会议音频存储在其服务器上。音频会通过转录层实时处理,并在转录后丢弃。转录文本会使用 IndexedDB 保存在你本地的浏览器中——你的浏览器,你的数据。没有第三方机器人加入你的通话,因此会议平台不会额外添加一个机器人参会者记录。若想更深入了解各类 AI 会议工具的数据实践,请参见 AI 会议隐私指南

如果我主要在桌面端使用 Teams,而不是浏览器呢?

Teams 的浏览器版本(在 Chrome 或 Edge 中打开 teams.microsoft.com)支持大多数常规通话的核心会议流程,包括视频、音频、聊天和屏幕共享,不过具体功能可用性可能因租户和浏览器而异。如果你的组织有明确政策要求使用 Teams 桌面应用,那么 MirrorCaption 的 Talk 模式可作为备用方案,从你的麦克风捕获音频。对于任何其他无法通过浏览器访问的会议平台,这同样适用。

对于日语或阿拉伯语,实时 AI 翻译的准确度如何?

准确度取决于音频质量、说话清晰度以及语言的惯用表达程度。MirrorCaption 的流式转录引擎会将前 3 到 5 个片段输入每次翻译调用,以提升日语或普通话这类声调或语境密集语言的连贯性。对于日常会议内容,这会生成可读、可跟上的实时翻译。对于高风险的法律、金融或医疗讨论,应将其视为辅助阅读工具,而不是专业口译的替代品。实时翻译准确性指南对基准结果有更详细的说明。

结论

在 2026 年,机器人正面临更强的平台级控制,原生翻译仍然依赖各平台的许可和设置,而“无机器人”工具通常仍需要下载软件。这是三个彼此独立的问题。大多数工具只能解决其中一两个。MirrorCaption 则绕开了这三者:无需安装、没有机器人,并且可在 Chrome 或 Edge 中的任何基于浏览器的会议平台上使用 50+ 可选语言。

如果你的会议完全在同一个平台内进行、该平台支持你的语言对,而且所需许可已经到位,那就直接使用内置功能——它根本不需要任何新工具。但如果你在 Zoom、Teams 和 Meet 之间切换,或者你希望在不同平台上对日语、阿拉伯语、普通话、韩语、印地语及其他非欧洲语言使用同一套设置,那么浏览器标签页方案就是更实际的答案。免费试用 1 小时,无需信用卡,也不会每月重置。

在下一次会议中试试 MirrorCaption

免费试用 1 小时。无需信用卡。无需安装。在 Chrome 或 Edge 中打开,1 分钟内即可开始翻译。

免费开始