为 OBS 添加实时字幕主要有三种选择:一个在你的 GPU 上运行的免费本地插件,一个像 StreamTranslate 这样的云服务,价格为 $14.99/month,或者一个完全无需安装的浏览器标签页。MirrorCaption 是第三种选择——一个基于浏览器的实时转录与翻译工具,支持 50+ 可选语言,起步免费,Premium 一次性最高为 €99。

你已经在 Twitch 直播中进行了 40 分钟。你从英语切换到日语,和老观众们互动。你的一半聊天区在打片假名。另一半则在问“你刚才说了什么?”你的 OBS 场景没有字幕。没有翻译层,英语观众也无法跟上内容。那个瞬间就这样过去了。

MirrorCaption 会在与你的 OBS 并行运行的 Chrome 浏览器标签页中捕获你的麦克风。无论你说的是英语、日语、韩语,还是对话走向何处,转录和翻译都会实时并排显示。本页将介绍如何将它集成到你的直播设置中,以及它与其他替代方案相比适合放在什么位置。

关键要点

为什么实时字幕对 OBS 主播很重要

OBS Studio 本身不附带任何转录或字幕引擎——它是采集和编码工具,不是语音识别平台。你在直播中看到的每一层字幕,都是在其上叠加的第三方工具提供的。

这种差距比过去更重要了。根据 TwitchTracker 的语言分布数据,美国约占 Twitch 观看量的 20%。你潜在观众中的另外 80% 分布在德国、韩国、俄罗斯、法国以及数十个其他国家——其中很多人如果能看到自己语言的字幕,会更容易跟上你的直播。

实时字幕能为直播带来三件事:

挑战在于,大多数字幕工具都要求你在月订阅和同一台负责视频编码的机器上运行吃 GPU 的本地软件之间二选一。MirrorCaption 提供了另一条路径。

🎮

双语主播(JP/EN)

在直播中途在日语和英语之间切换。MirrorCaption 会在第二块显示器上并排显示两种语言,让主播能在观众在聊天里发现误译之前,实时核对翻译准确性。

🌎

国际受众增长

一位英语主播为韩语、西班牙语和德语观众添加翻译字幕。字幕以 OBS 浏览器源叠加层的形式显示——同一场直播,不同受众群体都能读懂不同语言。

📺

反应型主播

在直播中观看外语内容。MirrorCaption 的 Meet 模式会捕获源标签页的音频并实时翻译,让主播能够基于真实内容做出反应,而不是靠视觉上下文猜测。

以可访问性优先的频道

直接在直播中显示给 聋人和听力障碍观众 的字幕。观众无需在 Twitch 端进行任何设置——字幕叠加层会被烧录进视频。

免费试用 MirrorCaption →

MirrorCaption 与 OBS 的三种配合方式

MirrorCaption 是一个渐进式 Web 应用。它在 Chrome 浏览器标签页中运行,通过浏览器的麦克风或标签页捕获 API 获取音频,并将转录和翻译实时回传到屏幕上。它是与 OBS 并行运行,而不是嵌入其中。实际可用的设置方式有三种。

方式 1 — 在第二块显示器上进行个人监看

这是最简单的设置,也是双语主播最常见的起点。

  1. 在你的直播机器上的 Chrome 中打开 mirrorcaption.com/app
  2. 选择 Talk 模式。这会捕获你的麦克风输入。
  3. 选择源语言(你正在说的语言)和目标语言(你想翻译成的语言)。
  4. 开始会话,并将 MirrorCaption 标签页移动到第二块显示器上。
  5. 当你直播时,你的语音会以实时转录的形式出现,并并排显示翻译。

一位韩英双语主播在第二块显示器上使用 MirrorCaption,先监看韩语敬语是如何被翻译的,再决定是否要在激动时刻被剪辑并断章取义地传播出去。并排视图让他们在翻译看起来不对时可以即时改述。

在这个工作流里,观众看不到 MirrorCaption。它是一个个人监看层——就像一个实时信心监视器,让你准确看到你的双语观众正在阅读什么。

方式 2 — OBS 浏览器源叠加层

如果要在直播中可见地显示实时字幕,可以将 MirrorCaption 作为 OBS 浏览器源添加。

  1. 在 Chrome 中打开 MirrorCaption 并开始 Talk 模式会话。
  2. 在 OBS 中,添加一个新的 Source → Browser Source。
  3. https://www.mirrorcaption.com/app 作为 URL 输入。
  4. 设置宽度和高度。完整的应用界面会作为一个图层渲染。
  5. 使用 OBS 的 Crop/Pad 滤镜或 Transform 设置来只保留实时转录区域,然后将其放置在场景底部。

一位日语主播将 MirrorCaption 作为浏览器源添加进来,裁剪成只显示翻译后的英文字幕行,并将其固定在游戏画面的下三分之一处。国际观众可以跟随英文翻译,而日语观众则在聊天中阅读原文。

坦白说一句:像 StreamTranslate 这样的工具会生成一个专用字幕条 URL,只显示字幕文本而没有周围 UI——作为 OBS 叠加层设置起来会更简洁一些。MirrorCaption 的浏览器源需要一次性的裁剪步骤才能达到同样效果,但 OBS 会将该配置保存在你的场景集合中,所以只需设置一次。

方式 3 — 对源内容进行实时翻译(Meet 模式)

这个工作流是专为观看外语视频的反应型主播设计的。

  1. 在 Chrome 浏览器标签页中打开你要反应的内容(YouTube 视频、外语直播、视频通话)。
  2. 在第二个 Chrome 标签页中打开 MirrorCaption,并选择 Meet 模式。这会捕获内容标签页的音频,而不是麦克风。
  3. 设置源语言(内容所使用的语言)和你的翻译目标语言。
  4. 开始会话。MirrorCaption 会在你的显示器上实时翻译内容音频。

一位英语主播在看日本综艺节目时做反应。通过在第二块显示器上运行 Meet 模式的 MirrorCaption,他们能看到字幕随着节目播放实时出现,从而对真正说了什么做出回应——而不是只根据表情和音效去猜。

OBS 字幕工具对比

目前 OBS 直播社区最常推荐的四种工具:

维度 MirrorCaption StreamTranslate LocalVocal Caption.Ninja
价格 免费试用(1 小时);€99 一次性 Premium 起价 $14.99/月 免费(开源) 免费
语言 50+ 28+ 约 100 种(基于 Whisper) 取决于浏览器
需要 OBS 插件
GPU 占用 无(云端) 无(云端) 高(本地 Whisper)
翻译质量 基于 GPT 多引擎 AI M2M100 模型 浏览器 ML
专用叠加层 URL 通过浏览器源显示完整应用 UI 字幕条 URL(最简洁) OBS 文本源 字幕条 URL
反应直播翻译 是(Meet 模式) 手动设置复杂

StreamTranslate 是目前最适合 OBS 叠加层的专用工具。把一个 URL 粘贴进 OBS,就会出现一个干净的字幕条。如果他们 28+ 语言中的主要欧洲和亚洲语言已经覆盖了你的受众,而且你也能接受月订阅,那么它是阻力最小的路径。

LocalVocal 适合那些想要完全离线、优先隐私处理,并且拥有足够强 GPU 的用户。要注意的是,它需要手动安装,可能会在 OBS 大版本更新时失效,而且会给已经在编码视频的机器增加明显的 GPU 负载。

MirrorCaption 在语言覆盖深度、日语、韩语和阿拉伯语的翻译质量、长期总成本,以及反应直播翻译场景方面更胜一筹——代价是与 StreamTranslate 的专用字幕条 URL 相比,初始浏览器源设置稍微复杂一些。

用任何语言直播

从 1 小时免费开始。无需信用卡。无需配置 OBS 插件。

免费打开 MirrorCaption →

50+ 种语言——包括你的观众真正使用的语言

StreamTranslate 覆盖 28+ 种语言。LocalVocal 在本地运行 Whisper,按原始数量覆盖更多语言,但翻译质量差异很大。对于日语、韩语、阿拉伯语和印地语,本地神经机器翻译模型的输出与基于 GPT、并能感知上下文对话的翻译相比,差异非常明显。

这种差距在直播中最为明显。会在日语和英语之间切换的双语主播——这是日本游戏直播中的常见模式——需要一个能够同时处理句中语言切换、口语语体变化和游戏俚语的翻译引擎。那种把词语孤立预测的方法很难做到这一点。将前几行对话作为上下文输入的基于 GPT 的翻译,表现要好得多。

MirrorCaption 还会同时显示原始转录和翻译,并提供词级联动:点按任意翻译词即可查看它对应的源词。对于想在直播中抽查翻译准确性的双语主播来说,这就是一个实时审计工具。

对于正在构建欧洲语言之外国际受众的主播来说,50+ 语言集合覆盖了普通话、日语、韩语、阿拉伯语、希伯来语、印地语、俄语、越南语、印尼语、泰语等——而且使用的是同一个界面和同样的一次性定价。

无需插件、无需 GPU 负担、无需担心 OBS 更新

在 OBS 论坛帖子中,关于 LocalVocal 最常见的抱怨之一就是版本兼容性——OBS 的大版本更新曾破坏该插件的音频滤镜链,导致需要手动重新安装或等待插件更新。对于把字幕作为可访问性设置一部分的主播来说,直播当晚插件损坏是个真正的问题。

MirrorCaption 完全运行在 OBS 之外。它存在于 Chrome 浏览器标签页中。OBS 更新不会破坏它。GPU 驱动更新也不会影响它。它与 OBS 的音频滤镜链、插件注册表或编码器设置都没有交互。今天可用的配置,在接下来的三次 OBS 发布后依然可用。

还有性能方面的因素。本地 AI 转录会给已经在以 1080p60 或更高分辨率编码视频的机器增加明显的 GPU 负载。使用中端硬件的主播有时会报告,当本地转录模型与 OBS 争夺 GPU 内存时会出现掉帧。MirrorCaption 将所有语音处理卸载到云端,把 GPU 留给编码使用。

订阅费用怎么算

按照 StreamTranslate 当前的定价 $14.99/月,带字幕直播一年大约要花 $180。两年则是 $360。你直播的每一个月,成本都会继续累积。

MirrorCaption Premium 为 €99 一次性。它包含 200 小时的托管转录额度、永久产品访问权限以及所有未来更新。Voice Pack(单独出售)会在包含的额度用完后补充小时数;Premium 客户可获得最低的每小时 Voice Pack 费率。按 $14.99/月 的等效标准计算,MirrorCaption 的成本大约在直播七个月后就能收回——之后每一场直播都不再产生额外费用。

对于不是每天都直播的主播——或者只想在特定活动中使用字幕支持,而不是每场直播都用——一次性模式会彻底消除“我这个月值回票价了吗?”的计算。你可以先用免费的 1 小时试用,无需信用卡,在正式付费前先检查你内容上的翻译质量。

常见问题

OBS 有内置实时字幕吗?

没有。OBS Studio 不包含内置字幕或转录引擎。主播通过外部工具添加实时字幕——可以是基于浏览器的服务、OBS 插件,或专用叠加层生成器。MirrorCaption 是一种基于浏览器的方案,不需要 OBS 插件。

我可以把 MirrorCaption 作为 OBS 浏览器源添加吗?

可以。在 Chrome 中打开 MirrorCaption 应用,开始 Talk 模式会话,然后将该标签页 URL 作为 Browser Source 添加到 OBS 中。使用 Crop/Pad 滤镜或 Transform 设置来只保留实时字幕区域,并将其放置在场景上方。OBS 会按场景保存该配置,所以只需设置一次。若想要更干净的专用叠加层 URL 方案,StreamTranslate 会生成一个无需裁剪的字幕条 URL。

实时字幕会出现在 Twitch VOD 中吗?

浏览器源叠加层会作为视觉元素烧录进直播视频——它们会作为视频画面的一部分出现在 VOD 和剪辑中。这与 CEA-608 内嵌字幕不同,后者通过 Twitch 播放器的 CC 按钮切换,并且需要像 OBS Closed Captioning plugin 这样的独立编码器插件。MirrorCaption 的叠加层方式意味着字幕会永久显示在录制视频中,无需观众端设置。

MirrorCaption 支持哪些直播语言?

MirrorCaption 支持 50+ 种可选语言,包括日语、韩语、普通话、阿拉伯语、印地语、德语、西班牙语、法语、葡萄牙语、俄语、希伯来语、越南语、印尼语、泰语等。翻译采用基于 GPT 的优化,能比词典式或孤立词方法更好地处理代码切换和对话式语音。请参阅 多语言转录指南,查看按语言拆分的说明。

MirrorCaption 和 LocalVocal 有什么区别?

LocalVocal 是一个免费的 OBS 插件,会在你的 GPU 上本地运行 AI 转录——适合优先隐私、离线且硬件足够强的设置。MirrorCaption 是基于浏览器的:无需 OBS 插件、无需 GPU 占用、也没有版本兼容风险。MirrorCaption 基于 GPT 的翻译在大多数直播场景中,对日语、韩语和阿拉伯语的上下文准确性更高。

MirrorCaption 有免费试用吗?

有。每个账户都会获得 1 小时免费的实时转录和翻译——一次性提供,不按月重置,也不需要信用卡。需要更多小时数时,可以升级到 Annual(€54.99/year,包含 100 小时托管转录额度)或 Premium(€99 一次性,包含 200 小时,所有未来更新和新功能优先访问)。Voice Pack(单独出售)可在任何时间为任何方案增加额度;Premium 客户可获得最低的每小时费率。

为你的下一场直播添加实时字幕

1 小时免费试用。无需信用卡。无需安装插件。可在 Chrome 中与 OBS 并行运行。

免费试用 MirrorCaption