OBSにライブキャプションを追加する方法は、主に3つあります。GPU上で動作する無料のローカルプラグイン、StreamTranslateのような$14.99/monthのクラウドサービス、そしてインストール不要のブラウザタブです。MirrorCaptionは3つ目の選択肢で、50以上の選択可能な言語に対応したブラウザベースのリアルタイム文字起こし・翻訳ツールです。料金は無料から始まり、Premiumは買い切り€99までです。
ライブTwitch配信を始めて40分。いつもの視聴者向けに英語から日本語へ切り替えます。チャットの半分はカタカナ。もう半分は「今なんて言ったの?」と入力しています。OBSのシーンにはキャプションがありません。翻訳レイヤーもなく、英語を話す視聴者が内容を追う手段もありません。その瞬間は過ぎていきます。
MirrorCaptionは、OBSと並行して動作するChromeブラウザタブでマイク音声を取得します。英語、日本語、韓国語、あるいは会話がどこへ向かっても、文字起こしと翻訳がリアルタイムで並んで表示されます。このページでは、配信環境にどう組み込むか、そして代替手段と比べてどこに位置づけられるかを解説します。
要点
- OBSには標準のキャプションエンジンがないため、ライブキャプションは外部ツールが必須です。
- MirrorCaptionはOBSと並行してChromeブラウザタブで動作し、プラグインのインストールも配信PCのGPU負荷も不要です。
- GPTベース翻訳で50以上の選択可能な言語に対応し、日本語、韓国語、アラビア語、ヒンディー語をカバー。StreamTranslateの28言語を大きく上回ります。
- 実用的なワークフローは3つ。2台目ディスプレイでの個人モニタリング、OBSブラウザソースのオーバーレイ、Meetモードによるソースコンテンツのリアルタイム翻訳です。
- Premiumは€99の買い切りで、200時間分のホスト型文字起こしクレジットが含まれます。StreamTranslateの現在価格で同等の年間コストは約$180です。
OBS配信者にライブキャプションが重要な理由
OBS Studioには文字起こしやキャプションのエンジンが搭載されていません。OBSはキャプチャとエンコードのためのツールであり、音声認識プラットフォームではないからです。配信で見かけるキャプションレイヤーはすべて、上に重ねたサードパーティーツールによるものです。
このギャップは、以前よりも重要になっています。TwitchTrackerの言語分布データによると、Twitch視聴の約20%を米国が占めています。残りの80%の潜在視聴者は、ドイツ、韓国、ロシア、フランス、そして数十の国々に分散しており、その多くは自分の言語でキャプションがあれば、より簡単に配信を追えます。
ライブキャプションが配信にもたらすものは3つあります。
- アクセシビリティ。 聴覚障害のある視聴者や難聴の視聴者が内容を追えます。共有空間で音声を切って視聴する人も少なくありません。
- 国際的なリーチ。 翻訳キャプションがあれば、他国の視聴者も自分が流暢に読める言語で内容を追えます。
- VODの発見性。 動画に焼き込まれたキャプション、または検索可能な文字起こしとして付与されたキャプションは、TwitchやYouTubeの検索インデックス対象コンテンツを増やします。
課題は、多くのキャプションツールが、月額サブスクか、同じマシンで動画エンコードを行いながらGPU負荷の高いローカルソフトを使うかの二択を迫ることです。MirrorCaptionは別の道を提供します。
バイリンガル配信者(JP/EN)
配信中に日本語と英語を切り替えます。MirrorCaptionは2台目モニターに両言語を並べて表示するため、配信者はチャットで誤訳が指摘される前に、リアルタイムで翻訳の正確さを確認できます。
国際的な視聴者拡大
英語圏の配信者が、韓国語、スペイン語、ドイツ語の視聴者向けに翻訳キャプションを追加します。キャプションはOBSのブラウザソースオーバーレイとして表示され、同じ配信を複数言語で異なる視聴者層が読めます。
リアクション配信者
配信中に外国語コンテンツを視聴します。MirrorCaptionのMeetモードはソースタブの音声を取得してリアルタイム翻訳するため、映像の文脈から推測するのではなく、実際の発言に対して自然にリアクションできます。
アクセシビリティ重視のチャンネル
聴覚障害のある視聴者や難聴の視聴者向けのキャプションを配信画面に直接表示します。視聴者側でTwitchの設定は不要で、キャプションオーバーレイは動画に焼き込まれます。
MirrorCaptionをOBSで使う3つの方法
MirrorCaptionはProgressive Web Appです。Chromeブラウザタブで動作し、ブラウザのマイクまたはタブキャプチャAPI経由で音声を取得し、文字起こしと翻訳をリアルタイムで画面に返します。OBSの内部ではなく、OBSと並行して動作します。実用的なセットアップは3つあります。
方法1 — 2台目ディスプレイでの個人モニタリング
最もシンプルで、バイリンガル配信者が最初に採用しやすい構成です。
- 配信PCのChromeで
mirrorcaption.com/appを開きます。 - Talkモードを選択します。これでマイク入力を取得します。
- ソース言語(話している言語)とターゲット言語(翻訳先)を選びます。
- セッションを開始し、MirrorCaptionタブを2台目モニターへ移動します。
- 配信中、発話内容がライブ文字起こしと並列翻訳として表示されます。
韓国語と英語を使う配信者が、MirrorCaptionを2台目ディスプレイで使い、盛り上がった瞬間に切り抜かれて文脈を失う前に、韓国語の敬語がどう翻訳されているかを確認します。並列表示により、翻訳が不自然なときはその場で言い換えられます。
このワークフローでは視聴者にMirrorCaptionは見えません。これは個人用のモニタリングレイヤーであり、バイリンガル視聴者が実際に読んでいる内容をリアルタイムで確認できる、いわば信頼性モニターのようなものです。
方法2 — OBSブラウザソースのオーバーレイ
ライブキャプションを配信画面に見せるには、MirrorCaptionをOBSのブラウザソースとして追加します。
- ChromeでMirrorCaptionを開き、Talkモードのセッションを開始します。
- OBSで新しいソースを追加し、ブラウザソースを選びます。
- URLとして
https://www.mirrorcaption.com/appを入力します。 - 幅と高さを設定します。アプリ全体のUIがレイヤーとして描画されます。
- OBSのCrop/PadフィルターまたはTransform設定でライブ文字起こし領域だけを切り出し、シーンの下部に配置します。
日本語配信者がMirrorCaptionをブラウザソースとして追加し、翻訳された英語キャプション行だけが見えるように切り抜いて、ゲーム画面の下3分の1に固定します。英語圏の視聴者は英訳を追え、日本語話者の視聴者はチャットで原文を読めます。
正直に言うと、StreamTranslateのようなツールは、周囲のUIがないキャプション専用のURLを生成するため、OBSオーバーレイとしては少し設定が簡単です。MirrorCaptionのブラウザソースは同じ結果を得るために一度だけ切り抜き作業が必要ですが、OBSはその設定をシーンコレクションに保存するため、セットアップは一度で済みます。
方法3 — ソースコンテンツのリアルタイム翻訳(Meetモード)
このワークフローは、外国語動画を視聴するリアクション配信者向けに設計されています。
- リアクション対象のコンテンツ(YouTube動画、海外配信、ビデオ通話など)をChromeブラウザタブで開きます。
- 2つ目のChromeタブでMirrorCaptionを開き、Meetモードを選択します。これにより、マイクではなくコンテンツタブの音声を取得します。
- ソース言語(コンテンツの言語)と翻訳先を設定します。
- セッションを開始します。MirrorCaptionが表示画面上でコンテンツ音声をリアルタイム翻訳します。
英語圏の配信者が日本のバラエティ番組にリアクションします。2台目ディスプレイでMirrorCaptionをMeetモードで動かすと、番組の進行に合わせて翻訳キャプションが表示され、表情や効果音から読み取れることだけでなく、実際に何が言われているのかに対して反応できます。
OBSキャプションツールの比較
現在、OBS配信コミュニティで特に推奨される4つのツールです。
| 項目 | MirrorCaption | StreamTranslate | LocalVocal | Caption.Ninja |
|---|---|---|---|---|
| 価格 | 無料トライアル(1時間);€99の買い切りPremium | $14.99/月から | 無料(オープンソース) | 無料 |
| 対応言語 | 50以上 | 28以上 | 約100(Whisperベース) | ブラウザ依存 |
| OBSプラグインが必要 | いいえ | いいえ | はい | いいえ |
| GPU使用量 | なし(クラウド) | なし(クラウド) | 高い(ローカルWhisper) | なし |
| 翻訳品質 | GPTベース | 複数エンジンAI | M2M100モデル | ブラウザML |
| 専用オーバーレイURL | ブラウザソース経由でフルアプリUI | キャプション専用URL(最も簡単) | OBSテキストソース | キャプション専用URL |
| リアクション配信の翻訳 | はい(Meetモード) | いいえ | 手動設定が複雑 | いいえ |
StreamTranslateは、OBS向けオーバーレイツールとして最も目的特化しています。URLを1つOBSに貼り付けるだけで、すっきりしたキャプション帯が表示されます。28以上の言語セットに含まれる主要な欧州語・アジア語で視聴者をカバーでき、月額課金に抵抗がなければ、最も手間の少ない選択肢です。
LocalVocalは、完全オフラインでプライバシー重視の処理を行いたく、十分なGPU性能がある場合に適しています。ただし、手動インストールが必要で、OBSのメジャーアップデートで壊れることがあり、すでに動画をエンコードしているマシンにかなりのGPU負荷を追加します。
MirrorCaptionは、言語の幅、日本語・韓国語・アラビア語の翻訳品質、長期的な総コスト、そしてリアクション配信の翻訳用途で優位です。その代わり、StreamTranslateの専用ストリップURLと比べると、最初のブラウザソース設定はやや手間がかかります。
50以上の言語 — 視聴者が実際に話す言語までカバー
StreamTranslateは28以上の言語をカバーします。LocalVocalはWhisperをローカルで動かし、総数ではより多くの言語に対応しますが、翻訳品質にはかなりばらつきがあります。日本語、韓国語、アラビア語、ヒンディー語では、ローカルのニューラル機械翻訳モデルと、周囲の会話文脈を理解するGPTベース翻訳では、出力が明確に異なります。
この差はライブ配信で最もはっきり見えます。日本語と英語を切り替えるバイリンガル配信者 — 日本のゲーム配信でよくあるパターンです — には、文中での言語切り替え、くだけた言い回しの変化、ゲーム用スラングを同時に処理できる翻訳エンジンが必要です。単語を個別に予測する方式では、そこに弱さがあります。会話の直前数行を文脈として与えるGPTベース翻訳なら、かなりうまく処理できます。
MirrorCaptionは原文の文字起こしと翻訳を同時に表示し、単語レベルで対応付けも行います。翻訳された任意の単語をタップすると、どの原文単語に対応しているかが分かります。ライブ配信中に翻訳の正確さをその場で確認したいバイリンガル配信者にとって、これはリアルタイムの監査ツールです。
欧州言語を超えて国際的な視聴者を増やしたい配信者向けに、50以上の言語セットは中国語、日本語、韓国語、アラビア語、ヘブライ語、ヒンディー語、ロシア語、ベトナム語、インドネシア語、タイ語などを、同じインターフェースと同じ買い切り価格でカバーします。
プラグイン不要、GPU負荷なし、OBS更新の不安もなし
LocalVocalについてOBSフォーラムで一貫して挙がる不満の1つは、バージョン互換性です。OBSのメジャーリリースでプラグインの音声フィルタチェーンが壊れ、手動での再インストールやプラグイン更新待ちが必要になることがあります。キャプションをアクセシビリティ設定の一部として頼っている配信者にとって、配信当日にプラグインが壊れるのは深刻な問題です。
MirrorCaptionは完全にOBSの外で動作します。Chromeブラウザタブの中に存在するため、OBSの更新で壊れることはありません。GPUドライバーの更新も影響しません。OBSの音声フィルタチェーン、プラグイン登録、エンコーダ設定とも一切関係がありません。今日動く設定は、次の3回のOBSリリース後もそのまま動きます。
パフォーマンス面でも利点があります。ローカルAI文字起こしは、すでに1080p60以上で動画をエンコードしているマシンに、無視できないGPU負荷を追加します。中程度のスペックの機材では、ローカル文字起こしモデルがOBSとGPUメモリを奪い合い、フレーム落ちが起きることがあります。MirrorCaptionは音声処理をすべてクラウドにオフロードし、GPUをエンコード専用に空けます。
サブスクの計算
StreamTranslateの現在価格が$14.99/月なら、キャプション付きで1年間配信すると約$180です。2年なら$360。配信するたびにコストは積み上がります。
MirrorCaption Premiumは€99の買い切りです。200時間分のホスト型文字起こしクレジット、恒久的な製品アクセス、今後のすべてのアップデートが含まれます。Voice Pack(別売)は、付属クレジットを使い切ったときに時間を追加できます。Premiumユーザーは1時間あたりのVoice Pack料金が最も低くなります。$14.99/月相当で考えると、MirrorCaptionの費用はおよそ7か月の配信で回収でき、その後の配信には追加費用がかかりません。
毎日配信しない人、あるいは毎回ではなく特定イベントだけにキャプションを使いたい人にとって、買い切りモデルなら「今月は元が取れているか」を考える必要がありません。まずはクレジットカード不要の1時間無料トライアルで、導入前に自分のコンテンツで翻訳品質を確認できます。
よくある質問
OBSに標準のライブキャプション機能はありますか?
いいえ。OBS Studioには標準のキャプションまたは文字起こしエンジンはありません。配信者は、ブラウザベースのサービス、OBSプラグイン、専用オーバーレイ生成ツールなどの外部ツールでライブキャプションを追加します。MirrorCaptionはOBSプラグイン不要のブラウザベースの選択肢です。
MirrorCaptionをOBSのブラウザソースとして追加できますか?
はい。ChromeでMirrorCaptionアプリを開き、Talkモードのセッションを開始してから、そのタブURLをOBSのブラウザソースとして追加します。Crop/PadフィルターまたはTransform設定でライブキャプション領域だけを切り出し、シーン上に配置します。OBSはこの設定をシーンごとに保存するため、セットアップは一度だけです。よりすっきりした専用オーバーレイURL方式を使いたい場合は、StreamTranslateが切り抜き不要のキャプション専用URLを生成します。
ライブキャプションはTwitchのVODに表示されますか?
ブラウザソースのオーバーレイは、配信動画に焼き込まれた視覚要素としてレンダリングされます。つまり、VODやクリップにも動画フレームの一部として表示されます。これはCEA-608の埋め込みキャプションとは異なり、TwitchプレーヤーのCCボタンで切り替える方式で、OBS Closed Captioning pluginのような別のエンコーダプラグインが必要です。MirrorCaptionのオーバーレイ方式なら、視聴者側の設定なしで録画動画にキャプションが恒久的に表示されます。
MirrorCaptionは配信用にどの言語をサポートしていますか?
MirrorCaptionは、日本語、韓国語、中国語、アラビア語、ヒンディー語、ドイツ語、スペイン語、フランス語、ポルトガル語、ロシア語、ヘブライ語、ベトナム語、インドネシア語、タイ語など、50以上の選択可能な言語をサポートしています。翻訳にはGPTベースの改善が使われており、辞書ベースや単語単独処理よりも、コードスイッチングや会話音声をうまく扱えます。言語ごとの詳細は多言語文字起こしガイドをご覧ください。
MirrorCaptionとLocalVocalの違いは何ですか?
LocalVocalは、GPU上でAI文字起こしをローカル実行する無料のOBSプラグインで、十分な性能のハードウェアを持つ、プライバシー重視のオフライン環境に適しています。MirrorCaptionはブラウザベースで、OBSプラグイン不要、GPU使用なし、バージョン互換性リスクもありません。MirrorCaptionのGPTベース翻訳は、多くのライブ配信用途で、日本語、韓国語、アラビア語をより高い文脈精度で処理します。
MirrorCaptionに無料トライアルはありますか?
はい。すべてのアカウントには、ライブ文字起こしと翻訳の1時間無料分が付与されます。1回限りで、月ごとのリセットはなく、クレジットカードも不要です。さらに時間が必要になったら、Annual(€54.99/year、100時間分のホスト型文字起こしクレジット付き)またはPremium(€99の買い切り、200時間付き、今後のすべてのアップデートと新機能への優先アクセス付き)にアップグレードできます。Voice Pack(別売)は、どのプランでもいつでもクレジットを追加できます。Premiumユーザーは1時間あたりの料金が最も低くなります。
次の配信にライブキャプションを追加しよう
まずは1時間無料でお試し。クレジットカード不要。プラグインのインストール不要。ChromeでOBSと並行して動作します。
MirrorCaptionを無料で試す