2026年には、プラグインやボットなしでZoom、Teams、Google Meetをリアルタイム翻訳できます。最もクリーンな選択肢は、MirrorCaptionのようなブラウザタブ型ツールです(ChromeまたはEdgeで開き、通話には誰も参加せず、50以上の選択可能な言語、Premiumは€99の買い切り)。代替として、各プラットフォームにはネイティブ翻訳機能があります。Zoomの翻訳キャプションには対象のホストプランまたはアドオンが必要で、Google Meetの音声翻訳は提供開始時点では英語との組み合わせのみ、Teamsのライブ翻訳キャプションにはTeams PremiumまたはMicrosoft 365 Copilotが必要です。いずれも、単一のプラットフォームに縛られます。

2026年3月、Google Meetは一部のボット風の参加リクエストを、よりリスクの高いロビーキューに分離し、ボットが通話に入る前の手間を増やしました。Microsoft Teamsは外部の自動会議アシスタント向けのポリシー制御を追加し、検出されたボットは既定で承認待ちのためロビーに回されます。FirefliesやOtterのようなツールに依存していたTeamsは、事実上一夜にして構成の見直しを迫られました。

このガイドでは、あらゆる方法、導入に必要なもの、費用、そしてそれぞれの弱点を整理します。これにより、一度決めたら何度も見直さずに済みます。

要点

2026年にボットがブロックされる理由

2026年3月、GoogleはMeetの入室フローを更新し、待機室の参加者を異なるリスクキューに分けました。ボット型の議事録作成ツールは「潜在的リスク」のフローに入ることがあり、ボットが参加する前にホストが明示的に許可または拒否を判断する必要があります。

MicrosoftのTeams会議ポリシーのドキュメントでは、サードパーティの自動ボットや会議アシスタント向けにExternal Bot Access Modeが定義されています。既定値のRequireApprovalWhenDetectedでは、検出されたボットは主催者の承認のためロビーに送られます。管理者は、すべてのボットを許可することも、検出されたボットをブロックすることもできます。

この手間を増幅させる要因は3つあります。

その結果、ボットベースの翻訳は、増え続ける業務用途で予測しにくくなっています。だからこそ、通話に参加者として入らない会議翻訳を探すチームが増えているのです。

MirrorCaptionは会議に参加しません。通話の横でブラウザタブとして動作します。

無料で試す — 1時間、カード不要

「ボットなし」は「インストール不要」と同じではない

ボット不要の会議翻訳を探すと、同じマーケティング上の主張の下に3つの異なる技術的アプローチが現れます。これらは実質的に異なり、IT承認がボトルネックならその違いは重要です。

Chrome拡張機能(Otter.ai extension、Tactiq)

拡張機能はブラウザプロファイル内にインストールされ、アクティブなタブまたはマイクから音声を取得します。会議にボットは参加せず、他の参加者には何も見えません。ただし、拡張機能はブラウザ内に存在するため、誰かがインストールして保守する必要があり、動作するのはインストールされたブラウザ内だけです。Firefoxユーザーや、ZoomやTeamsのデスクトップアプリに依存している人は対象外です。

デスクトップキャプチャアプリ(JotMe、SuperIntern)

ネイティブのデスクトップアプリケーションは、OSの音声出力からシステム音声を直接取得します。どのブラウザや会議クライアントを使っていても動作し、通話中にボットが見えることもありません。ただし、MacまたはWindows向けのネイティブアプリをダウンロードしてインストールする必要があり、IT部門は導入前に依然として確認と承認を求める場合があります。

ブラウザタブ型ツール(MirrorCaption)

ブラウザタブ型ツールはWebページとして開きます。MirrorCaptionは会議タブの横でデスクトップ版ChromeまたはEdgeのタブとして動作し、ブラウザ内蔵の画面キャプチャ機構を使ってそのタブの音声を取得します。これは、画面共有時にタブを共有するときにブラウザが使うのと同じAPIです。ダウンロード不要、拡張機能不要、デスクトップクライアント不要。翻訳を実行する人がURLを開くだけです。誰も通話に参加しないため、他の人には何も見えません。

アプローチ 例のツール 何かをインストールする? どのブラウザでも動く? 他の人に見える?
Chrome拡張機能 Otter extension, Tactiq はい(ブラウザ拡張機能) Chrome/Edgeのみ いいえ
デスクトップキャプチャアプリ JotMe, SuperIntern はい(ネイティブアプリ) はい(任意のブラウザ/アプリ) いいえ
ブラウザタブ型ツール MirrorCaption いいえ(URLを開くだけ) MeetモードではChrome/Edge いいえ

IT承認がボトルネックのチームでは、「ブラウザ拡張機能が必要」と「何も必要ない」の違いは、機能比較よりも重要です。Chromeで開くURLは、すでに多くの企業のブラウザポリシーで承認済みです。新しいブラウザ拡張機能やネイティブアプリは、通常そうではありません。

ネイティブのプラットフォーム翻訳は実際に何をカバーするのか

主要な会議プラットフォームはそれぞれ、何らかの組み込み翻訳を提供しています。ここでは、実際に何をカバーし、いくらかかり、どこで止まるのかを示します。

Zoomの翻訳キャプション

Zoomの翻訳キャプション機能では、ホストが会議やウェビナー中にライブ翻訳を有効にできます。ホストは対象のZoom Workplaceプラン、Business Plus、Enterprise Essentials、Enterprise Plus、Enterprise Premierのいずれか、またはTranslated Captionsアドオンが必要です。Zoomの対応翻訳キャプション言語は幅広く、アラビア語、中国語、日本語、韓国語、ヒンディー語、多くの欧州言語を含みます。制約は言語の広さというより、ホスト側のライセンス、キャプション設定、そしてこの機能がZoom内でしか役立たない点です。全体像はMirrorCaptionとZoom AI Companionの比較をご覧ください。

Google MeetのAI音声翻訳

Googleは2025年にMeetでAI搭載の音声翻訳を導入し、2026年には一部のWorkspaceプラン向けに一般提供を開始しました。2026年6月時点で、Googleは英語とスペイン語、フランス語、ドイツ語、ポルトガル語、イタリア語の双方向翻訳を案内しており、1回の会議で有効にできる言語ペアは1つだけです。日本語、北京語、韓国語、アラビア語、ヒンディー語を含むこの範囲外の言語は、ネイティブの音声翻訳機能では対象外です。Meetが何をカバーし、何をカバーしないのかの詳細は、Google Meet翻訳の代替ページをご覧ください。

Microsoft Teamsのライブ通訳とCopilot

Teamsには標準ライセンスに含まれるライブキャプションがありますが、これは文字起こしのみで、キャプションは自分の言語ではなく話者の言語で表示されます。ライブ翻訳キャプションはTeams PremiumまたはMicrosoft 365 Copilotで利用できます。Microsoftは日本語、韓国語、アラビア語、ヒンディー語、中国語を含む多数の対応話者言語と翻訳言語を案内していますが、価値はTeams内にとどまり、対象ライセンスに依存します。

プラットフォーム ネイティブ翻訳あり? 対応言語ペア 必要なプラン クロスプラットフォームで動く?
Zoom 翻訳キャプション 幅広いキャプション言語リスト 対象プランまたはアドオンが必要 Zoomのみ
Google Meet AI音声(英語 + 5言語) EN ↔ ES/FR/DE/PT/IT; 1会議につき1ペア Workspace + Google AIアドオン Meetのみ
Microsoft Teams Premium/Copilot経由の翻訳キャプション 数十のキャプション言語 Teams Premium($10/user/mo、年払い)またはMicrosoft 365 Copilot Teamsのみ
MirrorCaption リアルタイム配信(50以上の言語) 50以上の選択可能な言語 無料1時間; Premium €99 1回 Zoom, Teams, Meet, Webex(ブラウザ)

3つのネイティブ विकल्पに共通する制限は、どれも自社のプラットフォーム内でしか動かないことです。たとえば、外部との通話はZoom、社内はTeamsを使うなら、それぞれに別のライセンス、設定、利用習慣が必要です。これこそが、ネイティブ統合では解決できないプラットフォームロックの問題です。

プラグインなしで、あらゆる会議にリアルタイム翻訳を導入する方法

MirrorCaptionはひとつの原則に基づいて作られています。翻訳レイヤーは会議プラットフォームのものではなく、自分のものであるべきだという考えです。ブラウザタブで動作し、会議には誰も参加せず、セットアップは1分未満です。

実際の使い方は次のとおりです。

  1. デスクトップ版ChromeまたはMicrosoft Edgeでmirrorcaption.com/appを開きます。 ダウンロード不要、サインアップフォーム不要。1時間の無料トライアルがすぐに始まります。
  2. 別のタブで会議を開始します。 Zoomのブラウザ版(zoom.us)、Microsoft Teams(teams.microsoft.com)、Google Meet、またはWebexを使います。
  3. Meetモードを選び、「Share Tab Audio」をクリックします。 ブラウザのタブ共有ピッカーで会議タブを選択します。画面共有で使うのと同じブラウザAPIが、そのタブの音声ストリームを取得します。
  4. 入力言語と出力言語を設定します。 話者が何を話しているか、何を読みたいかを選びます。MirrorCaptionは50以上の選択可能な言語を双方向でサポートします。
  5. ストリーミング文字起こしと翻訳がすぐに始まります。 話されてから約500ms以内に単語が表示され始めることがあり、話者がまだ文の途中でも読める速さです。

他の参加者には、会議一覧に新しい参加者は表示されません。MirrorCaptionは通話に参加せず、プラットフォーム録画も開始しないため、会議プラットフォームはボット参加者、録画バナー、入室待ちを代わりに追加しません。翻訳は接続のこちら側で実行されますが、同意や会議録画に関する自社のポリシーに従う責任は引き続きあなたにあります。

例示的なワークフロー

国際チームの朝会

ベルリンのPMが、東京のエンジニアと上海のサプライヤー担当者とGoogle Meetで会議しています。会話は日本語と中国語の間を行き来します。どちらの言語も、Google MeetのネイティブAI翻訳では対象外です(2026年6月時点では英語、スペイン語、フランス語、ドイツ語、ポルトガル語、イタリア語まで)。

PMは別のChromeタブでMirrorCaptionを開き、Meetモードを選び、Google Meetタブの音声を共有します。入力言語は日本語、出力言語はドイツ語。翻訳は各発話の半秒以内に、単語ごとにサイドバイサイドのパネルへ表示されます。会話が中国語に切り替わると、PMは通話を終了したり再参加したりせずにMirrorCaption内で入力言語を切り替えます。会議にボットは追加されません。他の人の設定も変わりません。

このワークフローは例示です。実際の結果は、音声品質、話者の明瞭さ、そして組織のブラウザ設定に左右されます。

正直に述べるべき制約は、Meetモードには会議プラットフォームのブラウザ版が必要だということです。ZoomのブラウザベースのクライアントとTeamsのWeb版は、ほとんどの通常会議では十分に使えますが、機能の利用可否はテナント、ブラウザ、組織ポリシーによって異なる場合があります。組織がZoomデスクトップアプリを必須としている場合は、Talkモードが代替としてマイクから音声を取得します。通話の両側の音声がスピーカー越しに聞こえ、MirrorCaptionがリアルタイムで文字起こしと翻訳を行います。

次のZoomまたはTeamsの通話で使えます。他の参加者にインストールは不要です。

ブラウザでMirrorCaptionを開く

言語サポート: それでも残るプラットフォームロックの問題

言語対応はプラットフォームごとに異なります。Google Meetのネイティブ音声翻訳は、依然として英語と5つの欧州言語が中心です。ZoomとTeamsは、アジアや中東の多くの言語を含む、より広範な翻訳キャプション言語リストを公開していますが、それでも適切なプラン、適切な管理者またはホスト設定、そしてその1つのプラットフォーム内で会議が行われることが前提です。

国境をまたぐチームにとっての問題は、「どこかのプラットフォームがこの言語をサポートしているか」ではなく、「この会議のホスト、プラン、アプリ、プラットフォームが今日それをサポートしているか」です。

MirrorCaptionは、ロシア語、ヘブライ語、タイ語、ベトナム語、トルコ語、さらに40以上の追加の選択可能な言語とともに、同じブラウザタブのワークフローでこれら5つすべてをカバーします。利点は一貫性です。各プラットフォームの異なるホスト側機能に依存するのではなく、同じ言語ピッカーがGoogle MeetからZoom、Teams、Webexまでついてきます。

日本の取引先が交渉の途中で「ちょっと難しいです」と言ったとき、言語学的に正しい訳は「少し難しいです」ですが、文脈上の商業的な意味は、むしろ丁寧な断りに近いものです。話者がまだ話している最中に届くリアルタイム翻訳なら、文だけでなく、確認質問をする時間も得られます。会議後の文字起こしでは、そのどちらも得られません。文脈を伴う言語をAI翻訳がどう扱うかについては、リアルタイム翻訳の精度ガイドで詳しく解説しています。

プラグインなし翻訳の実際のコスト

ネイティブのプラットフォーム機能と専用ツールの価格差は、多くの比較ページが示すよりも大きいです。というのも、ネイティブ機能はしばしば、より高額な基本プランにバンドルされているからです。

ツール アプローチ 言語 価格(2026年)
Zoom translated captions Zoomのみ 幅広いキャプション言語リスト 対象のホストプランまたはアドオンが必要
Google Meet AI translation Meetのみ 英語と対応5言語 Workspace + Google AIアドオンが必要
Teams Premium translation Teamsのみ 数十のキャプション言語 $10/user/monthアドオン(年払い)またはMicrosoft 365 Copilot
JotMe デスクトップアプリ(インストール必要) 200+ 年払いで月額$10から(ライブ翻訳200分)
MirrorCaption Free ブラウザタブ(インストール不要) 50+ 1時間お試し、クレジットカード不要、買い切り
MirrorCaption Premium ブラウザタブ(インストール不要) 50+ €99の買い切り(200時間のホスト型クレジット、今後のすべてのアップデート、最安のVoice Pack料金)

MirrorCaption Premiumに実際に含まれる内容について補足します。€99は、ライフタイムのプランアクセス、今後のすべてのアップデートへの優先アクセス、そして200時間分のホスト型文字起こしクレジットを前払いで含む買い切り料金です。無制限プランではありません。200時間を使い切った後は、Voice Packを5時間単位(€2.99)または15時間単位(€7.99)で別途追加購入できます。Premiumのお客様は、1時間あたりのVoice Pack料金が最も低くなります。週に2時間の多言語会議を行うチームなら、200時間分のクレジットはおよそ2年分に相当します。

これを、デスクトップアプリの月額$10の年払いサブスクリプションと比べてみてください。同じ2年間で$240になり、システムトレイにネイティブアプリが常駐します。月額課金のほうが高くつくツールもあります。2026年版ベスト会議翻訳ツール比較では、各ツールの価格帯を網羅しています。

よくある質問

MirrorCaptionはZoomデスクトップアプリで使えますか?

Meetモードには、Zoomのブラウザ版(ChromeまたはEdgeでzoom.us)が必要です。Zoomデスクトップアプリが必要な場合は、代わりにTalkモードを使ってください。マイクから音声を取得するため、スピーカー越しに聞こえる通話の両側がリアルタイムで文字起こし・翻訳されます。音声取得はタブ取得よりやや直接性が低いものの、ほとんどの用途では翻訳品質は同等です。

他の会議参加者は何かをインストールする必要がありますか?

いいえ。MirrorCaptionはあなたのブラウザタブ内だけで動作します。他の参加者は何もインストールせず、MirrorCaptionから通知も受け取らず、会議に新しい参加者も見えません。これは、ブラウザタブ型ツールと、可視の参加者として会議に入るボットとの決定的な違いです。

ボットなしの会議翻訳はプライベートですか?

MirrorCaptionは会議音声をサーバーに保存しません。音声は文字起こしレイヤーを通じてリアルタイムで処理され、文字起こし後に破棄されます。文字起こし結果はIndexedDBを使ってブラウザ内にローカル保存されます。あなたのブラウザ、あなたのデータです。サードパーティのボットは通話に参加しないため、会議プラットフォームが追加のボット参加者レコードを作成することもありません。AI会議ツール全体のデータ取り扱いについては、AI会議プライバシーガイドをご覧ください。

主にデスクトップ版Teamsを使っていて、ブラウザは使わない場合は?

Teamsのブラウザ版(ChromeまたはEdgeでteams.microsoft.com)は、ビデオ、音声、チャット、画面共有を含む、ほとんどの通常会議の基本ワークフローをサポートしていますが、機能の利用可否はテナントやブラウザによって異なる場合があります。組織にTeamsデスクトップアプリを必須とする明確なポリシーがある場合は、MirrorCaptionのTalkモードが代替としてマイクから音声を取得します。これは、ブラウザベースのアクセスが利用できない他の会議プラットフォームでも使えます。

日本語やアラビア語のリアルタイムAI翻訳の精度はどのくらいですか?

精度は、音声品質、話者の明瞭さ、そして言語の慣用性に左右されます。MirrorCaptionのストリーミング文字起こしエンジンは、各翻訳呼び出しに直前の3〜5セグメントを渡し、日本語や中国語のような声調的または文脈密度の高い言語での一貫性を高めます。会話中心の会議内容であれば、リアルタイムで読みやすく追いやすい翻訳になります。法務、金融、医療のような重要性の高い議論では、専門通訳の代わりではなく、読みながら理解する補助として扱ってください。リアルタイム翻訳の精度ガイドでは、ベンチマーク結果をさらに詳しく解説しています。

結論

2026年には、ボットに対するプラットフォーム側の制御が強化され、ネイティブ翻訳は依然として各プラットフォームのライセンスと設定に依存し、「ボットなし」ツールでもソフトウェアのダウンロードが必要なことが多いです。これは3つの別々の問題です。多くのツールはそのうち1つか2つしか解決しません。MirrorCaptionは3つすべてを回避します。インストール不要、ボット不要、そしてChromeまたはEdge上のあらゆるブラウザベースの会議プラットフォームで50以上の選択可能な言語に対応します。

会議が完全に1つのプラットフォーム内で完結し、その言語ペアがそこでサポートされ、適切なライセンスもすでにあるなら、組み込み機能を使ってください。新しいツールは一切不要です。しかし、Zoom、Teams、Meetを使い分けている場合や、日本語、アラビア語、中国語、韓国語、ヒンディー語、その他の非欧州言語をプラットフォーム横断で同じ構成で使いたい場合は、ブラウザタブ型のアプローチが実用的な答えです。無料トライアルは1時間、クレジットカード不要、月ごとのリセットもありません。

次の会議でMirrorCaptionを試す

1時間無料でお試し。クレジットカード不要。インストール不要。ChromeまたはEdgeで開いて、1分以内に翻訳を始められます。

無料で始める