2026 年最適合視訊通話的即時語音翻譯應用程式是 MirrorCaption、Zoom Translated Captions、Google Meet Translated Captions、Microsoft Teams Live Translated Captions、Microsoft Translator、Notta 和 Otter.ai。每一款都適合不同情境:有些綁定特定平台,有些需要會議機器人,而且只有兩款能在即時通話中把翻譯直接唸出來。
真正重要的差距,不在於有哪些工具,而在於你的翻譯工具是在對話進行時運作,還是只能在對話結束後才處理。當一位韓國合作夥伴在 45 分鐘通話的第 12 分鐘說出含糊不清的內容時,你需要的是幾秒內就出現的翻譯——而不是一小時後才整理好的精美摘要。
示意情境
一支物流業務團隊正在與南韓的新經銷商通話。到了第 14 分鐘,經銷商切換成韓文,說明對交貨時段的疑慮。業務代表在會後產出的逐字稿會準確記錄那些話——大約 60 分鐘後才會完成。即時串流翻譯器則會在一秒內顯示同一句話,而此時對話仍然活著,足以立刻回應。
我們依四項標準評估了七款工具:翻譯是否真的是串流式(逐字處理,而非後製)、是否需要會議中的機器人、是否能把翻譯唸出來,以及實際費用是多少。
- MirrorCaption 是這份清單中唯一可在瀏覽器版 Zoom、Teams、Meet 和 Webex 通話中運作、且不需要機器人的瀏覽器工具,並可透過 Speak Translations 選用語音輸出。
- Zoom、Google Meet 和 Teams 都提供內建的即時翻譯字幕——如果整個團隊都使用同一平台,這很方便;但只要通話切換到其他工具,就完全派不上用場。
- Microsoft Translator 免費且支援語音輸出,但要求所有參與者在通話旁另外開啟 Translator 應用程式。
- Notta 和 Otter.ai 主要是會後工具——很適合做筆記,但嚴格來說並不是串流式語音翻譯器。
- 只有 MirrorCaption(透過 Speak Translations)和 Microsoft Translator(在其自家應用程式內)能在即時交流中把翻譯語音唸出來。
「即時語音翻譯」在視訊通話中到底是什麼意思
有兩種東西都被稱為「即時翻譯」,但實際運作方式差很多。
串流式轉錄與翻譯會在說話者還在講話時,就把文字顯示在畫面上。文字會逐字出現——通常先顯示部分結果,隨著更多上下文進來再自行修正。你是在事情發生的當下閱讀對話內容。MirrorCaption 和平台原生的翻譯字幕功能就是這樣運作。
近即時或後製處理則是在語句完成後才產出精修過的逐字稿或翻譯,有時只延遲幾秒,有時要等整場會議結束後才出來。Otter.ai 和 Notta 主要屬於這一類。它們的強項在於筆記品質與待辦事項,而不是通話進行中的理解。
還有一個多數比較文章完全忽略的差異:文字輸出 vs. 語音輸出。
這份清單中的七款工具都能在畫面上顯示翻譯文字。只有兩款能在即時交流中把翻譯唸出來。當其中一位參與者不方便看螢幕、你正在對一個房間簡報,或對方需要聽到翻譯後的回應而不是自己閱讀時,這個差異就最重要。
當一位日本客戶說出 「ちょっと難しいです」——字面意思是「有點困難」——串流工具會在通話進行中就顯示這句話,而此時還剩 40 分鐘可以回應。會後筆記則會在對話已經往前推進後,才給你同樣的三個字。
視訊通話用的 7 款最佳即時語音翻譯應用程式
1. MirrorCaption — 最適合跨平台與語音翻譯
MirrorCaption 是一款以瀏覽器為基礎的即時轉錄與翻譯工具,支援 50+ 種可選語言。只要在桌面版 Chrome 或 Microsoft Edge 中,搭配任何瀏覽器版視訊通話——Zoom、Google Meet、Teams、Webex——開啟它,它就能直接從瀏覽器分頁擷取會議音訊。沒有機器人加入會議。參與者也不需要額外安裝管理員權限。
轉錄會以逐字方式顯示,延遲低於一秒。翻譯會立即跟上,與原文並排顯示。每個翻譯後的字詞都可以點擊,查看它對應的原始字詞;當像「ちょっと難しいです」這類片語不能只靠字面翻譯時,這點就很重要。
MirrorCaption 在這份清單中最突出的功能是 Speak Translations——一項可選功能,能把使用者翻譯後的語音以目標語言唸出來。用中文說話、翻成英文時,MirrorCaption 可以在交流仍進行中時合成英文輸出。播放方式包括:筆電喇叭、透過 QR code 配對的手機,或 Mac 虛擬麥克風,將翻譯音訊直接路由到 Zoom、Meet 或 Teams 作為麥克風輸入,讓對方透過通話聽到翻譯內容。
對於面對面對話,手機上的 Talk mode 會以連續會話方式運作——雙方在同一個會話中輪流發言,不需要每一句都重新開始擷取。這就像連續口譯會話與點一下就翻譯的短語手冊之間的差別。
- 價格(mirrorcaption.com/#pricing):免費 — 一次性 1 小時,無需信用卡 · 年繳 — €54.99/年,含 100 小時 hosted credit · Premium(終身方案)— 一次性 €99,含 200 小時 hosted credit,未來所有更新與新功能優先存取,額外時數享最低 Voice Pack 費率;額外時數可另購 Voice Packs
- 適用於: 桌面版 Chrome 或 Edge(Meet mode,用於會議分頁音訊);手機版 Chrome(Talk mode,用於面對面)
- 需要機器人: 否
- 語音輸出: 是 — Speak Translations(筆電喇叭、配對手機或 Mac 虛擬麥克風)
- 語言: 50+ 種可選
限制: Meet mode 需要桌面版 Chrome 或 Edge——Safari 和 Firefox 不支援會議分頁音訊擷取。手機版 Talk mode 使用麥克風,不是為會議分頁音訊設計。工作場所的螢幕擷取與網頁應用程式政策仍然適用;多數團隊可自行設定,但請先確認貴組織的瀏覽器設定。
2. Zoom Translated Captions — 如果整個團隊都用 Zoom,這是最佳選擇
Zoom 提供 Translated Captions,這是主持人端功能,適用於部分付費方案。當主持人啟用後,每位參與者都可以選擇目標語言,並在通話中即時看到翻譯字幕。不需要開啟第三方工具,也不需要額外登入。
如果你的整個會議流程都在 Zoom 裡,這是阻力最低的路徑。可用的語言配對與所需方案等級列在 Zoom 的支援頁面上,且會隨著 Zoom 擴大覆蓋範圍而變動——在假設你的語言配對受支援之前,請先確認最新清單。
- 價格: 包含於符合資格的付費 Zoom 方案中——請參考 zoom.us/pricing 了解目前方案需求
- 適用於: 僅限 Zoom
- 需要機器人: 否(主持人端功能)
- 語音輸出: 否 — 僅文字字幕
- 語言: 一組語言配對;請參考 Zoom 的支援文章 了解最新清單
限制: 平台綁定 Zoom。多數方案沒有可匯出的翻譯逐字稿。若你的工作流程中有任何參與者使用不同的會議平台,這項功能就幫不上忙。
3. Google Meet Translated Captions — 最適合 Google Workspace 團隊
Google Meet 在部分 Google Workspace 方案中內建 Translated Captions。在會議中開啟後,字幕會即時以參與者的目標語言顯示。和 Zoom 的版本一樣,它是內建功能——不需要額外視窗。
免費的個人 Google 帳戶方案不包含 Translated Captions。可用性與支援的語言配對會依 Workspace 方案而異,並記載於 support.google.com/meet。
- 價格: 適用於部分 Google Workspace 方案——免費個人方案不提供
- 適用於: 僅限 Google Meet
- 需要機器人: 否
- 語音輸出: 否 — 僅文字字幕
- 語言: 一組語言配對;最新清單請見 support.google.com/meet
限制: 平台綁定 Google Meet。標準方案下字幕是暫時性的——沒有可搜尋的匯出逐字稿。
4. Microsoft Teams Live Translated Captions — 最適合 Microsoft 365 組織
Microsoft Teams 提供 Live Translated Captions,作為 Teams Premium 與某些 Microsoft 365 方案的一部分。每位參與者都可以選擇目標語言,並即時看到會議語音的字幕與翻譯。
對於已經在使用 Microsoft 365 的組織來說,這是 Teams 原生通話的自然選擇。和 Zoom 與 Google Meet 的對應功能一樣,它的用途也止於 Teams 邊界。
- 價格: 需要 Teams Premium 或符合資格的 Microsoft 365 方案——請在 learn.microsoft.com 確認目前需求
- 適用於: 僅限 Microsoft Teams
- 需要機器人: 否(管理員必須啟用此功能)
- 語音輸出: 否 — 僅文字字幕
- 語言: 一組語言配對;請參考 Microsoft 文件 了解最新清單
限制: 除了標準 Teams 授權外,還需要 Teams Premium。平台綁定 Microsoft Teams。
5. Microsoft Translator — 最佳免費選項(但有條件)
Microsoft Translator 提供免費的 Conversations 功能:多位參與者各自用自己的裝置加入同一個翻譯會話,並即時看到其他人的語音被翻譯成自己選擇的語言。它支援文字轉語音,因此每個裝置都可以把翻譯後的語音唸出來。
但條件是:它是獨立應用程式體驗,不是與既有視訊通話平台整合。若是視訊通話,所有參與者都需要在會議旁另外開啟 Microsoft Translator。這種額外步驟對某些用途——特別是面對面對話——還算可接受,但它不是能無縫取代瀏覽器分頁翻譯工具的方案。
- 價格: 免費 — translator.microsoft.com
- 適用於: 獨立網頁與行動應用程式——不會自動整合到 Zoom、Teams 字幕功能、Meet 或其他通話平台
- 需要機器人: 否
- 語音輸出: 是 — Translator 應用程式內的裝置 TTS
- 語言: 語言涵蓋範圍廣;最新清單請見 translator.microsoft.com
限制: 所有參與者都必須主動開啟並加入 Translator 會話。無法自動擷取另一個平台的會議音訊。
6. Notta — 最適合會後翻譯筆記
Notta 是一款 AI 筆記工具,可即時轉錄會議,並能產出翻譯摘要與筆記,主要是在會議結束後完成。它透過加入通話的會議機器人,或透過瀏覽器擴充功能來運作。
Notta 的強項在於會後的精修成果:乾淨的逐字稿、翻譯摘要、可分享的筆記。對於需要多語言會議紀錄,而不是通話中即時理解的團隊來說,這是實用的選擇。若把它當作通話中使用的即時語音翻譯器,它就不太適合這個角色。
- 價格: 訂閱方案 — 請見 notta.ai/pricing 了解目前方案等級
- 適用於: Zoom、Google Meet、Microsoft Teams,以及其他平台,透過機器人或瀏覽器擴充功能
- 需要機器人: 是
- 語音輸出: 否
- 語言: 支援多種語言轉錄;翻譯功能依方案而異
限制: 會議機器人會以可見參與者身分加入,且在多數平台上會觸發錄製通知。通話中的翻譯體驗是次於會後工作流程的。
7. Otter.ai — 最適合以英文為主的團隊
Otter.ai 是最廣泛使用的會議轉錄工具之一。它的即時英文轉錄確實很強——清楚的說話者標籤、持續更新的 AI 摘要,以及透過 OtterPilot 在會議進行時就會出現的待辦事項。
它在較高階方案中也有翻譯功能,但 Otter 本質上仍是以英文為主。對於所有參與者都說英文、目標是筆記與摘要的會議,Otter 表現不錯;但對於需要在對話中即時理解的多語言通話,它就不夠力了。
- 價格(otter.ai/pricing):免費(分鐘數有限)· Pro $16.99/月 · Business $30/月
- 適用於: Zoom、Google Meet、Microsoft Teams(透過 OtterPilot 機器人)
- 需要機器人: 是(OtterPilot 會以可見方式加入會議)
- 語音輸出: 否
- 語言: 主要為英文
限制: OtterPilot 會以可見參與者身分加入會議。非英文語言的翻譯品質落後於專門的多語言工具。不適合不希望有機器人出現的團隊。
在下一通電話中試試 MirrorCaption
1 小時免費。無需信用卡。在桌面版 Chrome 或 Edge 中,可搭配瀏覽器版 Zoom、Teams、Meet 和 Webex 使用。
免費開啟 MirrorCaption如何選擇合適的即時語音翻譯應用程式
四個問題就能快速縮小範圍。
你需要把翻譯唸出來,還是文字就夠了?
如果通話中的每個人都能閱讀字幕,文字就足夠了——而上面七款工具中有六款都能產生文字。如果有一位參與者不容易看螢幕,或者你需要對方在即時簡報或面對面對話中聽到翻譯後的回應,那麼只有 MirrorCaption via Speak Translations 和 Microsoft Translator(在其自家應用程式內)支援語音輸出。對於 跨境銷售通話 這類需要潛在客戶聽到翻譯而不是自己閱讀的情境,這個差異就是決定性的。
你的所有視訊通話都在同一個平台上嗎?
如果是——而且那個平台是 Zoom、Meet 或 Teams——內建的翻譯字幕功能就是阻力最低的路徑。不需要額外登入、不需要額外視窗,也不需要在既有方案之外再加購每席位附加功能。
如果你主持或加入的通話分散在多個平台,或你也想把同一工具用在面對面對話上,平台原生功能就無法跨平台使用。MirrorCaption 可在桌面版 Chrome 或 Edge 中,跨瀏覽器版 Zoom、Teams、Meet 和 Webex 通話運作,並在手機上加入 Talk mode 供面對面使用。若想更全面了解跨平台翻譯工具,請參考我們的 2026 最佳會議翻譯器總整理。
你的組織是否限制會議機器人或第三方擴充功能?
會議機器人(Notta 和 Otter.ai 使用)會以可見參與者身分加入通話,並在多數平台上觸發錄製通知。許多 IT 政策會封鎖或不鼓勵第三方機器人。MirrorCaption 直接從瀏覽器分頁擷取音訊——不需要機器人加入會議。
請注意,組織對瀏覽器螢幕分享與網頁應用程式存取的政策仍然適用。許多團隊可以不必提交 IT 工單就設定好 MirrorCaption,但請先確認貴組織的瀏覽器與螢幕擷取政策。若要直接比較機器人這個問題,請參考 MirrorCaption vs Zoom AI Companion。
你實際上多久需要一次翻譯?
若只是偶爾使用——每月幾通電話——MirrorCaption 的一次性免費 1 小時,或 Microsoft Translator 的免費方案,可能就夠了。若是經常使用,請比較一次性 €99 的 Premium(含 200 小時 hosted credit)與像 Otter Pro 約 $16.99/月 這類按席位訂閱工具。若每週有兩小時的翻譯通話,這種一次性方案通常會在前兩個月內回本。
快速比較:視訊通話用即時語音翻譯應用程式
| 工具 | 串流式即時 | 語音輸出 | 需要機器人 | 適用平台 | 起始費用 |
|---|---|---|---|---|---|
| MirrorCaption | 是 | 是(Speak Translations) | 否 | 桌面版 Chrome/Edge;手機版 Chrome | 免費 1 小時;€99 一次性 Premium |
| Zoom Translated Captions | 是 | 否 | 否 | 僅限 Zoom | 付費 Zoom 方案 |
| Google Meet Translated Captions | 是 | 否 | 否 | 僅限 Google Meet | 部分 Workspace 方案 |
| Teams Live Translated Captions | 是 | 否 | 否 | 僅限 Teams | 需要 Teams Premium |
| Microsoft Translator | 是 | 是(應用程式 TTS) | 否 | 僅限獨立應用程式 | 免費 |
| Notta | 部分 | 否 | 是 | Zoom、Meet、Teams | 訂閱制——請見網站 |
| Otter.ai | 部分(英文) | 否 | 是 | Zoom、Meet、Teams | $16.99/月 Pro |
常見問題
Zoom 有適用於視訊通話的即時語音翻譯嗎?
有。Zoom 在部分付費方案中提供 Translated Captions。當主持人啟用此功能後,參與者會在會議進行時即時看到自己選擇的目標語言字幕。它只有文字字幕——沒有語音輸出。可用的語言配對與所需方案等級列在 Zoom 的支援頁面 上,並會隨著 Zoom 擴大覆蓋範圍而更新。
有不會以機器人身分加入我會議的即時語音翻譯應用程式嗎?
有。MirrorCaption 會在你的瀏覽器分頁中執行,並直接從桌面版 Chrome 或 Edge 的會議分頁擷取音訊。沒有機器人加入會議,出席者名單中也不會多出額外參與者。平台原生選項——Zoom Translated Captions、Google Meet Translated Captions 和 Teams Live Translated Captions——也都不需要機器人,但各自只能在自己的平台內運作。
即時翻譯器能在視訊通話中把翻譯唸出來嗎?
可以。MirrorCaption 的 Speak Translations 功能會以近即時的速度,把使用者翻譯後的語音用目標語言唸出來。播放方式包括筆電喇叭、透過 QR code 配對的手機,或將翻譯音訊路由到 Zoom、Meet 或 Teams 作為麥克風輸入的 Mac 虛擬麥克風——因此對方會透過通話聽到翻譯。Microsoft Translator 也支援文字轉語音播放,但這是在其獨立應用程式內運作,而不是作為既有視訊通話上的整合層。
AI 語音翻譯在視訊通話中的準確度如何?
準確度取決於說話清晰度、麥克風品質、語言配對與口音。能把前面對話片段作為上下文帶入每次翻譯的工具,通常比逐句獨立翻譯的工具更適合多輪對話。對於最嚴苛的用途——法律、醫療、高風險談判——請把 AI 翻譯視為強力的即時輔助,而不是專業口譯員的認證替代品。若想更深入了解 AI 翻譯品質如何因工具與語言而異,請參考我們對 即時翻譯準確度 的分析。
視訊通話中最好的免費即時語音翻譯應用程式是什麼?
平台原生選項(Zoom Translated Captions、Google Meet Translated Captions、Teams Live Translated Captions)如果你本來就有付主持方案,實際上等於免費,但每一款都只綁定單一平台。Microsoft Translator 免費且不綁平台,但要求所有參與者在通話旁另外開啟其獨立應用程式。MirrorCaption 提供一次性免費 1 小時——無需信用卡、沒有每月重置——足以讓你在真正的通話中評估串流翻譯體驗,再決定是否付費。
結論
多數團隊會傾向使用自己已在用的平台內建翻譯功能。當所有人都留在同一個工具上時,這樣確實很好用。但只要通話切換到不同平台,或對話發生在面對面情境,平台原生功能就會完全消失。
MirrorCaption 正是為了填補這個落差而打造:一個可跨瀏覽器版視訊通話運作的單一瀏覽器分頁,不需要機器人就能擷取音訊,並可選擇透過 Speak Translations 把翻譯內容直接唸出來——速度足以讓真實對話持續進行。從你下一通多語言通話開始,先試試免費 1 小時體驗。