英翻中即時翻譯器能把正在說的英文即時轉成中文——也能把中文即時轉回英文——而且是在對方還在說話的同時完成。到了 2026 年,實用的選項大致分成三類:像 Google Translate 和 DeepL 這類文字應用程式、企業口譯平台,以及像 MirrorCaption 這種以瀏覽器為基礎的會議工具;它能為即時通話加上字幕並翻譯,而且不需要機器人加入會議。本指南會說明英中即時翻譯實際上是怎麼運作的、為什麼中文是最難處理的語言對之一,以及如何把它用在視訊通話與面對面對話中。
這裡是多數產品頁面會略過的誠實部分:把一句話輸入翻譯框,和翻譯一段即時對話,是兩種不同的問題。前者處理的是已完成的片段;後者則必須跟上重疊的發言、沒說完的想法,以及講到一半突然改口的人。如果你曾把一段中文回覆貼進 Google Translate,結果得到文法正確、但商務上卻很危險的英文,你就已經明白這件事為什麼重要了。
重點摘要
- 即時翻譯 ≠ 文字翻譯。 即時語音翻譯器會在對方還在說話時就同步加字幕並翻譯;文字應用程式則是你貼上完成片段後才翻譯。
- 英語與中文真的很難。 中文沒有動詞時態或複數,仰賴上下文,而且禮貌用語有時會讓「是」的意思整個翻轉。
- MirrorCaption 在瀏覽器中運作,沒有機器人。 Meet 模式可在桌機版 Chrome 或 Edge 擷取會議分頁音訊;Talk 模式則可在手機上處理面對面對話。
- 它可以把翻譯唸出來。 可選的 Speak Translations 會用目標語言朗讀你的翻譯內容,讓對方在即時交流中直接聽見。
- 價格是一次性,不是訂閱制。 1 小時免費試用、€54.99/年(100 小時),或一次付 €99(200 小時)——沒有每月綁約。
什麼是英翻中即時翻譯器?
英翻中即時翻譯器是一種能聆聽語音、轉寫內容,並持續輸出翻譯結果的軟體——通常是逐句、甚至逐字進行——而不是等講話結束才處理。它的關鍵特徵在於「時間」。你在英文還在被說出來的同時,就能讀到(或聽到)中文,這代表你可以在同一段對話裡立即回應,而不是等到之後再回。
這就是 即時字幕與逐字稿 的分界。逐字稿是你之後回頭檢視的紀錄;即時翻譯器則是你在通話中用來做決策的工具。無論是業務談判、看診,還是跨國站立會議,會後摘要晚了十分鐘,差別就在於你能不能及時發現問題,還是直接錯過。
多數通用翻譯應用程式都是為「片段」情境設計的。Google Translate 和 DeepL 在你貼上一段文字、然後等待結果時表現很好;但它們不是為了擷取 Zoom 通話、標示誰說了什麼、在多輪對話中維持上下文,或匯出結果而設計的。專為即時翻譯打造的工具,才能處理人們真正在說話時那種混亂、連續的現實情境。
想在自己的瀏覽器裡看到英中即時字幕嗎? 免費開啟 MirrorCaption——1 小時試用、免信用卡、免安裝。
為什麼英翻中即時翻譯比多數語言對更難?
英文和中文不只是詞彙不同——它們背後的文法邏輯也不同。這就是為什麼一個能準確處理英翻西的工具,到了英翻中卻可能卡住。大多數問題都來自三個差異。
中文透過上下文傳達時間與數量,而不是靠字尾變化
中文是一種分析語言:動詞不會因時態而變化,名詞也不會因複數而改變。「我去了」、「我去」、「我將去」可能共用同一個動詞,時間則由上下文詞語或像了這類助詞來補足。即時翻譯器必須即時從前後語境推斷時態。若上下文視窗抓錯了,「we shipped it」就可能被讀成「we will ship it」——在狀態會議裡,這可是很大的差距。
禮貌用語可能讓字面意思完全反轉
中文商務溝通通常屬於高語境。字面翻譯可以是對的,卻仍然會誤導。當對方說「这个可能有点难」——字面上是「這個可能有點困難」——真正的意思往往是委婉地拒絕。天真的翻譯只會給你「有點困難」,於是你還在繼續推進一筆其實已經談不下去的交易。在這裡,上下文與語氣細節比低語境語言對更重要。
量詞、專有名詞與同音詞會讓語音模型出錯
中文使用量詞(一个、一杯、一位),英文沒有完全對應的表達,而且中文同音詞很多,只有靠上下文才能分辨。專有名詞與產品名稱通常是雙向翻譯最容易失誤的地方。解法不是假裝準確率完美,而是提供讀者一個檢查的方法。這也是為什麼「點一下看原文」——把每個翻譯詞連回它來自的原始內容——對中文來說,比幾乎任何其他語言對都更重要。
想像一下,柏林的產品經理 Lena 在上午 9 點與深圳供應商通話。供應商在談她的截止日期時說了「这个可能有点难」。她的文字翻譯器顯示「this might be a little difficult」,於是她提出小幅折扣想把事情推過去。若有可點擊查看原文的即時翻譯器,她就能檢查這句話的語氣,讀出它真正的意思——委婉拒絕——也就不必做出原本不需要的讓步。
如何即時把英文翻成中文
英中即時翻譯有三種常見情境,而且各自都有清楚的設定方式。簡單來說:視訊會議用 Meet 模式,面對面對話用 Talk 模式;如果對方需要「聽到」翻譯,而不只是「看到」字幕,就用 Speak Translations。
1. 在視訊通話中(Meet 模式,無機器人)
在桌機版 Chrome 或 Microsoft Edge 的分頁中開啟你的 Zoom、Microsoft Teams、Google Meet 或 Webex 通話。再在第二個分頁啟動 MirrorCaption,並分享會議分頁的音訊。它會擷取正在說的內容,並在會議進行時並排顯示英文與中文,還會標示說話者。整個過程不會有任何東西加入會議——參與者名單裡沒有機器人,也不需要批准擴充功能,因此即使 IT 封鎖會議機器人也能使用。多數團隊都可以自行啟用,不必請管理員安裝。
2. 面對面對話(手機上的 Talk 模式)
若是面對面交談,請在手機上的 Chrome 開啟 Talk 模式。它會以單一連續工作階段運作:你只要啟動一次,雙方就能自然輪流說話。你不需要每一句都按按鈕,而且逐字稿會在多輪對話中保留上下文,因此後續回覆仍會被視為同一段對話的一部分。無論是在診所、租屋辦公室,還是市集攤位,把手機遞到桌子對面,雙方都能即時讀懂彼此。
3. 當對方需要「聽」到翻譯時(Speak Translations)
只看字幕有時還不夠。可選的 Speak Translations 功能會用目標語言把你的翻譯內容朗讀出來。你說英文,MirrorCaption 就能用中文發聲;對方聽到後再用自己的語言回覆,而這些內容又會以英文回到你這邊。播放可以透過筆電喇叭、配對的手機喇叭(用 QR code 設定),或——在 Mac 用戶端上——透過虛擬麥克風把翻譯後的語音導入 Zoom、Meet 或 Teams 作為麥克風輸入。重點是跨語言的近即時來回對話,而不是事後一起檢視的逐字稿。
準備好測試「看見翻譯」和「聽見翻譯」的差別了嗎? 開始免費工作階段,並開啟 Speak Translations——免信用卡。
挑選英中即時翻譯器時要看什麼
這個類別很擁擠,而且各種標籤彼此重疊。以下是幾種主要做法,在英中即時語音翻譯真正重要的項目上如何比較。
| 做法 | 即時英中語音翻譯 | 跨平台可用 | 可朗讀翻譯 | 計價模式 |
|---|---|---|---|---|
| MirrorCaption | 可以——通話期間串流字幕與翻譯 | 以瀏覽器為基礎,支援 Zoom、Teams、Meet、Webex,另有面對面 Talk 模式 | 可以——可選 Speak Translations | 一次性或年度制,沒有按席位訂閱 |
| 文字應用程式(Google Translate、DeepL) | 為輸入片段而設計;語音模式是逐輪處理,不是連續擷取通話 | 任何可貼上文字的地方都能用 | 短句的語音輸出有限 | 免費/免費增值 |
| 會議工具(例如 Otter.ai) | 英文轉寫很強;即時中文翻譯有限 | 透過應用程式或會議機器人加入 | 通常沒有 | 月費訂閱 |
| 平台內建字幕(Zoom、Teams、Google Meet) | 特定付費方案層級才有翻譯字幕 | 只能鎖定在單一平台內使用 | 通常沒有 | 綁定主辦者的方案層級 |
如果你的整個團隊都只用同一個工具,主流平台內建字幕確實很方便,但它們的翻譯功能取決於主辦者的方案層級,而且只能在該平台內運作。至於確切支援哪些語言對與方案需求,請查看各家廠商自己的支援文件——他們都有公開,而且細節會變動。挑選英中即時翻譯器時,實際上可以用這五個問題來檢查:
- 它是真即時,還是會後才出結果? 串流輸出才能讓你在對話中立即回應。
- 它能跨平台嗎? 如果你會用不只一種會議工具——或是會面對面交談——平台鎖定的字幕就不夠用。
- 你能驗證翻譯嗎? 對高語境中文來說,「點一下看原文」非常重要。
- 它能朗讀,而不只是顯示字幕嗎? 語音輸出能把單向閱讀變成雙向交流。
- 實際成本是多少? 對偶爾使用的人來說,一次性價格比訂閱費更划算。
若想更全面比較各種工具,請參考我們整理的 2026 年最佳會議翻譯器,以及我們的 多語言轉寫指南。
即時英翻中準確嗎?
誠實的答案是:在乾淨音訊下表現不錯,在雜亂音訊下就不完美,而且在高風險的法律或醫療決策中,永遠不能取代真人口譯員。在安靜、且一次只有一個人說話的通話中,現代串流翻譯對日常英文與中文都能處理得很好。當出現多人插話、濃重口音、背景噪音、慣用語與專有名詞時,準確度會可預期地下降——這些也是人類聽者最容易出錯的地方。
有兩個設計選擇可以縮小這個差距。第一是上下文:把前幾段內容一起送進每次翻譯呼叫,系統就能解決單一句子無法判斷的時態與指涉。第二是可驗證性:因為翻譯會連回原始詞句,你可以點任何中文片語,查看它來自哪個英文原文,並在造成損失前抓出誤讀。我們在〈即時翻譯準確度〉一文中深入討論了這些取捨。
想像 Daniel,一位客服主管,正在面對面回答一位說中文的客戶,對方詢問退款期限。Talk 模式會把雙方的發言保留在同一個工作階段中,所以當客戶接著問——「那如果超過了呢?」——翻譯器已經掌握前一輪的退款上下文,能正確翻出後續問題,而不是把它當成一段孤立片段。
價格:免費、年度與一次性方案
MirrorCaption 採一次性購買,而不是循環訂閱,這很適合每個月只做幾次跨語言通話、又不想每月都為此付費的人。
- 免費: 1 小時試用、一次性、無每月重置、免信用卡。完整使用 Meet 與 Talk 模式,以及 50+ 種可選語言。
- 年度方案 — €54.99/年: 內含 100 小時的代管轉寫額度,並包含一整年的更新與優先支援。
- Premium — €99 一次性: 一次購買、無循環訂閱,包含所有未來更新與優先使用權,並預先附贈 200 小時代管轉寫額度。
- Voice Packs: 當你用完內含時數後,可加購代管時數(例如 5 小時 €2.99),各方案皆可單獨購買。Premium 帳號享有最低的每小時加購費率。
這裡補充一點,因為很容易被誤解:€99 的 Premium 方案不是「永久無限時數」。它是一筆一次性購買,內含 200 小時代管額度與所有未來更新;超過之後,則以目前最優惠的費率購買 Voice Packs 補時。若要和像 Otter 付費方案 這類訂閱工具比較,對輕度與偶爾使用者來說,沒有月費的 €99 一次性方案,算起來完全是不同的數學。
想想 Mei,一位自由顧問,每個月大概會進行六次雙語客戶通話。若她訂閱 €16.99/月的轉寫服務,一年下來不管有沒有用都要花超過 €200。選擇 €99 一次性方案後,內含的 200 小時大約足夠她實際使用一年半;只有在通話時間拉長時,她才需要加購 Voice Pack——信用卡上不會每月固定扣款。
常見問題
我可以在視訊通話中即時把英文翻成中文嗎?
可以。使用 MirrorCaption 的 Meet 模式時,你只要在桌機版 Chrome 或 Microsoft Edge 的瀏覽器分頁中開啟通話,再在旁邊啟動 MirrorCaption,它就會擷取會議分頁音訊,並即時並排顯示英文與中文。會議中不會有機器人加入,Zoom、Teams 或 Google Meet 裡也不需要安裝任何東西。
有免費的英翻中即時翻譯器嗎?
MirrorCaption 為每個帳號提供 1 小時免費試用、一次性、免信用卡,而且沒有每月重置。之後你可以選擇年度方案(100 小時代管轉寫額度)或一次性 Premium 方案(200 小時),也可以加購 Voice Packs。
即時英翻中準確嗎?
在清楚音訊、且一次只有一位說話者的情況下,現代串流翻譯對日常英文與中文都能處理得很好。當出現多人插話、口音很重、慣用語與專有名詞時,準確度會下降。當語氣細節很重要時,「點一下看原文」可以讓你檢查任何中文翻譯背後的原始詞句。
它可以把中文翻譯唸出來嗎?
可以。可選的 Speak Translations 功能能把你的翻譯內容用目標語言朗讀出來,讓對方聽得到,而不只是看字幕。播放可使用筆電喇叭、配對的手機喇叭,或 Mac 虛擬麥克風將聲音導入會議中。
它只適用於會議,還是也能用在面對面對話?
可以。手機上的 Talk 模式(在 Chrome 中效果最佳)可用於面對面對話,並以單一連續工作階段運作。你只要啟動一次,雙方就能自然輪流說話;你不需要每句都按按鈕,而且逐字稿上下文會在多輪對話中延續。
我需要安裝應用程式或瀏覽器擴充功能嗎?
不需要。MirrorCaption 是以瀏覽器為基礎的網頁應用程式,會議參與者無需安裝。Meet 模式可在桌機版 Chrome 或 Microsoft Edge 中運作,Talk 模式則可在手機上的 Chrome 中運作。沒有下載、沒有擴充功能,也沒有需要批准的會議機器人。
結論
一個好的英翻中即時翻譯器,能做到文字應用程式做不到的三件事:跟上真實語速、讓你在高語境語言中驗證細節,以及跨越你實際開會與對話的平台與空間。對於輕量、偶爾的跨語言工作來說,一個以瀏覽器為基礎、沒有機器人、而且採一次性價格的工具,往往比企業口譯平台與月費訂閱更划算。
如果你下一通電話或下一段對話會跨越英中語言界線,最快的判斷方式就是直接用自己的音訊試試看。先從免費 1 小時開始,開啟並排字幕,再點一下翻譯看看背後的原文。你會在五分鐘內知道,即時翻譯是不是你會議一直缺少的升級。