MirrorCaption 可在瀏覽器版的 Zoom、Google Meet 和 Teams 通話中,即時串流轉錄與翻譯,支援 50+ 種語言——也可透過手機麥克風進行面對面使用。免費試用 1 小時,無需信用卡。

你剛接到一個合作案,對象是一位韓國創作者,她的美食頻道有兩百萬訂閱者。她很興奮——你聽得出來。她對你的第一個問題做了很長的回答,35 秒的韓文,你一聽就知道內容生動又細緻。你微笑。你點頭。你完全不知道她說了什麼。而你還有 47 分鐘的訪談要進行。

大多數為內容創作者打造的轉錄工作流程,解決的是後製問題。上傳錄音、等待、取得逐字稿。這對剪輯有幫助,但無法讓你在第三分鐘時追問下一個問題。MirrorCaption 會在對話進行當下就陪著你。

重點摘要

兩種轉錄方式——以及為什麼多數創作者工具錯過了當下

多數給創作者用的轉錄工具是為剪輯室打造的,不是為錄音室打造的。這之間有個重要差別:

後製轉錄——你錄下影片、上傳或處理檔案,之後才收到逐字稿。像 Descript、Sonix、Happy Scribe 和 Rev 這類工具在這方面最強:時間戳記、說話者標籤、乾淨匯出、剪輯工作流程。但這些幫助通常是在對話已經往前走之後才到位。

即時轉錄——字幕會在字詞被說出口時出現,延遲低於說話者 500 毫秒。Otter.ai 可用於以英文為主的會議。MirrorCaption 則支援 50+ 種語言,並提供左右並排的原文與翻譯——所以如果你的來賓用韓文回答,你會同時在左側看到韓文文字、右側看到英文翻譯。

差異很明確:當一位不說英文的來賓在第八分鐘回答你的問題時,沒有任何後製工具能幫你在第九分鐘立刻追問那個顯而易見的後續問題。這正是 MirrorCaption 的設計場景。另見:即時字幕 vs. 逐字稿——實際差別是什麼

MirrorCaption 如何為內容創作者運作

MirrorCaption 完全在你的瀏覽器中執行——不用下載、不用擴充功能,也不會有機器人加入通話並出現在每個人的參與者名單裡。

Meet 模式——適用於瀏覽器版視訊通話

在桌機版 Chrome 或 Microsoft Edge 中,於第二個分頁開啟 MirrorCaption。選擇 Meet 模式,然後分享你的 Zoom、Google Meet 或 Teams 瀏覽器分頁。MirrorCaption 會擷取該分頁的音訊以及你的麥克風,並立即開始串流轉錄。選擇說話者語言與你偏好的翻譯語言——當來賓說話時,左右並排畫面會逐字更新。

Talk 模式——適用於面對面的創作者聚會

正在現場拍攝合作內容嗎?在手機上的 Chrome 開啟 MirrorCaption,切換到 Talk 模式,然後把手機放在桌上你們兩人之間。雙方都能即時讀到彼此的話。無需安裝 App。除了正常使用瀏覽器外,也不用擔心行動數據方案。

會後

當你停止會話後,完整逐字稿就屬於你——可複製到剪貼簿、匯出為純文字,或下載為 Markdown。說話者標籤會顯示誰說了什麼。時間戳記會標示每個片段。你可以在逐字稿中搜尋,並跳到任何時刻。

這也是適用於 多語言遠端團隊 的同一套工作流程——只是套用到你的創作者訪談情境。

在你的下一場訪談中試試看。 1 小時免費、無需信用卡、無每月重置。

免費開啟 MirrorCaption

每位擁有全球受眾的創作者都熟悉的訪談情境

想像同一場訪談的兩種版本。

沒有 MirrorCaption:Ji-ho 是一位韓國遊戲創作者,當你問她關於倦怠的問題時,她用你從語氣、手勢就能看出來的方式,給出了一個深思熟慮、很個人的回答。你不會韓文。你問下一個照本宣科的問題,然後往下走。之後,當逐字稿送來時,你才發現她描述了自己曾經暫停直播 90 天的具體經過,以及她決定回歸的確切時刻。你的追問本來可能會是影片中最吸引人的段落。你永遠不會知道,因為對話已經往前走了。

有 MirrorCaption:當 Ji-ho 說話時,你會看到她的話在左欄以韓文出現——右欄則在半秒內顯示英文翻譯。你讀到:「我離開直播 90 天……我回來的那一刻,是我意識到自己是在為觀看數而做,而不是為了快樂。」你打斷她。「等等——你可以多說一點那個時刻嗎?」訪談就此轉向。

當一位日本來賓說出「ちょっと難しいです」,而你在原文旁看到「有點困難」時,如果你曾在日本待過一段時間,你就知道這其實是把更強烈的意見用較委婉的方式表達。原文會保留在畫面上。你可以進一步追問。只有翻譯還不夠;左右並排檢視才會給你完整脈絡。

這就是即時翻譯與後製轉錄的差別。你不是在讀「已經說過的內容」。你是在讀「正在說的內容」——而且你還有 45 分鐘可以引導這場對話。

之後你可以如何運用逐字稿

會話逐字稿不只是保險網,更是內容行事曆。一場 60 分鐘的創作者訪談可以產出:

若想更深入了解如何跨平台運用創作者逐字稿,請參考我們的 多語言轉錄指南

MirrorCaption 對直播不做什麼(請先看這段)

MirrorCaption 會在你的螢幕上顯示字幕——不會顯示在直播畫面上。 它不是 OBS 外掛,也不會把翻譯字幕疊加到你的直播上讓觀眾看到。如果你需要的是這個功能,請使用專門的直播字幕工具,例如 StreamTranslate 或 LocalVocal。

不過,許多直播創作者仍會在直播期間覺得 MirrorCaption 很有用:例如理解一位在鏡頭外說話的多語言來賓、跟上你不會的語言的聊天室訊息,或監看共同主持人用母語說了什麼。它是創作者的理解工具——不是觀眾字幕工具。

若要在最終影片中提供觀眾可見的字幕,YouTube 的自動字幕在上傳後可支援英文。若要製作多語言字幕,請匯出 MirrorCaption 逐字稿,並在剪輯軟體中將其加入為 SRT 軌。 我們關於 如何在任何視訊通話中取得即時字幕 的指南,會詳細說明這兩種做法。

🎙

創作者訪談(Zoom)

在 Meet 模式中開啟 MirrorCaption。擷取你的 Zoom 分頁音訊。逐字讀取來賓的回答——同時以他們的語言與你的語言顯示。

📷

面對面合作

沒有共同語言?在手機上使用 Talk 模式。把手機放在桌上你們之間。兩位創作者都能即時讀到彼此的內容,不必切換 App。

🎥

直播(你的視角)

在你的螢幕上即時閱讀多語言來賓或聊天室留言。觀眾看到的是你的直播;你看到的是字幕。不需要 OBS 外掛。

📚

訪談後內容

匯出會話逐字稿,用於節目筆記、YouTube 描述、部落格草稿與社群字幕——全部都來自同一段 60 分鐘內容。

這週要進行多語言創作者訪談嗎? 免費開始——包含 1 小時,無需設定。

免費試用 MirrorCaption

價格——對創作者來說實際要花多少

大多數為創作者打造的轉錄工具都按月收費。MirrorCaption 不會。

工具 即時 翻譯 需要安裝 費用
MirrorCaption ✓ 通話期間 50+ 種語言,雙語檢視 僅需瀏覽器分頁 €49 一次性(200 小時)
Descript ✗ 後製 後製翻譯工作流程,不是即時雙語檢視 網頁版 + 桌面應用程式 $24/月
Otter.ai ✓(以英文為主) 有限 會議助理 / App 工作流程 $16.99/月
Sonix ✗ 後製 53+ 種語言 瀏覽器上傳 $10/小時
Happy Scribe ✗ 後製 120+ 種語言 瀏覽器上傳 ~$17/月(AI)

算式很直接:以 €49 一次性來看,MirrorCaption 兩個月就能比 Descript 回本,三個月就能比 Otter 回本。之後每月都不用再付費——如果你需要超過 Lifetime 方案內含的 200 小時,還可以用 €2.99 購買 5 小時的 Voice Pack 加值。

如果你需要透過剪輯逐字稿來編輯影片,Descript 會是更好的工具——那確實是不同的工作流程。但若你要在通話當下理解多語言來賓,Descript 完全幫不上忙。

字幕也讓完成的影片更容易搜尋、引用與再利用。你已經從 MirrorCaption 拿到可搜尋的逐字稿——這會提供你製作字幕、描述、節目筆記與短片的原始文字。

常見問題

YouTube 會自動加上字幕嗎?

會,但有一些限制。YouTube 會自動為上傳的長影片與 Shorts 產生字幕,支援多種語言,但品質會有所差異,混合語言音訊也可能造成問題。對於 直播,自動字幕僅支援英文,而且在直播結束後不會保留——系統會從 VOD 重新產生新的字幕軌,可能與直播時顯示的內容不同。若是多語言內容或非英文來賓,請在錄製期間使用獨立的即時轉錄工具。

我要如何即時轉錄一場有外語來賓的 Zoom 訪談?

在桌機版 Chrome 或 Edge 中,於第二個分頁開啟 MirrorCaption。選擇 Meet 模式,並將你的 Zoom 瀏覽器分頁分享為音訊來源。將來賓的語言選為來源語言,並將你的語言選為翻譯目標。當來賓說話時,MirrorCaption 會在左側逐字串流轉錄、右側顯示翻譯——無需上傳錄音,也不用等待會後處理。

我可以把 MirrorCaption 和 OBS 一起使用嗎?

MirrorCaption 不是 OBS 外掛,也不會把翻譯字幕疊加到你的直播上讓觀眾看到。它會在瀏覽器分頁中,於你自己的螢幕上顯示即時字幕。如果你需要直接整合到 OBS、讓觀眾可見的字幕,StreamTranslate(雲端式、30+ 種語言)或 LocalVocal(免費、在本機執行、100+ 種語言)是專為此設計的。MirrorCaption 是這些工具的補充——它是你在直播期間用來理解多語言來賓的工具,而直播字幕工具則負責觀眾看到的內容。

MirrorCaption 會儲存我的錄音或音訊嗎?

不會。MirrorCaption 會從你的瀏覽器串流音訊以進行即時語音轉文字,且不會將音訊錄音儲存在 MirrorCaption 伺服器上。逐字稿會儲存在你瀏覽器本機(IndexedDB)。當你關閉會話時,即時音訊串流也會結束。只有使用分鐘數會被記錄作為計費用途,不會記錄對話內容。

有提供給內容創作者的免費版本嗎?

有。每個帳號一開始都會有 1 小時免費——一次性提供、每月不重置、無需信用卡。這足以完成一場完整的任何語言創作者訪談。如果你需要更多,Lifetime 方案為 €49 一次性可用 200 小時,若超過額度也可加購 Voice Pack。

現在,每位來賓都能觸及

在任何瀏覽器通話中,以任何語言訪問任何人。從 1 小時免費開始——無需信用卡、無每月重置、無需安裝。

立即開始免費使用