Transkriptionssoftware für Journalisten

MirrorCaption bietet Journalisten eine Live-Transkription während des Interviews: Audio wird im Browser erfasst, Untertitel erscheinen während der Sprachverarbeitung, und es muss keine Aufnahme hochgeladen werden. Es unterstützt 60+ Sprachen mit nebeneinander angezeigter Übersetzung, speichert Transkripte lokal im Browser und speichert keine Interview-Audiodateien auf MirrorCaption-Servern.

Wichtigste Erkenntnisse

MirrorCaption transkribiert in Echtzeit während des Interviews – das Transkript ist in dem Moment vollständig, in dem das Gespräch endet, nicht nach einer Upload-Wartezeit.
60+ Sprachen mit gleichzeitiger Transkription und Übersetzung, darunter Haitianisches Kreol, Arabisch, Mandarin und Hindi – Sprachen, mit denen Upload-basierte Tools oft Schwierigkeiten haben.
Audio wird im Browser erfasst und vom Spracherkennungsdienst von MirrorCaption verarbeitet; MirrorCaption speichert weder Audio noch Transkripte serverseitig.
Keine Desktop-App, keine Erweiterung, kein Meeting-Bot. Die Meeting-Audioerfassung funktioniert am besten in Desktop-Chrome oder Microsoft Edge; der Talk-Modus eignet sich am besten für mobiles Chrome bei persönlichen Mikrofongesprächen.
Kostenlose Testversion: 1 kostenlose Stunde, keine Kreditkarte erforderlich. Lifetime-Plan: €49 einmalig, günstiger als ein einzelnes 60-minütiges menschliches Transkript von Rev zum aktuellen Minutenpreis.

Vier Möglichkeiten, wie Journalisten MirrorCaption nutzen

🎤

Live-Pressekonferenzen

Verfolgen Sie jeden Sprecher in Echtzeit. Wenn ein Sprecher mitten im Statement die Sprache wechselt, bleiben Original- und übersetztes Transkript nebeneinander, während das Audio verarbeitet wird.

🌍

Mehrsprachige Quellen

Die Quelle spricht Spanisch, Arabisch oder Mandarin; Sie lesen die Übersetzung neben dem Original. Tippen Sie auf ein übersetztes Wort, um die Formulierung zu überprüfen, die Sie zitieren möchten.

💻

Video- und Telefoninterviews

Öffnen Sie MirrorCaption in einem zweiten Tab neben einem browserbasierten Zoom-, Teams- oder Meet-Anruf. Auf Desktop-Chrome oder Edge kann es Audio des geteilten Tabs oder Systemton erfassen, ohne dass ein Bot dem Anruf beitritt.

📱

Interviews vor Ort

Talk-Modus: Legen Sie Ihr Telefon zwischen sich und die Quelle. Beide Seiten sehen ihre eigenen Worte und die Übersetzung gleichzeitig. Kein Meeting-Bot, keine hochgeladene Aufnahmedatei.

Warum Journalisten immer noch Stunden durch Transkription verlieren

Ein einstündiges Interview kann trotzdem mehrere Stunden für die manuelle Transkription benötigen, besonders wenn das Audio Unterbrechungen, Akzente, Hintergrundgeräusche oder mehrere Sprecher enthält. Digitale Aufnahmegeräte verbesserten die Aufnahme; sie beseitigten jedoch nicht die Arbeit, Sprache in verwendbare Zitate umzuwandeln.

Die vorherrschende Alternative ist immer noch ein Record-first-Workflow: eine Datei hochladen, einen Meeting-Agenten senden oder ein Transkript nach der Aufnahme überprüfen. Die veröffentlichten Hilfecenter-Preise von Rev listen menschliche Transkription ab $1,99 pro Minute und KI-Transkription auf Minutenbasis zu $0,25 pro Minute, sodass ein 60-minütiges menschliches Transkript vor Steuern oder Zusatzkosten bei $119,40 beginnt.

Diese Tools sind nützlich, aber viele Journalisten-Workflows benötigen etwas Spezifischeres: ein lesbares Transkript während des Interviews, bevor das Fenster für Nachfragen geschlossen ist.

Das Upload-und-Warten-Problem

Viele Transkriptionstools sind für Produktions-Workflows konzipiert: Podcaster, die Episoden bearbeiten, Unternehmen, die Meeting-Aufnahmen archivieren. Journalisten haben einen anderen Bedarf: Sie müssen oft wissen, was gesagt wurde, während sie noch im Raum sind.

Wenn ein Kabinettsbeamter sagt „wir erwägen alle Optionen" und Sie den genauen Wortlaut lesen können, während er spricht, können Sie die entscheidende Nachfrage stellen. Wenn die Aussage erst durchsuchbar wird, nachdem das Interview oder die Meeting-Zusammenfassung vorliegt, ist die Quelle möglicherweise schon weg.

Die mehrsprachige Abdeckungslücke

Das Problem nach der Aufnahme verstärkt sich für Reporter, die Einwanderergemeinschaften, internationale Angelegenheiten oder grenzüberschreitende Quellen abdecken. Otter listet derzeit sechs Transkriptionssprachen und kann über Otter Chat übersetzen. Trint Live kann 30+ Sprachen live erkennen, während die Sprachunterstützung von Trint besagt, dass die Übersetzung nach der Transkription im Editor erfolgt. Rev unterstützt je nach Plan oder Dienst verschiedene KI- und menschliche Sprachoptionen, aber Kosten und Bearbeitungszeit variieren.

Ein Journalist, der die haitianische Diaspora in Miami, die chinesische Gemeinschaft in San Francisco oder diplomatische Vorgänge in Brüssel beobachtet, benötigt ein Tool, das den Sprachwechsel ohne separaten Dolmetscher oder 24-stündige Wartezeit bewältigt. Das ist die spezifische Lücke, die mehrsprachige Transkriptionstools für Live-Interview-Workflows selten schließen.

Probieren Sie es aus, bevor Sie weiterlesen: Öffnen Sie MirrorCaption in Ihrem Browser, 1 kostenlose Stunde, keine Kreditkarte.

Wie Echtzeit-Transkription das Interview verändert

Der Unterschied zwischen Upload-und-Warten und Echtzeit-Transkription ist nicht nur Geschwindigkeit. Es verändert, wie Sie während des Gesprächs arbeiten.

Wenn ein Transkript erscheint, während jemand spricht, können Sie den genauen Wortlaut verfolgen, wie er eintrifft, bemerken, wenn sich das Register verändert (formeller, vorsichtiger, nervöser), und Nachfolgefragen stellen, solange der Kontext noch lebendig ist. Sie überprüfen nicht, was gesagt wurde. Sie lesen, was gerade gesagt wird.

Beispiel-Workflow: Während eines mehrsprachigen Briefings wechselt ein Sprecher vom Englischen ins Französische und sagt „c'est une ligne rouge pour nous." Die französische Phrase neben einer Live-Übersetzung ins Englische zu sehen, hilft dem Reporter sofort zu entscheiden, ob er nach einer „roten Linie" fragen oder die Nuance später gegen den Originalwortlaut prüfen soll.

Das Echtzeit-Transkript verändert auch Ihre Notiznahme-Haltung. Anstatt die Aufmerksamkeit zwischen Zuhören und Kurzschrift-Schreiben aufzuteilen, lesen Sie das Transkript und schreiben analytische Notizen: Was es bedeutet, was es impliziert, was die nächste Frage sein sollte. Das wörtliche Protokoll erledigt sich von selbst.

Mehrsprachige Quellen transkribieren: 60+ Sprachen

Für Reporter, die Gemeinschaften abdecken, in denen Quellen nicht die Sprache des Journalisten sprechen, versagt das Standard-Werkzeugset schnell. Ein menschlicher Dolmetscher ist ideal, aber nicht immer verfügbar, erschwinglich oder für sensible Gespräche geeignet. Consumer-Übersetzungs-Apps wie Google Translate sind für Textausschnitte gedacht, nicht für Streaming-Sprache. Upload-basierte Transkriptionstools bieten keine Live-Übersetzungsebene.

MirrorCaption zeigt beide Sprachen parallel an – die Ausgangssprache und die Sprache des Journalisten – in nebeneinander liegenden Spalten. Tippen Sie auf ein übersetztes Wort, um das ursprüngliche Wort zu sehen, aus dem es stammt. Das ist für journalistische Genauigkeit wichtig: Eine Übersetzung, die die Worte einer Quelle als „wir hatten Schwierigkeiten" wiedergibt, kann einen Ausdruck verschleiern, der eigentlich „wir wurden bedroht" bedeutete. Die Nebeneinanderansicht ermöglicht die Überprüfung des Wortlauts, bevor Sie ihn zitieren.

Beispiel-Workflow: Ein Reporter für Wohnungsthemen interviewt einen Haitianisches-Kreol-Sprecher am Küchentisch. Das Original-Kreol und die englische Übersetzung erscheinen zusammen, sodass ein Ausdruck wie „yo chase nou deyò" gegen den Literalwortlaut geprüft werden kann, bevor er zum Zitat wird. Das Transkript ist weiterhin ein Werkzeug für journalistisches Urteilsvermögen, kein Ersatz für die Quellenverifizierung.

Zu den unterstützten Sprachen gehören Mandarin, Kantonesisch, Japanisch, Koreanisch, Arabisch, Hebräisch, Hindi, Haitianisches Kreol, Russisch, Portugiesisch, Spanisch, Französisch, Deutsch und 50+ weitere. Die Testversion beinhaltet die Live-Sprachfunktionen, und MirrorCaption berechnet keine zusätzlichen Kosten für einzelne Sprachpakete.

Persönliche Interviews mit MirrorCaption

Feldreporter haben nicht immer ein Zoom-Fenster und ein vorbereitetes Aufnahme-Setup. Manchmal findet das Interview auf einem Gerichtsflur, in einem Gemeinschaftszentrum oder am Küchentisch statt. Der Talk-Modus von MirrorCaption ist genau für diese Situation konzipiert.

Wie der Talk-Modus funktioniert

Öffnen Sie MirrorCaption im Browser Ihres Telefons. Tippen Sie auf „Talk". Wählen Sie die beiden verwendeten Sprachen aus – Ihre und die Ihrer Quelle. Legen Sie das Telefon mit dem Display nach oben zwischen sich. Während jede Person spricht, erscheint das Transkript in Echtzeit in beiden Sprachen auf demselben Bildschirm. Die Quelle kann ihre eigenen Worte in ihrer Sprache lesen; Sie lesen sie in Ihrer.

Für Quellen, die bei Aufnahmen vorsichtig sind, ist dieses Setup sichtbar transparent: Sie können genau beobachten, was während des Sprechens transkribiert wird. Es gibt keinen versteckten Recorder und keine hochgeladene Audiodatei. Das Live-Audio wird vom Spracherkennungsanbieter verarbeitet, während das Transkript lokal im Browser gespeichert wird, bis Sie es exportieren oder löschen.

Keine App, keine Erweiterung, minimaler Aufwand

MirrorCaption ist eine browserbasierte Progressive Web App. Kein Desktop-Download, keine Chrome-Erweiterung, kein Meeting-Bot. Bei einer Pressekonferenz mit einem unbekannten Laptop? URL öffnen. Einen Beat auf einem geliehenen Telefon abdecken? Gleiche URL, gleiche Oberfläche. Gehostete Transkription kann eine Anmeldung erfordern, bevor die enthaltenen Credits genutzt werden können, aber die Testversion bietet 1 Stunde ohne Kreditkarte.

Für Reporter, die es regelmäßig nutzen, kostet der Lifetime-Plan €49 einmalig, weniger als ein einzelnes 60-minütiges menschliches Transkript vom Standard-Service von Rev zum aktuell gelisteten Preis. Sehen Sie, wie er im Vergleich zu den am häufigsten verwendeten Live-Übersetzungstools abschneidet, wenn Sie einen umfassenderen Vergleich wünschen.

Datenschutz der Quelle: Wohin gehen die Audiodaten?

Für Journalisten, die mit sensiblen Quellen arbeiten, ist dies die richtige Frage, die vor dem Vertrauen in ein Transkriptionstool gestellt werden sollte.

Der menschliche Transkriptionsdienst von Rev bedeutet, dass Ihr Audio von einem menschlichen Transkriptor geprüft werden kann. Otter.ai und Trint sind kontobasierte Cloud-Dienste, daher sollten deren Aufbewahrungs-, Administrations- und Freigabekontrollen vor sensiblen Interviews geprüft werden. Die Datenschutzimplikationen von KI-Meeting-Tools sollten verstanden werden, bevor Sie sie für sensible Arbeiten einsetzen.

MirrorCaption verfolgt einen anderen Ansatz. Audio wird in Ihrem Browser erfasst und vom Spracherkennungsdienst von MirrorCaption in Echtzeit verarbeitet, aber nicht auf MirrorCaption-Server geschrieben. Transkripte werden im lokalen Speicher Ihres Browsers (IndexedDB) gespeichert, sodass die von Ihnen kontrollierte Kopie lokal auf Ihrem Gerät und Browserprofil liegt.

Beispiel-Workflow: Für eine Quelle, die Live-Notizen akzeptiert, aber keine gespeicherte Audioaufnahme wünscht, kann ein Reporter die Mikrofonaufnahme verwenden und das resultierende Transkript im lokalen Browser-Speicher aufbewahren. Das beseitigt nicht die Notwendigkeit, Live-Verarbeitung, Gerätesicherheit, Einwilligungsrecht oder Redaktionsrichtlinien zu bewerten; es vermeidet lediglich die Erstellung einer hochgeladenen Aufnahmedatei in MirrorCaption.

Das macht MirrorCaption nicht geeignet für klassifizierte oder rechtlich regulierte Quellenschutz-Workflows – Journalisten in diesen Situationen sollten rechtliche Beratung in Anspruch nehmen. Aber für den häufigen Fall einer Quelle, die einfach nicht in der Cloud aufgezeichnet werden möchte, ist MirrorCaption eine ehrliche, technisch belegte Antwort auf „speichert dieses Tool mein Audio?"

Wie MirrorCaption im Vergleich zu Tools abschneidet, die Journalisten bereits nutzen

Die vier am häufigsten in Journalisten-Transkriptions-Workflows genannten Tools lösen jeweils eine andere Version des Problems.

Funktion	MirrorCaption	Trint	Rev	Otter.ai
Echtzeit während des Interviews	Ja, Live-Untertitel	Ja, über Trint Live	Meeting-Notiztaker / Transkript nach Aufnahme	Ja, Live-Transkription und Meeting-Agenten
Sprachen	60+ mit Live-Übersetzung	40+ Transkription; 30+ Live-Erkennung; Übersetzung nach Transkript	Englisch/Spanisch bei niedrigeren KI-Stufen; 37+ bei Pro/Unlimited KI; Optionen für Mensch/Untertitel variieren	Englisch, Spanisch, Französisch, Deutsch, Japanisch, Vereinfachtes Chinesisch
Persönlich / Talk-Modus	Ja	Mikrofon-/Bildschirmaufnahme über Trint-Apps	Mobile Diktat/Aufnahme; kein Seite-an-Seite Talk-Modus	Web-/App-Aufnahme; kein Seite-an-Seite Talk-Modus
Speichermodell	Keine MirrorCaption-Audiospeicherung; Transkripte lokal	Cloud-Konto/Arbeitsbereich	Cloud-Dienst; menschliche Überprüfung verfügbar	Cloud-Konto/Arbeitsbereich
Keine Installation erforderlich	Browser-App; Desktop-Chrome/Edge für Meeting-Audio	Web-, Mobile- und Desktop-App-Optionen	Web-/Mobile-App-Optionen	Web/Mobil/Desktop; Chrome-Erweiterung optional
Preis	1 kostenlose Stunde; €49 einmaliger Lifetime-Plan	Abonnement-/Testpreise	$1,99/Min. menschlich; $0,25/Min. KI nach Minutenabrechnung; Abonnements variieren	Kostenloser Plan; Pro $16,99 monatlich oder $8,33 jährlich

Preise und Sprachreferenzen oben wurden anhand offizieller Seiten für Rev-Preise, Trint Live, Trint-Sprachunterstützung, Otter-Preise und von Otter unterstützte Sprachen überprüft.

Trint und Otter sind die bessere Wahl für kollaborative Redaktionen, die Transkriptfreigabe, Team-Annotierung, Redaktionsfeeds oder Meeting-Agenten-Workflows benötigen. Die menschliche Transkription von Rev bleibt eine starke Option für hochwichtige Audiodaten, wenn das Timing weniger dringend ist. MirrorCaption ist die fokussierte Wahl, wenn das Interview live ist, mehrsprachig ist und Sie ein Browser-Transkript ohne Meeting-Bot oder hochgeladene Aufnahmedatei wünschen.

Für einen detaillierten Direktvergleich der Genauigkeits- und Datenschutzunterschiede zwischen diesen Tools geht der KI-Transkriptions-Genauigkeitsvergleich tiefer als diese Übersichtstabelle.

Testen Sie es bei Ihrem nächsten Interview

Beginnen Sie mit 1 kostenloser Stunde. Keine Kreditkarte. Keine Erweiterung zu installieren. Verwenden Sie Desktop-Chrome oder Edge für Meeting-Audio oder mobiles Chrome für den Talk-Modus.

MirrorCaption kostenlos öffnen

So starten Sie die Transkription Ihres nächsten Interviews

Drei Workflows für die Szenarien, auf die Journalisten am häufigsten treffen.

Remote-Videointerview (Zoom, Teams, Google Meet)

Öffnen Sie MirrorCaption in einem separaten Desktop-Chrome- oder Edge-Tab, bevor Sie Ihren Anruf starten. Wählen Sie im Meet-Modus eine Aufnahmequelle, die das Anruf-Audio enthält, und behalten Sie die Mikrofonaufnahme für Ihre eigene Stimme aktiviert. Das Transkript läuft, während das Gespräch live ist. Wenn der Anruf endet, befindet sich das vollständige Transkript in Ihrem Browser, bereit zum Export als Klartext oder Markdown.

Telefoninterview

Auf dem Desktop stellen Sie Ihr Telefon auf Lautsprecher und verwenden die Mikrofonaufnahme von MirrorCaption, um beide Seiten des Anrufs aufzunehmen, oder verwenden ein zweites Gerät, wenn Einwilligung und Audioqualität wichtig sind. Das Anruf-Audio auf demselben mobilen Gerät ist browser- und plattformabhängig; behandeln Sie es daher als weniger zuverlässig als ein Desktop- oder Zweitgerät-Setup.

Persönliches Gespräch

Öffnen Sie MirrorCaption auf Ihrem Telefon im Talk-Modus. Wählen Sie beide Sprachen aus. Legen Sie das Telefon mit dem Display nach oben auf den Tisch zwischen Sie und Ihre Quelle. Beide Seiten sprechen natürlich; beide lesen das Transkript in ihrer eigenen Sprache, während das Gespräch voranschreitet. Keine separate Aufnahmedatei oder Upload-Warteschlange. Exportieren Sie die Sitzungsnotizen, wenn Sie fertig sind.

Häufig gestellte Fragen

Wie transkribieren Journalisten Interviews?

Die meisten Journalisten verwenden eine von drei Methoden: manuelle Transkription, aufnahmebasierte KI-Transkription oder Live-Transkription während des Interviews selbst. Der Live-Ansatz reduziert den Upload-und-Warten-Schritt und ermöglicht es dem Journalisten, im Gespräch zu bleiben, während das Transkript aufgebaut wird.

Gibt es ein kostenloses Transkriptionstool für Journalisten?

Ja. MirrorCaption beinhaltet 1 kostenlose Stunde ohne Kreditkarte. Otter.ai hat ebenfalls einen kostenlosen Plan mit 300 monatlichen Transkriptionsminuten und unterstützt derzeit Englisch, Spanisch, Französisch, Deutsch, Japanisch und Vereinfachtes Chinesisch. Für mehrsprachige Live-Transkription mit Seite-an-Seite-Übersetzung in 60+ Sprachen ist MirrorCaption die bessere erste Wahl zum Testen.

Kann ich ein fremdsprachiges Interview automatisch transkribieren?

MirrorCaption deckt 60+ Sprachen mit Transkription und Echtzeit-Übersetzung ab. Stellen Sie die Quellsprache auf Ihren Sprecher ein und wählen Sie Ihre Lesesprache. Das Transkript erscheint in beiden Sprachen nebeneinander, während das Gespräch stattfindet – kein Nachbearbeitungsschritt, kein separater Übersetzungsdurchgang. Tippen Sie auf ein übersetztes Wort, um den Originalwortlaut zu sehen, aus dem es stammt.

Zeichnet MirrorCaption mein Interview-Audio auf oder speichert es?

MirrorCaption zeichnet keine Audiodatei auf und speichert kein Interview-Audio auf MirrorCaption-Servern. Live-Audio wird vom Spracherkennungsdienst von MirrorCaption verarbeitet. Transkripte werden im lokalen Speicher Ihres Browsers (IndexedDB) gespeichert; Sie sollten daher Gerätesicherheit, Browser-Profilzugriff und Exporte wie alle anderen vertraulichen Notizen verwalten.

Kann ich MirrorCaption verwenden, ohne etwas zu installieren?

Ja. MirrorCaption ist eine browserbasierte Progressive Web App. Kein Desktop-Download, keine Chrome-Erweiterung und kein Meeting-Bot. Verwenden Sie Desktop-Chrome oder Microsoft Edge für Meeting-/Systemton-Aufnahme; verwenden Sie mobiles Chrome für den Talk-Modus und mikrofonbasierte persönliche Gespräche. Gehostete Transkription kann eine Anmeldung erfordern, bevor enthaltene Credits genutzt werden können.

Das Transkript, das fertig ist, wenn das Interview endet

Transkriptionssoftware für Journalisten bedeutete historisch gesehen eine Sache: Aufnahme hochladen und warten. MirrorCaption ändert das in: Tab öffnen und mitlesen.

Für Reporter, die mehrsprachige Quellen abdecken, Feldinterviews persönlich durchführen oder an Geschichten arbeiten, bei denen der Datenschutz der Quelle wichtig ist, ist dieser Unterschied nicht graduell – es ist eine vollständig andere Arbeitsweise. Das Transkript kommt in demselben Moment an wie die Worte. Die Nachfolgefrage ist noch möglich. Die Quelle ist noch im Raum.

Das gleiche Tool, das mehrsprachigen Remote-Teams dient, ist direkt auf den Journalisten-Workflow anwendbar, denn ein Interview ist nur ein Zwei-Personen-Meeting, bei dem jedes Wort zählt.

Ihr nächstes Interview, live transkribiert

1 kostenlose Stunde. Keine Kreditkarte. Keine Installation. Live-Transkription und -Übersetzung in 60+ Sprachen.

MirrorCaption kostenlos testen

Transkriptionssoftware fürJournalisten