Can I use Speechmatics without coding?

No. Speechmatics is an API-only platform that requires API credentials and code to call its WebSocket or REST endpoints. There is no standalone desktop app or ready-made meeting UI included.

Is there a free trial of MirrorCaption?

Yes. Every new MirrorCaption account includes 1 hour of hosted transcription credit — one-time, no monthly reset, no credit card required. Upgrade to Annual (€54.99/year) or Premium (€99 one-time) for more hours.

Does MirrorCaption work with Zoom, Teams, and Google Meet?

Yes. MirrorCaption Meet mode captures audio from a browser tab in desktop Chrome or Microsoft Edge, so it works alongside browser-based Zoom, Teams, Google Meet, and Webex without joining the call as a bot.

What languages does MirrorCaption support?

MirrorCaption supports 50+ selectable languages including Mandarin, Japanese, Korean, Arabic, Hebrew, Hindi, Russian, Spanish, French, German, Portuguese, and more.

Does MirrorCaption store my meeting audio?

No. Audio is streamed through your browser for real-time transcription and then discarded. Transcripts are saved locally in your browser. Meeting audio is never stored on MirrorCaption servers.

Alternative à Speechmatics : MirrorCaption

MirrorCaption est l’alternative à Speechmatics conçue pour la transcription vocale en temps réel sans code — Speechmatics Pro commence à 0,24 $ par heure pour un accès API brut, tandis que MirrorCaption est une application de navigateur prête à l’emploi avec des sous-titres bilingues en moins d’une seconde, un affichage de traduction côte à côte et un plan Premium unique à 99 €. Cette page s’adresse à la personne en réunion, pas au développeur qui construit l’outil de réunion.

Points clés

Speechmatics est une API pour développeurs — elle renvoie des transcriptions JSON sans interface de réunion ni affichage bilingue inclus
MirrorCaption est une application de navigateur que tout le monde peut ouvrir ; des sous-titres en moins d’une seconde apparaissent sans code requis
Speechmatics Pro en temps réel commence à 0,24 $/h ; MirrorCaption Premium est à 99 € une seule fois pour 200 h de crédit de transcription hébergée
MirrorCaption affiche l’original et la traduction côte à côte ; touchez n’importe quel mot traduit pour voir le mot source dont il provient
Le mode Meet capture l’audio de l’onglet du navigateur dans Chrome ou Edge sur ordinateur — aucun bot dans la réunion, aucune installation admin nécessaire pour les autres participants

Ce qu’est réellement Speechmatics

Speechmatics est une plateforme d’IA vocale d’entreprise — plus précisément, une API pour développeurs. Vous vous authentifiez avec une clé API, vous vous connectez à un point de terminaison WebSocket, vous diffusez l’audio et vous recevez les transcriptions et les traductions sous forme de données structurées. Il n’existe ni application téléchargeable, ni widget de navigateur, ni intégration de réunion fournie avec le produit. C’est une infrastructure sur laquelle vous construisez.

Cette conception est intentionnelle. Speechmatics cible les développeurs qui créent des produits activés par la voix : plateformes d’intelligence pour centres d’appels, systèmes de sous-titrage pour diffusions en direct, outils de documentation clinique et pipelines d’agents vocaux. Pour ces cas d’usage, une API flexible avec plus de 56 langues prises en charge, la prise en charge de la traduction via son API et de solides promesses de précision est le bon type d’outil.

Leurs benchmarks publiés méritent d’être pris au sérieux. Les évaluateurs G2 attribuent à Speechmatics 4,8 sur 5, en saluant régulièrement la précision sur les discours accentués et multilingues, la réactivité du support et les performances du modèle. Leurs certifications ISO 27001, GDPR, HIPAA et SOC 2 Type II sont de véritables références de conformité pour les secteurs réglementés.

Toutes ces capacités sont fournies sous forme de point de terminaison API. Si vous avez besoin que la transcription fonctionne dans votre prochaine réunion — cet après-midi — l’API seule ne suffira pas.

Ce que vous perdez en l’absence de frontend

Aucun affichage de sous-titres pendant l’appel

Lorsque Speechmatics traite votre audio, il envoie le texte de la transcription au point de terminaison que vous avez configuré. Il n’ouvre pas de fenêtre dans votre navigateur. Il n’affiche pas de sous-titres par-dessus votre appel Zoom ou Teams. Il ne montre pas de vue bilingue côte à côte.

Afficher des sous-titres à côté d’une réunion nécessite de créer une extension de navigateur, une application Electron ou une page web personnalisée qui appelle l’API et rend le résultat en temps réel. C’est un projet d’ingénierie — et un projet non trivial dès qu’on prend en compte la gestion des reconnexions, la compensation de latence et l’étiquetage multi-intervenants.

La traduction arrive sous forme de texte brut

Speechmatics renvoie le texte traduit aux côtés de la transcription source dans la même charge utile de réponse API. C’est techniquement élégant. Mais la mise en page côte à côte, la liaison mot à mot avec la source et la possibilité de toucher un mot traduit pour voir d’où il vient dans l’original — ce sont des fonctionnalités d’interface qui n’existent pas dans la réponse API. Chacune nécessite une phase distincte de conception et de développement avant de pouvoir être utilisée en réunion.

Le coût à la minute s’accumule à petite échelle

À 0,24 $ par heure pour Pro en temps réel, 200 heures d’utilisation de l’API coûtent environ 48 $. Ce montant semble raisonnable jusqu’à ce que l’on considère qu’il achète du calcul brut et des données de transcription livrées à un point de terminaison — sans interface, sans résumés et sans générateur de vocabulaire inclus. Un professionnel participant à trois ou quatre appels multilingues par semaine accumule environ 12 heures par mois, soit à peu près 3 $/mois sur l’API Speechmatics seule — mais si l’on ajoute le coût continu du développement frontend, l’investissement total est très différent.

Scénario illustratif

Un interprète indépendant évalue l’API Speechmatics pour des appels vidéo clients. La précision sur les paires allemand-anglais est excellente. Trois semaines plus tard, il est encore en train de prototyper une couche d’affichage — une page personnalisée qui rend les sous-titres à côté de l’onglet du navigateur où se déroulent les réunions. Pendant ce temps, les réunions continuaient d’avoir lieu. Le choix est finalement devenu : continuer à construire, ou utiliser quelque chose déjà construit. Speechmatics n’était pas inadapté à sa situation. Il avait été conçu pour un autre rôle dans la pile.

Comment MirrorCaption fonctionne comme alternative à Speechmatics

MirrorCaption est le produit fini qu’un développeur finirait par construire au-dessus d’une API vocale — sauf qu’il est déjà prêt et livré sous forme d’application de navigateur. Il gère la traduction en temps réel pour les équipes distantes multilingues sans nécessiter le moindre travail backend de votre part.

Voici à quoi ressemble une première session [workflow illustratif] :

Ouvrez mirrorcaption.com/app dans Chrome ou Microsoft Edge sur ordinateur
Sélectionnez le mode "Meet" pour capturer l’audio de l’onglet de votre réunion, ou "Talk" pour utiliser votre microphone
Choisissez une langue source et une langue cible de traduction parmi plus de 50 options sélectionnables
Démarrez votre appel Zoom, Teams, Google Meet ou Webex dans un onglet de navigateur séparé
Les sous-titres apparaissent mot par mot en moins d’une seconde après la prise de parole — l’original à gauche, la traduction à droite
Touchez n’importe quel mot traduit pour révéler le mot source exact dont il provient

Au fil de la réunion, un résumé IA se met à jour automatiquement dans la barre latérale — utile si vous êtes arrivé en retard ou si vous devez rattraper le fil entre deux segments. Les mots que vous souhaitez retenir peuvent être enregistrés dans un générateur de vocabulaire pour une révision ultérieure.

L’audio de la réunion transite par votre navigateur pour un traitement en temps réel, puis est supprimé. Les transcriptions sont enregistrées localement dans votre navigateur. MirrorCaption ne rejoint jamais l’appel en tant que bot, donc les autres participants ne le voient pas dans la liste des participants.

Voyez-le par vous-même : Chaque nouveau compte inclut 1 heure gratuite de transcription hébergée — aucune carte bancaire requise, aucune réinitialisation mensuelle. Ouvrir MirrorCaption gratuitement →

Comparaison des fonctionnalités — Speechmatics vs MirrorCaption

Fonctionnalité	MirrorCaption	Speechmatics
À qui cela s’adresse	Toute personne disposant d’un navigateur	Développeurs qui créent des produits
Configuration	Ouvrir un onglet de navigateur	Clé API + code + frontend personnalisé
Affichage des sous-titres pendant l’appel	✓ En moins d’une seconde, dans le navigateur	À construire soi-même
Traduction côte à côte	✓ Vue original + traduction	Texte brut dans la réponse API
Toucher pour voir le mot source	✓	Non inclus
Résumés de réunion IA	✓ Mise à jour automatique	Non inclus
Langues	Plus de 50 sélectionnables	Plus de 56 langues STT ; traduction via API
Détection des intervenants	✓	✓ via API
Générateur de vocabulaire	✓	Non inclus
Aucun bot dans la réunion	✓ Capture de l’onglet du navigateur	Dépend de votre architecture
Mode face à face	✓ Mode Talk sur Chrome mobile	Non inclus
Offre gratuite	1 h de crédit hébergé, sans carte bancaire	2 400 min/mois (codage requis)
Tarification	99 € Premium une seule fois (200 h de crédit)	À partir de 0,24 $/h en temps réel
Conformité	Audio non stocké côté serveur	ISO 27001, GDPR, HIPAA, SOC 2 Type II

Comparaison des tarifs

Speechmatics : facturation API au compteur

Le plan Pro de Speechmatics commence à 0,24 $ par heure pour la transcription en temps réel. Une offre gratuite fournit 2 400 minutes (40 heures) par mois, mais son utilisation nécessite des identifiants API et du code dès le premier jour. Il n’existe aucun moyen d’essayer Speechmatics sans configuration développeur.

Des tarifs réduits sont disponibles sur les offres payantes, et une tarification entreprise est proposée pour des volumes plus élevés. Si vous traitez des milliers d’heures d’audio dans un produit que vous construisez, ces remises deviennent significatives. La structure tarifaire est conçue pour cette échelle et ce mode d’utilisation.

MirrorCaption : un prix, un produit complet

La tarification de MirrorCaption est structurée autour d’heures de crédit de transcription hébergée :

Gratuit : 1 heure de transcription hébergée, une seule fois, sans réinitialisation mensuelle, sans carte bancaire. Accès complet aux modes Meet et Talk, plus de 50 langues sélectionnables, détection des intervenants, résumés IA et générateur de vocabulaire.
Annuel — 54,99 €/an : 100 heures de crédit de transcription hébergée incluses. Toutes les fonctionnalités actuelles et un an de mises à jour produit.
Premium — 99 € une seule fois : 200 heures de crédit de transcription hébergée incluses. Toutes les futures mises à jour produit avec accès prioritaire dès leur sortie. Premium est aussi l’offre la plus avantageuse pour les recharges Voice Pack — le tarif horaire est le plus bas sur Premium.
Voice Packs (vendus séparément sur toutes les offres) : 5 heures pour 2,99 € (0,60 €/h), 15 heures pour 7,99 € (0,53 €/h). Rechargez à tout moment, sans abonnement requis.

La comparaison la plus importante : 200 heures d’utilisation de l’API Speechmatics Pro coûtent environ 48 $ — et ces 48 $ fournissent des données de transcription brutes vers un point de terminaison, sans interface incluse. 200 heures de MirrorCaption Premium coûtent 99 € une seule fois et incluent l’affichage bilingue complet, les résumés IA, le générateur de vocabulaire, la détection des intervenants et toutes les futures fonctionnalités. Premium ne signifie pas une transcription hébergée illimitée à vie — une fois les 200 h de crédit épuisées, les heures supplémentaires proviennent des Voice Packs (vendus séparément) au meilleur tarif horaire disponible sur n’importe quel plan MirrorCaption.

Quand Speechmatics est le bon choix

Speechmatics est un excellent choix pour des cas d’usage spécifiques. Envisagez-le lorsque :

Vous construisez un produit qui a besoin d’une API vocale en backend — logiciel de centre de contact, sous-titrage de diffusion, documentation clinique ou pipeline d’agent vocal
Vous avez besoin de certifications de conformité d’entreprise — HIPAA, SOC 2 Type II, ISO 27001 — pour un secteur réglementé, et vous disposez d’une équipe d’ingénierie pour implémenter le frontend
Votre volume d’utilisation dépasse plusieurs centaines d’heures par mois, là où les paliers de tarification de volume de Speechmatics deviennent avantageux
Vous avez besoin d’un contrôle de vocabulaire personnalisé au niveau de l’API — noms de produits spécifiques à un domaine, terminologie clinique ou noms propres que les modèles standards manquent

Pour ces scénarios, Speechmatics est un véritable choix haut de gamme. Les promesses de précision et les références de conformité sont étayées par des benchmarks publiés et des certifications.

Vous ne construisez pas de produit ?

Si vous avez besoin de sous-titres bilingues en direct dans votre prochaine réunion — pas d’un projet d’intégration API — MirrorCaption est prêt maintenant. Pas de code. Pas de bot. Une heure gratuite pour commencer.

Essayer MirrorCaption gratuitement

Quand MirrorCaption est le bon choix

Choisissez MirrorCaption lorsque :

Vous êtes la personne en réunion, pas le développeur qui construit l’outil de réunion — vous avez besoin de sous-titres bilingues dans votre prochain appel, pas après une phase d’ingénierie
Votre équipe tient des appels multilingues sur Zoom, Teams, Google Meet ou Webex via navigateur, et chacun doit suivre dans sa propre langue pendant l’appel
Votre politique informatique interdit aux bots de rejoindre les réunions — MirrorCaption utilise la capture audio de l’onglet du navigateur, donc la plupart des équipes peuvent l’utiliser en autonomie sans demande d’approbation informatique
Vous souhaitez un paiement unique plutôt qu’une facturation API continue — Premium à 99 € remplace une relation de facturation à la minute sans limite
Vous apprenez une langue ou travaillez à l’international et souhaitez voir l’original et la traduction côte à côte tout en construisant votre vocabulaire à partir de conversations réelles

Pour une comparaison plus large des outils dans cet espace, consultez notre guide de transcription multilingue, qui couvre l’ensemble des options pour les réunions non anglophones.

Scénario illustratif

Une cheffe de produit dans une entreprise européenne organise des points hebdomadaires avec un fournisseur au Japon. Historiquement, la réunion nécessitait qu’un interprète se connecte en tant que tiers. Avec MirrorCaption ouvert dans un onglet de navigateur, elle lit la parole japonaise traduite en anglais mot par mot pendant que son interlocuteur parle. Lui lit son anglais traduit en japonais sur son propre écran. Aucun des deux n’a eu besoin d’installer quoi que ce soit ; aucun n’a eu besoin d’inviter un bot. Le temps d’interprétation a été remplacé par 40 minutes de conversation directe.

Questions fréquemment posées

Puis-je utiliser Speechmatics sans coder ?

Non. Speechmatics est une plateforme API uniquement. Son utilisation nécessite des identifiants API, du code pour appeler les points de terminaison WebSocket ou REST, et un frontend personnalisé pour afficher les résultats. Il n’existe ni application de bureau autonome ni extension de navigateur. Si vous avez besoin de transcription sans écrire de code, des outils comme MirrorCaption ou Otter.ai sont conçus pour ce cas d’usage.

Existe-t-il un essai gratuit de MirrorCaption ?

Oui. Chaque nouveau compte MirrorCaption inclut 1 heure de crédit de transcription hébergée — une seule fois, sans réinitialisation mensuelle, sans carte bancaire requise. C’est suffisant pour mener une réunion complète de bout en bout et évaluer l’affichage bilingue, le résumé IA et la détection des intervenants. Passez à l’offre Annual (54,99 €/an, 100 h) ou Premium (99 € une seule fois, 200 h) lorsque vous avez besoin de plus.

MirrorCaption fonctionne-t-il avec Zoom, Teams et Google Meet ?

Oui. Le mode Meet de MirrorCaption capture l’audio d’un onglet de navigateur dans Chrome ou Microsoft Edge sur ordinateur, il fonctionne donc avec Zoom, Teams, Google Meet et Webex via navigateur. MirrorCaption ne rejoint pas l’appel en tant que participant — il fonctionne dans un onglet séparé et lit l’audio que votre navigateur traite déjà. Les autres participants ne le voient pas dans la réunion.

Quelles langues MirrorCaption prend-il en charge ?

MirrorCaption prend en charge plus de 50 langues sélectionnables, dont le mandarin, le japonais, le coréen, l’arabe, l’hébreu, l’hindi, le russe, l’espagnol, le français, l’allemand, le portugais et bien d’autres. La langue source de transcription et la langue cible de traduction sont toutes deux sélectionnables indépendamment, afin que vous puissiez configurer n’importe quelle paire requise par la réunion.

MirrorCaption stocke-t-il l’audio de ma réunion ?

Non. L’audio transite par votre navigateur pour une transcription en temps réel, puis est supprimé. Les transcriptions sont enregistrées localement dans votre navigateur à l’aide d’IndexedDB — vous possédez les données. L’audio de la réunion n’est jamais stocké sur les serveurs de MirrorCaption. Les seules données conservées côté serveur sont les minutes de quota nécessaires à la facturation. Pour plus de contexte sur la confidentialité des outils IA, consultez notre aperçu de la confidentialité des réunions IA.

En résumé

Speechmatics et MirrorCaption ne se disputent pas le même travail. Speechmatics est une infrastructure pour les équipes qui intègrent l’IA vocale dans des produits. Ses benchmarks de précision, ses certifications de conformité et la flexibilité de son API sont de véritables atouts pour ce cas d’usage. Pour les développeurs qui ont besoin d’une API vocale fiable, précise et de niveau entreprise, sa réputation est méritée.

MirrorCaption s’adresse à la personne assise en réunion. Il fournit l’affichage bilingue, les sous-titres en moins d’une seconde, les résumés IA et le générateur de vocabulaire qu’il faudrait autrement des mois pour construire au-dessus d’une API brute. Vous ouvrez un onglet de navigateur, et cela fonctionne.

Si vous cherchez une alternative à Speechmatics parce que vous voulez des sous-titres multilingues en temps réel dans votre prochaine réunion — pas un projet d’intégration API — l’heure gratuite est le moyen le plus rapide de voir si MirrorCaption vous convient.

Commencez votre première réunion

1 heure gratuite de transcription hébergée. Aucune carte bancaire. Aucune réinitialisation mensuelle. Aucune installation pour les autres participants.

Ouvrir MirrorCaption gratuitement

Alternative à Speechmatics pour la transcription en temps réel