Les meilleures applications de traduction vocale en temps réel pour les appels vidéo en 2026 sont MirrorCaption, Zoom Translated Captions, Google Meet Translated Captions, Microsoft Teams Live Translated Captions, Microsoft Translator, Notta et Otter.ai. Chacune convient à une situation différente : certaines sont verrouillées à une plateforme, certaines nécessitent un bot de réunion, et seules deux peuvent lire la traduction à voix haute pendant un appel en direct.
L’écart qui compte le plus n’est pas de savoir quels outils existent. C’est de savoir si votre outil de traduction fonctionne pendant la conversation ou seulement après. Quand un partenaire coréen dit quelque chose d’ambigu à la 12e minute d’un appel de 45 minutes, il vous faut la traduction en quelques secondes — pas dans un résumé soigné une heure plus tard.
Scénario illustratif
Une équipe commerciale logistique est en appel avec un nouveau distributeur en Corée du Sud. À la 14e minute, le distributeur passe au coréen pour expliquer une préoccupation concernant les créneaux de livraison. La transcription post-réunion du commercial capturera ces mots avec précision — en environ 60 minutes. Un traducteur en streaming en temps réel fait apparaître la même phrase en moins d’une seconde, alors que la conversation est encore suffisamment vivante pour y répondre directement.
Nous avons évalué sept outils selon quatre critères : la traduction est-elle réellement en streaming (mot à mot, et non en post-traitement), nécessite-t-elle un bot dans la réunion, peut-elle lire la traduction à voix haute, et quel est son coût réel.
- MirrorCaption est le seul outil basé sur navigateur de cette liste qui fonctionne avec les appels Zoom, Teams, Meet et Webex basés sur navigateur sans bot, avec une sortie vocale optionnelle via Speak Translations.
- Zoom, Google Meet et Teams proposent chacun des sous-titres traduits en temps réel intégrés — pratique si toute votre équipe utilise cette même plateforme, inutile dès qu’un appel passe à un autre outil.
- Microsoft Translator est gratuit et prend en charge la sortie vocale, mais exige que tous les participants ouvrent séparément l’application Translator en parallèle de l’appel.
- Notta et Otter.ai sont principalement des outils post-réunion — excellents pour la prise de notes, mais pas des traducteurs vocaux en streaming au sens strict.
- Seuls MirrorCaption (via Speak Translations) et Microsoft Translator (dans sa propre application) peuvent lire la parole traduite à voix haute pendant un échange en direct.
Ce que signifie réellement « traduction vocale en temps réel » pour les appels vidéo
Deux choses sont toutes deux appelées « traduction en temps réel », alors qu’en pratique elles fonctionnent très différemment.
La transcription et la traduction en streaming affichent les mots à l’écran pendant que l’orateur parle encore. Le texte apparaît mot par mot — souvent avec des résultats partiels qui se corrigent d’eux-mêmes à mesure que davantage de contexte arrive. Vous lisez ce qui est dit au fur et à mesure. MirrorCaption et les fonctionnalités de sous-titres traduits natives des plateformes fonctionnent ainsi.
Le quasi temps réel ou le post-traitement produit une transcription ou une traduction soignée après la fin de l’énoncé, parfois avec un léger délai, parfois seulement une fois la réunion terminée. Otter.ai et Notta relèvent principalement de cette catégorie. Leurs points forts résident dans la qualité des notes et des actions à suivre, pas dans la compréhension en cours d’appel.
Il existe aussi une distinction que la plupart des articles comparatifs négligent complètement : sortie textuelle vs sortie vocale.
Les sept outils de cette liste peuvent tous afficher du texte traduit à l’écran. Seuls deux peuvent lire la traduction à voix haute pendant l’échange en direct. Cette distinction compte surtout lorsqu’un participant ne peut pas lire confortablement un écran, lorsque vous présentez dans une salle, ou lorsque l’autre partie doit entendre la réponse traduite plutôt que la lire.
Quand un client japonais dit 「ちょっと難しいです」 — littéralement « un peu difficile » — un outil en streaming fait apparaître cette formulation en plein appel, alors qu’il reste encore 40 minutes pour répondre. Une note post-réunion vous donne les mêmes trois mots une fois la conversation déjà passée à autre chose.
Les 7 meilleures applications de traduction vocale en temps réel pour les appels vidéo
1. MirrorCaption — Idéal pour le multi-plateforme et la traduction vocale
MirrorCaption est un outil de transcription et de traduction en temps réel basé sur navigateur, prenant en charge plus de 50 langues sélectionnables. Ouvrez-le dans Chrome ou Microsoft Edge sur ordinateur, à côté de n’importe quel appel vidéo basé sur navigateur — Zoom, Google Meet, Teams, Webex — et il capture directement l’audio de l’onglet du navigateur. Aucun bot ne rejoint la réunion. Aucune installation administrateur n’est nécessaire pour les participants.
La transcription apparaît mot par mot avec une latence inférieure à la seconde. La traduction suit immédiatement, côte à côte avec l’original. Chaque mot traduit est cliquable pour révéler le mot source dont il provient, ce qui compte lorsqu’une expression comme « ちょっと難しいです » demande plus qu’une traduction littérale.
Ce qui distingue MirrorCaption dans cette liste, c’est Speak Translations — une fonctionnalité optionnelle qui lit à voix haute la parole traduite de l’utilisateur dans la langue cible. Parlez en chinois, traduisez en anglais, et MirrorCaption peut synthétiser la sortie anglaise pendant que l’échange est encore en direct. Options de lecture : haut-parleur de l’ordinateur portable, téléphone appairé via code QR, ou microphone virtuel Mac qui achemine l’audio traduit directement dans Zoom, Meet ou Teams comme entrée micro afin que l’autre partie l’entende via l’appel.
Pour les conversations en face à face, le mode Talk sur mobile fonctionne comme une session continue — les deux parties parlent à tour de rôle dans la même session sans relancer la capture à chaque phrase. C’est la différence entre une session d’interprétation continue et un lexique à traduction instantanée phrase par phrase.
- Tarifs (mirrorcaption.com/#pricing) : Gratuit — 1 heure unique, sans carte bancaire · Annuel — 54,99 €/an, 100 h de crédit hébergé incluses · Premium (offre à vie) — 99 € en une fois, 200 h de crédit hébergé incluses, toutes les futures mises à jour et nouvelles fonctionnalités avec accès prioritaire, tarif Voice Pack le plus bas pour les heures supplémentaires ; heures supplémentaires via Voice Packs vendus séparément
- Fonctionne sur : Chrome ou Edge sur ordinateur (mode Meet, pour l’audio des onglets de réunion) ; Chrome sur mobile (mode Talk, pour le face-à-face)
- Bot requis : Non
- Sortie vocale : Oui — Speak Translations (haut-parleur de l’ordinateur portable, téléphone appairé ou micro virtuel Mac)
- Langues : Plus de 50 sélectionnables
Limites : Le mode Meet nécessite Chrome ou Edge sur ordinateur — Safari et Firefox ne prennent pas en charge la capture audio de l’onglet de réunion. Le mode Talk mobile utilise le microphone et n’est pas conçu pour l’audio des onglets de réunion. Les politiques de capture d’écran et d’applications web en entreprise s’appliquent toujours ; la plupart des équipes peuvent s’en charger elles-mêmes, mais vérifiez les paramètres de navigateur de votre organisation.
2. Zoom Translated Captions — Idéal si toute votre équipe utilise Zoom
Zoom propose Translated Captions comme fonctionnalité côté hôte disponible sur certains forfaits payants. Lorsque l’hôte l’active, chaque participant peut choisir une langue cible et voir les sous-titres traduits en temps réel pendant l’appel. Aucun outil tiers à ouvrir. Aucune connexion supplémentaire.
Pour les équipes dont toute la pile de réunions vit dans Zoom, c’est l’option la moins contraignante. Les paires de langues disponibles et le niveau de forfait requis sont indiqués sur la page d’assistance de Zoom et évoluent à mesure que Zoom étend sa couverture — vérifiez la liste actuelle avant de supposer que votre paire de langues est prise en charge.
- Tarifs : Inclus avec les forfaits Zoom payants éligibles — voir zoom.us/pricing pour les exigences actuelles
- Fonctionne sur : Zoom uniquement
- Bot requis : Non (fonction côté hôte)
- Sortie vocale : Non — sous-titres textuels uniquement
- Langues : Une sélection de paires de langues ; voir l’article d’assistance de Zoom pour la liste actuelle
Limites : Verrouillé à la plateforme Zoom. Pas d’export de transcription traduite sur la plupart des forfaits. Si un seul participant de votre flux de travail utilise une autre plateforme de réunion, cette fonctionnalité ne sert à rien.
3. Google Meet Translated Captions — Idéal pour les équipes Google Workspace
Google Meet inclut Translated Captions dans certains forfaits Google Workspace. Activez-les pendant une réunion et les sous-titres apparaissent dans la langue cible du participant en temps réel. Comme la version de Zoom, c’est intégré — aucune fenêtre supplémentaire n’est nécessaire.
Le niveau gratuit du compte Google personnel n’inclut pas Translated Captions. La disponibilité et les paires de langues prises en charge varient selon le forfait Workspace et sont documentées sur support.google.com/meet.
- Tarifs : Disponible dans certains forfaits Google Workspace — non disponible sur le niveau personnel gratuit
- Fonctionne sur : Google Meet uniquement
- Bot requis : Non
- Sortie vocale : Non — sous-titres textuels uniquement
- Langues : Une sélection de paires de langues ; liste actuelle sur support.google.com/meet
Limites : Verrouillé à la plateforme Google Meet. Les sous-titres sont éphémères au niveau standard — pas de transcription exportée et consultable.
4. Microsoft Teams Live Translated Captions — Idéal pour les organisations Microsoft 365
Microsoft Teams propose Live Translated Captions dans le cadre de Teams Premium et de certains forfaits Microsoft 365. Chaque participant peut sélectionner une langue cible et voir la parole de la réunion sous-titrée et traduite en temps réel.
Pour les organisations qui utilisent déjà Microsoft 365, c’est le choix naturel pour les appels natifs Teams. Comme pour les équivalents Zoom et Google Meet, son utilité s’arrête à la frontière de Teams.
- Tarifs : Nécessite Teams Premium ou un forfait Microsoft 365 éligible — vérifiez les exigences actuelles sur learn.microsoft.com
- Fonctionne sur : Microsoft Teams uniquement
- Bot requis : Non (l’administrateur doit activer la fonctionnalité)
- Sortie vocale : Non — sous-titres textuels uniquement
- Langues : Une sélection de paires de langues ; voir la documentation Microsoft pour la liste actuelle
Limites : Nécessite Teams Premium en plus de la licence Teams standard. Verrouillé à la plateforme Microsoft Teams.
5. Microsoft Translator — Meilleure option gratuite (avec une contrainte)
Microsoft Translator propose une fonctionnalité Conversations gratuite : plusieurs participants rejoignent une session de traduction partagée, chacun sur son propre appareil, et voient la parole des autres traduite dans leur langue choisie en temps réel. Il prend en charge la synthèse vocale afin que chaque appareil puisse lire la parole traduite à voix haute.
La contrainte : il s’agit d’une application autonome, et non d’une intégration aux plateformes d’appels vidéo existantes. Pour un appel vidéo, tous les participants doivent ouvrir Microsoft Translator séparément en parallèle de leur réunion. Cette friction reste gérable pour certains cas d’usage — en particulier les conversations en personne — mais ce n’est pas un remplacement transparent à brancher directement pour un outil de traduction dans un onglet de navigateur.
- Tarifs : Gratuit — translator.microsoft.com
- Fonctionne sur : Application web et mobile autonome — non intégrée automatiquement à Zoom, aux fonctions de sous-titres Teams, à Meet ou à d’autres plateformes d’appel
- Bot requis : Non
- Sortie vocale : Oui — synthèse vocale de l’appareil dans l’application Translator
- Langues : Large couverture linguistique ; voir translator.microsoft.com pour la liste actuelle
Limites : Tous les participants doivent ouvrir activement et rejoindre la session Translator. Ne capture pas automatiquement l’audio de réunion d’une autre plateforme.
6. Notta — Idéal pour les notes traduites après la réunion
Notta est un preneur de notes IA qui transcrit les réunions en temps réel et peut produire des résumés et des notes traduits, principalement après la fin de la réunion. Il fonctionne via un bot de réunion qui rejoint les appels ou via une extension de navigateur.
Le point fort de Notta est le livrable soigné après la réunion : transcription propre, résumé traduit, notes partageables. Pour les équipes qui ont besoin d’archives de réunion multilingues plutôt que d’une compréhension en cours d’appel, c’est un choix pratique. En tant que traducteur vocal en temps réel pour une utilisation en plein appel, il est moins adapté à ce rôle.
- Tarifs : Forfaits d’abonnement — voir notta.ai/pricing pour les niveaux actuels
- Fonctionne sur : Zoom, Google Meet, Microsoft Teams et autres via bot ou extension de navigateur
- Bot requis : Oui
- Sortie vocale : Non
- Langues : Transcription dans de nombreuses langues ; les fonctions de traduction varient selon le forfait
Limites : Le bot de réunion est visible pour les autres participants et déclenche une notification d’enregistrement sur la plupart des plateformes. L’expérience de traduction pendant l’appel est secondaire par rapport au flux de travail post-réunion.
7. Otter.ai — Idéal pour les équipes dont la langue principale est l’anglais
Otter.ai est l’un des outils de transcription de réunion les plus utilisés. Sa transcription anglaise en temps réel est réellement solide — libellés clairs des intervenants, résumés IA continus et actions à suivre qui apparaissent au fil de la réunion via OtterPilot.
La capacité de traduction existe dans les forfaits supérieurs, mais Otter reste fondamentalement centré sur l’anglais. Pour les réunions où tous les participants parlent anglais et où l’objectif est de prendre des notes et des résumés, Otter est très compétitif. Pour les appels multilingues où la compréhension en cours de conversation compte, il ne suffit pas.
- Tarifs (otter.ai/pricing) : Gratuit (minutes limitées) · Pro 16,99 $/mois · Business 30 $/mois
- Fonctionne sur : Zoom, Google Meet, Microsoft Teams (via le bot OtterPilot)
- Bot requis : Oui (OtterPilot rejoint les réunions de manière visible)
- Sortie vocale : Non
- Langues : Principalement l’anglais
Limites : OtterPilot rejoint la réunion en tant que participant visible. La qualité de traduction dans les langues non anglaises est inférieure à celle des outils multilingues dédiés. Ne convient pas aux équipes pour lesquelles la présence d’un bot est malvenue.
Essayez MirrorCaption lors de votre prochain appel
1 heure gratuite. Aucune carte bancaire. Fonctionne avec Zoom, Teams, Meet et Webex basés sur navigateur dans Chrome ou Edge sur ordinateur.
Ouvrir MirrorCaption gratuitementComment choisir la bonne application de traduction vocale en temps réel
Quatre questions suffisent à réduire rapidement le champ.
Avez-vous besoin que la traduction soit lue à voix haute, ou le texte suffit-il ?
Si tout le monde dans l’appel peut lire les sous-titres, le texte suffit — et six des sept outils ci-dessus produisent du texte. Si un participant ne peut pas lire facilement un écran, ou si vous avez besoin que l’autre partie entende la réponse traduite pendant une présentation en direct ou une conversation en face à face, seuls MirrorCaption via Speak Translations et Microsoft Translator (dans sa propre application) prennent en charge la sortie vocale. Pour les appels commerciaux transfrontaliers où le prospect doit entendre la traduction plutôt que la lire, cette distinction est décisive.
Tous vos appels vidéo se déroulent-ils sur une seule plateforme ?
Si oui — et que cette plateforme est Zoom, Meet ou Teams — les fonctionnalités de sous-titres traduits intégrées sont l’option la moins contraignante. Pas de connexion supplémentaire, pas de fenêtre supplémentaire, pas d’option payante par siège au-delà du forfait existant.
Si vous organisez ou rejoignez des appels sur plusieurs plateformes, ou si vous voulez le même outil pour les conversations en personne, les fonctionnalités natives à la plateforme ne vous suivent pas. MirrorCaption fonctionne avec les appels Zoom, Teams, Meet et Webex basés sur navigateur dans Chrome ou Edge sur ordinateur, et ajoute le mode Talk pour une utilisation en face à face sur mobile. Pour un aperçu plus large des outils de traduction multiplateformes, consultez notre sélection des meilleurs traducteurs de réunion 2026.
Votre organisation restreint-elle les bots de réunion ou les extensions tierces ?
Les bots de réunion (utilisés par Notta et Otter.ai) rejoignent les appels en tant que participant visible et déclenchent une notification d’enregistrement sur la plupart des plateformes. De nombreuses politiques informatiques bloquent ou découragent les bots tiers. MirrorCaption capture directement l’audio de l’onglet du navigateur — aucun bot ne rejoint la réunion.
Notez que les politiques de l’organisation concernant le partage d’écran dans le navigateur et l’accès aux applications web s’appliquent toujours. De nombreuses équipes peuvent configurer MirrorCaption sans ouvrir de ticket IT, mais vérifiez les politiques de votre organisation en matière de navigateur et de capture d’écran. Pour une comparaison directe sur la question du bot, voir MirrorCaption vs Zoom AI Companion.
À quelle fréquence avez-vous réellement besoin de traduction ?
Pour un usage occasionnel — quelques appels par mois — l’heure gratuite unique de MirrorCaption ou le niveau gratuit de Microsoft Translator peuvent suffire. Pour un usage régulier, comparez le Premium à 99 € en une fois (200 h de crédit hébergé incluses) avec des outils récurrents par siège comme Otter Pro à environ 16,99 $/mois. À raison de deux heures d’appels traduits par semaine, l’offre à paiement unique est généralement rentabilisée en moins de deux mois.
Comparatif rapide : applications de traduction vocale en temps réel pour les appels vidéo
| Outil | Streaming en temps réel | Sortie vocale | Bot requis | Fonctionne sur | Coût de départ |
|---|---|---|---|---|---|
| MirrorCaption | Oui | Oui (Speak Translations) | Non | Chrome/Edge sur ordinateur ; Chrome mobile | 1 h gratuite ; Premium à 99 € en une fois |
| Zoom Translated Captions | Oui | Non | Non | Zoom uniquement | Forfaits Zoom payants |
| Google Meet Translated Captions | Oui | Non | Non | Google Meet uniquement | Forfaits Workspace sélectionnés |
| Teams Live Translated Captions | Oui | Non | Non | Teams uniquement | Teams Premium requis |
| Microsoft Translator | Oui | Oui (TTS de l’application) | Non | Application autonome uniquement | Gratuit |
| Notta | Partiel | Non | Oui | Zoom, Meet, Teams | Abonnement — voir le site |
| Otter.ai | Partiel (EN) | Non | Oui | Zoom, Meet, Teams | 16,99 $/mois Pro |
Questions fréquentes
Zoom propose-t-il une traduction vocale en temps réel pour les appels vidéo ?
Oui. Zoom propose Translated Captions dans certains forfaits payants. Lorsqu’un hôte active la fonctionnalité, les participants voient les sous-titres dans leur langue cible choisie en temps réel pendant la réunion. C’est uniquement textuel — il n’y a pas de sortie vocale. Les paires de langues disponibles et le niveau de forfait requis sont indiqués sur la page d’assistance de Zoom et sont mis à jour à mesure que Zoom étend sa couverture.
Existe-t-il une application de traduction vocale en temps réel qui ne rejoint pas ma réunion en tant que bot ?
Oui. MirrorCaption fonctionne dans l’onglet de votre navigateur et capture directement l’audio de l’onglet de réunion dans Chrome ou Edge sur ordinateur. Aucun bot ne rejoint la réunion et aucun participant supplémentaire n’apparaît dans la liste des participants. Les options natives à la plateforme — Zoom Translated Captions, Google Meet Translated Captions et Teams Live Translated Captions — ne nécessitent pas non plus de bot, mais chacune ne fonctionne que dans sa propre plateforme.
Un traducteur en temps réel peut-il lire la traduction à voix haute pendant un appel vidéo ?
Oui. La fonctionnalité Speak Translations de MirrorCaption lit à voix haute la parole traduite de l’utilisateur dans la langue cible avec une temporalité quasi temps réel. Les options de lecture incluent le haut-parleur de l’ordinateur portable, un téléphone appairé via code QR, ou un microphone virtuel Mac qui achemine l’audio traduit vers Zoom, Meet ou Teams comme entrée micro — de sorte que l’autre partie entende la traduction via l’appel. Microsoft Translator prend également en charge la lecture par synthèse vocale, mais cela fonctionne dans sa propre application autonome plutôt que comme une couche intégrée au-dessus d’un appel vidéo existant.
Quelle est la précision de la traduction vocale IA lors des appels vidéo ?
La précision dépend de la clarté de l’orateur, de la qualité du microphone, de la paire de langues et de l’accent. Les outils qui transmettent les segments précédents de la conversation comme contexte à chaque appel de traduction obtiennent généralement de meilleurs résultats sur les dialogues à plusieurs tours que les outils qui traduisent chaque phrase isolément. Pour les cas d’usage les plus exigeants — juridique, médical, négociation à forts enjeux — considérez la traduction IA comme une aide en temps réel puissante, et non comme un substitut certifié à un interprète professionnel. Pour un examen plus précis de la manière dont la qualité de traduction IA varie selon l’outil et la langue, consultez notre analyse de la précision de la traduction en temps réel.
Quelle est la meilleure application gratuite de traduction vocale en temps réel pour les appels vidéo ?
Les options natives à la plateforme (Zoom Translated Captions, Google Meet Translated Captions, Teams Live Translated Captions) sont en pratique gratuites si vous payez déjà le forfait d’hébergement, mais chacune est verrouillée à une seule plateforme. Microsoft Translator est gratuit sans verrouillage de plateforme, mais exige que tous les participants ouvrent son application autonome en parallèle de l’appel. MirrorCaption offre une heure gratuite unique — pas de carte bancaire, pas de remise à zéro mensuelle — ce qui suffit pour évaluer l’expérience de traduction en streaming sur un vrai appel avant de souscrire à un forfait.
Lisez chaque mot — pendant la réunion
MirrorCaption fonctionne avec Zoom, Teams, Meet et Webex basés sur navigateur. Aucun bot. Aucune installation. 1 heure gratuite pour essayer.
Commencer gratuitementEn résumé
La plupart des équipes se tournent vers la fonctionnalité de traduction intégrée à la plateforme qu’elles utilisent déjà. Cela fonctionne bien lorsque tout le monde reste sur le même outil. Dès qu’un appel passe à une autre plateforme, ou qu’une conversation a lieu en personne, la fonctionnalité native à la plateforme disparaît complètement.
MirrorCaption est conçu pour combler cet écart : un seul onglet de navigateur qui fonctionne avec les appels vidéo basés sur navigateur, capture l’audio sans bot, et peut en option lire la sortie traduite à voix haute via Speak Translations — assez rapidement pour faire avancer une vraie conversation. Commencez par l’essai gratuit d’une heure lors de votre prochain appel multilingue.