Las mejores herramientas de transcripción gratuitas en línea en 2026 son MirrorCaption, Otter.ai, Google Docs Escritura por voz, Notta y oTranscribe — cada una diseñada para un trabajo distinto. La elección correcta depende de una sola pregunta: ¿necesitas transcripción durante una reunión en vivo o a partir de una grabación después del hecho?
La mayoría de los artículos comparativos tratan estas dos necesidades como si fueran lo mismo. No lo son. Confundirlas es la fuente más común de decepción al elegir una herramienta gratuita.
Kenji dirige revisiones trimestrales con un equipo asociado dividido entre Tokio y Berlín. Un martes, su contraparte alemana planteó una preocupación en los primeros cinco minutos que reenmarcó toda la agenda. Kenji captó el tono. Se perdió las palabras. Su transcripción de Otter.ai llegó dos horas después. La decisión ya se había tomado. Una herramienta en tiempo real no habría cambiado su vocabulario — pero lo habría mantenido en la conversación.
Esa es la división sobre la que se construye esta guía. Probamos nueve herramientas de transcripción gratuitas en una llamada bilingüe de 20 minutos y una grabación de 30 minutos de un solo hablante en inglés, y las clasificamos según para qué son realmente buenas.
Conclusiones clave
- Reuniones en vivo, multilingüe: MirrorCaption — 2h gratis/mes, más de 60 idiomas, sin instalación, sin bot
- Notas de reuniones en inglés, post-llamada: Otter.ai — 300 min gratis/mes, solo inglés
- Sin registro, ahora mismo: Google Docs Escritura por voz — gratis, sin cuenta, sin límite de minutos
- Transcripción manual con privacidad: oTranscribe — el audio nunca sale de tu dispositivo; tú escribes las palabras
- Atención a la letra pequeña: El plan gratuito de Notta es de 120 minutos al mes, no ilimitado
Dos tipos de herramientas de transcripción gratuitas — por qué importa la diferencia
Antes de comparar herramientas, vale la pena nombrar los dos trabajos que las personas buscan cuando buscan una herramienta de transcripción gratuita en línea:
La transcripción en vivo significa que las palabras aparecen en pantalla mientras alguien habla — lo suficientemente rápido para leer mientras la conversación aún está ocurriendo. La latencia debe ser inferior a un segundo. De esto trata la diferencia entre subtítulos en vivo y transcripciones: los subtítulos son para ahora, las transcripciones son para después.
La transcripción de archivos significa que tienes una grabación. La subes, esperas un minuto o dos y obtienes el texto. La precisión suele ser mayor porque el modelo procesa el contexto completo. La velocidad importa menos.
MirrorCaption, Google Docs Escritura por voz y Speechnotes gestionan audio en vivo. Otter.ai, Notta, Transkriptor y Descript gestionan grabaciones. Fathom hace ambas cosas, pero está diseñado para ser post-llamada. oTranscribe está en una categoría propia: es un asistente de escritura manual, no transcripción de IA en absoluto.
Qué buscar antes de elegir un plan gratuito
No todos los niveles gratuitos son iguales. Esto es lo que debes verificar:
Precisión. Para inglés de un solo hablante con audio limpio, la mayoría de las herramientas de transcripción de IA alcanzan ahora una precisión de palabras del 90–95%. Eso baja drásticamente con ruido de fondo, acentos marcados, jerga técnica o varios hablantes. La única prueba fiable es pasar el mismo clip de cinco minutos por las herramientas que estás comparando.
Soporte de idiomas. La mayoría de las herramientas gratuitas priorizan el inglés. Confirma que la herramienta realmente admite tu idioma de destino en tiempo real — no solo como opción de posprocesamiento. Otter.ai, Fathom y Descript son solo inglés en los planes gratuitos. MirrorCaption cubre más de 60 idiomas, incluidos mandarín, japonés, coreano, árabe e hindi en todos los niveles.
Límites del plan gratuito. El rango es notable:
- MirrorCaption: 2 horas por mes (se reinicia mensualmente)
- Otter.ai: 300 minutos por mes (se reinicia mensualmente)
- Google Docs Escritura por voz: ilimitado (sin cuenta necesaria)
- Notta: 120 minutos por mes
- Transkriptor: 90 minutos en el plan gratuito
- Descript: 60 minutos de medios por mes
Privacidad. La mayoría de las herramientas de transcripción de IA envían el audio a servidores externos para su procesamiento. Para reuniones sensibles — legales, médicas, financieras — verifica la política de retención de datos de la herramienta antes de la primera llamada. Si el procesamiento local es un requisito estricto, oTranscribe es la única opción genuinamente privada aquí. MirrorCaption toma un camino intermedio: el audio se transmite para procesamiento en tiempo real, pero nunca se almacena en el servidor.
Requisitos de instalación. Cualquier cosa que requiera una aplicación de escritorio, extensión de navegador o bot de reunión añade fricción y a menudo activa la revisión de TI. MirrorCaption, Notta, oTranscribe, Speechnotes, Transkriptor y Google Docs Escritura por voz funcionan sin instalación.
Las 9 mejores herramientas de transcripción gratuitas en línea en 2026
1. MirrorCaption — La mejor para reuniones en vivo y transcripción multilingüe
Ideal para: Videollamadas multilingüe, subtítulos en tiempo real, equipos remotos
MirrorCaption transmite transcripción y traducción palabra por palabra usando un motor STT de baja latencia por WebSocket más traducción GPT. El subtítulo aparece en menos de 500ms tras cada palabra — lo suficientemente rápido para leer mientras alguien sigue hablando. Ningún bot se une a tu reunión. Sin extensiones que instalar. Abre el navegador, comparte la pestaña y aparece la transcripción.
El nivel gratuito incluye acceso completo a más de 60 idiomas, detección de hablantes, resúmenes de reuniones con IA y constructor de vocabulario. No hay restricciones de funciones en el plan gratuito — solo un límite mensual de 2 horas que se reinicia cada mes.
Es la única herramienta de esta lista que combina traducción en tiempo real con una interfaz basada en navegador que funciona tanto en portátil como en teléfono. Para la traducción en tiempo real para equipos remotos, nada más en este resumen compite en un plan gratuito.
- Plan gratuito: 2h/mes, sin tarjeta de crédito, acceso completo a funciones
- Idiomas: más de 60 con traducción en tiempo real (no solo transcripción)
- Plataforma: Cualquier navegador — Chrome, Safari, Edge — escritorio y móvil
- Privacidad: Sin bot, audio nunca almacenado en el servidor, transcripciones guardadas localmente
- Limitación: Solo audio en vivo — sin carga de archivos pregrabados
2. Otter.ai — La mejor para notas de reuniones en inglés
Ideal para: Equipos en inglés que quieren notas post-reunión
Otter.ai es la herramienta de transcripción de reuniones más conocida para hablantes de inglés. OtterPilot — su bot de reuniones — se une a tu llamada de Zoom, Google Meet o Teams, la graba y genera una transcripción con búsqueda, resumen generado por IA y puntos de acción. La calidad de la transcripción en audio limpio en inglés es excelente.
El plan gratuito ofrece 300 minutos por mes, que se reinician mensualmente. Es suficiente para alrededor de seis reuniones de 50 minutos. Si todo tu equipo habla inglés y no te importa un bot visible, Otter es el nivel gratuito más generoso solo en inglés de esta lista.
Las limitaciones son reales. Sin traducción en tiempo real. El bot es visible para todos los participantes — algunas organizaciones e industrias reguladas bloquean completamente los bots de reuniones por preocupaciones de privacidad de datos con IA. Y el plan gratuito no admite idiomas distintos al inglés.
- Plan gratuito: 300 min/mes (se reinicia mensualmente)
- Idiomas: Solo inglés en el plan gratuito
- Plataforma: Aplicación de escritorio o web; el bot se une a tu reunión
- Limitación: El bot es visible; sin traducción en tiempo real; solo inglés
3. Google Docs Escritura por voz — La mejor para transcripción sin cuenta
Ideal para: Trabajos puntuales sin necesidad de registro
El reconocimiento de voz integrado de Chrome transcribe lo que escucha tu micrófono — tu propia voz o audio reproducido por los altavoces — directamente en un Google Doc. Sin cuenta más allá de una cuenta de Google (que la mayoría ya tiene). Sin límites de minutos. Sin coste adicional al de Chrome.
Funciona. Para notas de voz de un solo hablante, dictado o apuntes rápidos, es genuinamente útil. Para la transcripción de reuniones tiene dificultades: la precisión cae cuando el audio se reproduce por los altavoces del portátil (el micrófono capta el eco de la sala), y no hay detección de hablantes, ni traducción ni exportación más allá de copiar el texto.
- Plan gratuito: Ilimitado (sin límite de minutos)
- Idiomas: ~70 idiomas admitidos
- Plataforma: Solo navegador Chrome; sin instalación adicional
- Limitación: Solo entrada por micrófono; sin carga de archivos; sin funciones de IA; la precisión cae en entornos ruidosos
4. Notta — La mejor transcripción gratuita de carga de archivos
Ideal para: Grabaciones cortas que necesitas transcribir rápidamente
Sube un archivo de audio o vídeo, y Notta devuelve una transcripción con marcas de tiempo y etiquetas de hablantes en aproximadamente un minuto por cada diez minutos de audio. Admite más de 50 idiomas. La interfaz es limpia y exporta a Word, SRT y texto sin formato.
El inconveniente: el plan gratuito es de 120 minutos por mes, no ilimitado. Dos entrevistas de una hora agotan la asignación mensual. Planifícalo. Si tienes una sola grabación larga o un pequeño lote de grabaciones cortas y no quieres pagar, Notta es la opción de carga de archivos más limpia en el nivel gratuito.
- Plan gratuito: 120 min/mes
- Idiomas: más de 50 para transcripción
- Plataforma: Basado en navegador; sin instalación
- Limitación: El límite mensual se agota rápido para uso habitual
5. oTranscribe — La mejor para transcripción manual con privacidad
Ideal para: Audio sensible donde nada puede salir de tu dispositivo
oTranscribe es una aplicación web de código abierto donde subes un archivo de audio y escribes la transcripción tú mismo. Los atajos de teclado controlan la velocidad de reproducción e insertan marcas de tiempo. Nada se envía a ningún servidor — el archivo de audio permanece en tu navegador, local en tu máquina.
Queda claro qué es: oTranscribe no es transcripción de IA. No convierte el habla en texto automáticamente. Es un asistente de escritura — significativamente más rápido que un editor de texto simple, pero tú haces toda la escritura. Para periodistas, abogados y personal médico que manejan audio sensible, esa compensación vale la pena.
- Plan gratuito: Completamente gratis; código abierto
- Idiomas: Cualquiera (tú escribes las palabras)
- Plataforma: Basado en navegador; sin instalación; sin cuenta
- Limitación: Solo escritura manual — no es transcripción de IA
6. Fathom — El mejor tomador de notas de IA gratuito para equipos de reuniones en inglés
Ideal para: Equipos de ventas en inglés y responsables de equipo que usan Zoom, Meet o Teams
Fathom graba llamadas de Zoom, Google Meet y Microsoft Teams y genera aspectos destacados y un resumen post-reunión. El plan gratuito cubre grabaciones y transcripciones ilimitadas sin límite de minutos — uno de los niveles gratuitos más generosos en la categoría de notas de reuniones.
Las compensaciones son conocidas: salida en inglés primero, notas post-llamada, y captura que puede usar un bot visible o modo sin bot dependiendo de la configuración. Si tu equipo habla inglés y quiere notas gratuitas post-reunión, Fathom ofrece un valor sólido. Si necesitas subtítulos en vivo o traducción, no lo proporciona.
- Plan gratuito: Grabaciones y transcripciones ilimitadas
- Idiomas: Solo inglés
- Plataforma: Zoom, Google Meet y Microsoft Teams
- Limitación: Sin subtítulos en tiempo real; sin traducción; el modo de captura varía según la configuración
Priya es una periodista freelance en Londres que entrevistó a una investigadora en Mumbai durante 45 minutos. Primero probó Notta — usó casi la mitad de su asignación mensual gratuita en una sola grabación. En la siguiente entrevista, reprodujo el audio por los altavoces de su portátil y dejó que Google Docs Escritura por voz lo transcribiera. La precisión fue de alrededor del 72%. Utilizable para notas. No lo suficientemente limpio para citar. Para publicación, terminó pagando un mes de Notta Pro. La lección: las herramientas gratuitas son correctas para borradores y notas internas. Para cualquier cosa que quede registrada, presupuesta una buena transcripción.
7. Speechnotes — La mejor para transcripción rápida por micrófono
Ideal para: Notas de voz y dictado en una habitación tranquila
Speechnotes usa la API de Web Speech de Google, ejecutándose en Chrome, para transcribir lo que recoge tu micrófono. Sin registro, sin límite de minutos, decenas de idiomas. Para dictado en solitario en un entorno tranquilo, es una herramienta limpia que hace bien un solo trabajo.
No transcribirá una videollamada (no puede capturar audio del sistema sin un bucle de hardware), y el audio se procesa a través de los servidores STT de Google, por lo que la privacidad no es un punto fuerte. Trátalo como un bloc de notas de voz a texto, no como una herramienta de reuniones.
- Plan gratuito: Ilimitado
- Idiomas: más de 50 idiomas
- Plataforma: Navegador Chrome; sin instalación; sin cuenta
- Limitación: Solo micrófono; no puede capturar una videollamada; el audio va a los servidores de Google
8. Transkriptor — Útil para clips cortos ocasionales
Ideal para: Probar la interfaz en una grabación corta
Transkriptor ofrece transcripción de carga de archivos con etiquetas de hablantes, marcas de tiempo y una interfaz de edición. La interfaz es pulida. La opción gratuita actual está limitada a 90 minutos, suficiente para probar algunas grabaciones cortas, pero no suficiente para flujos de trabajo habituales de reuniones.
Vale la pena mencionarlo porque Transkriptor aparece en muchos resúmenes y los lectores a menudo descubren el límite solo después de registrarse. Si el producto te atrae, sus planes de pago empiezan en alrededor de $9.99/mes, lo que es competitivo. En el nivel gratuito, es mejor tratarlo como una opción de uso ocasional.
- Plan gratuito: 90 minutos
- Idiomas: más de 40 idiomas
- Plataforma: Basado en navegador; sin instalación
- Limitación: El plan gratuito es limitado; el uso habitual requiere un plan de pago
9. Descript — La mejor para creadores de contenido que editan audio
Ideal para: Podcasters y creadores de vídeo que editan por transcripción
La característica diferenciadora de Descript es la edición basada en transcripción: elimina una palabra de la transcripción y el audio desaparece. Esto es genuinamente útil para podcasters y editores de vídeo que no quieren tocar una línea de tiempo. El plan gratuito ahora incluye 60 minutos de medios por mes en lugar de una asignación de horas de transcripción por separado.
Requiere descargar una aplicación de escritorio, por lo que no está basada en navegador. También está principalmente centrada en el inglés y construida para la creación de contenido, no para reuniones. Si eres un podcaster editando notas del programa, Descript merece su lugar. Para la transcripción de reuniones, no es la herramienta adecuada.
- Plan gratuito: 60 minutos de medios/mes
- Idiomas: Principalmente inglés
- Plataforma: Aplicación de escritorio (Mac y Windows); requiere descarga
- Limitación: Descarga requerida; no basada en navegador; no apta para reuniones
¿Necesitas transcripción en tiempo real durante tu próxima reunión?
MirrorCaption te da 2 horas gratuitas al mes — sin tarjeta de crédito, más de 60 idiomas, ningún bot se une a la llamada.
Empieza GratisLímites del plan gratuito — Comparación
| Herramienta | Límite gratuito | Idiomas | ¿Tiempo real? | ¿Sin instalación? | ¿Audio almacenado? |
|---|---|---|---|---|---|
| MirrorCaption | 2h/mes | 60+ con traducción | Sí | Sí | No |
| Otter.ai | 300 min/mes | Solo inglés | Parcial (bot) | No (app/bot) | Sí |
| Google Docs Escritura por voz | Ilimitado | ~70 idiomas | Sí (solo mic) | Sí | A través de Google |
| Notta | 120 min/mes | más de 50 idiomas | No | Sí | Sí |
| oTranscribe | Ilimitado | Cualquiera (manual) | Solo manual | Sí | No (solo local) |
| Fathom | Grabaciones ilimitadas | Solo inglés | No (post-llamada) | No (bot) | Sí |
| Speechnotes | Ilimitado | más de 50 idiomas | Sí (solo mic) | Sí | A través de Google |
| Transkriptor | 90 min | más de 40 idiomas | No | Sí | Sí |
| Descript | 60 min de medios/mes | Inglés | No | No (app) | Sí |
¿Qué herramienta de transcripción gratuita es la adecuada para ti?
Empieza con tu caso de uso principal. La mayoría de las personas necesitan exactamente un tipo de herramienta — y elegir el tipo equivocado es más costoso que elegir la marca equivocada.
- Estás en una reunión en vivo con hablantes de otros idiomas → MirrorCaption. Ninguna otra herramienta gratuita de esta lista traduce en tiempo real. Para reuniones de seguimiento multilingüe, llamadas con clientes o conferencias, es la única opción que te mantiene en la conversación.
- Necesitas notas post-reunión en inglés → Otter.ai. La mejor calidad de transcripción en inglés, más minutos por mes en el nivel gratuito, se une a tu calendario automáticamente.
- Quieres cero fricción ahora mismo → Google Docs Escritura por voz. Abre Chrome, ve a Herramientas > Escritura por voz, empieza a hablar. Sin formularios que rellenar.
- Tienes una o dos grabaciones para transcribir → Notta. Sube, espera 60 segundos, descarga. Controla cuidadosamente el límite mensual de 120 minutos.
- Manejas audio sensible → oTranscribe. Nada sale de tu navegador. Trae tu velocidad de escritura.
- Realizas llamadas de ventas en inglés en Zoom, Meet o Teams → Fathom. Reuniones ilimitadas, notas de IA sólidas, sin pago mensual.
- Creas podcasts o contenido de vídeo → Descript. La función de edición por transcripción justifica el requisito de descarga.
Preguntas frecuentes sobre herramientas de transcripción gratuitas
¿Son las herramientas de transcripción gratuitas suficientemente precisas para uso profesional?
Para inglés de un solo hablante en audio limpio, sí — la mayoría de las herramientas de transcripción de IA alcanzan una precisión de palabras del 90–95%. Es suficiente para notas internas y borradores. No es suficientemente fiable para publicar textualmente sin una revisión previa. La precisión cae con habla con acento, ruido de fondo, vocabulario técnico y contenido multilingüe. Prueba tu audio específico antes de comprometerte con cualquier herramienta.
¿Las herramientas de transcripción gratuitas graban y almacenan mi audio?
La mayoría sí. Las excepciones son Google Docs Escritura por voz (usa la API de habla de Chrome local, pasa por Google pero no almacena permanentemente), oTranscribe (completamente local — nada sale de tu dispositivo) y MirrorCaption (el audio se transmite a un motor STT en tiempo real para procesamiento en vivo, pero nunca se almacena en el servidor). Para reuniones sensibles, verifica la política de retención de datos de cualquier herramienta antes de usarla. Nuestra guía sobre privacidad en resúmenes de reuniones con IA cubre qué preguntas hacer.
¿Pueden las herramientas de transcripción gratuitas manejar varios idiomas?
Algunas pueden. MirrorCaption admite más de 60 idiomas con traducción en tiempo real en su plan gratuito — este es su principal diferenciador respecto a todas las demás herramientas de esta lista. Notta y Speechnotes admiten varios idiomas para transcripción, pero no traducción. Otter.ai, Fathom y Descript son solo inglés en los niveles gratuitos. Google Docs Escritura por voz admite alrededor de 70 idiomas, pero la precisión varía significativamente según el idioma.
¿Cuál es la mejor herramienta de transcripción gratuita para reuniones de Zoom?
Para subtítulos en tiempo real durante Zoom: MirrorCaption. Captura el audio de tu pestaña de Zoom a través del navegador — sin bot, sin extensión, sin aprobación de TI. Para notas post-reunión en inglés: Fathom (grabaciones ilimitadas en Zoom, Meet y Teams) o el plan gratuito de 300 minutos de Otter.ai. Para una comparación más detallada específica de Zoom, consulta nuestro resumen del mejor traductor de reuniones 2026.
¿Existe una herramienta de transcripción verdaderamente ilimitada y gratuita?
Google Docs Escritura por voz y Speechnotes no tienen límites de minutos. Ambas son herramientas de micrófono de un solo hablante — no pueden capturar el audio de una videollamada sin una solución de hardware. MirrorCaption ofrece 2 horas por mes, que se reinicia mensualmente: no es ilimitado, pero es el nivel gratuito de transcripción de grado de reunión más generoso con traducción en tiempo real. Para usuarios ocasionales que necesitan transcribir su propio habla, Google Docs Escritura por voz es efectivamente gratuita para siempre.
Andre es un consultor freelance que dirige entre cuatro y seis llamadas con clientes al mes, cada una de alrededor de 40 minutos. Estaba pagando $16.99/mes por Otter Pro. Cambiar al plan Lifetime de MirrorCaption costó €49 una vez. Lo recuperó en tres meses. La calidad de la transcripción en sus llamadas francés-inglés mejoró porque MirrorCaption realmente traduce — Otter dejaba las frases en francés sin tocar. Sigue usando el nivel gratuito de Otter para las ocasionales llamadas solo en inglés. Las dos herramientas sirven para trabajos distintos.
La conclusión sobre herramientas de transcripción gratuitas en línea
Las mejores herramientas de transcripción gratuitas en línea en 2026 resuelven problemas específicos bien. El error es elegir una para un trabajo para el que no fue diseñada.
Si estás en una reunión en vivo con hablantes de otros idiomas, ninguna herramienta basada en carga de archivos te ayudará en el momento. Si estás transcribiendo una grabación de entrevista de tres horas, una herramienta en tiempo real tampoco es la opción adecuada.
La versión más corta: Google Docs Escritura por voz para trabajos sin compromiso, Otter.ai para notas de reuniones en inglés, MirrorCaption para reuniones multilingüe en vivo — y el único plan gratuito en este grupo que incluye traducción en tiempo real y se reinicia cada mes.
Empieza con 2 horas gratis — sin tarjeta de crédito
MirrorCaption transcribe y traduce tu próxima reunión en tiempo real. Funciona en cualquier navegador, en cualquier plataforma de videollamadas. Nada que instalar.
Prueba MirrorCaption Gratis