MirrorCaption es una app de interpretación médica basada en navegador que transmite transcripción y traducción en tiempo real durante las citas clínicas — sin necesidad de llamada telefónica, sin facturación por minuto y sin que ningún bot se una a tu llamada de telemedicina. Abre una pestaña en tu portátil o teléfono, selecciona el idioma del paciente y lee lo que dice mientras lo dice. Admite más de 60 idiomas y funciona tanto para consultas presenciales como para visitas de telemedicina en cualquier plataforma.
Son las 14:30 de un martes. La cita de las 15:00 de la Dra. Linh Nguyen es una primera consulta — Gurpreet Singh, 58 años, posible dolor torácico, habla panyabí. El intérprete del personal de la clínica trabaja lunes, miércoles y viernes. Linh tiene tres opciones: esperar entre 8 y 12 minutos a que se conecte un intérprete telefónico (suponiendo que haya uno disponible para panyabí a esa hora), pedir al hijo adulto del paciente que describa síntomas de dolor torácico sin tener vocabulario de cardiología, o abrir una pestaña del navegador.
Abre la pestaña. Selecciona panyabí → inglés. Treinta segundos después, Gurpreet está describiendo sus síntomas mientras Linh lee la traducción en tiempo real — palabra por palabra, a medida que habla.
- Más de 40 millones de personas en EE. UU. tienen un dominio limitado del inglés; las barreras lingüísticas son una causa documentada de eventos clínicos adversos, no solo una molestia.
- La interpretación telefónica profesional (OPI) cuesta entre 1,50 y 3,00 dólares por minuto — una cita de 20 minutos con asistencia lingüística cuesta entre 30 y 60 dólares por visita.
- MirrorCaption transmite transcripción y traducción en tiempo real en cualquier navegador — sin instalación, sin llamada telefónica, sin bot uniéndose a la reunión — por 49 € en un único pago.
- Funciona para llamadas de telemedicina (Zoom, Teams, doxy.me) y consultas presenciales; tanto el profesional como el paciente pueden leer los subtítulos al mismo tiempo.
- MirrorCaption no sustituye a los intérpretes humanos certificados en consentimientos quirúrgicos, evaluaciones psiquiátricas o conversaciones legales complejas.
Las barreras lingüísticas en la atención sanitaria son un riesgo clínico
Más de 40 millones de personas en Estados Unidos tienen un dominio limitado del inglés (LEP) — hablan en casa un idioma distinto del inglés y tienen dificultades importantes para comunicarse en inglés en un contexto sanitario. Según los datos de la Oficina del Censo de EE. UU., las mayores poblaciones LEP hablan español, chino, vietnamita, tagalo, coreano, árabe, panyabí y criollo haitiano.
Las consecuencias clínicas están bien documentadas. La investigación ha demostrado que los pacientes con LEP sufren tasas significativamente más altas de eventos adversos graves relacionados con fallos de comunicación, incluidas dosis incorrectas de medicación, instrucciones de alta mal entendidas y diagnósticos retrasados. No son casos aislados — son patrones que se repiten en urgencias, centros de atención primaria y consultas de especialistas allí donde el acceso lingüístico es inconsistente.
Desde el punto de vista legal, los proveedores sanitarios financiados con fondos federales están obligados a proporcionar acceso lingüístico en virtud del Título VI de la Ley de Derechos Civiles. La Oficina de Derechos Civiles del HHS hace cumplir este requisito. Las Normas Nacionales CLAS (Servicios Cultural y Lingüísticamente Apropiados) van más allá: la Norma 5 exige explícitamente ofrecer asistencia lingüística a todo paciente que la necesite, sin coste, en todos los puntos de contacto.
La mayoría de las clínicas entienden esta obligación. La brecha no está en la concienciación — está en la logística. Las líneas de intérpretes telefónicos implican tiempos de espera. Las tabletas de interpretación remota por vídeo (VRI) requieren contratos empresariales. Y las alternativas informales son ética y médicamente problemáticas de formas difíciles de defender si se produce un evento adverso.
Cómo gestionan hoy las clínicas el acceso lingüístico — y en qué falla cada enfoque
Interpretación telefónica (OPI)
LanguageLine Solutions, CyraCom y servicios similares conectan a quien llama con un intérprete en directo en más de 200 idiomas. El modelo funciona cuando hay un intérprete disponible. En la práctica, los tiempos de espera para idiomas menos comunes — somalí, hmong, criollo haitiano, panyabí — pueden ser de 8 a 15 minutos en horas punta. La facturación es por minuto: aproximadamente entre 1,50 y 3,00 dólares según el idioma, la hora del día y el volumen contratado.
Haz las cuentas en voz alta: una cita de 20 minutos con 20 minutos de interpretación activa cuesta entre 30 y 60 dólares cada vez. Una clínica que atiende a tres pacientes LEP por semana paga entre 90 y 180 dólares por semana — entre 4.680 y 9.360 dólares al año. Para una consulta con cinco profesionales y un volumen similar, eso supera los 30.000 dólares anuales. Los centros de salud comunitarios que funcionan con subvenciones a menudo quedan fuera por precio antes de empezar.
La OPI también es funcionalmente incompatible con la telemedicina. Cuando la cita es una videollamada por Zoom o Teams, el profesional no puede al mismo tiempo sostener un teléfono en la oreja para un intérprete telefónico mientras realiza una visita por vídeo. Los flujos de trabajo no encajan.
Tabletas de interpretación remota por vídeo (VRI)
Los hospitales despliegan sistemas VRI — iPads o tabletas específicas montadas en soportes, conectadas a servicios de interpretación por vídeo como MARTTI o InDemand. El modelo proporciona una conexión visual, lo que importa para el registro emocional y para las lenguas de signos. La limitación: el hardware VRI está ligado a la institución. Un centro de salud comunitario que atiende a pacientes rurales por telemedicina no puede usar una tableta VRI dentro de una ventana de Zoom. Los profesionales autónomos no pueden acceder a los niveles de precios empresariales de VRI. La herramienta resuelve bien el problema presencial dentro del hospital, y nada más.
Google Translate — la herramienta que la mayoría de las consultas ya usa
Merece la pena nombrar al elefante en la habitación. Un número significativo de médicos de atención primaria admite usar Google Translate con pacientes. Es comprensible: es gratis, instantáneo y está disponible en cualquier teléfono. También es inadecuado para uso clínico, por varias razones concretas.
Google Translate procesa fragmentos de texto escritos, no voz en streaming. No tiene diarización de hablantes (ninguna forma de separar la voz del profesional de la del paciente), no está entrenado en contexto médico para la precisión terminológica y no ofrece exportación — el intercambio desaparece cuando se cierra la ventana. Para documentación, no deja registro. La herramienta está diseñada para traducir la carta de un restaurante en una ciudad extranjera. No fue diseñada para una conversación de diagnóstico diferencial.
Tampoco existe una vía HIPAA. Las condiciones de Google no incluyen un Business Associate Agreement para el producto Translate de consumo. Los profesionales que lo usan lo hacen fuera de cualquier marco de cumplimiento.
Personal y familiares como intérpretes
Usar personal no formado o familiares como intérpretes es el enfoque informal más común — y el que presenta la tasa de error documentada más alta. Los intérpretes familiares omiten y modifican información clínica, a menudo sin querer, debido a un vocabulario limitado y a la implicación emocional. Un padre pidiendo a su hijo que interprete un diagnóstico de cáncer, o un cónyuge suavizando un pronóstico que no quiere transmitir, son patrones que el personal clínico reconoce de inmediato. El personal no formado se enfrenta a lagunas de vocabulario similares y no está entrenado en ética de la interpretación (confidencialidad, precisión, no interferencia).
Hay una cuarta opción. MirrorCaption funciona íntegramente en tu navegador — abre la pestaña antes de que entre el paciente. Los equipos remotos que trabajan entre idiomas lo usan por la misma razón que los profesionales sanitarios: la transcripción aparece mientras alguien sigue hablando.
Probar gratis →Cómo es en la práctica un intérprete médico basado en navegador
MirrorCaption funciona como una Progressive Web App — sin descarga, sin extensión de navegador y sin necesidad de aprobación de IT. Ábrela en Chrome, Edge o Safari en un portátil, tableta o teléfono. Este es el flujo de trabajo clínico:
- Abre la app en mirrorcaption.com/app. Inicia sesión o continúa con el plan gratuito (1 hora gratis, una sola vez, sin tarjeta de crédito).
- Selecciona la fuente de audio. Para citas presenciales, elige solo micrófono. Para llamadas de telemedicina, elige audio del sistema + micrófono para capturar ambos lados de la videollamada.
- Configura los idiomas. Selecciona el idioma hablado por el paciente y tu idioma de lectura. La transcripción muestra ambas columnas una al lado de la otra.
- Inicia la sesión. Las palabras aparecen en pantalla en menos de 500 ms desde que se pronuncian. Las palabras parciales se corrigen automáticamente a medida que se acumula contexto.
Modo presencial: entrega el teléfono o la tableta al paciente. Habla al micrófono; tú lees la traducción en tu pantalla. Tú hablas; el paciente lee tus palabras traducidas a su idioma. Un dispositivo, una pestaña del navegador, sin hardware adicional.
Modo telemedicina: MirrorCaption captura el audio de la llamada desde la pestaña del navegador usando la captura de audio de pantalla integrada del navegador. Ningún bot se une a la llamada. Ningún participante recibe una notificación. El paciente solo te ve y te oye a ti; MirrorCaption se ejecuta en una segunda ventana de tu lado.
Admisión en clínica comunitaria
Llega un paciente somalí para una cita del mismo día. El intérprete del personal no está disponible. Abre la app en el portátil del mostrador de admisión, selecciona somalí → inglés y entrega al paciente la pantalla para que lea. La anamnesis empieza en menos de un minuto.
Visita de telemedicina
Realizas un seguimiento por Zoom con un paciente cantonés en una zona rural. MirrorCaption captura el audio de la llamada en una segunda pestaña — sin llamada a un intérprete, sin bot uniéndose al vídeo. Ambas partes se comunican en tiempo real.
Traspaso presencial
Un paciente de urgencias ambulatorias habla criollo haitiano. El profesional abre MirrorCaption en su teléfono, cambia al modo cara a cara y lo coloca sobre la camilla entre ambos. Las dos partes leen las palabras de la otra a medida que se pronuncian.
Clínica rural, sin intérprete en plantilla
Un profesional autónomo en una clínica rural atiende a pacientes vietnamitas tres días por semana. El intérprete certificado más cercano está a 40 millas. MirrorCaption funciona en el portátil que ya tiene la clínica — sin hardware, sin contrato y sin factura por minuto.
Los idiomas más importantes en entornos clínicos
MirrorCaption admite más de 60 idiomas, incluidos todos los idiomas clínicos de mayor necesidad identificados en los datos de equidad sanitaria de EE. UU. y la UE:
- Español — con diferencia, el idioma LEP más común en EE. UU.
- Chino mandarín y cantonés — dialectos distintos que requieren modelos STT separados
- Vietnamita, tagalo, coreano, indonesio
- Árabe, somalí, criollo haitiano — de alta necesidad y poco cubiertos por la mayoría de proveedores OPI
- Panyabí, hindi, urdu, bengalí
- Ruso, portugués, polaco, rumano
- Francés, alemán, italiano, neerlandés
La traducción es bidireccional — el profesional habla o escribe en inglés y el paciente lee en su idioma, y viceversa, en la misma sesión. La detección de hablantes etiqueta automáticamente las voces distintas en la transcripción, de modo que el registro muestra quién dijo qué. Eso importa para la documentación clínica y para revisar la conversación después de la cita.
Una nota honesta sobre la precisión: MirrorCaption funciona bien en diálogos médicos conversacionales — descripción de síntomas, instrucciones sobre medicación, programación de seguimientos. No está entrenado en jerga clínica especializada al nivel de un intérprete médico certificado. Para citas ambulatorias generales, eso no suele ser una limitación. Para consultas de neurocirugía o evaluaciones psiquiátricas, un intérprete humano sigue siendo el estándar adecuado.
HIPAA y privacidad — una respuesta directa
La primera pregunta que hace cualquier proveedor sanitario es: "¿Cumple esto con HIPAA?". La respuesta honesta requiere dos partes.
Qué hace MirrorCaption con el audio: no se almacena nada en servidores. El audio se transmite desde tu navegador a nuestra API de streaming para la transcripción en tiempo real y luego se descarta. Los servidores de MirrorCaption nunca reciben ni conservan audio. Las transcripciones se guardan localmente en el almacenamiento IndexedDB de tu navegador — viven en tu dispositivo, no en una base de datos en la nube. Cuando cierras la sesión, el audio desaparece.
La cuestión estructural de cumplimiento: MirrorCaption es una herramienta de software, no una entidad sanitaria. Actualmente no ofrece un Business Associate Agreement (BAA). Para consultas que operan en entornos estrictamente regulados con programas formales de cumplimiento HIPAA, esto importa y deberías revisarlo con tu responsable de cumplimiento antes de implantar cualquier herramienta sin BAA en un flujo de trabajo de cara al paciente.
Para una comparación práctica: Google Translate — la herramienta que un número significativo de clínicas usa actualmente de forma informal — tampoco ofrece un BAA, enruta el texto a través de los servidores de Google y registra datos de consulta bajo la política de privacidad estándar de Google. El modelo de almacenamiento local de MirrorCaption protege la privacidad de forma significativamente mejor que las alternativas informales de las que ya dependen la mayoría de las consultas, incluso sin un BAA formal.
El coste real del acceso lingüístico — y una opción más asequible
Las cuentas que los proveedores de interpretación telefónica no ponen en sus webs:
- Precio OPI: ~2,00 dólares/minuto (estimación media para LanguageLine o CyraCom)
- Una cita, 20 minutos de asistencia lingüística: 40 dólares
- Tres citas por semana: 120 dólares/semana
- Anualizado: 6.240 dólares/año
- Una consulta con cinco profesionales al mismo volumen: 31.200 dólares/año
Los servicios de tabletas VRI cuestan entre 0,80 y 2,00 dólares por minuto, más el coste del equipo y la licencia empresarial. Los centros de salud comunitarios y los profesionales autónomos no son el cliente objetivo de la VRI empresarial — quedan fuera por precio antes de la primera conversación.
El plan Lifetime de MirrorCaption cuesta 49 € en un único pago. Incluye 200 horas de transcripción y traducción gestionadas. Con tres citas semanales de 20 minutos con asistencia lingüística, eso son 52 horas al año — el plan Lifetime cubre casi cuatro años a ese volumen antes de necesitar una recarga. Los Voice Pack añaden 5 horas por 2,99 € o 15 horas por 7,99 € cuando necesitas más.
-
Más de 60 idiomas con transcripción y traducción en streaming en tiempo real — ambos lados de la conversación, de forma bidireccional.
-
Funciona en persona y en telemedicina — entrega del teléfono en citas presenciales, captura de audio de pestaña para llamadas de Zoom/Teams/doxy.me.
-
Ningún bot se une a la llamada — sin notificación visible para el paciente, sin terceros participantes en la videollamada.
-
Detección de hablantes — etiqueta automáticamente por separado las voces del profesional y del paciente en la transcripción.
-
Almacenamiento local de transcripciones — no se guarda audio en servidores; la transcripción permanece en el almacenamiento local de tu navegador.
-
49 € en un único pago, 200 horas incluidas — sin facturación por minuto, sin contrato empresarial y sin tener que esperar a una ventana de disponibilidad de intérprete.
Para quién es — y para quién no —
MirrorCaption es especialmente adecuado para:
- Centros de salud comunitarios sin intérpretes en plantilla a tiempo completo
- Clínicas de atención primaria y urgencias ambulatorias que atienden a poblaciones de pacientes multilingües
- Proveedores de telemedicina que usan Zoom, Teams, doxy.me o cualquier plataforma de vídeo basada en navegador
- Clínicas rurales donde la OPI telefónica añade entre 10 y 15 minutos de espera y altera el flujo de las citas
- Profesionales autónomos que necesitan acceso lingüístico pero no pueden justificar los costes de licencias empresariales
MirrorCaption no sustituye a los intérpretes humanos certificados en:
- Conversaciones de consentimiento informado para cirugía o procedimientos invasivos — en la mayoría de jurisdicciones requieren un intérprete cualificado
- Entrevistas de crisis de salud mental o evaluaciones psiquiátricas donde el matiz emocional es clínicamente crítico
- Situaciones pediátricas en las que se pide al menor que interprete — este es un problema ético que MirrorCaption resuelve, pero los casos pediátricos complejos siguen requiriendo apoyo profesional
- Procedimientos legales, declaraciones o situaciones que requieran un registro de interpretación certificado y documentado
Si no tienes claro si un encuentro clínico entra en la categoría de "requiere intérprete humano", opta por un servicio profesional. MirrorCaption está diseñado para las citas rutinarias en las que una espera de 8 minutos de OPI genera fricción sin aportar más seguridad. Compáralo con cómo MirrorCaption se diferencia de las herramientas generales para reuniones que no abordan en absoluto el contexto clínico.
Preguntas frecuentes
¿Es un intérprete médico con IA en tiempo real lo bastante preciso para uso clínico?
Para citas ambulatorias rutinarias — describir síntomas, confirmar pautas de medicación, hablar del seguimiento, explicar un diagnóstico común — sí, con el juicio clínico adecuado. La precisión de MirrorCaption es comparable a la de otras herramientas de traducción con IA que los profesionales ya usan informalmente, con la ventaja de que ambas partes ven el mismo texto en tiempo real. Para decisiones de alto riesgo que impliquen jerga especializada compleja (explicación de riesgos quirúrgicos, evaluación psiquiátrica detallada, cálculos complejos de dosis), un intérprete médico humano certificado sigue siendo el estándar adecuado. Usa tu criterio clínico caso por caso, como harías con cualquier otra herramienta.
¿Funciona durante una llamada de telemedicina por Zoom o Teams?
Sí. MirrorCaption captura el audio de la pestaña del navegador usando la API integrada de audio de pantalla del navegador (getDisplayMedia), por lo que funciona con cualquier videollamada basada en navegador — Zoom, Teams, Google Meet, doxy.me y otras. Ningún bot se une a la llamada. Ningún participante recibe una notificación de que se está ejecutando software de traducción. El paciente solo te ve y te oye a ti. MirrorCaption se ejecuta en una ventana del navegador independiente en tu dispositivo. Puedes consultar la visión general completa de herramientas de traducción para reuniones para una comparación más amplia.
¿El paciente tiene que instalar algo?
No. En modo presencial, abres la app en tu dispositivo y se la entregas al paciente. Ve la pantalla — no necesita cuenta, app ni descarga por su parte. Para telemedicina, MirrorCaption se ejecuta solo de tu lado; el paciente usa su interfaz habitual de videollamada sin cambios.
¿MirrorCaption cumple con HIPAA?
MirrorCaption no almacena audio en servidores y mantiene las transcripciones solo en el almacenamiento local de tu navegador. Actualmente no ofrece un Business Associate Agreement (BAA). En entornos clínicos estrictamente regulados con programas formales de cumplimiento HIPAA, coméntalo con tu responsable de cumplimiento. Para la mayoría de los flujos de trabajo de clínicas ambulatorias, la arquitectura de almacenamiento local es significativamente más privada que las herramientas que muchas consultas ya usan sin revisión de cumplimiento — incluido Google Translate, que enruta el texto a través de los servidores de Google bajo su política de privacidad de consumo.
¿Qué idiomas están disponibles para las citas con pacientes?
Más de 60 idiomas, incluidos español, chino mandarín, cantonés, vietnamita, tagalo, panyabí, hindi, urdu, árabe, somalí, criollo haitiano, ruso, portugués, coreano, polaco, rumano, francés, alemán, italiano y neerlandés. La lista completa está disponible en la configuración de la app. Si atiendes a una comunidad lingüística que no aparece en esta lista, contacta con soporte — la cobertura de idiomas sigue ampliándose activamente.
Empieza antes de tu próxima cita
1 hora gratis (una sola vez). Sin tarjeta de crédito. Sin instalación. Abre la pestaña antes de que entre el paciente.
Empieza gratisLas barreras lingüísticas en entornos clínicos causan daños evitables. Los servicios de interpretación profesional son el estándar de referencia — y en encuentros complejos y de alto riesgo, nada sustituye a un intérprete humano cualificado. Para la cita rutinaria en la que una espera de 12 minutos de OPI genera fricción sin aportar más seguridad, una app de interpretación médica basada en navegador es el punto intermedio práctico. Sin llamadas telefónicas. Sin contratos empresariales. Sin aprobación de IT. Abre la pestaña y lee lo que dice tu paciente — en tiempo real.