MirrorCaption é um app de interpretação médica baseado no navegador que transmite transcrição e tradução em tempo real durante consultas clínicas — sem necessidade de ligação telefônica, sem cobrança por minuto, sem bot entrando na sua chamada de telemedicina. Abra uma aba no laptop ou no celular, selecione o idioma do paciente e leia o que ele está dizendo enquanto fala. Ele oferece suporte a mais de 60 idiomas e funciona tanto para atendimentos presenciais quanto para consultas por telemedicina em qualquer plataforma.
São 14h30 de uma terça-feira. A consulta das 15h da Dra. Linh Nguyen é uma nova triagem — Gurpreet Singh, 58 anos, possível dor no peito, falante de punjabi. O intérprete da clínica trabalha segunda, quarta e sexta. Linh tem três opções: esperar de 8 a 12 minutos para um intérprete por telefone atender (supondo que haja um disponível para punjabi nesse horário), pedir ao filho adulto do paciente que descreva sintomas de dor no peito sem ter vocabulário de cardiologia, ou abrir uma aba no navegador.
Ela abre a aba. Seleciona Punjabi → English. Trinta segundos depois, Gurpreet está descrevendo seus sintomas enquanto Linh lê a tradução em tempo real — palavra por palavra, enquanto ele fala.
- Mais de 40 milhões de pessoas nos EUA têm proficiência limitada em inglês; barreiras linguísticas são uma causa documentada de eventos clínicos adversos, não apenas um inconveniente.
- A interpretação profissional por telefone (OPI) custa de $1.50 a $3.00/minuto — uma consulta de 20 minutos com suporte linguístico sai por $30 a $60 por atendimento.
- MirrorCaption transmite transcrição e tradução em tempo real em qualquer navegador — sem instalação, sem ligação telefônica, sem bot entrando na reunião — por €49 pagamento único.
- Funciona para chamadas de telemedicina (Zoom, Teams, doxy.me) e atendimentos presenciais; tanto o clínico quanto o paciente podem ler as legendas simultaneamente.
- MirrorCaption não substitui intérpretes humanos certificados em consentimento cirúrgico, avaliação psiquiátrica ou discussões legais complexas.
Barreiras linguísticas na saúde são um risco clínico
Mais de 40 milhões de pessoas nos Estados Unidos têm proficiência limitada em inglês (LEP) — falam um idioma diferente do inglês em casa e enfrentam dificuldade significativa para se comunicar em inglês em nível de atendimento de saúde. Segundo dados do US Census Bureau, as maiores populações LEP falam espanhol, chinês, vietnamita, tagalo, coreano, árabe, punjabi e crioulo haitiano.
As consequências clínicas são bem documentadas. Pesquisas mostram que pacientes LEP apresentam taxas significativamente maiores de eventos adversos graves ligados à falha de comunicação, incluindo doses erradas de medicamentos, instruções de alta mal compreendidas e diagnósticos atrasados. Não são casos isolados — são padrões que se repetem em pronto-socorros, clínicas de atenção primária e consultórios especializados sempre que o acesso linguístico é inconsistente.
Legalmente, prestadores de saúde financiados pelo governo federal são obrigados a fornecer acesso linguístico sob o Título VI da Lei dos Direitos Civis. O HHS Office for Civil Rights fiscaliza essa exigência. Os National CLAS Standards (Serviços Cultural e Linguisticamente Apropriados) vão além: o Padrão 5 exige explicitamente oferecer assistência linguística a todo paciente que precise, sem custo, em todos os pontos de contato.
A maioria das clínicas entende essa obrigação. A lacuna não é de conscientização — é de logística. Linhas de intérprete por telefone envolvem tempo de espera. Tablets de interpretação remota por vídeo (VRI) exigem contratos corporativos. E as alternativas informais são ética e medicamente problemáticas de formas difíceis de defender se ocorrer um evento adverso.
Como as clínicas lidam com acesso linguístico hoje — e onde cada abordagem falha
Interpretação por telefone (OPI)
LanguageLine Solutions, CyraCom e serviços semelhantes conectam quem liga a um intérprete ao vivo em mais de 200 idiomas. O modelo funciona quando há um intérprete disponível. Na prática, o tempo de espera para idiomas menos comuns — somali, hmong, crioulo haitiano, punjabi — pode chegar a 8 a 15 minutos nos horários de pico. A cobrança é por minuto: cerca de $1.50 a $3.00 dependendo do idioma, horário do dia e volume contratado.
Faça as contas em voz alta: uma consulta de 20 minutos com 20 minutos de interpretação ativa custa de $30 a $60 cada vez. Uma clínica que atende três pacientes LEP por semana paga de $90 a $180/semana — $4,680 a $9,360 por ano. Para uma prática com cinco clínicos e volume semelhante, isso passa de $30,000 por ano. Centros comunitários de saúde que operam com financiamento por subsídios muitas vezes ficam sem acesso antes mesmo de começar.
OPI também é funcionalmente incompatível com telemedicina. Quando a consulta é uma videochamada no Zoom ou Teams, o clínico não consegue ao mesmo tempo segurar um telefone no ouvido para o intérprete telefônico e conduzir a consulta por vídeo. Os fluxos de trabalho não se integram.
Tablets de interpretação remota por vídeo (VRI)
Hospitais implantam sistemas de VRI — iPads ou tablets dedicados montados em suportes, conectados a serviços de intérprete por vídeo como MARTTI ou InDemand. O modelo oferece conexão visual, o que importa para registro emocional e para línguas de sinais. A limitação: o hardware de VRI fica vinculado à instituição. Um centro comunitário de saúde que atende pacientes rurais por telemedicina não consegue usar um tablet de VRI dentro de uma janela do Zoom. Profissionais autônomos não conseguem acessar faixas de preço corporativas de VRI. A ferramenta resolve bem o problema presencial dentro do hospital, e nada mais.
Google Translate — a ferramenta que a maioria das clínicas já usa
Vale a pena nomear o elefante na sala. Um número relevante de médicos de atenção primária admite usar Google Translate com pacientes. É compreensível: é grátis, instantâneo e disponível em qualquer celular. Também é inadequado para uso clínico, de várias formas específicas.
Google Translate processa trechos de texto digitado, não fala em streaming. Não tem diarização de falantes (nenhuma forma de separar a voz do clínico da voz do paciente), não tem treinamento em contexto médico para precisão terminológica e não oferece exportação — a troca desaparece quando a janela fecha. Para documentação, não deixa registro. A ferramenta foi criada para traduzir o cardápio de um restaurante em uma cidade estrangeira. Não foi criada para uma conversa sobre diagnóstico diferencial.
Também não há um caminho de conformidade com HIPAA. Os termos do Google não incluem um Business Associate Agreement para o produto Translate de consumo. Clínicos que o usam fazem isso fora de qualquer estrutura de conformidade.
Equipe e familiares como intérpretes
Usar funcionários sem treinamento ou familiares como intérpretes é a abordagem informal mais comum — e a que tem a maior taxa de erro documentada. Intérpretes familiares omitem e modificam informações clínicas, muitas vezes sem intenção, devido a vocabulário limitado e envolvimento emocional. Um pai pedindo ao filho que interprete um diagnóstico de câncer, ou um cônjuge suavizando um prognóstico que não quer transmitir, são padrões que a equipe clínica reconhece imediatamente. Funcionários sem treinamento enfrentam lacunas de vocabulário semelhantes e não são treinados em ética de interpretação (confidencialidade, precisão, não interferência).
Existe uma quarta opção. MirrorCaption roda inteiramente no seu navegador — abra a aba antes de o paciente entrar. Equipes remotas em diferentes idiomas usam pelo mesmo motivo que os clínicos: a transcrição aparece enquanto a pessoa ainda está falando.
Teste grátis →Como é, na prática, um intérprete médico baseado no navegador
MirrorCaption funciona como um Progressive Web App — sem download, sem extensão de navegador, sem necessidade de aprovação de TI. Abra no Chrome, Edge ou Safari em um laptop, tablet ou celular. Este é o fluxo de trabalho clínico:
- Abra o app em mirrorcaption.com/app. Faça login ou continue no plano grátis (1 hora grátis, uma vez, sem cartão de crédito).
- Selecione a fonte de áudio. Para consultas presenciais, escolha apenas microfone. Para chamadas de telemedicina, escolha áudio do sistema + microfone para capturar os dois lados da videochamada.
- Defina os idiomas. Selecione o idioma falado pelo paciente e o idioma em que você vai ler. A transcrição exibe as duas colunas lado a lado.
- Inicie a sessão. As palavras aparecem na tela em menos de 500 ms após serem faladas. Palavras parciais são corrigidas automaticamente conforme o contexto se acumula.
Modo presencial: Entregue o celular ou tablet ao paciente. Ele fala no microfone; você lê a tradução na sua tela. Você fala; ele lê suas palavras traduzidas para o idioma dele. Um dispositivo, uma aba do navegador, sem hardware extra.
Modo telemedicina: MirrorCaption captura o áudio da chamada da aba do navegador usando a captura de áudio de tela integrada do navegador. Nenhum bot entra na chamada. Nenhum participante recebe notificação. O paciente vê e ouve apenas você; MirrorCaption roda em uma segunda janela do seu lado.
Triagem em clínica comunitária
Um paciente falante de somali chega para uma consulta no mesmo dia. Intérprete da equipe indisponível. Abra o app no laptop da recepção, selecione Somali → English, entregue a tela ao paciente para ler. A anamnese começa em menos de um minuto.
Consulta por telemedicina
Fazendo um acompanhamento via Zoom com um paciente falante de cantonês em uma região rural. MirrorCaption captura o áudio da chamada em uma segunda aba — sem ligação para intérprete, sem bot entrando no vídeo. Os dois lados se comunicam em tempo real.
Passagem presencial
Um paciente de pronto atendimento fala crioulo haitiano. O clínico abre MirrorCaption no celular, muda para o modo face a face e o coloca na mesa de exame entre os dois. Ambas as partes leem as palavras uma da outra enquanto são faladas.
Clínica rural, sem intérprete da equipe
Um profissional autônomo em uma clínica rural atende pacientes falantes de vietnamita três dias por semana. O intérprete certificado mais próximo fica a 40 milhas de distância. MirrorCaption roda no laptop que a clínica já tem — sem hardware, sem contrato, sem cobrança por minuto.
Idiomas mais importantes em contextos clínicos
MirrorCaption oferece suporte a mais de 60 idiomas, incluindo todos os idiomas clínicos de maior necessidade identificados em dados de equidade em saúde dos EUA e da UE:
- Espanhol — o idioma LEP mais comum nos EUA com ampla margem
- Chinês mandarim e cantonês — dialetos distintos que exigem modelos STT separados
- Vietnamita, tagalo, coreano, indonésio
- Árabe, somali, crioulo haitiano — alta necessidade, pouco atendidos pela maioria dos fornecedores de OPI
- Punjabi, hindi, urdu, bengali
- Russo, português, polonês, romeno
- Francês, alemão, italiano, holandês
A tradução é bidirecional — o clínico fala ou digita em inglês e o paciente lê no idioma dele, e vice-versa, na mesma sessão. A detecção de falantes rotula automaticamente vozes distintas na transcrição, para que o registro mostre quem disse o quê. Isso importa para documentação clínica e para revisar a conversa após a consulta.
Uma observação honesta sobre precisão: MirrorCaption tem bom desempenho em diálogo médico conversacional — descrição de sintomas, instruções de medicação, agendamento de acompanhamento. Ele não é treinado em jargão clínico especializado no nível de um intérprete médico certificado. Para consultas ambulatoriais gerais, isso normalmente não é uma limitação. Para consultas de neurocirurgia ou avaliações psiquiátricas, um intérprete humano continua sendo o padrão adequado.
HIPAA e privacidade — uma resposta direta
A primeira pergunta que qualquer prestador de saúde faz é: "Isso está em conformidade com a HIPAA?" A resposta honesta exige duas partes.
O que MirrorCaption faz com o áudio: nada é armazenado em servidores. O áudio é transmitido do seu navegador para nossa API de streaming para transcrição em tempo real e depois descartado. Os servidores do MirrorCaption nunca recebem nem retêm áudio. As transcrições são salvas localmente no armazenamento IndexedDB do seu navegador — ficam no seu dispositivo, não em um banco de dados na nuvem. Quando você fecha a sessão, o áudio desaparece.
A questão estrutural de conformidade: MirrorCaption é uma ferramenta de software, não uma entidade de saúde. No momento, não oferece um Business Associate Agreement (BAA). Para práticas que operam em ambientes estritamente regulados com programas formais de conformidade com HIPAA, isso importa e deve ser revisado com seu responsável por compliance antes de implantar qualquer ferramenta sem BAA em um fluxo de trabalho voltado ao paciente.
Para comparação prática: Google Translate — a ferramenta que um número significativo de clínicas usa informalmente hoje — também não oferece BAA, encaminha texto pelos servidores do Google e registra dados de consulta sob a política de privacidade padrão do Google. O modelo de armazenamento local do MirrorCaption protege a privacidade de forma significativamente melhor do que as alternativas informais em que a maioria das clínicas já confia, mesmo sem um BAA formal.
O custo real do acesso linguístico — e uma opção mais acessível
As contas que os fornecedores de interpretação por telefone não colocam em seus sites:
- Preço de OPI: ~$2.00/minuto (estimativa intermediária para LanguageLine ou CyraCom)
- Uma consulta, 20 minutos de suporte linguístico: $40
- Três consultas por semana: $120/semana
- Anualizado: $6,240/ano
- Uma prática com cinco clínicos no mesmo volume: $31,200/ano
Serviços de tablet VRI custam de $0.80 a $2.00/minuto, além de custos de equipamento e licenciamento corporativo. Centros comunitários de saúde e profissionais autônomos não são o cliente-alvo do VRI corporativo — ficam sem acesso antes da primeira conversa.
O plano Lifetime do MirrorCaption custa €49 pagamento único. Isso inclui 200 horas de transcrição e tradução gerenciadas. Em três consultas de 20 minutos com suporte linguístico por semana, isso dá 52 horas por ano — o plano Lifetime cobre quase quatro anos nesse volume antes de ser necessário recarregar. Voice Packs adicionam 5 horas por €2.99 ou 15 horas por €7.99 quando você precisar de mais.
-
Mais de 60 idiomas com transcrição e tradução em streaming em tempo real — os dois lados da conversa, de forma bidirecional.
-
Funciona presencialmente e em telemedicina — entrega do celular para consultas na clínica, captura de áudio da aba para chamadas no Zoom/Teams/doxy.me.
-
Nenhum bot entra na chamada — sem notificação visível ao paciente, sem participante terceirizado na reunião por vídeo.
-
Detecção de falantes — rotula automaticamente separadamente as vozes do clínico e do paciente na transcrição.
-
Armazenamento local da transcrição — nenhum áudio armazenado em servidores; a transcrição fica no armazenamento local do seu navegador.
-
€49 pagamento único, 200 horas incluídas — sem cobrança por minuto, sem contrato corporativo, sem janela de disponibilidade de intérprete para esperar.
Para quem isso é — e para quem não é
MirrorCaption é mais indicado para:
- Centros comunitários de saúde sem equipe de intérpretes em tempo integral
- Clínicas de atenção primária e pronto atendimento que atendem populações multilíngues
- Prestadores de telemedicina que usam Zoom, Teams, doxy.me ou qualquer plataforma de vídeo baseada em navegador
- Clínicas rurais onde o OPI por telefone adiciona 10 a 15 minutos de espera e atrapalha o fluxo das consultas
- Profissionais autônomos que precisam de acesso linguístico, mas não conseguem justificar custos de licenciamento corporativo
MirrorCaption não substitui intérpretes humanos certificados em:
- Conversas de consentimento informado para cirurgia ou procedimentos invasivos — isso exige um intérprete qualificado na maioria das jurisdições
- Entrevistas de crise em saúde mental ou avaliação psiquiátrica, em que a nuance emocional é clinicamente crítica
- Situações pediátricas em que a criança está sendo solicitada a interpretar — este é um problema ético que MirrorCaption resolve, mas casos pediátricos complexos ainda justificam suporte profissional
- Processos legais, depoimentos ou situações que exijam um registro de interpretação certificado e documentado
Se você não tiver certeza se um atendimento clínico entra na categoria "intérprete humano obrigatório", opte pelo serviço profissional. MirrorCaption foi projetado para consultas de rotina em que uma espera de 8 minutos por OPI cria atrito sem aumentar a segurança. Compare com como MirrorCaption difere de ferramentas gerais para reuniões que não abordam o contexto clínico de forma alguma.
Perguntas frequentes
Um intérprete médico de IA em tempo real é preciso o suficiente para uso clínico?
Para consultas ambulatoriais de rotina — descrever sintomas, confirmar horários de medicação, discutir cuidados de acompanhamento, explicar um diagnóstico comum — sim, com julgamento clínico apropriado. A precisão do MirrorCaption é comparável à de outras ferramentas de tradução por IA que os clínicos já usam informalmente, com a vantagem de que ambas as partes veem o mesmo texto em tempo real. Para decisões de alto risco envolvendo jargão especializado complexo (explicação de risco cirúrgico, avaliação psiquiátrica detalhada, cálculos complexos de dosagem), um intérprete médico humano certificado continua sendo o padrão adequado. Use seu julgamento clínico caso a caso, como faria com qualquer outra ferramenta.
Funciona durante uma chamada de telemedicina no Zoom ou Teams?
Sim. MirrorCaption captura o áudio da aba do navegador usando a API integrada de áudio de tela do navegador (getDisplayMedia), então funciona com qualquer videochamada baseada em navegador — Zoom, Teams, Google Meet, doxy.me e outras. Nenhum bot entra na chamada. Nenhum participante recebe notificação de que um software de tradução está em execução. O paciente vê e ouve apenas você. MirrorCaption roda em uma janela separada do navegador no seu dispositivo. Você pode conferir a visão geral completa das ferramentas de tradução para reuniões para uma comparação mais ampla.
O paciente precisa instalar alguma coisa?
Não. No modo presencial, você abre o app no seu dispositivo e o entrega ao paciente. Ele vê a tela — sem conta, sem app, sem download necessário da parte dele. Para telemedicina, MirrorCaption roda apenas do seu lado; o paciente usa a interface normal da videochamada sem nenhuma alteração.
MirrorCaption está em conformidade com a HIPAA?
MirrorCaption não armazena áudio em servidores e mantém as transcrições apenas no armazenamento local do seu navegador. No momento, não oferece um Business Associate Agreement (BAA). Para ambientes clínicos estritamente regulados com programas formais de conformidade com HIPAA, converse sobre isso com seu responsável por compliance. Para a maioria dos fluxos de trabalho de clínicas ambulatoriais, a arquitetura de armazenamento local é significativamente mais privada do que as ferramentas que a maioria das clínicas já usa sem revisão de conformidade — incluindo Google Translate, que encaminha texto pelos servidores do Google sob sua política de privacidade para consumidores.
Quais idiomas estão disponíveis para consultas com pacientes?
Mais de 60 idiomas, incluindo espanhol, chinês mandarim, cantonês, vietnamita, tagalo, punjabi, hindi, urdu, árabe, somali, crioulo haitiano, russo, português, coreano, polonês, romeno, francês, alemão, italiano e holandês. A lista completa está disponível nas configurações do app. Se você atende uma comunidade linguística que não está nesta lista, entre em contato com o suporte — a cobertura de idiomas está se expandindo ativamente.
Comece antes da sua próxima consulta
1 hora grátis (uma vez). Sem cartão de crédito. Sem instalação. Abra a aba antes de o paciente entrar.
Comece grátisBarreiras linguísticas em contextos clínicos causam danos evitáveis. Serviços profissionais de interpretação são o padrão ouro — e, em atendimentos complexos e de alto risco, nada substitui um intérprete humano qualificado. Para a consulta de rotina em que uma espera de 12 minutos por OPI cria atrito sem aumentar a segurança, um app de interpretação médica baseado no navegador é o meio-termo prático. Sem ligações telefônicas. Sem contratos corporativos. Sem aprovação de TI. Abra a aba e leia o que seu paciente está dizendo — em tempo real.