Can I use Speechmatics without coding?

No. Speechmatics is an API-only platform that requires API credentials and code to call its WebSocket or REST endpoints. There is no standalone desktop app or ready-made meeting UI included.

Is there a free trial of MirrorCaption?

Yes. Every new MirrorCaption account includes 1 hour of hosted transcription credit — one-time, no monthly reset, no credit card required. Upgrade to Annual (€54.99/year) or Premium (€99 one-time) for more hours.

Does MirrorCaption work with Zoom, Teams, and Google Meet?

Yes. MirrorCaption Meet mode captures audio from a browser tab in desktop Chrome or Microsoft Edge, so it works alongside browser-based Zoom, Teams, Google Meet, and Webex without joining the call as a bot.

What languages does MirrorCaption support?

MirrorCaption supports 50+ selectable languages including Mandarin, Japanese, Korean, Arabic, Hebrew, Hindi, Russian, Spanish, French, German, Portuguese, and more.

Does MirrorCaption store my meeting audio?

No. Audio is streamed through your browser for real-time transcription and then discarded. Transcripts are saved locally in your browser. Meeting audio is never stored on MirrorCaption servers.

MirrorCaption vs Speechmatics: qual escolher?

MirrorCaption é a alternativa ao Speechmatics criada para transcrição de fala em tempo real sem código — Speechmatics Pro começa em $0.24 por hora para acesso bruto à API, enquanto MirrorCaption é um app de navegador pronto, com legendas bilíngues em menos de um segundo, exibição de tradução lado a lado e um plano Premium único de €99. Esta página é para quem está na reunião, não para o desenvolvedor que está construindo a ferramenta da reunião.

Principais pontos

Speechmatics é uma API para desenvolvedores — ela retorna transcrições em JSON, sem interface de reunião nem exibição bilíngue incluídas
MirrorCaption é um app de navegador que qualquer pessoa pode abrir; as legendas em menos de um segundo aparecem sem necessidade de código
Speechmatics Pro em tempo real começa em $0.24/h; MirrorCaption Premium custa €99 uma única vez por 200h de crédito de transcrição hospedada
MirrorCaption mostra original e tradução lado a lado; toque em qualquer palavra traduzida para ver a palavra de origem de onde ela veio
O modo Meet captura o áudio da aba do navegador no Chrome ou Edge para desktop — sem bot na reunião, sem necessidade de instalação administrativa para os demais participantes

O que o Speechmatics realmente é

Speechmatics é uma plataforma empresarial de IA de fala — especificamente, uma API para desenvolvedores. Você se autentica com uma chave de API, conecta-se a um endpoint WebSocket, transmite áudio e recebe transcrições e traduções como dados estruturados. Não há app para download, widget de navegador nem integração com reuniões incluída no produto. É uma infraestrutura sobre a qual você constrói.

Esse design é intencional. O Speechmatics atende desenvolvedores que criam produtos com voz: plataformas de inteligência para call center, sistemas de legendagem para transmissões ao vivo, ferramentas de documentação clínica e pipelines de agentes de voz. Para esses casos de uso, uma API flexível com 56+ idiomas suportados, suporte a tradução via API e fortes alegações de precisão é o tipo certo de ferramenta.

Vale a pena levar a sério os benchmarks publicados. Os avaliadores do G2 dão ao Speechmatics 4,8 de 5, elogiando consistentemente a precisão em fala com sotaque e multilíngue, o suporte ágil e o desempenho do modelo. As certificações ISO 27001, GDPR, HIPAA e SOC 2 Type II são credenciais reais de conformidade para setores regulados.

Toda essa capacidade é entregue como um endpoint de API. Se você precisa que a transcrição funcione na sua próxima reunião — esta tarde — a API sozinha não vai resolver.

O que você perde quando não há frontend

Sem exibição de legendas durante a chamada

Quando o Speechmatics processa seu áudio, ele entrega o texto da transcrição ao endpoint que você configurou. Ele não abre uma janela no seu navegador. Ele não sobrepõe legendas à sua chamada no Zoom ou no Teams. Ele não mostra uma visualização bilíngue lado a lado.

Exibir legendas junto com uma reunião exige criar uma extensão de navegador, um app Electron ou uma página web personalizada que chame a API e renderize a saída em tempo real. Isso é um projeto de engenharia — e nada trivial quando você leva em conta tratamento de reconexão, compensação de latência e identificação de múltiplos falantes.

A tradução chega como texto bruto

O Speechmatics retorna o texto traduzido junto com a transcrição de origem no mesmo payload da resposta da API. Tecnicamente, isso é elegante. Mas layout lado a lado, vinculação palavra a palavra com a origem e a capacidade de tocar em uma palavra traduzida para ver de onde ela veio no original — esses são recursos de interface que não existem na resposta da API. Cada um deles exige uma etapa separada de design e desenvolvimento antes de poder ser usado em uma reunião.

O custo por minuto se acumula em pequena escala

Em $0.24 por hora para Pro em tempo real, 200 horas de uso da API custam aproximadamente $48. Esse valor parece administrável até você considerar que ele compra computação bruta e dados de transcrição entregues a um endpoint — sem interface, sem resumos e sem construtor de vocabulário incluídos. Um profissional que participa de três a quatro chamadas multilíngues por semana acumula cerca de 12 horas por mês, o que dá aproximadamente $3/mês apenas na API do Speechmatics — mas, somado ao custo contínuo de engenharia do frontend, o investimento total fica bem diferente.

Cenário ilustrativo

Um intérprete freelancer avalia a API do Speechmatics para chamadas de vídeo com clientes. A precisão em pares alemão-inglês é excelente. Três semanas depois, ele ainda está prototipando uma camada de exibição — uma página personalizada que renderiza legendas ao lado da aba do navegador onde as reuniões acontecem. Enquanto isso, as reuniões continuaram acontecendo. A escolha acabou sendo: continuar construindo ou usar algo já pronto. O Speechmatics não estava errado para a situação dele. Ele foi projetado para uma função diferente na pilha.

Como o MirrorCaption funciona como alternativa ao Speechmatics

MirrorCaption é o produto final que um desenvolvedor acabaria construindo sobre uma API de fala — só que ele já está pronto e é entregue como um app de navegador. Ele lida com tradução em tempo real para equipes remotas multilíngues sem exigir nenhum trabalho de backend da sua parte.

Veja como é uma primeira sessão [fluxo ilustrativo]:

Abra mirrorcaption.com/app no Chrome ou Microsoft Edge para desktop
Selecione o modo "Meet" para capturar o áudio da aba da reunião, ou "Talk" para usar seu microfone
Escolha um idioma de origem e um idioma de destino entre 50+ opções selecionáveis
Inicie sua chamada no Zoom, Teams, Google Meet ou Webex em uma aba separada do navegador
As legendas aparecem palavra por palavra em até um segundo após a fala — original à esquerda, tradução à direita
Toque em qualquer palavra traduzida para revelar a palavra exata de origem de onde ela veio

À medida que a reunião avança, um resumo por IA é atualizado automaticamente na barra lateral — útil se você entrou atrasado ou precisa se atualizar entre os trechos. Palavras que você quer lembrar podem ser salvas em um construtor de vocabulário para revisão posterior.

O áudio da reunião passa pelo seu navegador para processamento em tempo real e depois é descartado. As transcrições são salvas localmente no seu navegador. O MirrorCaption nunca entra na chamada como um bot, então os outros participantes não o veem na lista de participantes.

Veja você mesmo: Toda conta nova inclui 1 hora grátis de transcrição hospedada — sem cartão de crédito, sem renovação mensal. Abra o MirrorCaption grátis →

Comparação de recursos — Speechmatics vs MirrorCaption

Recurso	MirrorCaption	Speechmatics
Para quem é	Qualquer pessoa com um navegador	Desenvolvedores criando produtos
Configuração	Abra uma aba do navegador	Chave de API + código + frontend personalizado
Exibição de legendas durante a chamada	✓ Em menos de um segundo, no navegador	Construa você mesmo
Tradução lado a lado	✓ Visualização original + tradução	Texto bruto na resposta da API
Toque para ver a palavra de origem	✓	Não incluído
Resumos de reunião por IA	✓ Atualização automática	Não incluído
Idiomas	50+ selecionáveis	56+ idiomas de STT; tradução via API
Detecção de falantes	✓	✓ via API
Construtor de vocabulário	✓	Não incluído
Sem bot na reunião	✓ Captura da aba do navegador	Depende da sua arquitetura
Modo presencial	✓ Modo Talk no Chrome para celular	Não incluído
Plano gratuito	1h de crédito hospedado, sem cartão de crédito	2.400 min/mês (exige programação)
Preço	€99 Premium único (200h de crédito)	A partir de $0.24/h em tempo real
Conformidade	Áudio não armazenado no servidor	ISO 27001, GDPR, HIPAA, SOC 2 Type II

Comparação de preços

Speechmatics: cobrança por uso da API

O plano Pro do Speechmatics começa em $0.24 por hora para transcrição em tempo real. Um plano gratuito oferece 2.400 minutos (40 horas) por mês, mas usá-lo exige credenciais de API e código desde o primeiro dia. Não há como testar o Speechmatics sem configuração de desenvolvedor.

Há preços com desconto nos planos pagos, e preços corporativos estão disponíveis para volumes maiores. Se você estiver processando milhares de horas de áudio em um produto que está construindo, esses descontos se tornam relevantes. A estrutura de preços foi pensada para essa escala e esse padrão de uso.

MirrorCaption: um preço, produto completo

O preço do MirrorCaption é estruturado em torno de horas de crédito de transcrição hospedada:

Grátis: 1 hora de transcrição hospedada, uma única vez, sem renovação mensal, sem cartão de crédito. Acesso completo aos modos Meet e Talk, 50+ idiomas selecionáveis, detecção de falantes, resumos por IA e construtor de vocabulário.
Anual — €54.99/ano: 100 horas de crédito de transcrição hospedada incluídas. Todos os recursos atuais e um ano de atualizações do produto.
Premium — €99 único: 200 horas de crédito de transcrição hospedada incluídas. Todas as futuras atualizações do produto com acesso prioritário assim que forem lançadas. O Premium também é o plano mais econômico para recargas de Voice Pack — a tarifa por hora é a mais baixa no Premium.
Voice Packs (vendidos separadamente em todos os planos): 5 horas por €2.99 (€0.60/h), 15 horas por €7.99 (€0.53/h). Recarregue quando quiser, sem necessidade de assinatura.

A comparação mais importante: 200 horas de uso da API Speechmatics Pro custam aproximadamente $48 — e esses $48 entregam dados brutos de transcrição para um endpoint, sem interface incluída. 200 horas de MirrorCaption Premium custam €99 uma única vez e incluem a exibição bilíngue completa, resumos por IA, construtor de vocabulário, detecção de falantes e todos os recursos futuros. O Premium não é transcrição hospedada ilimitada para sempre — quando o crédito de 200h acabar, horas adicionais vêm de Voice Packs (vendidos separadamente) com a melhor tarifa por hora disponível em qualquer plano do MirrorCaption.

Quando o Speechmatics é a escolha certa

Speechmatics é uma excelente escolha para casos de uso específicos. Considere-o quando:

Você está construindo um produto que precisa de uma API de fala no backend — software para contact center, legendagem de transmissão, documentação clínica ou um pipeline de agente de voz
Você precisa de certificações de conformidade empresarial — HIPAA, SOC 2 Type II, ISO 27001 — para um setor regulado, e tem uma equipe de engenharia para implementar o frontend
Seu volume de uso excede várias centenas de horas por mês, quando os níveis de preço por volume do Speechmatics se tornam vantajosos
Você precisa de controle de vocabulário personalizado no nível da API — nomes de produtos específicos do domínio, terminologia clínica ou substantivos próprios que os modelos padrão não captam

Para esses cenários, o Speechmatics é uma escolha realmente de alto nível. As alegações de precisão e as credenciais de conformidade são respaldadas por benchmarks publicados e certificações.

Não está construindo um produto?

Se você precisa de legendas bilíngues ao vivo na sua próxima reunião — e não de um projeto de integração de API — o MirrorCaption está pronto agora. Sem código. Sem bot. Uma hora grátis para começar.

Experimente o MirrorCaption grátis

Quando o MirrorCaption é a escolha certa

Escolha o MirrorCaption quando:

Você é a pessoa na reunião, não o desenvolvedor que está construindo a ferramenta da reunião — você precisa de legendas bilíngues na sua próxima chamada, não depois de uma sprint de engenharia
Sua equipe faz chamadas multilíngues no Zoom, Teams, Google Meet ou Webex baseados no navegador, e todos precisam acompanhar no próprio idioma durante a chamada
Sua política de TI restringe bots de entrarem em reuniões — o MirrorCaption usa captura de áudio da aba do navegador, então a maioria das equipes pode se autogerenciar sem solicitar aprovação da TI
Você quer um pagamento único em vez de cobrança contínua por API — o Premium de €99 substitui uma relação de cobrança aberta por minuto
Você é um estudante de idiomas ou um profissional internacional que quer ver original e tradução lado a lado e construir vocabulário a partir de conversas reais

Para uma comparação mais ampla das ferramentas nesse espaço, veja nosso guia de transcrição multilíngue, que cobre o panorama completo de opções para reuniões em outros idiomas.

Cenário ilustrativo

Uma gerente de produto de uma empresa europeia realiza alinhamentos semanais com um fornecedor no Japão. Historicamente, a reunião exigia um intérprete entrando por telefone como terceira parte. Com o MirrorCaption aberto em uma aba do navegador, ela lê o japonês traduzido para o inglês palavra por palavra enquanto o interlocutor fala. Ele lê o inglês dela traduzido para o japonês na própria tela. Nenhum dos dois precisou instalar nada; nenhum dos dois precisou convidar um bot. O tempo do intérprete foi substituído por 40 minutos de conversa direta.

Perguntas frequentes

Posso usar o Speechmatics sem programar?

Não. O Speechmatics é uma plataforma somente de API. Usá-lo exige credenciais de API, código para chamar os endpoints WebSocket ou REST e um frontend personalizado para exibir os resultados. Não há app de desktop independente nem extensão de navegador. Se você precisa de transcrição sem escrever código, ferramentas como MirrorCaption ou Otter.ai são feitas para esse caso de uso.

Existe um teste grátis do MirrorCaption?

Sim. Toda nova conta do MirrorCaption inclui 1 hora de crédito de transcrição hospedada — uma única vez, sem renovação mensal, sem necessidade de cartão de crédito. Isso é suficiente para executar uma reunião completa do início ao fim e avaliar a exibição bilíngue, o resumo por IA e a detecção de falantes. Faça upgrade para Anual (€54.99/ano, 100h) ou Premium (€99 único, 200h) quando precisar de mais.

O MirrorCaption funciona com Zoom, Teams e Google Meet?

Sim. O modo Meet do MirrorCaption captura áudio de uma aba do navegador no Chrome ou Microsoft Edge para desktop, então ele funciona junto com Zoom, Teams, Google Meet e Webex baseados no navegador. O MirrorCaption não entra na chamada como participante — ele roda em uma aba separada e lê o áudio que seu navegador já está processando. Os demais participantes não o veem na reunião.

Quais idiomas o MirrorCaption suporta?

O MirrorCaption suporta 50+ idiomas selecionáveis, incluindo mandarim, japonês, coreano, árabe, hebraico, hindi, russo, espanhol, francês, alemão, português e muito mais. Tanto a origem da transcrição quanto o destino da tradução podem ser selecionados de forma independente, então você pode configurar qualquer par que a reunião exigir.

O MirrorCaption armazena o áudio da minha reunião?

Não. O áudio é transmitido pelo seu navegador para transcrição em tempo real e depois descartado. As transcrições são salvas localmente no seu navegador usando IndexedDB — os dados são seus. O áudio da reunião nunca é armazenado nos servidores do MirrorCaption. Os únicos dados retidos no servidor são os minutos de cota necessários para cobrança. Para mais contexto sobre privacidade em ferramentas de IA, veja nossa visão geral sobre privacidade em reuniões com IA.

Em resumo

Speechmatics e MirrorCaption não competem pela mesma função. O Speechmatics é infraestrutura para equipes que estão incorporando IA de fala em produtos. Seus benchmarks de precisão, certificações de conformidade e flexibilidade de API são vantagens reais para esse caso de uso. Para desenvolvedores que precisam de uma API de fala confiável, precisa e de nível empresarial, ele faz jus à sua reputação.

MirrorCaption é para a pessoa sentada na reunião. Ele entrega a exibição bilíngue, as legendas em menos de um segundo, os resumos por IA e o construtor de vocabulário que, de outra forma, levariam meses para ser construídos sobre uma API bruta. Você abre uma aba do navegador e ele funciona.

Se você está procurando uma alternativa ao Speechmatics porque quer legendas multilíngues em tempo real na sua próxima reunião — e não um projeto de integração de API — a hora grátis é a maneira mais rápida de ver se o MirrorCaption serve para você.

Comece sua primeira reunião

1 hora grátis de transcrição hospedada. Sem cartão de crédito. Sem renovação mensal. Sem instalação para outros participantes.

Abra o MirrorCaption grátis