How accurate is AI meeting transcription in 2026?

Modern AI transcription achieves 3–8% word error rate on clean English audio. In real meeting conditions, noise, multiple speakers, audio compression, WER rises to 8–17% depending on the tool. Non-English languages see higher error rates on most consumer meeting tools.

What is word error rate (WER)?

Word error rate counts substitutions (wrong word), insertions (extra word), and deletions (missed word), divided by the total reference word count. A 5% WER means roughly five errors per 100 words. Lower is better.

Which AI transcription tool is most accurate in 2026?

For clean English audio, Whisper Large v3 and Deepgram Nova-2 achieve roughly 3–6% WER. For real-time multilingual meetings, MirrorCaption offers the best combination of streaming accuracy and language coverage at 60+ languages.

Does AI transcription accuracy drop for non-English languages?

Yes, significantly. Consumer tools like Otter.ai, Fireflies, and Zoom AI Companion are English-primary; non-English accuracy drops sharply. Whisper and MirrorCaption perform more consistently across languages due to broader multilingual training.

Is Whisper more accurate than Otter.ai?

On clean English audio, Whisper Large v3 achieves noticeably lower WER than Otter.ai. In real meeting conditions the gap narrows but persists. Whisper requires developer deployment; Otter is a complete consumer product.

Acuratețea transcrierii AI în 2026

Pentru majoritatea criteriilor de evaluare, niciun singur instrument AI de transcriere nu câștigă detașat în 2026. Pentru audio în engleză curat, Whisper Large v3 și Deepgram Nova-2 conduc la rata de eroare pe cuvânt, în jur de 3–6%. Pentru întâlniri multilingve care au nevoie de rezultate în timp real, instrumentele STT multilingve native pentru streaming, precum MirrorCaption, performează cel mai constant în limbile non-engleze. Care instrument este cel mai precis pentru tine depinde de momentul în care ai nevoie de transcript și de limbile folosite de vorbitorii tăi.

În septembrie anul trecut, Nadia a întâmpinat o problemă pe care majoritatea benchmarkurilor de acuratețe nu o surprind. Ea coordonează un program de cercetare calitativă la o universitate din Berlin și avea nevoie de un instrument de transcriere pentru interviuri de 45 de minute cu oameni de știință internaționali, ingineri al căror engleză este fluentă tehnic, dar puternic accentuată. Whisper Large v3 a produs cea mai curată ieșire pe clipul ei de test: un vorbitor nativ de engleză, cameră liniștită, text pregătit. A rulat același model pe un interviu de 40 de minute cu un inginer aerospațial japonez. Nouăsprezece erori la substantive proprii. Două propoziții complete eliminate complet. Modelul cu al doilea cel mai bun scor WER în laborator a fost cel în care a avut încredere pentru cercetarea reală.

Această comparație evaluează șapte instrumente în patru condiții audio: engleză curată de studio, un apel Zoom simulat, code-switching bilingv engleză-mandarină și un vorbitor de engleză non-nativă. Iată ce arată datele, unde cedează fiecare instrument și care se potrivește fiecărui caz de utilizare.

Idei principale

Pentru audio în engleză curat, Whisper Large v3 și Deepgram Nova-2 ating ~3–6% WER, dar niciunul nu este un instrument de întâlniri „gata de folosit” pentru utilizatorii finali.
Toate instrumentele înregistrează o creștere a WER de 2–3× în condiții reale de întâlnire față de audio curat de studio.
Otter.ai, Fireflies și Zoom AI Companion sunt orientate în principal spre engleză; acuratețea în alte limbi scade puternic, mai ales pentru limbile asiatice și din Orientul Mijlociu.
MirrorCaption (streaming STT + GPT) oferă streaming în timp real în peste 60 de limbi, cu latență sub 500 ms, singurul instrument pentru utilizatori finali care combină acuratețea în timp real cu acoperire lingvistică largă.
Niciun instrument nu este „cel mai precis” în toate condițiile. Metrica potrivită este acuratețea atunci și acolo unde ai nevoie efectiv de ea.

Ce înseamnă de fapt „acuratețea transcrierii”

Rata de eroare pe cuvânt (WER) explicată

Rata de eroare pe cuvânt este metrica standard pentru acuratețea speech-to-text. Formula: numără substituțiile (cuvânt greșit), inserțiile (cuvânt în plus) și omisiunile (cuvânt ratat), apoi împarte la numărul total de cuvinte din referință. Un WER de 5% înseamnă aproximativ cinci erori la 100 de cuvinte. Într-o întâlnire de 1.200 de cuvinte, asta înseamnă 60 de erori, unele inofensive („the” vs. „a”), altele cu consecințe („vom aproba asta” vs. „vom analiza asta”).

Scorurile WER publicate provin de obicei din seturi de date controlate, precum LibriSpeech (vorbire citită, curată) sau Common Voice. Întâlnirile reale sunt diferite: audio comprimat de codecurile Zoom sau Teams, mai mulți vorbitori care se suprapun, accente non-native, zgomot de fundal și jargon tehnic care nu a fost în datele de antrenare ale modelului. WER în condiții de întâlnire este, de regulă, de 2–3 ori mai mare decât WER-ul de laborator pentru fiecare instrument din această listă.

Întrebarea care contează mai mult decât WER

Înainte de a compara scorurile de acuratețe, răspunde la asta: ai nevoie de transcript în timpul întâlnirii sau după ea? Un instrument de streaming cu WER de 7% care livrează rezultatele în timp ce vorbitorul încă vorbește este adesea mai util pentru o decizie în timpul întâlnirii decât un instrument batch cu WER de 4% care ajunge zece minute mai târziu. Acuratețea ține la fel de mult de momentul livrării ca de rata de eroare. Articolul nostru complementar despre acuratețea traducerii în timp real tratează în profunzime acest compromis.

Cum am evaluat aceste instrumente

Am rulat fiecare instrument prin patru scenarii audio:

Studio curat, un singur vorbitor nativ de engleză, mediu acustic controlat
Condiții de întâlnire, apel Zoom simulat, doi vorbitori nativi de engleză, zgomot de fundal ușor
Schimb bilingv, code-switching engleză și mandarină, câte un vorbitor nativ pentru fiecare limbă
Engleză non-nativă, vorbitor japonez cu nivel intermediar spre avansat de engleză

Instrumente evaluate: Otter.ai, OpenAI Whisper Large v3, Fireflies.ai, Zoom AI Companion, Deepgram Nova-2, AssemblyAI Universal-2 și MirrorCaption. Intervalele WER din acest articol provin din benchmarkuri academice publicate, documentație de la furnizori și testele noastre. Prezentăm intervale, nu estimări punctuale, deoarece acuratețea variază semnificativ în funcție de condițiile audio; tratează-le ca orientative, nu definitive, și testează cu propriul conținut înainte de a te angaja la un instrument.

Vezi cum gestionează MirrorCaption întâlnirile tale

2 ore gratuite pe lună. Fără instalare. Orice browser.

Încearcă gratuit

Comparație a acurateței transcrierii AI: rezultatele din 2026

Tabelul de mai jos rezumă WER-ul aproximativ în condițiile de test, capacitatea în timp real, acoperirea lingvistică și dacă instrumentul este disponibil ca produs pentru utilizatori finali sau doar ca API pentru dezvoltatori.

Instrument	WER EN curat	WER întâlnire	Timp real	Limbi	Produs pentru utilizatori finali
Whisper Large v3	~3–5%	~12–18%	Nu (batch)	99	Nu (necesită dezvoltare)
Deepgram Nova-2	~4–6%	~7–12%	Da (API)	36	Nu (doar API)
AssemblyAI Universal-2	~5–8%	~8–13%	Parțial	17	Nu (doar API)
Otter.ai	~8–12%	~10–16%	Da	EN-primary	Da
MirrorCaption	~5–8%	~7–12%	Da (<500ms)	60+	Da
Fireflies.ai	~9–14%	~11–17%	Nu (post-call)	60+ (post-call)	Da
Zoom AI Companion	~9–13%	~11–16%	Parțial	~8	Da (enterprise)

Intervalele WER sunt aproximative, bazate pe benchmarkuri publicate, inclusiv HuggingFace Open ASR Leaderboard, raportul tehnic Whisper de la OpenAI, documentația furnizorilor și testele noastre. Valorile reale variază în funcție de calitatea audio, caracteristicile vorbitorului și vocabular.

Trei lucruri ies în evidență. Primul: diferența dintre WER-ul curat și cel din întâlniri este mai mare decât sugerează majoritatea afirmațiilor furnizorilor; saltul Whisper de la ~4% la ~15% este dramatic deoarece este un model batch, nu unul conceput pentru zgomotul din întâlniri. Al doilea: instrumentele doar API (Deepgram, AssemblyAI) depășesc constant produsele pentru consumatori la WER brut, dar necesită muncă de inginerie pentru implementare. Al treilea: acoperirea lingvistică largă și capacitatea în timp real coexistă rar; instrumentele care oferă ambele sunt puține.

Analiză instrument cu instrument

1. OpenAI Whisper Large v3

Whisper este reperul de acuratețe pentru audio în engleză curat. OpenAI l-a antrenat pe 680.000 de ore de audio web multilingv, ceea ce îi oferă performanțe solide pe vorbirea accentuată din distribuția sa de antrenare. Pe benchmarkuri de vorbire citită, curată, Whisper Large v3 obține WER sub 5%. Pe corpusul AMI, un set de date cu întâlniri reale cu mai mulți participanți, WER crește în intervalul 12–18%, deoarece Whisper este un model batch: procesează segmente audio complete, nu fluxuri live.

Limitarea fundamentală este că Whisper este un model, nu un produs. Folosirea lui necesită Python, resurse de calcul și timp de dezvoltare. Implementarea în timp real are nevoie de inginerie suplimentară. Dacă ai asta, Whisper este excelent pentru engleză. Dacă nu, vezi mai jos. Pentru o comparație practică directă, citește pagina noastră MirrorCaption vs. Whisper.

2. Deepgram Nova-2

Nova-2 de la Deepgram este cea mai puternică opțiune orientată spre dezvoltatori pentru acuratețe în streaming în timp real. Obține ~4–6% WER pe engleză curată și menține performanțe competitive în condiții de întâlnire (~7–12%), deoarece Deepgram optimizează în mod specific pentru telefonie și audio de conferință. Latența de streaming este sub 300 ms. Cele 36 de limbi suportate sunt suficiente pentru multe echipe, dar insuficiente pentru o acoperire multilingvă largă.

Constrângerea este identică cu cea a Whisper: este un API. Plătești pentru un flux de date în jurul căruia echipa ta de inginerie trebuie să construiască, să redea și să gestioneze. Nu există UI, nici etichete pentru vorbitori din start, nici strat de rezumat AI. Prețul de ~0,0043 USD/min se adună rapid la utilizare intensă.

3. AssemblyAI Universal-2

AssemblyAI oferă diarizare puternică a vorbitorilor, importantă pentru transcrierile de întâlniri, unde a ști cine a spus ce contează la fel de mult ca ce s-a spus. Universal-2 obține ~5–8% WER pe audio curat. Streamingul în timp real este disponibil, dar mai puțin matur decât oferta Deepgram. La 17 limbi suportate, este o limitare importantă pentru echipele internaționale. La fel ca Deepgram, necesită integrare de dezvoltare; nu există produs pentru utilizatori finali.

4. Otter.ai

Cel mai bun pentru echipe doar în engleză

Otter este alegerea implicită pentru consumatori în transcrierea întâlnirilor în engleză. WER-ul pe engleza americană clară este solid, în jur de 8–12% în condiții de întâlnire, competitiv pentru un produs de consum. OtterPilot se alătură automat întâlnirilor, capturează audio și generează notițe și elemente de acțiune cu etichete pentru vorbitori. Integrarea cu calendarul pentru Zoom, Google Meet și Teams este fiabilă.

Lacunele apar rapid în afara limbii engleze. Otter nu oferă traducere în timp real, iar calitatea transcrierii în alte limbi este semnificativ mai slabă decât performanța în engleză. La 16,99 USD/lună per utilizator, costul se acumulează pentru echipe. Vezi comparația noastră completă MirrorCaption vs. Otter.ai pentru o analiză funcție cu funcție.

5. MirrorCaption (streaming STT + GPT)

Cel mai bun pentru multilingv în timp real

MirrorCaption folosește un motor STT nativ pentru streaming, prin WebSocket, care obține constant rezultate bune pe engleză non-nativă și pe limbile asiatice. WER-ul pe audio de întâlnire se situează în intervalul ~7–12%, cu latență de streaming sub 500 ms. Dar WER-ul brut nu surprinde imaginea completă pentru un instrument capabil de traducere.

Fiecare segment de transcriere este trecut prin traducere GPT cu context din ultimele 3–5 segmente. Când un client japonez spune ちょっと難しいです, literal „puțin dificil”, stratul de traducere ia în calcul conversația din jur înainte de a decide dacă este un comentariu logistic sau un refuz comercial politicos. Această acuratețe la nivel de sens este ceea ce majoritatea benchmarkurilor WER nu măsoară.

Pentru utilizatorii finali, MirrorCaption este singurul instrument din această listă care combină acuratețe în streaming în timp real, acoperire în peste 60 de limbi, captură audio fără bot prin tab de browser și o interfață care nu necesită instalare. 49 € pe viață cu 200 de ore incluse; 2 ore gratuite pe lună.

Motor STT: Streaming WebSocket cu latență redusă, <500ms
Traducere: GPT cu fereastră de context de 3–5 segmente
Limbi: 60+ inclusiv mandarină, japoneză, coreeană, arabă, hindi
Confidențialitate: Fără bot, fără stocare audio pe server, persistență locală a transcriptului
Preț: Gratuit (2h/lună) · Anual 29 € · Pe viață 49 €

Testează acuratețea în timp real în propriile întâlniri

Deschide MirrorCaption în browser, fără descărcare, fără configurare necesară.

Deschide MirrorCaption

6. Fireflies.ai

Fireflies se concentrează pe stratul de notițe de întâlnire: botul se alătură apelului, înregistrează totul și generează transcripturi post-întâlnire cu rezumate AI. Integrările CRM cu HubSpot și Salesforce îl fac popular în rândul echipelor de vânzări. WER-ul în condiții de întâlnire este de aproximativ 9–14%, acceptabil pentru generarea de rezumate, unde câteva erori de cuvânt rareori schimbă sensul unui element de acțiune.

Constrângerea este momentul. Fireflies este un instrument post-call. Transcrierea în timp real este disponibilă, dar nu este produsul de bază, iar traducerea este doar post-call. Dacă ai nevoie să înțelegi ce se spune în timpul întâlnirii, nu după, Fireflies nu se potrivește acestei nevoi.

7. Zoom AI Companion

Zoom AI Companion gestionează competent subtitrările live în Zoom, cu un WER de aproximativ 9–13% în condiții de întâlnire, rezonabil pentru o funcție nativă platformei. Pentru cele ~8 limbi suportate, calitatea variază semnificativ în funcție de perechea de limbi. Engleza este puternică; diferența crește pentru limbile asiatice.

Constrângerile dure: blocare în platformă (funcționează doar în Zoom), licențiere enterprise necesară pentru funcțiile de traducere și nicio modalitate de a-l folosi pentru conversații față în față sau întâlniri pe alte platforme. Pentru echipele care trăiesc exclusiv în Zoom și se întâlnesc în principal în engleză, AI Companion este o alegere fără fricțiuni. Pentru orice depășește acest cadru, vei avea nevoie de un instrument separat.

Unde cedează fiecare instrument

Engleză accentuată și non-nativă

Aici scorurile WER din laborator încetează să mai fie utile. Otter, Fireflies și Zoom AI Companion sunt antrenate în principal pe date în engleză nativă. Vorbitorii cu accente din Asia de Est, Asia de Sud sau Orientul Mijlociu văd rate de eroare semnificativ mai mari, în unele cazuri 20–30% WER, atunci când vorbirea lor se abate de la distribuția de antrenare. Whisper gestionează mai bine engleza accentuată datorită corpusului său mai larg de antrenare multilingvă. Motorul STT multilingv nativ pentru streaming al MirrorCaption arată mai puține substituții de foneme pe engleză non-nativă decât instrumentele de întâlniri pentru consumatori.

Conversații bilingve și code-switching

Code-switching-ul, un vorbitor japonez care folosește un termen tehnic în engleză la mijlocul propoziției, sau un vorbitor de mandarină care spune „我们 schedule 一个 meeting”, pune în dificultate majoritatea modelelor STT. Modelele standard se fixează pe o singură limbă per sesiune și tratează cuvintele neașteptate din altă limbă drept erori. Whisper gestionează o parte din code-switching datorită datelor sale de antrenare mixte. MirrorCaption rulează detectarea limbii pe segment, nu se blochează pe o singură limbă la începutul sesiunii, ceea ce gestionează mai elegant schimburile bilingve. Pentru un ghid complet despre instrumentele de transcriere multilingvă, vezi ghidul nostru de transcriere multilingvă.

În februarie, o echipă de vânzări software B2B a descoperit această problemă pe pielea ei. Apelul de joi cu un prospect-cheie din Tokyo părea să fi mers bine. Zoom AI Companion a livrat rezumatul la nouă minute după încheierea apelului. Rezumatul spunea: „Clientul și-a exprimat îngrijorări legate de calendarul evaluării.” Expresia reală, surprinsă doar când liderul de vânzări a revăzut înregistrarea, a fost: „Trebuie să suspendăm complet evaluarea noastră.” Ambele transcripturi erau tehnic corecte la nivel de cuvânt. Rezumatul Zoom a pierdut semnificația comercială. Nimeni nu a observat la timp pentru a pune o întrebare de follow-up.

Timp real vs. post-procesare: compromisul latență-acuratețe

STT-ul de streaming produce transcrieri parțiale care se actualizează pe măsură ce sosește mai mult audio. Un cuvânt poate fi transcris într-un fel, apoi corectat când următoarele cuvinte oferă context. Instrumentele de post-procesare așteaptă un segment audio complet, oferind o acuratețe mai bună deoarece au contextul integral, dar cu o întârziere de la secunde la minute până la apariția rezultatului. Diferența finală de acuratețe dintre streaming și batch este, de obicei, de 1–3 puncte procentuale. Este reală, dar mică în raport cu valoarea de a avea rezultate în timp ce încă poți acționa asupra lor. Articolul nostru despre subtitrări live vs. transcripturi tratează acest compromis în detaliu.

Care instrument este cel mai precis pentru cazul tău de utilizare?

Pentru transcripturi post-întâlnire doar în engleză: Whisper Large v3 (printr-un wrapper sau o implementare self-hosted) sau Otter.ai. Ambele oferă rezultate post-întâlnire bine finisate. Otter este mai ușor pentru utilizatorii non-tehnici; Whisper este mai bun dacă ai resurse de dezvoltare și vrei acuratețe maximă. Citește comparația noastră streaming STT vs. Whisper pentru analiza tehnică.

Pentru întâlniri multilingve în timp real: MirrorCaption (streaming STT + GPT). Streaming în timp real, peste 60 de limbi, fără bot, bazat pe browser. Abordarea în două straturi, STT în streaming plus traducere contextuală, adaugă acuratețe la nivel de sens pe care benchmarkurile WER nu o surprind.

Pentru acuratețe API de nivel dezvoltator: Deepgram Nova-2 pentru sarcini voluminoase, orientate în principal spre engleză; AssemblyAI Universal-2 pentru cazuri de utilizare care necesită diarizare puternică a vorbitorilor. Ambele necesită investiție de inginerie.

Pentru comoditate nativă platformei: Google Meet Live Captions dacă trăiești exclusiv în Google Workspace; Zoom AI Companion dacă fiecare întâlnire are loc în Zoom. Acceptă blocarea în platformă ca preț pentru zero configurare.

Marcus, un inginer software brazilian care învață japoneză, a început să folosească MirrorCaption pentru check-in-urile sale bilunare cu colegii din Tokyo. La fiecare sesiune, salva cinci sau șase expresii în fișa lui de vocabular, nu japoneză de manual, ci limbaj real de întâlnire: forme politicoase pentru dezacord, vocabularul tehnic pe care îl foloseau efectiv colegii, formulările care apăreau înainte de a se lua o decizie. După patru luni avea aproape 200 de expresii din conversații reale. Colegii lui din Tokyo au observat schimbarea înainte să o menționeze el.

Întrebări frecvente

Cât de precisă este transcrierea AI a întâlnirilor în 2026?

Transcrierea AI modernă atinge o rată de eroare pe cuvânt de 3–8% pe audio în engleză curat. În condiții reale de întâlnire, zgomotul de fundal, mai mulți vorbitori și compresia audio fac ca WER-ul să crească de obicei la 8–17%, în funcție de instrument. Acuratețea pentru limbile non-engleze variază semnificativ: instrumentele antrenate în principal pe engleză pot vedea WER-ul dublându-se sau mai mult atunci când vorbitorii folosesc mandarină, japoneză, arabă sau alte limbi non-engleze.

Ce este rata de eroare pe cuvânt (WER)?

Rata de eroare pe cuvânt numără substituțiile (cuvânt greșit), inserțiile (cuvânt în plus) și omisiunile (cuvânt ratat), împărțite la numărul total de cuvinte din referință. Un WER de 5% înseamnă aproximativ cinci erori la 100 de cuvinte. Mai mic este mai bine, dar WER nu face diferența între o eroare inofensivă și una cu consecințe; „aprobați” vs. „dezaprobați” contează ambele ca o singură substituție.

Care instrument AI de transcriere este cel mai precis în 2026?

Pentru audio în engleză curat, Whisper Large v3 și Deepgram Nova-2 ating ~3–6% WER și conduc clasamentul. Pentru întâlniri multilingve în timp real, MirrorCaption oferă cea mai bună combinație de acuratețe în streaming și acoperire lingvistică. Niciun singur instrument nu conduce pe toate dimensiunile; răspunsul depinde de condițiile audio, mixul de limbi și dacă ai nevoie de rezultate în timpul sau după întâlnire.

Scade acuratețea transcrierii AI pentru limbile non-engleze?

Da, semnificativ. Instrumentele pentru consumatori precum Otter.ai, Fireflies și Zoom AI Companion sunt antrenate în principal pe date în engleză; acuratețea în alte limbi scade puternic, mai ales pentru limbile asiatice și din Orientul Mijlociu. Whisper și MirrorCaption performează mai constant între limbi datorită corpusurilor de antrenare multilingve mai largi.

Cum afectează streamingul în timp real acuratețea transcrierii?

STT-ul de streaming produce rezultate parțiale care se autocorectează pe măsură ce se acumulează context. Acuratețea finală pentru instrumentele de streaming este, de obicei, cu 1–3 puncte procentuale WER mai slabă decât la instrumentele batch pe același audio, un decalaj real, dar mic, având în vedere că outputul în streaming ajunge în timp ce întâlnirea este încă în desfășurare. Vezi articolul nostru despre subtitrări live vs. transcripturi pentru o analiză mai profundă.

Este Whisper mai precis decât Otter.ai?

Pe audio în engleză curat, Whisper Large v3 obține un WER vizibil mai mic decât Otter.ai. În condiții reale de întâlnire, diferența se reduce, dar persistă. Whisper este un model pe care îl implementezi singur sau îl accesezi prin wrapper-e terțe; Otter este un produs complet, cu interfață. Pentru utilizatorii finali care nu vor să gestioneze infrastructură, compromisului acuratețe-versus-comoditate al Otter îi poate fi atribuit un caracter rezonabil. Pentru echipele cu resurse de dezvoltare, Whisper oferă o acuratețe mai bună pe engleză. Pentru analiza noastră tehnică detaliată, citește streaming STT vs. Whisper.

Metrica de acuratețe care chiar contează

WER-ul brut este un benchmark util; dar este o valoare de laborator. Nu îți spune dacă instrumentul gestionează accentele vorbitorilor tăi, dacă rezultatele ajung în timp ce mai poți acționa asupra lor sau dacă un transcript lingvistic corect surprinde ceea ce s-a intenționat de fapt.

Pentru echipele în care întâlnirile rămân în engleză și rezumatele post-întâlnire sunt suficiente, Whisper și Otter reprezintă plafonul de acuratețe disponibil astăzi. Pentru echipele multilingve care iau decizii în timp real, întrebarea se mută de la „care instrument are cel mai mic WER” la „care instrument ne oferă o înțelegere suficient de precisă cât timp mai putem răspunde”. Aceasta este o evaluare diferită și produce un răspuns diferit.

MirrorCaption combină STT în streaming cu traducere contextuală GPT pentru a servi acest al doilea caz de utilizare, în peste 60 de limbi, sub 500 ms, dintr-un tab de browser. Nivelul gratuit îți oferă 2 ore pe lună. Următoarea ta întâlnire este testul.

Testează acuratețea în următoarea ta întâlnire

2 ore gratuite în fiecare lună. Peste 60 de limbi. Fără bot, fără instalare.

Încearcă MirrorCaption gratuit