MirrorCaption คือซอฟต์แวร์ถอดเสียงพอดแคสต์สำหรับเซสชันสด: มันสตรีมบทถอดเสียงระหว่างที่คุณบันทึก โดยไม่ต้องรอให้อัปโหลดไฟล์เสียงที่เสร็จสมบูรณ์ หากคุณบันทึกในเครื่องมือบนเบราว์เซอร์อย่าง Riverside, StreamYard, Zoom หรือ Google Meet ให้เปิด MirrorCaption ควบคู่ไปด้วย แล้วติดตามบทถอดเสียงไปพร้อมกับบทสนทนาที่กำลังดำเนินอยู่
เวิร์กโฟลว์การถอดเสียงพอดแคสต์จำนวนมากยังคงเริ่มหลังการบันทึก: จบเซสชัน ส่งออกไฟล์เสียง อัปโหลด รอประมวลผล แล้วจึงดาวน์โหลดและแก้ไข ลำดับขั้นตอนนั้นมีปัญหาที่ย้อนกลับไม่ได้อย่างหนึ่ง: คุณจะไม่เห็นว่าบทถอดเสียงหน้าตาเป็นอย่างไรจนกว่าจะจบเซสชัน หากแขกรับเชิญตอบคำถามสำคัญติดขัด หรือไมโครโฟนของคุณหลุดไป 8 วินาที คุณจะรู้เอาทีหลัง หน้านี้อธิบายว่าทำไมเรื่องนั้นจึงสำคัญ MirrorCaption ต่างจาก Descript, Castmagic, Otter และ Rev อย่างไร และช่วยรายการสองภาษาตรงไหนบ้าง
ประเด็นสำคัญ
- เวิร์กโฟลว์การถอดเสียงพอดแคสต์จำนวนมากเริ่มจากไฟล์เสียงที่เสร็จแล้วหรือการบันทึกการประชุม
- MirrorCaption สตรีมบทถอดเสียงแบบสดระหว่างการบันทึก อ่านได้ก่อนที่คุณจะกดหยุด
- การจับแท็บและเสียงระบบทำงานได้ดีที่สุดบน Chrome และ Edge บนเดสก์ท็อป; โหมดไมโครโฟนใช้งานได้บนเบราว์เซอร์มือถือที่รองรับ
- รองรับการถอดเสียงและแปลมากกว่า 60 ภาษา เหมาะกับรูปแบบพอดแคสต์สองภาษา
- แผนใช้งานตลอดชีพจ่ายครั้งเดียว €49 พร้อมรวม 200 ชั่วโมง โดยไม่ต้องสมัครสมาชิกสำหรับแผนนั้น
ทำไมการถอดเสียงพอดแคสต์จึงสำคัญ และเครื่องมือส่วนใหญ่ขาดอะไรไป
เครื่องมือค้นหาไม่สามารถอ่านเสียงได้แม่นยำเท่าข้อความที่มองเห็นได้ การสัมภาษณ์ยาว 52 นาทีจะรวบรวม คัดอ้างอิง และนำกลับมาใช้ซ้ำได้ง่ายกว่ามากเมื่อมีบทถอดเสียง แนวทางข้อมูลมีโครงสร้างของ Google อธิบายว่า markup เป็นวิธีช่วยให้ระบบค้นหาเข้าใจเนื้อหาหน้าเว็บ ไม่ใช่สิ่งทดแทนการเผยแพร่ข้อความที่มีประโยชน์ซึ่งผู้ฟังและเครื่องมือค้นหาสามารถอ่านได้จริง
เหตุผลข้อที่สองคือการเข้าถึงสำหรับทุกคน องค์การอนามัยโลก ประเมินว่ามีผู้คน 430 ล้านคนที่ต้องการการฟื้นฟูสมรรถภาพจากภาวะการได้ยินบกพร่องระดับรุนแรง บทถอดเสียงทำให้รายการที่มีแต่เสียงกลายเป็นสิ่งที่ผู้ชมกลุ่มกว้างขึ้นเข้าถึงได้ นอกจากนี้ยังกลายเป็นประสบการณ์ผู้ฟังที่พบได้ทั่วไปมากขึ้น: Apple Podcasts มีบทถอดเสียงตอนแบบค้นหาได้ และ Spotify เปิดให้ครีเอเตอร์ที่มีสิทธิ์จัดการบทถอดเสียงตอนใน Spotify for Creators ดูคู่มือของเราเรื่อง คำบรรยายสดสำหรับผู้บกพร่องทางการได้ยินและหูหนวก เพื่ออ่านเพิ่มเติมเกี่ยวกับการทำให้เนื้อหาเสียงเข้าถึงได้
เหตุผลข้อที่สามคือเวิร์กโฟลว์การผลิต โน้ตตอน บท แทร็กโซเชียล และข้อความสำหรับจดหมายข่าว ล้วนมาจากแหล่งเดียวกัน: สิ่งที่แขกรับเชิญพูด บทถอดเสียงที่ค้นหาได้และมีเวลาประทับทำให้แหล่งข้อมูลนั้นใช้งานได้ทันที คุณไม่ต้องไล่สครับไฟล์เสียงเพื่อหา quote ที่จำได้จากนาทีที่ 38; คุณใช้ Ctrl+F ในบทถอดเสียง
เครื่องมืออย่าง Descript, Otter, Castmagic และ Rev จัดการงานถอดเสียงหลังการผลิตได้ดีหลายแบบ จุดที่ MirrorCaption ต่างออกไปคือ: การติดตามแบบสดระหว่างการบันทึก เวิร์กโฟลว์หลายภาษา และการตั้งค่าที่ทำงานบนเบราว์เซอร์โดยไม่ต้องมีบอทเข้าร่วมการประชุม ช่องว่างทั้งสามข้อนี้คือเหตุผลที่หน้านี้มีอยู่
ปัญหาของการอัปโหลดแล้วรอ
ลองนึกภาพโปรดิวเซอร์คนหนึ่งกำลังบันทึกสัมภาษณ์ 48 นาที กับผู้ก่อตั้งที่ชื่อบริษัทไม่คุ้นหู แขกรับเชิญพูดชื่อบริษัทสามครั้งติดกันอย่างรวดเร็วในขณะที่ไมโครโฟนอยู่ใกล้เกินไป และต่อมาบทถอดเสียงก็แสดงชื่อออกมาสามแบบต่างกัน
ข้อความสามารถแก้ไขย้อนหลังได้ แต่เสียงที่ไม่ชัดแก้ไม่ได้ หากโปรดิวเซอร์เห็นบทถอดเสียงระหว่างการบันทึก เขาอาจหยุดแล้วถามว่า: "ขอเช็กชื่ออีกครั้งได้ไหม ช่วยพูดชัด ๆ อีกทีได้หรือเปล่า?" แขกรับเชิญพูดซ้ำ คลิปยังคงอยู่ และการตัดต่อก็ไม่ต้องหาทางแก้เฉพาะหน้า
เวิร์กโฟลว์แบบอัปโหลดแล้วรอถือว่าการถอดเสียงเป็นขั้นตอนการเผยแพร่ แต่การถอดเสียงแบบเรียลไทม์ทำให้มันกลายเป็นเครื่องมือการผลิต ที่คุณลงมือแก้ไขได้ในขณะที่เซสชันยังดำเนินอยู่
การถอดเสียงพอดแคสต์แบบเรียลไทม์เปลี่ยนเวิร์กโฟลว์ของคุณอย่างไร
ความต่างระหว่างการถอดเสียงแบบเรียลไทม์กับหลังการผลิตไม่ใช่แค่เรื่องความเร็ว แต่คือชุดของการตัดสินใจที่คุณทำได้
เมื่อคุณอ่านบทถอดเสียงได้ขณะกำลังบันทึก คุณจะจับข้อผิดพลาดได้ในทันทีที่มันเกิดขึ้น คุณรู้แน่ชัดว่าควรขอคำอธิบายเพิ่มเติม ขอให้อ่านซ้ำ หรือขออัดใหม่เมื่อไร คุณออกจากเซสชันพร้อมบทถอดเสียงที่ครบถ้วนและสะอาด แทนที่จะเป็นฉบับที่ต้องคอยปะซ่อมตรงช่วงที่มีปัญหา การบันทึกจะกลายเป็นไฟล์สุดท้าย ไม่ใช่จุดเริ่มต้นของงานซ่อมแซม
MirrorCaption ใช้ Soniox WebSocket streaming เพื่อส่งคำออกมาทันทีที่พูด โดยมีค่า latency เป้าหมายต่ำกว่า 500 มิลลิวินาทีในสภาวะปกติ นั่นหมายความว่าคุณอ่านบทถอดเสียงได้ในขณะที่แขกรับเชิญยังพูดอยู่ คุณภาพการแปลยังดีขึ้นเมื่อมีบริบทล่าสุด ทำให้คำศัพท์เฉพาะอุตสาหกรรมและคำนามเฉพาะที่ข้ามขอบเขตประโยคมีบริบทมากพอสำหรับการตีความที่ถูกต้อง ดูคำอธิบายเชิงลึกว่าอะไรทำให้การถอดเสียงแบบสตรีมมิงต่างจากการประมวลผลแบบแบตช์ได้ที่ คำบรรยายสด vs บทถอดเสียง
รายการสัมภาษณ์
อ่านไปพร้อมกับคำตอบของแขกรับเชิญ จับอาการติดขัด เสียงหลุด หรือชื่อที่ไม่ชัดก่อนจบเซสชัน ไม่ต้องอัดใหม่
พอดแคสต์เดี่ยว
บันทึกด้วยไมโครโฟนและอ่านบทถอดเสียงของตัวเองแบบสด สังเกตคำฟุ่มเฟือยหรือการพูดนอกเรื่องได้ทันที ไม่ใช่ตอนหลัง
รายการสองภาษา
ทั้งสองภาษาปรากฏเคียงกันระหว่างเซสชัน ส่งออกบทถอดเสียงสองภาษาได้ทันทีที่คุณหยุด โดยไม่ต้องรวมไฟล์สองไฟล์แยกกัน
เวิร์กโฟลว์โน้ตตอน
บทถอดเสียงพร้อมใช้ทันทีที่คุณหยุดบันทึก ส่งออกเป็น Markdown วางลงใน Notion และเผยแพร่โน้ตตอนภายในวันเดียวกัน
ทำงานร่วมกับชุดเครื่องมือบันทึกที่คุณใช้อยู่แล้ว
บน Chrome และ Edge บนเดสก์ท็อป MirrorCaption จะจับแท็บเบราว์เซอร์หรือเสียงระบบโดยใช้ API getDisplayMedia ของเบราว์เซอร์ นั่นหมายความว่ามันสามารถทำงานควบคู่กับเครื่องมือบันทึกบนเบราว์เซอร์ได้โดยไม่ต้องมีการเชื่อมต่อแยกต่างหากหรือบอทเข้าร่วมเซสชัน:
- Riverside.fm
- StreamYard
- Zoom
- Google Meet
- Cleanfeed
- Zencastr
- แพลตฟอร์มบันทึกบนเบราว์เซอร์อื่น ๆ ทั้งหมด
นอกจากนี้ยังจับเสียงไมโครโฟนได้โดยตรง เหมาะสำหรับการบันทึกเดี่ยว การสนทนาแบบเจอหน้ากัน หรือ Q&A กับผู้ชมแบบสดที่ไม่มีแพลตฟอร์มวิดีโอแยกต่างหากเข้ามาเกี่ยวข้อง แขกรับเชิญของคุณจะไม่เห็นบอทประชุม เพราะ MirrorCaption ไม่ได้เข้าร่วมเซสชัน สำหรับการจับแท็บหรือเสียงระบบแบบเต็ม ให้ใช้ Chrome หรือ Edge บนเดสก์ท็อป; บน Safari, Firefox และเบราว์เซอร์มือถือ ให้ทดสอบโหมดเสียงที่ต้องการก่อนพึ่งพามันในการบันทึก
จากการบันทึกสู่โน้ตตอนในคลิกเดียว
สำหรับรายการการเงินส่วนบุคคลภาษาแมนดาริน โน้ตตอนอาจกลายเป็นส่วนที่ช้าที่สุดของการผลิต: ไล่สครับตอนยาว 40 นาทีเพื่อหาตำแหน่งเวลาและช่วงที่นำไปอ้างอิงได้ แล้วแปลประโยคที่ดีที่สุดเป็นภาษาอังกฤษสำหรับผู้ฟังต่างประเทศ
บทถอดเสียงแบบสดเปลี่ยนเวิร์กโฟลว์นั้น เมื่อเซสชันหยุด MirrorCaption สามารถส่งออกบทถอดเสียง Markdown พร้อมเวลาประทับและป้ายกำกับผู้พูด รวมถึงข้อความที่แปลแล้วเมื่อเปิดการแปลไว้ โปรดิวเซอร์สามารถวางลงใน Notion ใช้สรุปด้วย AI เป็นจุดเริ่มต้น และแก้ไขโน้ตตอนจากข้อความแทนที่จะจากไทม์ไลน์เสียงดิบ
รูปแบบการส่งออก: Markdown, ข้อความธรรมดา และคัดลอกไปยังคลิปบอร์ด ป้ายกำกับผู้พูดรวมมาให้อัตโนมัติ แต่ละช่วงมีเวลาประทับ สรุปที่สร้างด้วย AI จะแสดงในบล็อกแยกต่างหากด้านบน
เปิด MirrorCaption ในเบราว์เซอร์ของคุณ แพ็กเกจฟรีรวม 1 ชั่วโมง ใช้ครั้งเดียว ไม่ต้องใช้บัตรเครดิต
เปรียบเทียบซอฟต์แวร์ถอดเสียงพอดแคสต์
เครื่องมือส่วนใหญ่ในหมวดนี้ทำงานได้ดีจริง ๆ Descript โดดเด่นเรื่องตัวแก้ไขหลังการผลิต เวฟฟอร์มแบบภาพ การพากย์ทับ และการลบคำฟุ่มเฟือย หากการตัดต่อคือสิ่งที่คุณให้ความสำคัญ Castmagic เด่นเรื่องการสร้างคลิปโซเชียลและคอนเทนต์ดัดแปลงจากสื่อที่บันทึกไว้ Rev ระดับถอดเสียงโดยมนุษย์มีประโยชน์เมื่อความแม่นยำที่ตรวจสอบได้สำคัญกว่าความเร็ว
จุดที่ MirrorCaption ต่างออกไปสำหรับเวิร์กโฟลว์พอดแคสต์แบบสดและหลายภาษา:
| เครื่องมือ | ราคา | เวิร์กโฟลว์ทั่วไป | แนวทางด้านภาษา | เหมาะที่สุดสำหรับ |
|---|---|---|---|---|
| Descript Pro | $24/mo billed annually | บันทึก/นำเข้า แล้วแก้ไขบทถอดเสียง | 25 ภาษาสำหรับการถอดเสียง | การตัดต่อวิดีโอและพอดแคสต์ |
| Castmagic | $79/mo billed annually | อัปโหลดหรือนำเข้า แล้วสร้างชิ้นงาน | การถอดเสียงหลายภาษา | การนำคอนเทนต์ AI ไปใช้ซ้ำ |
| Otter.ai | $16.99/mo monthly | บันทึกโน้ตการประชุมแบบสดและการนำเข้า | รองรับหลายภาษา เน้นการประชุม | โน้ตการประชุม |
| Rev (AI) | $0.25/min | อัปโหลดหรือบันทึก แล้วรับบทถอดเสียง | หลายภาษาบนแพ็กเกจแบบชำระเงิน | บทถอดเสียงเก็บถาวรที่แม่นยำ |
| MirrorCaption | €49 once | บทถอดเสียงแบบสดจากแท็บเบราว์เซอร์หรือไมค์ระหว่างบันทึก | มากกว่า 60 ภาษา พร้อมการแปล | การบันทึกสด + รายการสองภาษา |
หากรายการของคุณเป็นภาษาอังกฤษล้วนและคุณทำงานผลิตส่วนใหญ่หลังการบันทึก Descript เป็นตัวเลือกที่แข็งแรง MirrorCaption มุ่งไปที่เวิร์กโฟลว์และผู้ชมอีกแบบหนึ่ง: พอดแคสเตอร์ที่ต้องการบทถอดเสียงระหว่างการบันทึก และทุกคนที่ทำรายการหลายภาษา หากต้องการเปรียบเทียบแบบละเอียดทีละฟีเจอร์กับ Otter ดู MirrorCaption vs Otter.ai
พอดแคสต์หลายภาษา: จุดที่การถอดเสียงสดช่วยได้
ลองพิจารณาพอดแคสต์เยอรมัน-อังกฤษเกี่ยวกับวัฒนธรรมสตาร์ทอัพในยุโรป แต่ละตอนจับคู่ผู้ก่อตั้งที่พูดเยอรมันกับนักลงทุนที่พูดอังกฤษ บทสนทนาสลับไปมาระหว่างภาษาอยู่ตลอด บางครั้งก็กลางประโยค
เวิร์กโฟลว์หลังการผลิตมักหมายถึงการบันทึกตอน สร้างบทถอดเสียงหนึ่งฉบับ หาช่วงที่เปลี่ยนภาษา แล้วแก้ด้วยเครื่องมืออีกตัวหรือการแปลด้วยมือ การเก็บกวาดแบบนั้นพอรับมือได้ครั้งหนึ่ง แต่จะกลายเป็นงานซ้ำ ๆ เมื่อทุกตอนมีการสลับรหัสภาษา
ด้วย MirrorCaption บทถอดเสียงจะสตรีมระหว่างการบันทึก โดยมีคำพูดต้นฉบับและคำแปลวางเคียงกันเมื่อเปิดการแปลไว้ เมื่อแขกรับเชิญสลับจาก "We're still very early" ไปเป็น "Wir sind noch sehr früh" กลางประโยค มุมมองสดจะคงบริบทการแปลให้มองเห็นอยู่ เมื่อเซสชันจบ ข้อความต้นฉบับและข้อความแปลจะพร้อมใช้งานจากการส่งออกเซสชันเดียวกัน
รูปแบบพอดแคสต์สองภาษา เช่น สเปน/อังกฤษ แมนดาริน/อังกฤษ เยอรมัน/อังกฤษ และญี่ปุ่น/อังกฤษ สร้างปัญหาเวิร์กโฟลว์ที่บทถอดเสียงภาษาเดียวแก้ได้ไม่ดีนัก MirrorCaption ถูกสร้างขึ้นรอบมุมมองสองภาษาสดนี้ ดู คู่มือการถอดเสียงหลายภาษา ของเราเพื่ออ่านรายละเอียดเต็ม ๆ ว่าเครื่องมือหลัก ๆ ทำงานอย่างไรในแต่ละคู่ภาษา
บทถอดเสียงแบบเคียงข้างกันสำหรับตอนสองภาษา
ในมุมมองเดสก์ท็อปของ MirrorCaption คำพูดต้นฉบับและคำแปลจะแสดงเป็นคอลัมน์คู่ขนาน แต่ละคำที่แปลแล้วสามารถเชื่อมกลับไปยังคำต้นทางที่มาของมันได้ ดังนั้นคุณจิ้มคำใดคำหนึ่งเพื่อดูวลีต้นฉบับได้ สำหรับพอดแคสต์สอนภาษา ที่ผู้ฟังต้องการเห็นต้นฉบับควบคู่กับคำแปล รูปแบบเคียงข้างกันนี้ให้คุณเห็นทั้งสองคอลัมน์ไปพร้อมกับบทสนทนาที่เกิดขึ้นจริง
เวิร์กโฟลว์สองภาษาแบบสดเดียวกันนี้ใช้ได้กับครีเอเตอร์ที่เผยแพร่หลายรูปแบบ: เวอร์ชันอังกฤษและสเปนของตอนหนึ่งสามารถเริ่มจากเซสชันบันทึกเดียวและการส่งออกเดียว ดูว่า การถอดเสียงสำหรับคอนเทนต์ครีเอเตอร์ นำสิ่งนี้ไปใช้กับเวิร์กโฟลว์ YouTube และไลฟ์สตรีมอย่างไร
เริ่มต้นใน 3 ขั้นตอน
- เปิด mirrorcaption.com ในเบราว์เซอร์ของคุณ ไม่ต้องดาวน์โหลดหรือใช้ส่วนขยาย สำหรับการจับแท็บ/เสียงระบบแบบเต็ม ให้ใช้ Chrome หรือ Edge บนเดสก์ท็อป สำหรับเซสชันที่ใช้เฉพาะไมโครโฟน ให้ใช้เบราว์เซอร์บนเดสก์ท็อปหรือมือถือที่รองรับ
- แชร์แท็บเบราว์เซอร์ของเครื่องมือบันทึกเมื่อมีการแจ้ง MirrorCaption จะจับเสียงจากแท็บควบคู่กับไมโครโฟนของคุณ หากคุณบันทึกเดี่ยวด้วยไมค์อย่างเดียว ให้เลือกโหมดไมโครโฟน ไม่มีใครในเซสชันเห็นการแจ้งเตือน
- กดเริ่ม บทถอดเสียงจะสตรีมทันที ทีละคำ ด้วย latency ต่ำกว่า 500 มิลลิวินาที ระบบจะติดป้ายกำกับผู้พูดให้อัตโนมัติ เมื่อคุณหยุด ให้ส่งออกบทถอดเสียงฉบับเต็มเป็น Markdown หรือข้อความธรรมดา พร้อมเวลาประทับและป้ายกำกับผู้พูด
แพ็กเกจฟรีรวมการถอดเสียง 1 ชั่วโมง ใช้ครั้งเดียว โดยไม่ต้องใช้บัตรเครดิต เพียงพอสำหรับทดสอบตอนสั้น ๆ หรือช่วงสด และประเมินว่าเวิร์กโฟลว์แบบเรียลไทม์เหมาะกับกระบวนการผลิตของคุณหรือไม่ก่อนตัดสินใจผูกมัดกับอะไร
แพ็กเกจฟรี: 1 ชั่วโมง ใช้ครั้งเดียว ไม่ต้องใช้บัตรเครดิต เหมาะสำหรับการทดสอบสดแบบสั้น ๆ ก่อนการบันทึกครั้งถัดไปของคุณ
ราคา: €49 ครั้งเดียว เทียบกับเครื่องมือแบบสมัครสมาชิก
เครื่องมือถอดเสียงและนำคอนเทนต์พอดแคสต์ไปใช้ซ้ำจำนวนมากทำงานบนการสมัครสมาชิกรายเดือนหรือรายปี ที่การใช้งานเฉลี่ย บันทึกสัปดาห์ละหนึ่งถึงสองชั่วโมง การสมัครสมาชิกอาจสำคัญพอ ๆ กับรายการฟีเจอร์
| แผน | ค่าใช้จ่ายรายเดือน | ค่าใช้จ่ายรายปี | ชั่วโมงที่รวม | ภาษา |
|---|---|---|---|---|
| Descript Pro | $24/mo | $288/yr | 30h/mo | 25 ภาษาสำหรับการถอดเสียง |
| Castmagic Starter | $79/mo | $948/yr | 20h/mo | การถอดเสียงหลายภาษา |
| Otter.ai Pro | $16.99/mo | $99.96-$203.88/yr | 1,200 min/mo | รองรับหลายภาษา |
| MirrorCaption Annual | €2.42/mo | €29/yr | 100h | 60+ |
| MirrorCaption Lifetime | €0 after purchase | €49 once | 200h | 60+ |
ที่ความถี่การบันทึกสัปดาห์ละหนึ่งตอนยาว 50 นาที 200 ชั่วโมงจะครอบคลุมประมาณสี่ปีครึ่งของเซสชัน หลังจากนั้น Voice Pack สามารถเติมชั่วโมงเพิ่มได้โดยไม่ต้องสมัครสมาชิกหรือผูกมัดรายเดือน
หากเทียบกับการสมัครสมาชิกรายเดือน การซื้อแบบตลอดชีพมักคุ้มทุนคืนภายในประมาณหนึ่งถึงสามเดือน ขึ้นอยู่กับแผนและอัตราแลกเปลี่ยน หากคุณซื้อแบบรายปี ให้เทียบกับวันต่ออายุและนาทีที่รวมมา สำหรับพอดแคสเตอร์ที่ทำงานเป็นครั้งคราวและผลิตปีละหกถึงแปดตอน การหลีกเลี่ยงการสมัครสมาชิกแบบต่อเนื่องอาจสำคัญกว่าการมีโควตารายเดือนจำนวนมาก
-
การถอดเสียงแบบสตรีมมิงเรียลไทม์ ส่งออกทีละคำด้วย latency ต่ำกว่า 500 มิลลิวินาทีผ่าน Soniox WebSocket STT อ่านได้ในขณะที่แขกรับเชิญยังพูดอยู่
-
มากกว่า 60 ภาษา พร้อมการแปล แมนดาริน กวางตุ้ง ญี่ปุ่น เกาหลี อาหรับ สเปน ฝรั่งเศส เยอรมัน ฮินดี โปรตุเกส และอีกมากกว่า 50 ภาษา รายการสองภาษาจัดการได้โดยตรง
-
ตรวจจับผู้พูดอัตโนมัติ เสียงที่แตกต่างกันจะถูกติดป้ายกำกับให้อัตโนมัติ เปลี่ยนชื่อผู้พูดในบทถอดเสียงก่อนส่งออก
-
สรุปที่สร้างด้วย AI สรุปแบบมีโครงสร้างจะรีเฟรชไปตามความคืบหน้าของเซสชัน ส่งออกไปพร้อมกับบทถอดเสียงเพื่อใช้เป็นโน้ตตอนทันที
-
ไม่มีการเก็บเสียงของ MirrorCaption เสียงจะสตรีมจากเบราว์เซอร์ของคุณไปยังโครงสร้างพื้นฐานการถอดเสียงเพื่อประมวลผล บทถอดเสียงจะอยู่ในที่เก็บข้อมูลภายในเบราว์เซอร์ของคุณ เว้นแต่คุณจะส่งออกหรือคัดลอก MirrorCaption บันทึกนาทีการใช้งานเพื่อการคิดค่าบริการ ไม่ใช่เนื้อหาบทถอดเสียง
-
เวิร์กโฟลว์บนเบราว์เซอร์ แนะนำให้ใช้ Chrome และ Edge บนเดสก์ท็อปสำหรับการจับแท็บ/เสียงระบบแบบเต็ม ขณะที่โหมดใช้เฉพาะไมโครโฟนรองรับกรณีใช้งานบนเดสก์ท็อปและมือถือที่เบากว่า
คำถามที่พบบ่อย
MirrorCaption ใช้กับไฟล์เสียงที่บันทึกไว้ล่วงหน้าได้ไหม?
ยังไม่ได้ในตอนนี้ MirrorCaption สร้างมาสำหรับเซสชันสด โดยจับเสียงจากแท็บเบราว์เซอร์หรือไมโครโฟนแบบเรียลไทม์ผ่าน API getDisplayMedia ของเบราว์เซอร์ หากคุณต้องการถอดเสียงไฟล์ที่เสร็จแล้ว เครื่องมืออย่าง Descript หรือ Rev จัดการเวิร์กโฟลว์นั้นได้ดี MirrorCaption คือทางเลือกที่เหมาะเมื่อคุณต้องการบทถอดเสียงระหว่างการบันทึก ไม่ใช่หลังจากนั้น
ใช้กับวิดีโอพอดแคสต์ที่บันทึกบน Riverside หรือ YouTube Live ได้ไหม?
ได้ หากคุณบันทึกผ่านเครื่องมือบนเบราว์เซอร์อย่าง Riverside, StreamYard หรือ YouTube Studio MirrorCaption จะจับเสียงแท็บแบบเรียลไทม์ คุณจะได้บทถอดเสียงสดระหว่างเซสชันการบันทึก เมื่อเซสชันจบ ให้ส่งออกบทถอดเสียงควบคู่กับไฟล์วิดีโอ ทั้งสองอย่างพร้อมใช้งานพร้อมกันโดยไม่มีขั้นตอนประมวลผลเพิ่มเติม
บทถอดเสียงแม่นยำแค่ไหนสำหรับผู้พูดภาษาอังกฤษที่ไม่ใช่เจ้าของภาษา หรือสำเนียงที่ชัดเจนต่างกัน?
MirrorCaption ใช้ Soniox streaming STT และผลลัพธ์บางส่วนสามารถอัปเดตได้เมื่อมีบริบทเสียงเพิ่มขึ้น คุณภาพการแปลจะดีขึ้นอีกเมื่อมีบริบทล่าสุด ดังนั้นคำที่ข้ามขอบเขตประโยคจะมีข้อมูลให้ใช้มากขึ้นก่อนที่ข้อความสุดท้ายจะแสดงออกมา สำหรับการพูดที่มีสำเนียงหนักหรือพูดเร็วมาก คุณควรตรวจทานไฟล์ที่ส่งออกก่อนเผยแพร่เสมอ
MirrorCaption เก็บเสียงพอดแคสต์ของฉันไหม?
ไม่มีการเก็บเสียงพอดแคสต์ไว้บนเซิร์ฟเวอร์ของ MirrorCaption เสียงจะสตรีมจากเบราว์เซอร์ของคุณไปยังโครงสร้างพื้นฐานการถอดเสียงเพื่อประมวลผล และบทถอดเสียงจะถูกบันทึกไว้ในเครื่องในเบราว์เซอร์ของคุณโดยใช้ IndexedDB เว้นแต่คุณจะส่งออกหรือคัดลอก MirrorCaption บันทึกนาทีการใช้งานเพื่อวัตถุประสงค์ในการคิดค่าบริการ ไม่ใช่เนื้อหาบทถอดเสียง สิ่งนี้ทำให้เวิร์กโฟลว์เหมาะกับพอดแคสเตอร์ที่ต้องการหลีกเลี่ยงการอัปโหลดไฟล์เสียงที่เสร็จแล้วไปยังคลังเนื้อหาแยกต่างหาก
รองรับภาษาอะไรบ้าง และจัดการการสลับภาษาในกลางประโยคได้ไหม?
MirrorCaption รองรับมากกว่า 60 ภาษา รวมถึงแมนดาริน กวางตุ้ง ญี่ปุ่น เกาหลี อาหรับ ฮีบรู ฮินดี รัสเซีย โปรตุเกส สเปน ฝรั่งเศส เยอรมัน และอิตาลี สำหรับการสลับภาษาในกลางประโยค MirrorCaption จะคงคอลัมน์ต้นฉบับและคอลัมน์แปลให้มองเห็นได้ระหว่างเซสชันสด นี่คือฟีเจอร์หลักสำหรับรูปแบบพอดแคสต์สองภาษา: คุณจะสังเกตเห็นการเปลี่ยนภาษาได้ในขณะที่บทสนทนายังเกิดขึ้นอยู่ แทนที่จะไปพบมันตอนเก็บกวาดทีหลัง
ถอดเสียงตอนถัดไปของคุณแบบสด
ฟรี 1 ชั่วโมง ใช้ครั้งเดียว ไม่ต้องใช้บัตรเครดิต ไม่ต้องติดตั้ง ใช้ Chrome หรือ Edge บนเดสก์ท็อปเพื่อจับเสียงจากแท็บการบันทึกได้เต็มรูปแบบ
Start Free Trial