MirrorCaption হলো লাইভ সেশনের জন্য পডকাস্ট ট্রান্সক্রিপশন সফটওয়্যার: আপনি রেকর্ড করার সময়ই এটি ট্রান্সক্রিপ্ট স্ট্রিম করে, কোনো চূড়ান্ত অডিও ফাইল আপলোড হওয়ার জন্য অপেক্ষা না করেই। আপনি যদি Riverside, StreamYard, Zoom, বা Google Meet-এর মতো ব্রাউজার-ভিত্তিক টুলে রেকর্ড করেন, তাহলে MirrorCaption সেটির পাশে খুলে রাখুন এবং কথোপকথন এগোতে থাকলে ট্রান্সক্রিপ্ট পর্যবেক্ষণ করুন।
অনেক পডকাস্ট ট্রান্সক্রিপশন ওয়ার্কফ্লো এখনো রেকর্ডিংয়ের পর শুরু হয়: সেশন শেষ করুন, অডিও ফাইল এক্সপোর্ট করুন, আপলোড করুন, প্রসেসিং শেষ হওয়ার জন্য অপেক্ষা করুন, তারপর ডাউনলোড করে এডিট করুন। এই ধারাবাহিকতার একটি অপরিবর্তনীয় সমস্যা আছে: সেশন শেষ না হওয়া পর্যন্ত আপনি ট্রান্সক্রিপ্ট কেমন দেখাচ্ছে তা দেখতে পান না। আপনার অতিথি যদি কোনো গুরুত্বপূর্ণ উত্তরে হোঁচট খান, বা আপনার মাইক ৮ সেকেন্ডের জন্য বন্ধ হয়ে যায়, আপনি সেটা পরে জানতে পারেন। এই পৃষ্ঠায় ব্যাখ্যা করা হয়েছে কেন এটি গুরুত্বপূর্ণ, MirrorCaption কীভাবে Descript, Castmagic, Otter, এবং Rev থেকে আলাদা, এবং কোথায় এটি দ্বিভাষিক শোগুলোর জন্য সহায়ক।
মূল বিষয়গুলো
- অনেক পডকাস্ট ট্রান্সক্রিপশন ওয়ার্কফ্লো একটি সম্পূর্ণ অডিও ফাইল বা মিটিং রেকর্ডিং দিয়ে শুরু হয়।
- MirrorCaption রেকর্ডিং চলাকালেই লাইভ ট্রান্সক্রিপ্ট স্ট্রিম করে, যা stop চাপার আগেই পড়া যায়।
- ট্যাব এবং সিস্টেম-অডিও ক্যাপচারের সেরা সমর্থন ডেস্কটপ Chrome এবং Edge-এ; মাইক্রোফোন মোড সমর্থিত মোবাইল ব্রাউজারেও উপলভ্য।
- ট্রান্সক্রিপশন ও অনুবাদের জন্য ৬০+ ভাষা সমর্থন করে, যা দ্বিভাষিক পডকাস্ট ফরম্যাটের জন্য উপকারী।
- €49 এককালীন লাইফটাইম প্ল্যানে ২০০ ঘণ্টা অন্তর্ভুক্ত, এবং সেই প্ল্যানের জন্য কোনো সাবস্ক্রিপশন প্রয়োজন নেই।
পডকাস্ট ট্রান্সক্রিপশন কেন গুরুত্বপূর্ণ, এবং বেশিরভাগ টুল কোথায় কম পড়ে
সার্চ ইঞ্জিন অডিওকে দৃশ্যমান টেক্সটের মতো একই নির্ভুলতায় পড়তে পারে না। ৫২ মিনিটের একটি সাক্ষাৎকার ট্রান্সক্রিপ্ট থাকলে ক্রল, উদ্ধৃতি, এবং পুনঃব্যবহার করা অনেক সহজ হয়। Google-এর structured data নির্দেশিকা মার্কআপকে সার্চ সিস্টেমকে পৃষ্ঠার বিষয়বস্তু বুঝতে সাহায্য করার একটি উপায় হিসেবে বর্ণনা করে; এটি এমন উপকারী টেক্সট প্রকাশের বিকল্প নয়, যা শ্রোতা এবং সার্চ ইঞ্জিন সত্যিই পড়তে পারে।
দ্বিতীয় কারণ হলো অ্যাক্সেসিবিলিটি। World Health Organization অনুমান করে যে ৪৩০ মিলিয়ন মানুষের প্রতিবন্ধকতাজনিত শ্রবণহানির জন্য পুনর্বাসন প্রয়োজন। একটি ট্রান্সক্রিপ্ট অডিও-নির্ভর শোকে এমন কিছুতে রূপ দেয়, যা আপনার সম্ভাব্য শ্রোতাদের আরও বড় অংশ ব্যবহার করতে পারে। এটি এখন একটি স্বাভাবিক শ্রোতা-অভিজ্ঞতাও হয়ে উঠছে: Apple Podcasts অনুসন্ধানযোগ্য এপিসোড ট্রান্সক্রিপ্ট দেয়, এবং Spotify যোগ্য ক্রিয়েটরদের Spotify for Creators-এ এপিসোড ট্রান্সক্রিপ্ট পরিচালনা করতে দেয়। অডিও কনটেন্টকে আরও অ্যাক্সেসযোগ্য করার বিষয়ে আরও জানতে আমাদের বধির ও শ্রবণপ্রতিবন্ধী ব্যবহারকারীদের জন্য লাইভ ক্যাপশন গাইড দেখুন।
তৃতীয় কারণ হলো প্রোডাকশন ওয়ার্কফ্লো। শো নোট, চ্যাপ্টার, সোশ্যাল ক্লিপ, এবং নিউজলেটার এক্সার্প্ট—সবই একই উৎস থেকে আসে: আপনার অতিথি কী বলেছেন। অনুসন্ধানযোগ্য, টাইমস্ট্যাম্পযুক্ত ট্রান্সক্রিপ্ট সেই উৎসকে সঙ্গে সঙ্গে ব্যবহারযোগ্য করে তোলে। আপনি মিনিট ৩৮-এ যে উদ্ধৃতিটি মনে আছে তা খুঁজতে অডিও ফাইল স্ক্রাব করেন না; ট্রান্সক্রিপ্টে Ctrl+F ব্যবহার করেন।
Descript, Otter, Castmagic, এবং Rev-এর মতো টুল অনেক পোস্ট-প্রোডাকশন ট্রান্সক্রিপশন কাজ ভালোভাবে সামলায়। MirrorCaption যেখানে আলাদা: রেকর্ডিং চলাকালীন লাইভ মনিটরিং, বহুভাষিক ওয়ার্কফ্লো, এবং ব্রাউজার-নেটিভ সেটআপ, যার জন্য কোনো মিটিং বট লাগে না। এই তিনটি ঘাটতিই এই পৃষ্ঠার কারণ।
আপলোড করে অপেক্ষা করার সমস্যা
ধরুন, একজন প্রযোজক ৪৮ মিনিটের একটি সাক্ষাৎকার রেকর্ড করছেন এমন এক প্রতিষ্ঠাতার সঙ্গে, যার কোম্পানির নাম তার কাছে অপরিচিত। অতিথি দ্রুত তিনবার নামটি বলেন, আর মাইক্রোফোনটি খুব কাছে থাকায় পরে ট্রান্সক্রিপ্টে সেটি তিনভাবে ভিন্নভাবে দেখা যায়।
টেক্সট পরে ঠিক করা যায়, কিন্তু অস্পষ্ট অডিও ঠিক করা যায় না। যদি প্রযোজক রেকর্ডিং চলাকালেই ট্রান্সক্রিপ্ট দেখতেন, তাহলে তিনি থামিয়ে জিজ্ঞেস করতে পারতেন: "শুধু নামটা নিশ্চিত করতে, আপনি কি সেটা পরিষ্কারভাবে আবার বলতে পারেন?" অতিথি আবার বলেন, ক্লিপটি ঠিক থাকে, আর এডিটে কোনো workaround লাগে না।
আপলোড করে অপেক্ষা করার ওয়ার্কফ্লো ট্রান্সক্রিপশনকে একটি প্রকাশনার ধাপ হিসেবে দেখে। রিয়েল-টাইম ট্রান্সক্রিপশন এটিকে একটি প্রোডাকশন টুলে পরিণত করে, যা সেশন এখনো লাইভ থাকতেই আপনি কাজে লাগাতে পারেন।
রিয়েল-টাইম পডকাস্ট ট্রান্সক্রিপশন কীভাবে আপনার ওয়ার্কফ্লো বদলে দেয়
রিয়েল-টাইম এবং পোস্ট-প্রোডাকশন ট্রান্সক্রিপশনের পার্থক্য শুধু গতি নয়। এটি সেই সিদ্ধান্তগুলোর সেট, যা আপনি নিতে পারেন।
রেকর্ডিং চলাকালীন ট্রান্সক্রিপ্ট পড়তে পারলে, ভুলগুলো ঘটার মুহূর্তেই ধরতে পারেন। কখন স্পষ্টীকরণ চাইতে হবে, আবার পড়তে বলতে হবে, বা পুনরায় নিতে হবে—তা আপনি ঠিক জানেন। আপনি সেশন শেষ করেন একটি সম্পূর্ণ, পরিষ্কার ট্রান্সক্রিপ্ট নিয়ে, এমন নয় যে সমস্যা-যুক্ত অংশগুলো ঘিরে পরে প্যাচ দিতে হবে। রেকর্ডিংটি তখন চূড়ান্ত রেকর্ডিং হয়ে যায়, কোনো মেরামতের কাজের শুরু নয়।
MirrorCaption Soniox WebSocket streaming ব্যবহার করে কথাগুলো উচ্চারিত হওয়ার সঙ্গে সঙ্গেই শব্দ পৌঁছে দেয়, স্বাভাবিক অবস্থায় sub-500ms লক্ষ্য latency সহ। এর মানে, আপনার অতিথি কথা বলতেই থাকলেও আপনি ট্রান্সক্রিপ্ট পড়তে পারেন। সাম্প্রতিক প্রসঙ্গের সঙ্গে অনুবাদের মানও উন্নত হয়, তাই বাক্যসীমা জুড়ে থাকা শিল্প-নির্দিষ্ট শব্দ ও proper noun সঠিকভাবে নির্ণয়ের জন্য আরও প্রসঙ্গ পাওয়া যায়। streaming transcription আর batch processing-এর পার্থক্য আরও গভীরভাবে জানতে আমাদের লাইভ ক্যাপশন বনাম ট্রান্সক্রিপ্ট ব্যাখ্যাটি দেখুন।
ইন্টারভিউ শো
আপনার অতিথি উত্তর দিতে দিতে সঙ্গে সঙ্গে পড়ুন। সেশন শেষ হওয়ার আগে হোঁচট, অডিও কাটা পড়া, বা অস্পষ্ট নাম ধরে ফেলুন। পুনরায় রেকর্ডের দরকার নেই।
একক পডকাস্ট
মাইক্রোফোন দিয়ে রেকর্ড করুন এবং নিজের ট্রান্সক্রিপ্ট লাইভ পড়ুন। ফিলার শব্দ বা বিষয়চ্যুত আলাপ মুহূর্তেই ধরুন, পরে নয়।
দ্বিভাষিক শো
সেশনের সময় উভয় ভাষা পাশাপাশি দেখা যায়। দুটি আলাদা ফাইল একত্র করার ঝামেলা ছাড়াই stop করার মুহূর্তেই দ্বিভাষিক ট্রান্সক্রিপ্ট এক্সপোর্ট করুন।
শো নোট ওয়ার্কফ্লো
আপনি রেকর্ডিং বন্ধ করামাত্র ট্রান্সক্রিপ্ট প্রস্তুত। Markdown হিসেবে এক্সপোর্ট করুন, Notion-এ পেস্ট করুন, এবং একই দিনে শো নোট প্রকাশ করুন।
আপনার বিদ্যমান রেকর্ডিং স্ট্যাকের সঙ্গে কাজ করে
ডেস্কটপ Chrome এবং Edge-এ MirrorCaption ব্রাউজারের getDisplayMedia API ব্যবহার করে ব্রাউজার ট্যাব বা সিস্টেম অডিও ক্যাপচার করে। এর মানে, এটি আলাদা কোনো ইন্টিগ্রেশন বা সেশনে যোগ দেওয়া বট ছাড়াই ব্রাউজার-ভিত্তিক রেকর্ডিং টুলের পাশে চলতে পারে:
- Riverside.fm
- StreamYard
- Zoom
- Google Meet
- Cleanfeed
- Zencastr
- অন্য যেকোনো ব্রাউজার-ভিত্তিক রেকর্ডিং প্ল্যাটফর্ম
এটি সরাসরি মাইক্রোফোন অডিওও ক্যাপচার করে, যা একক রেকর্ডিং সেটআপ, মুখোমুখি আলাপ, বা লাইভ অডিয়েন্স Q&A-র জন্য উপকারী, যেখানে আলাদা কোনো ভিডিও প্ল্যাটফর্ম জড়িত নেই। আপনার অতিথিরা কোনো মিটিং বট দেখেন না, কারণ MirrorCaption সেশনে যোগ দিচ্ছে না। পূর্ণ ট্যাব বা সিস্টেম-অডিও ক্যাপচারের জন্য ডেস্কটপ Chrome বা Edge ব্যবহার করুন; Safari, Firefox, এবং মোবাইল ব্রাউজারে রেকর্ডিংয়ের জন্য নির্ভর করার আগে আপনার কাঙ্ক্ষিত অডিও মোড পরীক্ষা করে নিন।
এক ক্লিকে রেকর্ডিং থেকে শো নোটে
একটি ম্যান্ডারিন-ভাষার ব্যক্তিগত অর্থনীতি শোতে শো নোট প্রোডাকশনের সবচেয়ে ধীর অংশ হয়ে উঠতে পারে: ৪০ মিনিটের এপিসোড স্ক্রাব করে টাইমস্ট্যাম্প ও উদ্ধৃতিযোগ্য মুহূর্ত খুঁজে বের করা, তারপর আন্তর্জাতিক শ্রোতাদের জন্য সেরা লাইনগুলো ইংরেজিতে অনুবাদ করা।
লাইভ ট্রান্সক্রিপ্ট এই ওয়ার্কফ্লো বদলে দেয়। সেশন থামলে, MirrorCaption টাইমস্ট্যাম্প ও স্পিকার লেবেলসহ একটি Markdown ট্রান্সক্রিপ্ট এক্সপোর্ট করতে পারে, এবং অনুবাদ চালু থাকলে অনূদিত টেক্সটও দেয়। প্রযোজক এটি Notion-এ পেস্ট করতে পারেন, AI summary-কে শুরু হিসেবে ব্যবহার করতে পারেন, এবং raw audio timeline-এর বদলে টেক্সট থেকে শো নোট এডিট করতে পারেন।
এক্সপোর্ট ফরম্যাট: Markdown, plain text, এবং copy-to-clipboard। স্পিকার লেবেল স্বয়ংক্রিয়ভাবে অন্তর্ভুক্ত থাকে। প্রতিটি সেগমেন্টে একটি টাইমস্ট্যাম্প থাকে। AI-জেনারেটেড summary উপরে আলাদা ব্লকে দেখা যায়।
আপনার ব্রাউজারে MirrorCaption খুলুন। ফ্রি টিয়ারে ১ ঘণ্টা অন্তর্ভুক্ত, এককালীন, কোনো ক্রেডিট কার্ড প্রয়োজন নেই।
পডকাস্ট ট্রান্সক্রিপশন সফটওয়্যারের তুলনা
এই ক্যাটাগরির বেশিরভাগ টুলই তাদের কাজ সত্যিই ভালোভাবে করে। যদি আপনার অগ্রাধিকার এডিটিং হয়, তাহলে Descript-এর পোস্ট-প্রোডাকশন এডিটর, ভিজ্যুয়াল waveform, overdub, এবং filler-word removal শক্তিশালী। Castmagic রেকর্ড করা মিডিয়া থেকে সোশ্যাল ক্লিপ এবং repurposed content তৈরিতে শক্তিশালী। গতি অপেক্ষা যাচাইকৃত নির্ভুলতা বেশি গুরুত্বপূর্ণ হলে Rev-এর human transcription tier উপকারী।
লাইভ এবং বহুভাষিক পডকাস্ট ওয়ার্কফ্লোতে MirrorCaption যেখানে আলাদা:
| টুল | মূল্য | সাধারণ ওয়ার্কফ্লো | ভাষাগত অবস্থান | সেরা ব্যবহার |
|---|---|---|---|---|
| Descript Pro | $24/mo billed annually | রেকর্ড/ইম্পোর্ট, তারপর ট্রান্সক্রিপ্ট এডিট | ২৫টি ট্রান্সক্রিপশন ভাষা | ভিডিও এবং পডকাস্ট এডিটিং |
| Castmagic | $79/mo billed annually | আপলোড বা ইম্পোর্ট, তারপর অ্যাসেট তৈরি | বহুভাষিক ট্রান্সক্রিপশন | AI কনটেন্ট repurposing |
| Otter.ai | $16.99/mo monthly | লাইভ মিটিং নোট এবং ইম্পোর্ট | বহুভাষিক সমর্থন, মিটিং-কেন্দ্রিক | মিটিং নোট |
| Rev (AI) | $0.25/min | আপলোড বা রেকর্ড, তারপর ট্রান্সক্রিপ্ট গ্রহণ | পেইড টিয়ারে একাধিক ভাষা | নির্ভুল আর্কাইভ ট্রান্সক্রিপ্ট |
| MirrorCaption | €49 once | রেকর্ডিং চলাকালীন লাইভ ব্রাউজার-ট্যাব বা মাইক ট্রান্সক্রিপ্ট | অনুবাদসহ ৬০+ ভাষা | লাইভ রেকর্ডিং + দ্বিভাষিক শো |
আপনার শো যদি শুধু ইংরেজিভাষী হয় এবং আপনি রেকর্ডিংয়ের পরে বেশিরভাগ প্রোডাকশন কাজ করেন, তাহলে Descript একটি শক্তিশালী পছন্দ। MirrorCaption একটি ভিন্ন ওয়ার্কফ্লো এবং ভিন্ন শ্রোতাকে লক্ষ্য করে: যারা রেকর্ডিং চলাকালেই ট্রান্সক্রিপ্ট চান, এবং যারা বহুভাষিক শো চালান। Otter-এর সঙ্গে ফিচারভিত্তিক পূর্ণ তুলনার জন্য দেখুন MirrorCaption vs Otter.ai।
বহুভাষিক পডকাস্ট: লাইভ ট্রান্সক্রিপশন কোথায় সাহায্য করে
ইউরোপের স্টার্টআপ সংস্কৃতি নিয়ে একটি জার্মান-ইংরেজি পডকাস্ট ভাবুন। প্রতিটি এপিসোডে একজন জার্মানভাষী প্রতিষ্ঠাতা এবং একজন ইংরেজিভাষী বিনিয়োগকারী থাকেন। কথোপকথন জুড়ে ভাষা বদলায়, কখনও বাক্যের মাঝখানেও।
পোস্ট-প্রোডাকশন ওয়ার্কফ্লোতে প্রায়ই এপিসোড রেকর্ড করা, একটি ট্রান্সক্রিপ্ট তৈরি করা, ভাষা বদলেছে এমন অংশগুলো খুঁজে বের করা, তারপর দ্বিতীয় কোনো টুল বা ম্যানুয়াল অনুবাদ প্রক্রিয়ায় সেগুলো ঠিক করা লাগে। একবার এই পরিষ্কার-পরিচ্ছন্নতা করা যায়, কিন্তু প্রতিটি এপিসোডে code-switching থাকলে এটি পুনরাবৃত্তিমূলক হয়ে যায়।
MirrorCaption-এ অনুবাদ চালু থাকলে রেকর্ডিং চলাকালীনই ট্রান্সক্রিপ্ট স্ট্রিম হয়, এবং মূল বক্তব্য ও অনুবাদ পাশাপাশি দেখা যায়। যখন কোনো অতিথি বাক্যের মাঝখানে "We're still very early" থেকে "Wir sind noch sehr früh"-এ চলে যান, লাইভ ভিউ অনুবাদের প্রসঙ্গ দৃশ্যমান রাখে। সেশন শেষ হলে, মূল এবং অনূদিত টেক্সট একই সেশন এক্সপোর্টে পাওয়া যায়।
Spanish/English, Mandarin/English, German/English, এবং Japanese/English-এর মতো দ্বিভাষিক পডকাস্ট ফরম্যাট এমন একটি ওয়ার্কফ্লো সমস্যা তৈরি করে, যা একভাষিক ট্রান্সক্রিপ্ট ভালোভাবে সমাধান করতে পারে না। MirrorCaption এই লাইভ দ্বিভাষিক ভিউকে কেন্দ্র করে তৈরি। ভাষা-জোড়া জুড়ে প্রধান টুলগুলো কীভাবে কাজ করে তার পূর্ণ বিশ্লেষণের জন্য আমাদের বহুভাষিক ট্রান্সক্রিপশন গাইড দেখুন।
দ্বিভাষিক এপিসোডের জন্য পাশাপাশি ট্রান্সক্রিপ্ট
MirrorCaption-এর ডেস্কটপ ভিউতে মূল বক্তব্য এবং অনুবাদ সমান্তরাল কলামে দেখা যায়। প্রতিটি অনূদিত শব্দ তার উৎস শব্দের সঙ্গে লিঙ্ক হতে পারে, তাই আপনি কোনো শব্দে ট্যাপ করে মূল বাক্যাংশ দেখতে পারেন। অনুবাদের পাশাপাশি মূল ভাষাও রাখতে চান এমন ভাষা-শেখার পডকাস্টের জন্য, এই পাশাপাশি ফরম্যাট কথোপকথন চলাকালেই আপনাকে দুই কলাম দেয়।
একাধিক ফরম্যাটে প্রকাশ করা কনটেন্ট ক্রিয়েটরদের ক্ষেত্রেও একই লাইভ দ্বিভাষিক ওয়ার্কফ্লো প্রযোজ্য: একটি এপিসোডের ইংরেজি এবং স্প্যানিশ সংস্করণ এক রেকর্ডিং সেশন এবং এক্সপোর্ট থেকেই শুরু হতে পারে। কনটেন্ট ক্রিয়েটরদের জন্য ট্রান্সক্রিপশন কীভাবে YouTube এবং লাইভ স্ট্রিম ওয়ার্কফ্লোতে এটি প্রয়োগ করে, তা দেখুন।
তিন ধাপে শুরু করুন
- আপনার ব্রাউজারে mirrorcaption.com খুলুন। কোনো ডাউনলোড বা এক্সটেনশন প্রয়োজন নেই। পূর্ণ ট্যাব/সিস্টেম-অডিও ক্যাপচারের জন্য ডেস্কটপ Chrome বা Edge ব্যবহার করুন। শুধু মাইক্রোফোন সেশনের জন্য সমর্থিত ডেস্কটপ বা মোবাইল ব্রাউজার ব্যবহার করুন।
- প্রম্পট এলে আপনার রেকর্ডিং টুলের ব্রাউজার ট্যাব শেয়ার করুন। MirrorCaption আপনার মাইক্রোফোনের পাশাপাশি ট্যাব অডিও ক্যাপচার করে। আপনি যদি শুধু মাইক দিয়ে একা রেকর্ড করেন, তাহলে microphone mode নির্বাচন করুন। সেশনে কেউ কোনো নোটিফিকেশন দেখে না।
- start চাপুন। ট্রান্সক্রিপ্ট সঙ্গে সঙ্গে, শব্দে শব্দে, 500ms-এর কম latency-তে স্ট্রিম হয়। স্পিকার স্বয়ংক্রিয়ভাবে লেবেল করা হয়। stop করার পর, টাইমস্ট্যাম্প এবং স্পিকার লেবেলসহ সম্পূর্ণ ট্রান্সক্রিপ্ট Markdown বা plain text হিসেবে এক্সপোর্ট করুন।
ফ্রি টিয়ারে ১ ঘণ্টা ট্রান্সক্রিপশন অন্তর্ভুক্ত, এককালীন, কোনো ক্রেডিট কার্ড প্রয়োজন নেই। এটি যথেষ্ট একটি ছোট এপিসোড বা লাইভ সেগমেন্ট পরীক্ষা করার জন্য এবং কোনো কিছুর প্রতিশ্রুতি দেওয়ার আগে রিয়েল-টাইম ওয়ার্কফ্লো আপনার প্রোডাকশন প্রক্রিয়ার সঙ্গে মানানসই কি না তা মূল্যায়ন করার জন্য।
ফ্রি টিয়ার: ১ ঘণ্টা, এককালীন। কোনো ক্রেডিট কার্ড নয়। আপনার পরের রেকর্ডিংয়ের আগে একটি ছোট লাইভ টেস্টের জন্য সেরা।
মূল্য: €49 একবার বনাম সাবস্ক্রিপশন টুল
অনেক পডকাস্ট ট্রান্সক্রিপশন এবং repurposing টুল মাসিক বা বার্ষিক সাবস্ক্রিপশনে চলে। গড় ব্যবহারে, সপ্তাহে এক থেকে দুই ঘণ্টা রেকর্ডিং হলে, ফিচার তালিকার মতোই সাবস্ক্রিপশনও গুরুত্বপূর্ণ হয়ে উঠতে পারে।
| প্ল্যান | মাসিক খরচ | বার্ষিক খরচ | অন্তর্ভুক্ত ঘণ্টা | ভাষা |
|---|---|---|---|---|
| Descript Pro | $24/mo | $288/yr | 30h/mo | ২৫টি ট্রান্সক্রিপশন ভাষা |
| Castmagic Starter | $79/mo | $948/yr | 20h/mo | বহুভাষিক ট্রান্সক্রিপশন |
| Otter.ai Pro | $16.99/mo | $99.96-$203.88/yr | 1,200 min/mo | বহুভাষিক সমর্থন |
| MirrorCaption Annual | €2.42/mo | €29/yr | 100h | 60+ |
| MirrorCaption Lifetime | €0 after purchase | €49 once | 200h | 60+ |
সপ্তাহে একটি ৫০ মিনিটের এপিসোড রেকর্ড করার গতিতে, ২০০ ঘণ্টা প্রায় সাড়ে চার বছরের সেশন কভার করে। এরপর Voice Pack দিয়ে সাবস্ক্রিপশন বা মাসিক প্রতিশ্রুতি ছাড়াই ঘণ্টা বাড়ানো যায়।
আপনি যদি মাসিক সাবস্ক্রিপশনের সঙ্গে তুলনা করেন, তাহলে প্ল্যান এবং বিনিময় হারের ওপর নির্ভর করে এককালীন কেনাকাটা সাধারণত প্রায় এক থেকে তিন মাসের মধ্যে উঠে আসে। আপনি যদি বার্ষিক সিট কেনেন, তাহলে নবায়নের তারিখ এবং অন্তর্ভুক্ত মিনিটের সঙ্গে তুলনা করুন। বছরে ছয় থেকে আটটি এপিসোড তৈরি করা অনিয়মিত পডকাস্টারদের জন্য, পুনরাবৃত্ত সাবস্ক্রিপশন এড়ানো বড় মাসিক কোটা থাকার চেয়ে বেশি গুরুত্বপূর্ণ হতে পারে।
-
রিয়েল-টাইম স্ট্রিমিং ট্রান্সক্রিপশন, Soniox WebSocket STT-এর মাধ্যমে 500ms-এর কম latency-তে শব্দে শব্দে আউটপুট। আপনার অতিথি কথা বলতেই থাকলে পড়া যায়।
-
অনুবাদসহ ৬০+ ভাষা, Mandarin, Cantonese, Japanese, Korean, Arabic, Spanish, French, German, Hindi, Portuguese, এবং আরও ৫০+। দ্বিভাষিক শো নেটিভভাবে সামলানো হয়।
-
স্বয়ংক্রিয় স্পিকার শনাক্তকরণ, ভিন্ন ভিন্ন কণ্ঠ স্বয়ংক্রিয়ভাবে লেবেল করা হয়। এক্সপোর্টের আগে ট্রান্সক্রিপ্টে স্পিকারদের নাম বদলান।
-
AI-জেনারেটেড summary, সেশন এগোতে থাকলে একটি কাঠামোবদ্ধ summary রিফ্রেশ হয়। তা ট্রান্সক্রিপ্টের সঙ্গে এক্সপোর্ট করে সঙ্গে সঙ্গে শো নোট পান।
-
MirrorCaption-এ অডিও সংরক্ষণ নেই, প্রসেসিংয়ের জন্য অডিও আপনার ব্রাউজার থেকে ট্রান্সক্রিপশন অবকাঠামোতে স্ট্রিম হয়। আপনি export বা copy না করা পর্যন্ত ট্রান্সক্রিপ্ট আপনার ব্রাউজারের local storage-এ থাকে। MirrorCaption বিলিংয়ের জন্য ব্যবহার মিনিট লগ করে, ট্রান্সক্রিপ্টের বিষয়বস্তু নয়।
-
ব্রাউজার-ভিত্তিক ওয়ার্কফ্লো, পূর্ণ ট্যাব/সিস্টেম-অডিও ক্যাপচারের জন্য ডেস্কটপ Chrome এবং Edge সুপারিশ করা হয়, আর microphone-only mode হালকা ডেস্কটপ ও মোবাইল ব্যবহারের ক্ষেত্রে সহায়তা করে।
প্রায়শই জিজ্ঞাসিত প্রশ্ন
MirrorCaption কি আগে থেকে রেকর্ড করা অডিও ফাইলের জন্য কাজ করে?
এখনো নয়। MirrorCaption লাইভ সেশনের জন্য তৈরি, এটি ব্রাউজারের getDisplayMedia API-এর মাধ্যমে রিয়েল টাইমে আপনার ব্রাউজার ট্যাব বা মাইক্রোফোন থেকে অডিও ক্যাপচার করে। আপনি যদি একটি সম্পূর্ণ ফাইল ট্রান্সক্রাইব করতে চান, তাহলে Descript বা Rev-এর মতো টুল সেই ওয়ার্কফ্লো ভালোভাবে সামলায়। আপনি যখন রেকর্ডিং চলাকালেই ট্রান্সক্রিপ্ট চান, পরে নয়, তখন MirrorCaption সঠিক পছন্দ।
Riverside বা YouTube Live-এ রেকর্ড করা ভিডিও পডকাস্টে কি এটি ব্যবহার করতে পারি?
হ্যাঁ। আপনি যদি Riverside, StreamYard, বা YouTube Studio-এর মতো ব্রাউজার-ভিত্তিক টুল দিয়ে রেকর্ড করেন, MirrorCaption রিয়েল টাইমে ট্যাব অডিও ক্যাপচার করে। রেকর্ডিং সেশনের সময় আপনি লাইভ ট্রান্সক্রিপ্ট পান। সেশন শেষ হলে, ভিডিও ফাইলের সঙ্গে ট্রান্সক্রিপ্ট এক্সপোর্ট করুন; অতিরিক্ত কোনো প্রসেসিং ধাপ ছাড়াই দুটোই একই সময়ে প্রস্তুত থাকে।
অ-স্থানীয় ইংরেজি বক্তা বা উচ্চারণযুক্ত বক্তৃতার ক্ষেত্রে ট্রান্সক্রিপ্ট কতটা নির্ভুল?
MirrorCaption Soniox streaming STT ব্যবহার করে, এবং আরও অডিও প্রসঙ্গ আসার সঙ্গে আংশিক ফলাফল আপডেট হতে পারে। সাম্প্রতিক প্রসঙ্গের সঙ্গে অনুবাদের মান আরও উন্নত হয়, তাই বাক্যসীমা জুড়ে থাকা শব্দগুলোর জন্য চূড়ান্ত টেক্সট দেখানোর আগে আরও তথ্য উপলভ্য থাকে। খুব বেশি উচ্চারণযুক্ত বা দ্রুত বলা বক্তৃতার ক্ষেত্রে, প্রকাশের আগে আপনাকে অবশ্যই এক্সপোর্টটি পর্যালোচনা করতে হবে।
MirrorCaption কি আমার পডকাস্ট অডিও সংরক্ষণ করে?
MirrorCaption সার্ভারে কোনো পডকাস্ট অডিও সংরক্ষণ করা হয় না। প্রসেসিংয়ের জন্য অডিও আপনার ব্রাউজার থেকে ট্রান্সক্রিপশন অবকাঠামোতে স্ট্রিম হয়, এবং আপনি export বা copy না করা পর্যন্ত ট্রান্সক্রিপ্ট আপনার ব্রাউজারে IndexedDB ব্যবহার করে স্থানীয়ভাবে সংরক্ষিত থাকে। MirrorCaption বিলিংয়ের উদ্দেশ্যে ব্যবহার মিনিট লগ করে, ট্রান্সক্রিপ্টের বিষয়বস্তু নয়। এটি সেই পডকাস্টারদের জন্য উপকারী, যারা সম্পূর্ণ অডিও ফাইল আলাদা কোনো কনটেন্ট লাইব্রেরিতে আপলোড করা এড়াতে চান।
এটি কোন ভাষা সমর্থন করে, এবং বাক্যের মাঝখানে code-switching সামলাতে পারে কি?
MirrorCaption Mandarin, Cantonese, Japanese, Korean, Arabic, Hebrew, Hindi, Russian, Portuguese, Spanish, French, German, এবং Italian-সহ ৬০+ ভাষা সমর্থন করে। code-switching-এর ক্ষেত্রে, যেখানে একজন বক্তা বাক্যের মাঝখানে দুই ভাষার মধ্যে বদলান, MirrorCaption লাইভ সেশনের সময় মূল এবং অনূদিত কলাম দৃশ্যমান রাখে। দ্বিভাষিক পডকাস্ট ফরম্যাটের জন্য এটিই মূল ফিচার: পরিষ্কার-পরিচ্ছন্নতার সময় নয়, কথোপকথন চলাকালেই আপনি ভাষা বদল লক্ষ্য করতে পারেন।
আপনার পরের এপিসোড লাইভ ট্রান্সক্রাইব করুন
১ ঘণ্টা ফ্রি, এককালীন। কোনো ক্রেডিট কার্ড নয়। কোনো ইনস্টলেশন নয়। পূর্ণ রেকর্ডিং-ট্যাব অডিও ক্যাপচারের জন্য ডেস্কটপ Chrome বা Edge ব্যবহার করুন।
Start Free Trial