امروزه تعداد بسیار زیادی فایل صوتی و ویدئویی در اینترنت یافت میشود اما متأسفانه، با در نظر گرفتن اینکه 6000 زبان مختلف در دنیا وجود دارد برای اکثر مردم، گوش دادن و درک فایلهایی که به زبان غیر مادری آنها هست اگر نگویم غیر ممکن بلکه کاری سخت و دشوار است برای فهم فایلهای صوتی به زبان دیگر نیازمند سالها تلاش برای یادگیری زبان مورد نظر است.
ترجمه صوتی چیست؟
زمانی که اسم ترجمه صوتی میآید اکثر مردم به یاد اپلیکیشنهای مترجم صوتی و سخنگو میافتن ولی ترجمه صوتی محدود به تبدیل ویس به متن نیست، یکی از اصلی ترین کاربردهای ترجمه صوتی: تبدیل زبان صوتی یا ویدئویی ضبط شده به زبان قابل فهم برای مخاطب است.
ترجمه صوتی چگونه کار میکند؟
معمولا نحوه عملکرد نرم افزارهای ترجمه صوتی به سه بخش تقسیم میشود. هوش مصنوعی در هر سه بخش نقش کلیدی دارد و میتواند به طور مستقیم بر روی دقت سیستم اثر بگذارد. این سه بخش عبارتند از:
- تشخیص گفتار: فناوری ASR یا بازشناسی گفتار، وظیفه تبدیل صدای فایل ورودی به متن را دارد. (فارسآوا دقیقترین نرم افزار برای تبدیل فایل صوتی فارسی به متن است.)
- ترجمه ماشینی: سیستمهای ترجمه خودکار به کمک تکنولوژیهای یادگیری ماشینی میتواند متنی را به زبان دیگر ترجمه کنند. (مانند سرویس گوگل ترنسلیت)
- تبدیل متن به صدا: بعضی از سرویسهای ترجمه صوتی قادر هستند که متن ترجمه شده را بخوانند.
برای اینکه یک نرم افزار مترجم صوتی به درستی کار کند، باید حداقل فناور تشخیص گفتار و ترجمه ماشینی را درون خود داشته باشد یعنی فناوری تبدیل متن به صدا، به اندازه دو فناوری دیگر از اهمیت بالای برخودار نیست.
آینده ترجمه خودکار
امروزه شاید دقت سرویسهای ترجمه فیلم و فایل صوتی در حد انتظار نباشد ولی ما در جهانی زندگی میکنیم که هوش مصنوعی به طور باور نکردنی در حال تغییر آن است. پیشرفتهای باورنکردنی در پزشکی و فناوریهای در حال گسترش وسایل نقلیه خودران؛ نوید آینده رو به ما میدهد که هوش مصنوعی بخشی جدا نشدنی از آن است. ترجمه خودکار از نوع گفتاری و نوشتاری به لطف ظهور شبکههای عصبی و یادگیری ماشینی پیشرفت زیادی کرده است و دور از انتظار نیست که در سالهای پیش رو دقت سرویسهای ترجمه صوتی به طور چشم گیری بهبود یابد.