وارد کردن احساسات در پردازش گفتار

وارد کردن احساسات در پردازش گفتار

وارد کردن احساسات در پردازش گفتار ممکن شد. الکسا همچون انسان دارای قلب شد! شرکت بریتانیایی توانست هوش مصنوعی (هوش‌واره) را بیافریند که می‌تواند همچون انسان با احساساتی ژرف گفتگو کرده و حتی گریه کند.

یک شرکت بریتانیایی هوش مصنوعی (هوش واره) را توسعه داده که می‌تواند همچون یک انسان راستین با احساسات ژرفی گفتگو و هتا گریه نماید. با عامر اندیش همراه باشید تا درباره چگونگی این دستاورد برجسته و دلچسب بیشتر بدانید.

وارد کردن احساسات در پردازش گفتار با به کارگیری از نرم‌افزار سونانتیک (Sonantic)

یاران دیجیتالی که به آنان خو کرده‌ایم، همچون الکسا یا گوگل استیستنت (Google assistant) تمایل به گفتگو با تن یکنواخت دارند بدون آنکه کوچکترین نشانی از احساسات در صدای آنان هویدا باشد.

اگرچه این توناژ گفتگو شاید برای یک دستیار صدا معمولی کافی به نظر می‌رسد، همانند رایانه‌های فلتی که بدان‌ها خو کرده‌ایم، ولی برای تولیدکنندگان آواها و تهیه‌کنندگان بازی‌های ویدیویی و یا فیلم‌ها هیچگاه مناسب نخواهد بود.

اکنون با کمک این فناوری گسترش یافته به وسیله تیم ده نفره‌ در شرکت لندنی سونانتیک (Sonantic)، توانایی خطوط گفتار آواهایی درخور اعتماد و استواری را تنها در چند دقیقه فراهم می‌کند.

ویژگی نرم‌افزار سوناتیک در وارد کردن احساسات در پردازش گفتار

  • این نرم‌افزار سوناتیک (Sonantic) می‌تواند با احساسات ژرف عاطفی به گفتگو ادامه دهد.
  • این کار به دست بازیگران صدا در زمان‌های گوناگون ثبت و ضبط شده است.
  • شرکت‌های فیلم‌سازی می‌توانند از هوش مصنوعی در فرآوری گفتار تنها در ظرف چند دقیقه بهره‌برداری نمایند.
  • به دلیل به کارگیری از صدای بازیگران، هر بار استفاده از این نرم‌افزار توسط شرکت‌ها یا اشخاص، حق امتیازی به آنان اهدا می‌شود.

این نرم‌افزار می‌تواند صدای خود را با ویژگی‌های گوناگونی (از ترس و بیم گرفته تا غم و اندوده وهتا نفس نفس زدن) منتشر کند.

برپایه گفته‌های زینا قریشی، مدیر و گرداننده اجرایی سونانتیک، صداهایی بیش از اندازه واقع‌‌گرایانه‌ای به دست این هوش مصنوعی آفریده شده است. برخلاف دیگر شرکت‌های تبدیل کننده گفتار به نوشتار، رویکرد و نگاه این شرکت به تیزنگر‌ی‌ها و نکات پنهان و ریز در تولید آواست.

برای آفرینش هر آوایی جداگانه، از بازیگرانی گوناگون کمک گرفته می‌شود تا هر آوایی را با شدت و سختی و احساساتی گوناگون ضبط و ثبت نمایند. بدین ترتیب، وارد کردن احساسات در پردازش گفتار در این هوش مصنوعی ممکن شده است و این فناوری می‌تواند هر آوای درخواستی را با احساساتی مختلفی بیان دارد.

زمانی‌که شرکت‌های فیلم‌سازی با تولیدکنندگان بازی‌های ویدیویی از صداهای شرکت سونانتیک استفاده نمایند، به ناچار به پرداخت حق امتیاز به بازیگرانی هستند که از صدای آنان بهره‌بردای شده است.

استفاده از فناوری آنالیز گفتار در کسب‌وکارها
استفاده از فناوری آنالیز گفتار در کسب‌وکارها

براساس گفته‌های خانم قریشی به روزنامه تایمز، “فرآوری خطوط آوا یا صدا، کاری سنگین و پرهزینه‌ای به شمار می‌آید. زیرا برای انجام آن به بازیگران، ویراستارها، کارگردان‌ها، استادیوهای کتاب و انجام چندین و چند کار تکراری نیاز است که همگی آنان نیازمند پرداخت هزینه‌هایی جداگانه است.”

وی همچنین اینگونه به گفته‌های خود را اینگونه دنبال نمود که با وارد کردن احساسات در پردازش گفتار، ما می‌توانیم زمان نیازین برای انجام این مهم را برای شرکت‌ها، از چندین ماه تنها به چند دقیقه کاهش دهیم و شرکت‌ها یا هتا افراد را از انجام همگی این تدارک هزینه‌بر و وقت‌گیر نجات دهیم.

یکی از کلیدی‌ترین فایده‌ی این سامانه بر به کارگیری بازیگران آوایی معمولی در زمانی است که در لحظه آخر، به اعمال دگرگونی‌هایی نیاز باشد. زیرا در صورت به کارگیری از بازیگران، برای اعمال چنین دگرگونی‌هایی باید دوباره از ابتدا عمل ضبط انجام شود که فرایندی وقت‌گیر خواهد بود. درحالیکه با کمک این هوش، اعمال چنین دگرگونی‌هایی تنها در کمتر از چند دقیقه شدنی خواهد بود.

برپایه گفته‌های جان فلین (John Flynn)، گرداننده و مدیر ارشد فناوری شرکت سونانتیک (Sonantic) به گاهنامه تایمز: ما در حال یادگیری ژرفی برای تمرکز بر روی المان‌های ماکرو هستیم تا وارد کردن احساسات در پردازش گفتار را به صورت کامل و جامعی انجام دهیم. به گونه‌ای که تا تمامی احساساتی مانند غم و اندوه، شادی و هیجان، پریشانی و اندوهگینی، شتاب و نفس نفس زدن و دیگر نکته‌هایی این چنین را به این هوش اضافه نماییم.

بنابراین، اکنون الگوریتمی دردست داریم که تمرکز بر خود را بر روی شیوه تنفس و گونه‌های گوناگون واج‌ها و آواها قرار داده است که ممکن است در هنگام گریه کردن و یا دیگر هیجانات باعث دگرگونی تن گفتار شود. بدین چیدمان با وارد کردن احساسات در پردازش گفتار با کمک فناوری، ما قادریم تا گفتار تن‌های گوناگون آواها بسته به احساسات گوناگون را در دست داشته باشیم.

سخن آخر

برپایه گاهنامه تایمز، با بسته شدن استودیوهای ضبط سنتی در طی تعطیلات، شاهد افزایش درخواست‌ها از این شرکت توسط بسیاری از استودیوی گوناگون تلویزیونی و فیلم‌سازی هستیم که به دنبال راه‌های جایگزین برای تامین صدای کاری مورد نیاز خود هستند.

 

 

 

لینک کوتاه شده : https://amerandish.com/BiNeC
به این مطلب امتیاز دهید
0.0/5

به اشتراک بگذارید

اشتراک گذاری در whatsapp
اشتراک گذاری در telegram
اشتراک گذاری در linkedin
اشتراک گذاری در twitter
اشتراک گذاری در email

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

فارس آوا

تبدیل گفتار به متن

باتاوا

دستیارسازمانی - چت بات

هوشتل

اپراتورهوشمند مرکز تماس

بینایار

درک هوشمند ویدیو و تصویر

_ مطالب مرتبط _