وارد کردن احساسات در پردازش گفتار ممکن شد. الکسا همچون انسان دارای قلب شد! شرکت بریتانیایی توانست هوش مصنوعی (هوشواره) را بیافریند که میتواند همچون انسان با احساساتی ژرف گفتگو کرده و حتی گریه کند.
یک شرکت بریتانیایی هوش مصنوعی (هوش واره) را توسعه داده که میتواند همچون یک انسان راستین با احساسات ژرفی گفتگو و هتا گریه نماید. با عامر اندیش همراه باشید تا درباره چگونگی این دستاورد برجسته و دلچسب بیشتر بدانید.
وارد کردن احساسات در پردازش گفتار با به کارگیری از نرمافزار سونانتیک (Sonantic)
یاران دیجیتالی که به آنان خو کردهایم، همچون الکسا یا گوگل استیستنت (Google assistant) تمایل به گفتگو با تن یکنواخت دارند بدون آنکه کوچکترین نشانی از احساسات در صدای آنان هویدا باشد.
اگرچه این توناژ گفتگو شاید برای یک دستیار صدا معمولی کافی به نظر میرسد، همانند رایانههای فلتی که بدانها خو کردهایم، ولی برای تولیدکنندگان آواها و تهیهکنندگان بازیهای ویدیویی و یا فیلمها هیچگاه مناسب نخواهد بود.
اکنون با کمک این فناوری گسترش یافته به وسیله تیم ده نفره در شرکت لندنی سونانتیک (Sonantic)، توانایی خطوط گفتار آواهایی درخور اعتماد و استواری را تنها در چند دقیقه فراهم میکند.
ویژگی نرمافزار سوناتیک در وارد کردن احساسات در پردازش گفتار
- این نرمافزار سوناتیک (Sonantic) میتواند با احساسات ژرف عاطفی به گفتگو ادامه دهد.
- این کار به دست بازیگران صدا در زمانهای گوناگون ثبت و ضبط شده است.
- شرکتهای فیلمسازی میتوانند از هوش مصنوعی در فرآوری گفتار تنها در ظرف چند دقیقه بهرهبرداری نمایند.
- به دلیل به کارگیری از صدای بازیگران، هر بار استفاده از این نرمافزار توسط شرکتها یا اشخاص، حق امتیازی به آنان اهدا میشود.
این نرمافزار میتواند صدای خود را با ویژگیهای گوناگونی (از ترس و بیم گرفته تا غم و اندوده وهتا نفس نفس زدن) منتشر کند.
برپایه گفتههای زینا قریشی، مدیر و گرداننده اجرایی سونانتیک، صداهایی بیش از اندازه واقعگرایانهای به دست این هوش مصنوعی آفریده شده است. برخلاف دیگر شرکتهای تبدیل کننده گفتار به نوشتار، رویکرد و نگاه این شرکت به تیزنگریها و نکات پنهان و ریز در تولید آواست.
برای آفرینش هر آوایی جداگانه، از بازیگرانی گوناگون کمک گرفته میشود تا هر آوایی را با شدت و سختی و احساساتی گوناگون ضبط و ثبت نمایند. بدین ترتیب، وارد کردن احساسات در پردازش گفتار در این هوش مصنوعی ممکن شده است و این فناوری میتواند هر آوای درخواستی را با احساساتی مختلفی بیان دارد.
زمانیکه شرکتهای فیلمسازی با تولیدکنندگان بازیهای ویدیویی از صداهای شرکت سونانتیک استفاده نمایند، به ناچار به پرداخت حق امتیاز به بازیگرانی هستند که از صدای آنان بهرهبردای شده است.
براساس گفتههای خانم قریشی به روزنامه تایمز، “فرآوری خطوط آوا یا صدا، کاری سنگین و پرهزینهای به شمار میآید. زیرا برای انجام آن به بازیگران، ویراستارها، کارگردانها، استادیوهای کتاب و انجام چندین و چند کار تکراری نیاز است که همگی آنان نیازمند پرداخت هزینههایی جداگانه است.”
وی همچنین اینگونه به گفتههای خود را اینگونه دنبال نمود که با وارد کردن احساسات در پردازش گفتار، ما میتوانیم زمان نیازین برای انجام این مهم را برای شرکتها، از چندین ماه تنها به چند دقیقه کاهش دهیم و شرکتها یا هتا افراد را از انجام همگی این تدارک هزینهبر و وقتگیر نجات دهیم.
یکی از کلیدیترین فایدهی این سامانه بر به کارگیری بازیگران آوایی معمولی در زمانی است که در لحظه آخر، به اعمال دگرگونیهایی نیاز باشد. زیرا در صورت به کارگیری از بازیگران، برای اعمال چنین دگرگونیهایی باید دوباره از ابتدا عمل ضبط انجام شود که فرایندی وقتگیر خواهد بود. درحالیکه با کمک این هوش، اعمال چنین دگرگونیهایی تنها در کمتر از چند دقیقه شدنی خواهد بود.
برپایه گفتههای جان فلین (John Flynn)، گرداننده و مدیر ارشد فناوری شرکت سونانتیک (Sonantic) به گاهنامه تایمز: ما در حال یادگیری ژرفی برای تمرکز بر روی المانهای ماکرو هستیم تا وارد کردن احساسات در پردازش گفتار را به صورت کامل و جامعی انجام دهیم. به گونهای که تا تمامی احساساتی مانند غم و اندوه، شادی و هیجان، پریشانی و اندوهگینی، شتاب و نفس نفس زدن و دیگر نکتههایی این چنین را به این هوش اضافه نماییم.
بنابراین، اکنون الگوریتمی دردست داریم که تمرکز بر خود را بر روی شیوه تنفس و گونههای گوناگون واجها و آواها قرار داده است که ممکن است در هنگام گریه کردن و یا دیگر هیجانات باعث دگرگونی تن گفتار شود. بدین چیدمان با وارد کردن احساسات در پردازش گفتار با کمک فناوری، ما قادریم تا گفتار تنهای گوناگون آواها بسته به احساسات گوناگون را در دست داشته باشیم.
سخن آخر
برپایه گاهنامه تایمز، با بسته شدن استودیوهای ضبط سنتی در طی تعطیلات، شاهد افزایش درخواستها از این شرکت توسط بسیاری از استودیوی گوناگون تلویزیونی و فیلمسازی هستیم که به دنبال راههای جایگزین برای تامین صدای کاری مورد نیاز خود هستند.