فناوری تشخیص گفتار گوگل ، پروژه جدید این شرکت برای کمک به افراد با معولیت‌های ویژه گفتاری

آیا به دنبال تنظیم برنامه قرار ملاقات هستید؟ از تلفن همراه خود سوال کنید. نیاز دارید تا چراغ اتاق خود را خاموش کنید؟ گوگل هوم (google home) اینکار را برای شما انجام خواهد داد. با عامر اندیش تا انتها همراه باشید تا درباره پروژ] جدید گوگل اطلاعات جالبی کسب کنید.

فناوری تشخیص گفتار گوگل برای کمک به افراد با معلولیت‌های گفتاری

اکنون سیستم‌های عمل‌کننده‌ صوتی (voice-activated) به لطف توانایی خود در خودکارسازی و ساده کردن کارهای دنیوی، محبوبیت زیادی در بین مصرف کنندگان کسب کرده‌اند.

این همان انگیزه لازم برای گوگل برای توسعه برنامه خوب اجتماعی خود تحت تام google Euphonia بود. این برنامه، یک برنامه عالی برای افرادی است که ناشنوایند یا از مشکلاتی مانند مولتیپل اسکلروزیس، پارکینسون، سکته مغزی و یا از شرایط عصبی مانند ALS در رنج‌اند.

این انگیزه‌ای برای پروژه تازه تاسیس Google Euphonia ، بخشی از برنامه هوش مصنوعی این شرکت برای برنامه‌های خوب اجتماعی است. درحقیقت پروژه Euphonia (یوفونیا)، پروژه جدید فناوری تشخیص گفتار گوگل است که در آن، اعضای تیم پروژه در حال بررسی راه‌های بهبود گفتار برای افرادی که ناشنوا هستند یا دارای شرایط عصبی مانند ALS ، سکته مغزی ، پارکینسون ، مولتیپل اسکلروزیس یا آسیب دیدگی مغزی هستند.

برای دست‌یابی به این مهم، گوگل با کمک سازمان معتبر توسعه درمان ALS (ALS therapy (Development Institue شروع به جمع‌آوری نمونه‌های صوتی ضبط شده از افرادی کرد که بیماری‌های عصبی دارند و از مشکلات شدید گفتاری و تحرک در رنج‌اند.

برای افرادی با شرایط عصبی، سامانه‌های voice-activated نقش مهمی در انجام وظایف هر روزه آنان و گفت‌وگو با همکاران، پرستارانشان و یا افرادی که دوستشان دارند، بازی می‌می‌کند. شما می‌توانید لامپ اتاق خود را روشن کنید، موزیک پخش نمایید یا با دیگران به راحتی گفت‌وگو نمایید. تمامی این کارها زمانی شدنی است که تکنولوژی توانایی درک صدا و زبان ما و ترجمه آن به زبانی باشد که خود آن را می‌فهمد.

فناوری تشخیص گفتار گوگل از الگوریتم‌های یادگیری ماشین که به آموزش داده‌های گسترده نیاز دارند، استفاده می کند. گوگل اعلام کرده است که از صدها هزار، یا هتا میلیون‌ها جملاتی که مردم خوانده‌اند، به عنوان نمونه‌هایی برای الگوریتم‌هایی برای یادگیری ماشین استفاده کرده تا بتواند هر کدام از این جملات را تشخیص دهد. اما همه اینان برای افرادی که مشلات گفتاری دارند، کافی نیست.

با پروژه Euphonia (یوفونیا)، تیم از نمونه‌های صوتی از افراد با اختلالات گفتاری استفاده خواهد کرد، به این امید که شاید ماشین  بتواند دستوراتی که شفاف بیان نمی‌شوند، کاملا متوجه شود.

درحالی‌که هدف، آفرینش فناوری است که بیشتر و بیشتر در دسترس افرادی با مشکلات گفتاری باشد، اما هنوز نتیجه نهایی نامشخص است.

هدف نهایی فناوری تشخیص گفتار گوگل ، فراهم نمودن مدل‌هایی در دسترس است تا برای افرادی که با مشکلات ALS و دیگر مشکلات پزشکی دست‌وپنجه نرم می‌کنند، به خوبی کار کند. این امکان وجود دارد که ماشین متوجه گفتار افرادی دارای مشکل ALS که قادر به صحبت به صورت شفاف و واضح نیستند، شود. در این مورد، ممکن است که احتیاج به پیاده‌سازی سطحی از شخصی‌سازی باشد. این بدان معنا خواهد بود که  هر شخص مدل مخصوص خود را در اختیار خواهد داشت.

فناوری تشخیص گفتار گوگل به دلیل مجموعه داده‌های بزرگی که برای آموزش در دسترس بوده است، می تواند تقریباً هر دستور صوتی افراد بدون اختلال گفتار را درک نماید. اما یک عدم اطمینانی درباره چگونگی فناوری تشخیص گفتار قادر به درکمستقیم  و انجام دستوارت افرادی است که در صحبت کردن با مشکل روبه‌رویند. تیم پروژه Euphonia نمونه‌های گفتاری محدودی از افرادی در دست دارند که با موانع گفتاری دست‌وپنجه نرم می‌کنند. چنین منابع محدودی، تنها اجازه تمرکز بر واژگان یا اصطلاحات ویژه‌ای مانند “کتاب را برایم بخوان” یا “چراغ‌ها را خاموش کن” می‌دهد.

با توجه به جزییات این پروژه که توسط مدیرعامل گوگل، ساندار پیچای (Sundar Pichai) در ماه می 2020 فارش گردید، گرچه ده‌ها هزار عبارت و اصطلاح ضبط شده در دسترس است، ولی برای موفقیت به صدها هزار فایل صوتی نیاز است.

لینک کوتاه شده : https://amerandish.com/LzMpn

به اشتراک بگذارید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

فارس آوا

تبدیل گفتار به متن

باتاوا

دستیارسازمانی - چت بات

هوشتل

اپراتورهوشمند مرکز تماس

_ مطالب مرتبط _

درخواست شما با موفقیت ارسال شد.

ضمن تشکر بابت ارسال پیام، در سریع‌ترین زمان ممکن کارشناسان شرکت عامراندیش درخواست شما را بررسی خواهند نمود.