آیا به دنبال تنظیم برنامه قرار ملاقات هستید؟ از تلفن همراه خود سوال کنید. نیاز دارید تا چراغ اتاق خود را خاموش کنید؟ گوگل هوم (google home) اینکار را برای شما انجام خواهد داد. با عامر اندیش تا انتها همراه باشید تا درباره پروژ] جدید گوگل اطلاعات جالبی کسب کنید.
فناوری تشخیص گفتار گوگل برای کمک به افراد با معلولیتهای گفتاری
اکنون سیستمهای عملکننده صوتی (voice-activated) به لطف توانایی خود در خودکارسازی و ساده کردن کارهای دنیوی، محبوبیت زیادی در بین مصرف کنندگان کسب کردهاند.
این همان انگیزه لازم برای گوگل برای توسعه برنامه خوب اجتماعی خود تحت تام google Euphonia بود. این برنامه، یک برنامه عالی برای افرادی است که ناشنوایند یا از مشکلاتی مانند مولتیپل اسکلروزیس، پارکینسون، سکته مغزی و یا از شرایط عصبی مانند ALS در رنجاند.
این انگیزهای برای پروژه تازه تاسیس Google Euphonia ، بخشی از برنامه هوش مصنوعی این شرکت برای برنامههای خوب اجتماعی است. درحقیقت پروژه Euphonia (یوفونیا)، پروژه جدید فناوری تشخیص گفتار گوگل است که در آن، اعضای تیم پروژه در حال بررسی راههای بهبود گفتار برای افرادی که ناشنوا هستند یا دارای شرایط عصبی مانند ALS ، سکته مغزی ، پارکینسون ، مولتیپل اسکلروزیس یا آسیب دیدگی مغزی هستند.
برای دستیابی به این مهم، گوگل با کمک سازمان معتبر توسعه درمان ALS (ALS therapy (Development Institue شروع به جمعآوری نمونههای صوتی ضبط شده از افرادی کرد که بیماریهای عصبی دارند و از مشکلات شدید گفتاری و تحرک در رنجاند.
برای افرادی با شرایط عصبی، سامانههای voice-activated نقش مهمی در انجام وظایف هر روزه آنان و گفتوگو با همکاران، پرستارانشان و یا افرادی که دوستشان دارند، بازی میمیکند. شما میتوانید لامپ اتاق خود را روشن کنید، موزیک پخش نمایید یا با دیگران به راحتی گفتوگو نمایید. تمامی این کارها زمانی شدنی است که تکنولوژی توانایی درک صدا و زبان ما و ترجمه آن به زبانی باشد که خود آن را میفهمد.
فناوری تشخیص گفتار گوگل از الگوریتمهای یادگیری ماشین که به آموزش دادههای گسترده نیاز دارند، استفاده می کند. گوگل اعلام کرده است که از صدها هزار، یا هتا میلیونها جملاتی که مردم خواندهاند، به عنوان نمونههایی برای الگوریتمهایی برای یادگیری ماشین استفاده کرده تا بتواند هر کدام از این جملات را تشخیص دهد. اما همه اینان برای افرادی که مشلات گفتاری دارند، کافی نیست.
با پروژه Euphonia (یوفونیا)، تیم از نمونههای صوتی از افراد با اختلالات گفتاری استفاده خواهد کرد، به این امید که شاید ماشین بتواند دستوراتی که شفاف بیان نمیشوند، کاملا متوجه شود.
درحالیکه هدف، آفرینش فناوری است که بیشتر و بیشتر در دسترس افرادی با مشکلات گفتاری باشد، اما هنوز نتیجه نهایی نامشخص است.
هدف نهایی فناوری تشخیص گفتار گوگل ، فراهم نمودن مدلهایی در دسترس است تا برای افرادی که با مشکلات ALS و دیگر مشکلات پزشکی دستوپنجه نرم میکنند، به خوبی کار کند. این امکان وجود دارد که ماشین متوجه گفتار افرادی دارای مشکل ALS که قادر به صحبت به صورت شفاف و واضح نیستند، شود. در این مورد، ممکن است که احتیاج به پیادهسازی سطحی از شخصیسازی باشد. این بدان معنا خواهد بود که هر شخص مدل مخصوص خود را در اختیار خواهد داشت.
فناوری تشخیص گفتار گوگل به دلیل مجموعه دادههای بزرگی که برای آموزش در دسترس بوده است، می تواند تقریباً هر دستور صوتی افراد بدون اختلال گفتار را درک نماید. اما یک عدم اطمینانی درباره چگونگی فناوری تشخیص گفتار قادر به درکمستقیم و انجام دستوارت افرادی است که در صحبت کردن با مشکل روبهرویند. تیم پروژه Euphonia نمونههای گفتاری محدودی از افرادی در دست دارند که با موانع گفتاری دستوپنجه نرم میکنند. چنین منابع محدودی، تنها اجازه تمرکز بر واژگان یا اصطلاحات ویژهای مانند “کتاب را برایم بخوان” یا “چراغها را خاموش کن” میدهد.
با توجه به جزییات این پروژه که توسط مدیرعامل گوگل، ساندار پیچای (Sundar Pichai) در ماه می 2020 فارش گردید، گرچه دهها هزار عبارت و اصطلاح ضبط شده در دسترس است، ولی برای موفقیت به صدها هزار فایل صوتی نیاز است.