ارتقا دستیار صوتی Alexa و Siri برای کمک به سالمندان

دانشمندان رایانه در دانشگاه سن دیگوی کالیفرنیا، به خاطر توسعه دادن یک دستیار صوتی برای برقراری بهتر ارتباط با سالمندان، جایزه تحقیقات آمازون را دریافت کردند. هدف اولیه آن‌ها، ایجاد یک سیستم برای پاسخ به سوالات پزشکی افراد بالغ بالای ۶۵ سال بود. ؛ داده‌ها نشان می‌دهند که افراد بالغ بالای ۶۵ سال (یک دموگرافیک که نشان می‌دهد شدت این مشکل بین سال ۲۰۱۰ و ۲۰۵۰ دو برابر می‌شود) بعد از چند بار تلاش ناموفق برای دریافت پاسخ سوالاتشان، دیگر از این ابزارها استفاده نمی‌کنند. مشکل این است که، سیستم‌های پردازش زبان طبیعی (NLP)، در حال آموزش دیدن برای درک سوالات کوتاه و رسمی هستند. این برای افرادی که همراه با تکنولوژی رایانه بزرگ شده‌اند و می‌دانند که چطور باید سوالاتشان را مطرح کنند تا توسط دستگاه درک و فهمیده شود، خوب است. اما افراد سالمندی که عادت دارند با انسان‌ها صحبت کنند، نه ماشین‌ها، گاهی مجبورند تلاش کنند تا سوالات یا مکالمات طولانی را به یک جمله کوتاه تجزیه کنند تا هوش مصنوعی به کار رفته در دستیارهای صوتی، بتواند منظور آن‌ها را بفهمد.

ارتقا دستیار صوتی Alexa و Siri برای کمک به سالمندان

خلیل مارینی، دانشجوی دکتری علوم رایانه دانشگاه UC San Diego که توسط جایزه تحقیقات آمازون پشتیبانی شده است تا روی این پروژه کار کند می‌گوید: «کار ما این است که این مشکل را برطرف کنیم. ما داریم روی تکنولوژی‌ای کار می‌کنیم که این بار را از دوش سالمندان برمی‌دارد. به جای اینکه افراد سالمند مجبور باشند سوالشان رو به شکل دیگر تغییر داده و عنوان کنند، ما می‌خواهیم هوش مصنوعی بتواند نحوه صحبت کردن فرد سالمند را یاد بگیرد و درک کند.»

برای دستیابی به این مهم، مارینی که یک دانشجوی فارغ‌التحصیل شده از آزمایشگاه پروفسور داپا ناکاشول از دانشکده علوم رایانه UC San Diego است، در حال کار بر روی ایجاد یک سیستم سوال پاسخ پیوسته یا end-to-end است که بتواند:

  1. سوال کاربر را به اجزای کلیدی آن تجزیه کند.
  2. سوال پزشکی تجزیه شده را به یک سوال مرسوم در یک پایگاه داده متشکل از ۱۷,۰۰۰ سوال پزشکی تطابق دهد که این پایگاه داده توسط موسسه ملی سلامت ارائه شده است.
  3. بخش‌های مربوطه از پاسخ طولانی متناظر با سوال را انتخاب کرده و با کاربر به اشتراک بگذارد.

مارینی تا الان اولین مرحله را به انجام رسانده است و هوش مصنوعی‌ای آموزش داده تا بتواند یک سوال طولانی را به یک سوال کوتاه‌تر خلاصه‌سازی کند؛ که این کار را با آموزش مدل NLP هم برای خلاصه‌سازی سوالات و هم برای طبقه‌بندی کار که به آن وقف سوال گفته می‌شود، انجام داده است. در این روش، مدل یاد می‌گیرد تا تشخیص دهد که آیا با پاسخ‌دهی به یک سوال کوتاه، سوال ابتدایی طولانی‌تر پاسخ داده می‌شود یا خیر.

دستیار صوتی برای سالمندان

مارینی افزود: «ما فهمیدیم که اگر آموزش را همزمان خلاصه‌سازی و در عین حال طبقه‌بندی کنیم، می‌توانیم نتایج بهتری ارائه دهیم. این مدل هوش مصنوعی برای خلاصه‌سازی سوال را می‌توان به عنوان یک ویژگی مستقل به دستیاران صوتی موجود مثل Alexa اضافه کرد، یا به عنوان اولین مرحله درون هر سیستم پرسش و پاسخ که بتواند سوالات کاربر را کوتاه کند، در نظر گرفت.»

تیم مسئول، هنوز در حال کار بر روی دستیابی به ابزار مناسب برای تطابق دادن سوال با یک سوال موجود در بانک سوالات متداول است؛ که در این مورد، این بانک توسط موسسه ملی سلامت فراهم شده است. سپس، هوش مصنوعی باید قطعات مرتبط از سوال طولانی را انتخاب کرده و به کاربر نمایش دهد.

طبق اعلام آزمایشگاه ناکاشول: «تاثیر بالقوه این کار بسیار چشمگیر است، چون هدفش افزایش جمعیت افرادی است که می‌توانند از ابزارهای مکالمه‌ای بهره ببرند و این کار را از طریق هدف‌گذاری یک بخش مهم از جمعیت، یعنی سالمندان انجام خواهد داد.»

فراگیرتر کردن هوش مصنوعی

چرا این کاربران در تست‌های اولیه دستیاران صوتی در نظر گرفته نشدند؟ این مشکلی است که پیوسته در سیستم‌ها و آموزش هوش مصنوعی وجود داشته و مارینی و محققان در تیم VOLI سعی دارند آن را برطرف کنند. وی در این باره گفت: «دربین کاربران سیستم‌های پرسش و جواب موجود، سالمندان نادیده گرفته شدند. این امر ناشی از کمبود تحقیقات در بین کاربران اینترنت است، که سبب شده داده‌های زیادی در مورد این دموگرفیک خاص وجود نداشته باشد. ما مشکلی داریم که به کمبود داده تبدیل شده است و اگر داده‌ای وجود نداشته باشد، نمی‌توانیم یک الگوریتم ایجاد کنیم تا با نیازهای خاص این بخش از جمعیت سازگاری داشته باشد.»

مارینی از نزدیک با این مشکل آشنا شده است؛ چون به عنوان یکی از بومیان کشور مراکش، متوجه شده است که عملا هیچ مدل هوش مصنوعی برای زبان بومی‌اش یعنی Darija که نوعی زبان عربی در مراکش است، وجود ندارد. او می‌گوید: «من متوجه شدم که هیچ مدل NLP یا مدل هوش مصنوعی وجود ندارد که به خوبی برای زبان بومی من عمل کند. پس اولین پروژه من، ایجاد داده‌هایی است که هوش مصنوعی بتواند برای زبان بومی من بیاموزد.»

خلیل مارینی به تحقیقات Adobe و گروه Alexa در آمازون پیوسته و روی ایجاد مدل‌های هوش مصنوعی کار می‌کند که بتوانند قواعد زبان یک جمله را به شکل قابل تفسیر پیشبینی کنند و قسمت‌های مهم از مقالات طولانی را خلاصه‌سازی کنند. مارینی می‌گوید: «هدف جهانی تحقیق من، ایجاد تکنولوژی زبان انسانی قابل تفسیرتر و قابل دسترس‌تر برای مخاطبان بیشتر است. فعلا وظیفه من، عمدتا کار بر روی تکنولوژی زبان انگلیسی است، اما همچنین قابل دسترس‌تر کردن آن برای مخاطبان حاشیه‌نشین یا مورد توجه واقع نشده است، که در این مورد، منظور سالمندان است.»

آیا دستیار صوتی فارسی مانند الکسا آمازون، سیری اپل داریم؟

خوشبختانه شرکت عامراندیش تواسته یک دستیار صوتی با نام باتاوا برای پاسخگویی به سوالات متنی و صوتی بسازد، این دستیار صوتی با استفاده از آخرین روش‌های هوش مصنوعی و یادگیری ماشین در زبان فارسی، به راحتی به سوالات کاربران پاسخ می‌دهد.

منبع: techxplore

5/5 - (1 امتیاز)
لینک کوتاه شده : https://amerandish.com/cqzAD

به اشتراک بگذارید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

_ مطالب مرتبط _

اخبار شرکت

مروری بر اینوتکس 2019

امسال هم نمایشگاه اینوتکس 2019 در تاریخ 19 الی 22 خرداد سال 98 در سالن خلیج فارس نمایشگاه بین المللی برگزار گردید. رشد چشمگیر شرکت

اپلیکیشن‌های تشخیص گفتار
پردازش گفتار

اپلیکیشن‌های تشخیص گفتار خودکار (ASR) و آینده این بازار روبه رشد جهانی

بازار اپلیکیشن‌های تشخیص گفتار خودکار،  چشم‌انداز منطقه‌ای، استراتژی‌های رقابتی و پیش‌بینی‌های مقطعی از 2019 تا 2025 انتظار می‌رود بازار اپلیکیشن‌های تشخیص گفتار خودکار (ASR) در

درخواست شما با موفقیت ارسال شد.

ضمن تشکر بابت ارسال پیام، در سریع‌ترین زمان ممکن کارشناسان شرکت عامراندیش درخواست شما را بررسی خواهند نمود.