دانشمندان رایانه در دانشگاه سن دیگوی کالیفرنیا، به خاطر توسعه دادن یک دستیار صوتی برای برقراری بهتر ارتباط با سالمندان، جایزه تحقیقات آمازون را دریافت کردند. هدف اولیه آنها، ایجاد یک سیستم برای پاسخ به سوالات پزشکی افراد بالغ بالای ۶۵ سال بود. ؛ دادهها نشان میدهند که افراد بالغ بالای ۶۵ سال (یک دموگرافیک که نشان میدهد شدت این مشکل بین سال ۲۰۱۰ و ۲۰۵۰ دو برابر میشود) بعد از چند بار تلاش ناموفق برای دریافت پاسخ سوالاتشان، دیگر از این ابزارها استفاده نمیکنند. مشکل این است که، سیستمهای پردازش زبان طبیعی (NLP)، در حال آموزش دیدن برای درک سوالات کوتاه و رسمی هستند. این برای افرادی که همراه با تکنولوژی رایانه بزرگ شدهاند و میدانند که چطور باید سوالاتشان را مطرح کنند تا توسط دستگاه درک و فهمیده شود، خوب است. اما افراد سالمندی که عادت دارند با انسانها صحبت کنند، نه ماشینها، گاهی مجبورند تلاش کنند تا سوالات یا مکالمات طولانی را به یک جمله کوتاه تجزیه کنند تا هوش مصنوعی به کار رفته در دستیارهای صوتی، بتواند منظور آنها را بفهمد.
خلیل مارینی، دانشجوی دکتری علوم رایانه دانشگاه UC San Diego که توسط جایزه تحقیقات آمازون پشتیبانی شده است تا روی این پروژه کار کند میگوید: «کار ما این است که این مشکل را برطرف کنیم. ما داریم روی تکنولوژیای کار میکنیم که این بار را از دوش سالمندان برمیدارد. به جای اینکه افراد سالمند مجبور باشند سوالشان رو به شکل دیگر تغییر داده و عنوان کنند، ما میخواهیم هوش مصنوعی بتواند نحوه صحبت کردن فرد سالمند را یاد بگیرد و درک کند.»
برای دستیابی به این مهم، مارینی که یک دانشجوی فارغالتحصیل شده از آزمایشگاه پروفسور داپا ناکاشول از دانشکده علوم رایانه UC San Diego است، در حال کار بر روی ایجاد یک سیستم سوال پاسخ پیوسته یا end-to-end است که بتواند:
- سوال کاربر را به اجزای کلیدی آن تجزیه کند.
- سوال پزشکی تجزیه شده را به یک سوال مرسوم در یک پایگاه داده متشکل از ۱۷,۰۰۰ سوال پزشکی تطابق دهد که این پایگاه داده توسط موسسه ملی سلامت ارائه شده است.
- بخشهای مربوطه از پاسخ طولانی متناظر با سوال را انتخاب کرده و با کاربر به اشتراک بگذارد.
مارینی تا الان اولین مرحله را به انجام رسانده است و هوش مصنوعیای آموزش داده تا بتواند یک سوال طولانی را به یک سوال کوتاهتر خلاصهسازی کند؛ که این کار را با آموزش مدل NLP هم برای خلاصهسازی سوالات و هم برای طبقهبندی کار که به آن وقف سوال گفته میشود، انجام داده است. در این روش، مدل یاد میگیرد تا تشخیص دهد که آیا با پاسخدهی به یک سوال کوتاه، سوال ابتدایی طولانیتر پاسخ داده میشود یا خیر.
مارینی افزود: «ما فهمیدیم که اگر آموزش را همزمان خلاصهسازی و در عین حال طبقهبندی کنیم، میتوانیم نتایج بهتری ارائه دهیم. این مدل هوش مصنوعی برای خلاصهسازی سوال را میتوان به عنوان یک ویژگی مستقل به دستیاران صوتی موجود مثل Alexa اضافه کرد، یا به عنوان اولین مرحله درون هر سیستم پرسش و پاسخ که بتواند سوالات کاربر را کوتاه کند، در نظر گرفت.»
تیم مسئول، هنوز در حال کار بر روی دستیابی به ابزار مناسب برای تطابق دادن سوال با یک سوال موجود در بانک سوالات متداول است؛ که در این مورد، این بانک توسط موسسه ملی سلامت فراهم شده است. سپس، هوش مصنوعی باید قطعات مرتبط از سوال طولانی را انتخاب کرده و به کاربر نمایش دهد.
طبق اعلام آزمایشگاه ناکاشول: «تاثیر بالقوه این کار بسیار چشمگیر است، چون هدفش افزایش جمعیت افرادی است که میتوانند از ابزارهای مکالمهای بهره ببرند و این کار را از طریق هدفگذاری یک بخش مهم از جمعیت، یعنی سالمندان انجام خواهد داد.»
فراگیرتر کردن هوش مصنوعی
چرا این کاربران در تستهای اولیه دستیاران صوتی در نظر گرفته نشدند؟ این مشکلی است که پیوسته در سیستمها و آموزش هوش مصنوعی وجود داشته و مارینی و محققان در تیم VOLI سعی دارند آن را برطرف کنند. وی در این باره گفت: «دربین کاربران سیستمهای پرسش و جواب موجود، سالمندان نادیده گرفته شدند. این امر ناشی از کمبود تحقیقات در بین کاربران اینترنت است، که سبب شده دادههای زیادی در مورد این دموگرفیک خاص وجود نداشته باشد. ما مشکلی داریم که به کمبود داده تبدیل شده است و اگر دادهای وجود نداشته باشد، نمیتوانیم یک الگوریتم ایجاد کنیم تا با نیازهای خاص این بخش از جمعیت سازگاری داشته باشد.»
مارینی از نزدیک با این مشکل آشنا شده است؛ چون به عنوان یکی از بومیان کشور مراکش، متوجه شده است که عملا هیچ مدل هوش مصنوعی برای زبان بومیاش یعنی Darija که نوعی زبان عربی در مراکش است، وجود ندارد. او میگوید: «من متوجه شدم که هیچ مدل NLP یا مدل هوش مصنوعی وجود ندارد که به خوبی برای زبان بومی من عمل کند. پس اولین پروژه من، ایجاد دادههایی است که هوش مصنوعی بتواند برای زبان بومی من بیاموزد.»
خلیل مارینی به تحقیقات Adobe و گروه Alexa در آمازون پیوسته و روی ایجاد مدلهای هوش مصنوعی کار میکند که بتوانند قواعد زبان یک جمله را به شکل قابل تفسیر پیشبینی کنند و قسمتهای مهم از مقالات طولانی را خلاصهسازی کنند. مارینی میگوید: «هدف جهانی تحقیق من، ایجاد تکنولوژی زبان انسانی قابل تفسیرتر و قابل دسترستر برای مخاطبان بیشتر است. فعلا وظیفه من، عمدتا کار بر روی تکنولوژی زبان انگلیسی است، اما همچنین قابل دسترستر کردن آن برای مخاطبان حاشیهنشین یا مورد توجه واقع نشده است، که در این مورد، منظور سالمندان است.»
آیا دستیار صوتی فارسی مانند الکسا آمازون، سیری اپل داریم؟
خوشبختانه شرکت عامراندیش تواسته یک دستیار صوتی با نام باتاوا برای پاسخگویی به سوالات متنی و صوتی بسازد، این دستیار صوتی با استفاده از آخرین روشهای هوش مصنوعی و یادگیری ماشین در زبان فارسی، به راحتی به سوالات کاربران پاسخ میدهد.
منبع: techxplore