هوش مصنوعی محاورهای یا مکالمهای نوعی از هوش مصنوعی است که به انسانها امکان صحبت کردن با رباتها را میدهد. هوش مصنوعی مکالمهای میتواند در چت بات هوشمند یا سامانه پاسخگویی هوشمند تلفنی حتی دستیارهای صوتی مورد استفاده قرار بگیرد. هوش مصنوعی مکالمهای یک فناوری نو ظهور است که به سرعت در حال بهبود و گسترش هست. این نوع از هوش میتواند از طریق رسانههای مختلف از جمله صدا، ویدیو و متن با کاربران تعاملاتی داشته باشد.
تجربه کاربری محاورهای (Conversational UX) یک تجربه کاربری است که از ترکیب چت، صدا و یا هر فناوری مبتنی بر زبان طبیعی استفاده میکند تا بتواند یک تجربه محاورهی انسانگونه را به وجود بیاورد. انسانها از گفتوگو با یکدیگر و محاوره لذت میبرند و تجربه کاربری محاورهای هدفش آن است که این لذت را به کار کردن با یک نرمافزار، اپلیکیشن و یا سیستم اضافه کند.
دقت کنید که صرفا صدا یک تجربه کاربری محاورهای را ایجاد نمیکند بلکه یک تجربه کاربری محاورهای نیاز به تعامل و یک گفتوگوی دوطرفه با کاربرش دارد و برای اینکه بتوانیم چنین تجربهای را برای کاربرمان ایجاد کنیم به هوش مصنوعی محاورهای نیاز داریم.
زمانی که عبارت هوش مصنوعی محاورهای (Conversational AI) به گوشمان میخورد یاد چتباتها میافتیم. چتباتها غالبا در یک دامنه محدود کار میکنند و مبتنی بر قواعد هستند و بر اساس آخرین ورودی که از کاربرشان گرفتهاند پاسخهایشان را تولید میکنند. این گونه چتباتها نمیتوانند بیانگر یک هوش مصنوعی محاورهای باشند. چت باتها برای اینکه معرف یک هوش مصنوعی محاورهای باشند باید با کاربرشان تعامل داشته باشند، باید بتوانند در یک سیستم گفتوگو محور کار کنند، باید بتوانند در طول گفتوگویشان با کاربر دانشی را کسب کنند و از آن برای تولید پاسخها استفاده کنند، اگر برای تولید پاسخ به دانش و اطلاعاتی نیاز دارند باید بتوانند سوال بپرسند و مهمتر از همه اینها باید بتوانند متوجه شوند که کاربر موضوع بحث را عوض کرده است.
زمانی که چتباتها تمام این تواناییها را کنار هم جمعآوری کنند آن موقع است که میتوانیم بگوییم که یک هوش مصنوعی محاورهای داریم و در نتیجه آن میتوانیم یک تجربه کاربری محاورهای را برای کاربرانمان ایجاد کنیم.
«مقصود» گوینده چیست؟ (Intent)
هوش مصنوعی محاورهای چطور کار میکند؟ چطور صحبتهای کاربرش را متوجه میشود و با او گفتوگو میکند؟ اولین قدم در هر مکالمه و محاورهای، چه هوش مصنوعی و چه هوش طبیعی، فهمین جملهای است که کاربر گفته است. این که مقصود او چه بوده و چه نیتی داشته از گفتن این جمله و پشت جملهای که به ما گفته است چه خواستهای داشته؟ پس اولین چیزی که نیاز است تا به هوش مصنوعی محاورهای آموزش دهیم مقصودها و نیتها است.
یک هتل را فرض کنید که وارد آن شدهاید و به قسمت پذیرش رفتهاید؛ معمولا چه سوالهایی با مسئول پذیرش رد و بدل میشود؟ صحبتهایی مثل اینکه آیا اتاق دو تخته خالی دارید؟ آیا یک سوئیت رو به دریا برای دوشنبه هفته آینده دارید؟ میشود اتاقی را که برای دوشنبه هفته بعد رزرو کرده بودم را کنسل کنید؟ آیا هتل شما استخر هم دارد؟ اینها نمونههایی از صحبتهایی است که ممکن است بین یک فرد و مسئول پذیرش رد و بدل شود.
ما میتوانیم این مثالها را در سه دسته تقسیم بندی کنیم: اطلاعات هتل، رزرو اتاق و کنسل کردن اتاق. همان طور که یک مسئول پذیرش این دستهها را میداند و زمانی که فردی با او صحبت میکند، صحبتهای او را به یکی از این دستهها ربط میدهد، هوش مصنوعی محاورهای هم دقیقا همین کار را میکند. یعنی صحبتی که میشنود و متوجه آن میشود را ربط میدهد به یکی از این دستهها. برای اینکه چنین اتفاقی بیافتد ما نیاز داریم تا برای هر مقصود ده، بیست و یا بیشتر مثال و نمونه آماده کنیم تا هوش مصنوعی محاورهای بتواند آنها را یاد بگیرد.
«موجودیت» چیست؟ (Named Entity)
ما از هوش مصنوعی محاورهای استفاده میکنیم تا تجربه کاربری محاورهای را برای کاربرانمان ایجاد کنیم. در بخش قبلی صحبتهایمان متوجه شدیم که هوش مصنوعی محاورهای در اولین قدم نیاز دارد تا مقصود و نیت جمله را متوجه شود و در دومین قدم خود هوش مصنوعی محاورهای نیاز دارد تا اطلاعات و کلمات مهمی که در جمله گفته میشود را استخراج، شناسایی و تکمیل کند.
مجددا بخش پذیرش هتل را به خاطر بیاورید. فردی که از پذیرش هتل پرسیده بود که یک اتاق دو تخته رو به دریا برای سه شنبه هفته بعد میخواهم. در این مثال دو تخته بودن اتاق، سه شنبه هفته بعد و رو به دریا بودن اتاق اطلاعات مهمی هستند که آن فرد در جمله خود گفته است و همان طور که مسئول بخش پذیرش این اطلاعات را استخراج میکند و از آنها برای ارائه جواب به فرد کمک میگیرد، هوش مصنوعی محاورهای هم همین کار را انجام میدهد.
نامها، اسمها، شکلها، حالتها، زمانها و مکانها و خیلی چیزهای دیگر که مشابه اینها و شامل اطلاعات هستند مواردی هستند که در این گام شناسایی و استخراج میشوند و ما به اینها موجودیت میگوییم. هوش مصنوعی محاورهای در گام دوم علاوه بر اینکه موجودیتها را شناسایی و استخراج میکند، آنها را تکمیل نیز میکند. مثلا اگر در جملهای سه شنبه هفته بعد گفته شده باشد، هوش مصنوعی محاورهای آن را تبدیل به تاریخ دقیق سه شنبه هفته بعد میکند.
در گام سوم هوش مصنوعی محاورهای وظیفه دارد تا تمام موجودیتهایی که در طول مکالمه با کاربر استخراج کرده را به خاطر بسپارد تا بتواند پاسخ کاربرش را بر اساس آن اطلاعات بدهد. مثال بیان شده را مجددا در نظر بگیرید. فردی که برای سه شنبه هفته بعد اتاق دو تخته رو به دریا میخواست. حقیقت این است که ما همیشه سوالمان را این گونه بیان نمیکنیم. مثلا به بخش پذیرش میگوییم یک اتاق دو تخته میخواهم و مسئول پذیرش میپرسد برای کی و ما میگوییم سه شنبه هفته بعد و مسئول پذیرش میگوید بگذارید بگردم و در این حین ما میگوییم راستی اتاق رو به دریا هم باشد.
این گفتوگو و اطلاعات این بار پخش شده بین جملات مختلفی که ما داریم با مسئول پذیرش رد و بدل میکنیم. همان طور که مسئول بخش پذیرش این اطلاعات مهم را از جملات ما استخراج میکند و به خاطر میسپارد، وظیفه هوش مصنوعی محاورهای نیز هم در قدم سوم به خاطر سپردن این موجودیتها و اطلاعات مهم است.