تست تورینگ (Turing Test)، یکی از آزمونهای پیشنهادی برای ارزیابی هوش مصنوعی است! این روزها سرعت پیشرفت هوش مصنوعی و محصولاتی که بر پایه آن ساخته می شوند، بسیار زیاد است و استقبال مردمی از آنها بالا رفتهاست، پذیرش سیستمها و ابزارهایی مانند باتاوا (دستیار هوشمند سازمانی)، هوشتل (اپراتور مرکز هوشمند تماس) و … سرعت گرفتهاست، اما چه معیاری برای کاربرد چنین محصولاتی وجود دارد؟ چگونه میتوانیم مطمئن باشیم که این سیستمها پیشرفت خواهند کرد؟
یکی از رایجترین روشهای آزمون کردن هوش مصنوعی که از سال ۱۹۵۱ مورد استفاده قرار میگیرد، تورینگ است که توسط فردی با همین نام یعنی آلن تورینگ ابداع شد! آلن تورینگ یک ریاضیدان برجسته بود که در زمینه علوم کامپیوتری در انگلستان شهرت داشت. اگر دوست دارید که اطلاعات خود پیرامون این آزمون را تکمیل کنید و جواب سوالات خود را پیدا کنید، کافیست تا انتهای این مقاله همراه عامراندیش هوشمند باشید.
آزمون تورینگ چیست؟ (بازی تقلید یا Imitation Game چیست)
تست تورینگ یا Turing Test که آن را با نام بازی تقلید در بین علوم کامپیوتری میشناسند، این تست در ابتدا برای ارزیابی قدرت هوش مصنوعی یک سیستم مورد استفاده قرار نمیگرفت و بیشتر برای قدرت تشخیص یک داور بود! در ابتدا برای انجام این آزمون لازم بود که پیش نیازهای زیر وجود داشته باشد:
- یک داور
- داوطلب مرد
- داوطلب زن
هدف بازی تقلید این بود که داوری که به صورت جداگانه و از طریق سیستم با این افراد در ارتباط است، تشخیص دهد که کدام یک از کسانی که با او صحبت میکنند، مرد است و کدام یک زن! اگر شرکت کننده زن به گونه ای صحبت میکرد که داور او را مرد تشخیص میداد، داوطلب زن برنده میشد، اما این موضوع چه ارتباطی با هوش مصنوعی و ارزیابی آن دارد؟
بر اساس پیشنهاد آلن تورینگ، جای شرکت کنده زن با رایانه (هوش مصنوعی) عوض شد به نحوی که در این زمان داور باید تشخیص دهد که کدام شرکت کننده انسان و کدام یک ربات است! در این شیوه ارزیابی اگر هوش مصنوعی قادر باشد که در بیش از نیمی از سوالات داور را فریب دهد و باعث شود که قضاوت اشتباهی انجام دهد، رایانه بر ذهن انسان پیشی میگیرد و برنده رقابت خواهد شد.
پردازش زبانهای طبیعی، شاخه ای مهم و حساس در AI
پردازش زبانهای طبیعی (از جمله صدای شما)، یکی از مهمترین شاخههای هوش مصنوعی و علوم کامپیوتری محسوب میشود که در طول زمان، پیشرفت بسیار زیادی داشتهاست. همین موضوع باعث ظهور دستیارهای صوتی موبایلهای ما شدهاست! به عنوان مثال دستیار صوتی Siri در سیستم عامل iOS و دستیار صوتی گوگل در سیستم عامل Android نشان دهنده همین موضوع است.
یکی از عوامل و فاکتورهای موفقیت رایانه و کامپیوتر که باعث میشود بر انسان پیروز شود، همین موضوع پردازش زبانهای طبیعی است! در واقع کامپیوتر باید قادر باشد بر اساس زبانی که با او صحبت میشود، حرف بزند و جواب سوالات را بدهد تا داور نتواند تشخیص دهد که رایانه، انسان نیست!
برخی از برنامههایی که در تست تورینگ توانستند، موفق عمل کنند، شهرت جهانی پیدا کردند و بارها توسط رسانههای مختلف از آنها یاد شد از میان چنین برنامههایی، ELIZA شاید از همه معروف تر باشد! این برنامه که توسط جوزف وایزنبام (پژوهش گر آلمانی- آمریکایی) طراحی و توسعه داده شد، توانست در این آزمون موفقیت خوبی کسب کند.
این روزها البته دیگر الیزا (ELIZA)، برنامه پیشرفته ای محسوب نمیشود چرا که پلنهای فوق پیشرفته ای مانند محصولات گوگل جای این برنامهها را گرفتهاند. حالا که با کلیت این آزمون و شیوه برگزاری آن کمی آشنا شدید، نوبت آن میرسد که در مورد نحوه موفقیت چت باتها در این آزمون بدانید! آیا آماده دانستن راز رباتهای هوش مصنوعی برای موفقیت هستید؟
چت باتها چگونه در تست تورینگ موفق میشوند؟
یکی از ادعاهای رایج در مورد محصولات هوش مصنوعی، این است که توانستهاند با موفقیت در این زمینه موفق شوند و بر هوش انسانی پیشی بگیرند! حقیقت این است که این ادعاها شاید به صورت کامل کذب نباشند، اما مطمئناً برای این کار تکنیکها و ترفندهایی وجود دارد که از آنها بی اطلاعید! رازهایی که باعث میشوند، انسان در این رقابت شکست بخورد.
اولین نرمافزار و برنامه کامپیوتری که توانست از سد بزرگ این آزمون عبور کند و موفقیتی در این زمینه بدست آورد، ELIZA بود که کمی بالاتر در مورد آن صحبت کردیم، اما مسئله بعدی این است که چت باتها، چطور میتوانند در این آزمون موفق شوند؟ چه کلیدواژههایی از آنها پرسیده میشود و باعث میشود که آنها مانند یک انسان جواب دهند.
حقیقت این است که بر اساس کلیدواژههای موجود در متن کاربر انسانی (داور) چت بات قادر است که بر اساس تحلیل آن اقدام به پاسخگویی برای نیاز شما کند. در گذشته الگوریتمهای پاسخگویی به شدت ساده بودند، اما این روزها که علم هوش مصنوعی و پردازش متن تا حد بسیار زیادی افزایش پیدا کردهاست، الگوریتمها بسیار پیچیدهتر شدند.
یکی دیگر از رباتهایی که در این زمینه موفق بودهاست، رباتی تحت عنوان یوجین بود که خود را یک کودک بچه ۱۳ ساله اوکراینی معرفی کرد. این ربات با داشتن غلطهای املایی، اشتباهات در دستور زبان و … به خاطر سن ۱۳ ساله و زبان اوکراینی، توانست که انسان را شکست دهد و باعث شود که داور قضاوت بدی داشته باشد.
جایزه لوبنر، پاداش فریب دادن انسان
جایزه لوبنر از آن دسته جایزههایی است که به صورت سالانه به برنامهها و نرمافزارهای مبتنی بر هوش مصنوعی داده میشود که توانسته باشند در آزمون تورینگ داور (انسان) را فریب دهند و خود را بالاتر از هوش انسانی نشان دهند. این جایزه و نحوه دادن آن در طول مدت زمان تغییر کردهاست.
به عنوان مثال در سالهای ابتدایی که جایزه لوبنر به برنامهها و نرمافزارهای سرافراز در هوش مصنوعی داده میشد، داور باید در همان ۵ دقیقه اول تشخیص دهد که آیا فرد مورد نظر ربات است یا خیر؟ سالها بعد یعنی در سال ۲۰۱۰ مبنای موفقیت و برنده شدن برنامهها، ۲۵ دقیقه شد و تا کنون ادامه داشتهاست.
این جایزه شامل ردهبندیهای مختلف است و در کنار نشان جایزه لوبنر به کاربران هزینه مادی هم عطا میشود! نفر اول و برنده میتواند جایزه ۴۰۰۰ دلاری، دوم برنده جایزه ۱۵۰۰ دلاری، سوم جایزه ۱۰۰۰ دلاری و نفر چهارم برنده جایزه ۵۰۰ دلاری شود. البته یکسری جایزه دیگر هم برای شرکت کنندگان در نظر گرفته شدهاست، اما تابحال نرمافزاری نتوانستهاست، امتیاز لازم برای این جایزه را کسب کند.
انتقادات وارد شده به تست تورینگ چیست؟
در طی مدت زمان طولانی که از این آزمون برای صحت سنجی کاربران استفاده شدهاست، انتقادات و نظرات تندی راجع به این شیوه ارزیابی شکل گرفتهاست! برخی از این نظرات تند و انتقادی به قوانین این آزمون حمله کردهاند و برخی دیگر مدت زمان لازم برای تشخیص ربات یا انسان بودن شخص یا شی که در حال صحبت با داور است را کم میدانند!
حقیقت این است که پایه و اساس برنده شده در تست تورینگ، رفتار است و نه ادراک او، بنابراین شاید نتوان بر اساس همین قوانین و مقررات هوش ربات را بیشتر از انسان دانست و برای آن حد تعیین کرد. به عقیده برخی از کارشناسان حوزه هوش مصنوعی که نسبت به این آزمون انتقاد داشتهاند، ارزیابی تورینگ قادر است که در این زمینه تنها توانایی کلامی (نوشتاری) انسان را بررسی کند و این موضوع برای اثبات باهوش تر بودن ربات نسبت به انسان نیست.
آیا آزمون تورینگ جایگزین میشود و یا بهبود پیدا میکند؟
طبق این انتقادات، راهها و روشهای دیگری برای جایگزینی و بهبود این آزمون ارائه شدهاست که شاید مناسب باشند. در این زمینه برخی از کارشناسان گفتهاند که باید زمان این آزمون تا ۱۲۰ دقیقه افزایش پیدا کند تا داور بتواند بر اساس قدرت رفتاری مخاطب تشخیص دهد که آیا با ربات صحبت میکند یا انسان!
برای این که یک آزمون موفق داشته باشیم و بتوانیم محصول نهایی آن را به عنوان یک ابر ربات در نظر بگیریم که انسان را شکست دادهاست، باید پایمان را فراتر بگذاریم و یک برنامه را از جنبههای مختلف بررسی کنیم! با این کار قادر هستیم که تشخیص دهیم آیا واقعاً یک برنامه توانسته انسان را پشت سربگذارد و موفق شود.
نتیجه گیری
این که زمانی میرسد که رباتها از ما انسانها باهوش تر باشند، امری اجتناب ناپذیر است و این مسئله را از همین الان با بررسی این موضوع که رباتها تا چه حد توانستهاند در زندگی ما نفوذ کنند، متوجه میشوید! رباتها و برنامههای هوش مصنوعی به زودی در تمامی مراکز صنعتی، شرکتها، کارخانهها، محلهای کار، سازمانهای دولتی، خانهها، آپارتمانها و … یافت خواهند شد و از همین رو باید به فکر ارزیابی و تست آنها به شیوههای درست باشیم!
شما در این زمینه چه نظری دارید؟ آیا به نظر شما روشی وجود دارد که قادر باشد به شیوه ای کاربردی تر اقدام به بررسی میزان قدرت یک ربات یا برنامه مبتنی بر AI کند؟ نظرات خود را در پایین همین مقاله با ما و دیگر افرادی که این مقاله را میخوانند به اشتراک بگذارید.