شبکه عصبی هوش مصنوعی میآموزد چه زمانی نباید به خود اعتماد کند!
پژوهشگران روشی برای شبکههای عصبی در یادگیری عمیق ایجاد کردند تا به سرعت، سطح اطمینان در خروجی خود را تخمین بزنند. اکسپرس (Express) گزارش کرده است که مهندسان دانشگاه MIT انتظار دارند که این پیشرفت در نهایت باعث نجات جان افراد بسیاری شود، زیرا در حال حاضر، به صورت گستردهای از یادگیری عمیق در روشهای رومزه کنونی استفاده میشود.
این پژوهش با هدایت الكساندر امینی (Alexander Amini)، دانشجوی دكتراي دانشگاه MIT، انجام پذیرفته است و “رگرسيون آشكار عميق (Deep Evidential Regression)” لقب گرفته است. با این رویکرد، روند انجام کارها سریعتر شده و حتی میتواند به فناوری ایمنتر هوش مصنوعی (AI) نیز منجر شود.
امینی به اکسپرس چنین گفت که: “ما تنها به داشتن مدلهایی با کارآیی بالا نیاز نداریم، بلکه افزون بر آن، به شبکه عصبی مصنوعی نیاز داریم تا به ما در درک اینکه چه زمانی نمیتوانیم به آنها اعتماد کنیم، یاری رسانند.” وی اینگونه ادامه داد که: “از این مدلها و شبکهها به طور گستردهای در کاربردهای گوناگونی استفاده میشود و میتواند برای ارزیابی محصولاتی به کار گرفته شوند. با برآورد عدم اطمینان از یک مدل آموخته شده، میآموزیم که چقدر خطا از مدل انتظار داریم و چه دادههای از دست رفتهای میتواند مدل را بهبود بخشد.”
این تحلیلگر هوش مصنوعی بیان میکند که چگونه رویکردهای پیشین در تحلیل عدم اطمینان بر اساس یادگیری عمیق بیزی (Bayesian deep learning) استوار است. یادگیری عمیق بیزی (Bayesian deep learning) یک علم میان رشتهای بین یادگیری عمیق و نظریه احتمال بیزی است. مدلهای یادگیری عمیق بیزی معمولا تخمین عدم قطعیت را یا با توزیع وزن مدلها و یا با یادگیری نگاشت مستقیم به خروجیهای احتمالی فرمبندی میکنند.
این رویکرد، یک روند بسیار کند در دنیای واقعی است، جاییکه تصمیمگیریها میتوانند بین زندگی و مرگ تفاوت ایجاد کنند. امینی همچنین افزود که: “ما تاکنون با استفاده از یادگیری عمیق موفقیتهای زیادی کسب کردهایم. شبکه عصبی هوش مصنوعی معمولا در 99 درصد از مواقع، پاسخهای صحیحی به ما میگوید. ” وی چنین ادامه داد که: “چیزی که از محققان دور مانده است، توانایی این مدلها در دانستن و گفتن این نکته به ماست که چه زمانی ممکن است در خروجی اشتباه کنند. اهمیت آن یک درصد (زمانیکه مدلها اشتباه میکنند) برای ما بسیار زیاد است و باید بدانیم که چگونه میتوانیم آن موقعیتها را با اطمینان و کارآیی بالایی تشخیص دهیم.”
پژوهشگران با یک چالش بینایی کامپیوتر کار خود را برای آزمایش این روش و رویکرد آغاز کردند. آنها شبکه عصبی هوش مصنوعی خود را برای تجزیه و تحلیل یک تصویر و تخمین عمق کانونی هر پیکسل آموزش دادند. اتومبیلهای خودران از محاسبات مشابهی برای تخمین نزدیکی با عابر پیاده یا وسیله نقلیه دیگر استفاده میکنند، چنین محاسباتی اصلا کار سادهای نیست. همانطور که پژوهشگران امیدوار بودند، شبکه عدم اطمینان بالایی را برای پیکسلها در جایی مشخص نمود که عمق اشتباه را پیشبینی کرده بود.
امینی چنین گفت: “این خطاها بسیار واسنجیده (کالیبره) شدهاند که باعث میشود این شبکه یکی از مهمترین موارد در ارزیابی کیفیت برآوردکننده عدم قطعیت به شمار بیاید.” این آزمون، توانایی شبکه را برای برچسبگذاری در زمانهایی که کاربران نباید اعتماد کامل به سیستم داشته باشند نشان میدهد. امینی در ادامه اینگونه افزود که: “برای مثال، اگر این مدل (شبکه عصبی مصنوعی)، یک برنامه مراقبتهای بهداشتی است، شاید نباید زیاد به تشخیصی که ارائه میدهد، تکیه کرد و در عوض میبایست به دنبال راه دومی نیز باشید.”
دکتر رایا هادسل (Dr. Raia Hadsell)، یک پژوهشگر هوش مصنوعی در DeepMind است رگرسیون را اینگونه توصیف میکند: “یک رویکرد ساده و ظریفی که زمینه تخمین عدم قطعیت را پیش میبرد و برای رباتیک و دیگر سیستمهای کنترل در دنیای واقعی بسیار مهم است.” وی افزود: “این کار به روشی بدیع انجام میشود که از برخی جنبههای شلوغ دیگر رویکردها اجتناب میورزد. در نتیجه باعث میشود که رویکرد انتخابی، نه تنها ظریف و دقیق باشد، بلکه از نظر محاسباتی نیز کارآمدتر عمل کند. چنین رویکرد و روشی، یک ترکیب برنده خواهد بود.”