یک الگوریتم جدید یادگیری عمیق میتواند هنگام از کار افتادن سیستمها (از ماهوارهها گرفته تا مراکز داده) اطلاعات پیشرفتهای را ارائه دهد.
محققان دانشگاه MIT یک الگوریتم مبتنی بر یادگیری عمیق برای تشخیص ناهنجاری در دنبالههای زمانی توسعه دادهاند. زمانی که شما مسئول یک ماهواره چند میلیون دلاری هستید که با سرعت هزاران مایل بر ساعت در فضا حرکت میکند، باید مطمئن باشید که این ماهواره راحت و آسان در حال حرکت است. دنبالههای زمانی دراین مورد میتوانند به شما کمک کنند. دنباله زمانی تاریخچهای است که مکررا در طول زمان اندازهگیری شدهاست. این دنباله میتواند عملکرد طولانی مدت و کوتاه مدت سیستم را ردیابی کند. به عنوان مثال میتوان به منحنی بدنام موارد ابتلای جدید روزانه Covid-19 و منحنی Keeling اشاره کرد که از سال 1958 میزان دی اکسیدکربن جو را ردیابی کردهاست. در عصر دادههای بزرگ Kalyan Veeramachaneni میگوید:”دنبالههای زمانی در همه جا، از ماهواره گرفته تا توربینها جمع آوری میشوند. همه این ماشینآلات دارای سنسورهایی هستند که این دنبالههای زمانی را در مورد نحوه عملکرد خود جمعآوری میکنند.”
اما تجزیه و تحلیل این دنبالههای زمانی و مشخص کردن نقاط غیرعادی در آنها میتواند پیچیده باشد. دادهها میتوانند پر از خطا و دادههای نامربوط باشند. مثلا اگر یک اپراتور دنبالهی شامل خوانش درجهحرارت بالای یک ماهواره را ببیند، از کجا بفهمد که این نوسان بیضرر است یا نشانه گرم شدن بیش از حد ماهواره است؟
این مشکلی است که Veeramachaneni رهبر گروه تبدیل داده به هوش مصنوعی در آزمایشگاه سیستمهای اطلاعات و تصمیمگیری MIT امیدوار است بتواند آن را حل کند. این گروه یک روش مبتنی بر یادگیری عمیق برای مشخص کردن ناهنجاریها در دادههای یک دنباله زمانی ایجاد کردهاست. روش آنها که TadGAN نامیده میشود بهتر از روشهای دیگر عمل میکند. TadGAN میتواند به اپراتورها کمک کند و تغییرات عمده در دنبالههای زمانی را در طیف وسیعی از سیستمهای با ارزش از ماهوارهای که در فضا پرواز میکند گرفته تا اتاق سرورهایی که در زیرزمین کار میکنند، شناسایی و به آنها واکنش نشان دهد.
این تحقیق در کنفرانس IEEE BigData دسامبر 2020 ارائه شد. نویسندگان مقاله شامل اعضای گروه تبدیل داده به هوش مصنوعی Veeramachaneni، فوقدكتر Dongyu Liu، دانشجوی تحقیق Alexander Geiger و دانشجوی كارشناسی ارشد Sarah Alnegheimish و همچنین Alfredo Cuesta-Infante از دانشگاه Rey Juan Carlosاسپانیا هستند.
برای سیستم پیچیدهای همچون ماهواره، تجزیه و تحلیل دنبالههای زمانی باید خودکار باشد. شرکت ماهوارهای SES، که با Veeramachaneni همکاری میکند، انبوهی از دنبالههای زمانی یعنی حدود 30000 پارامتر منحصر به فرد برای هر فضاپیما را از ماهوارههای ارتباطی خود دریافت میکند. اپراتورهای انسانی در اتاق کنترل SES تنها میتوانند بخشی از آن دنباله زمانی را که در حال چشمک زدن روی صفحه هستند دنبال کنند. آنها برای مشخص کردن مقادیر خارج از محدوده فقط به یک سیستم هشدار متکی هستند. شرکت SES از تیم Veeramachaneni خواست که برای تجزیه و تحلیل تمام آن دنبالههای زمانی و مشخص کردن هرگونه رفتار غیرمعمول، از یادگیری عمیق استفاده کند.
چالشهای این درخواست زیاد است. اگر الگوریتم یادگیری عمیق نتواند ناهنجاری را تشخیص دهد، تیم فرصت رفع اشکال را از دست میدهد. اما اگر دادهای که دقیق نیست باعث شود که هربار زنگ خطر بیدلیل به صدا در آید، اعضای تیم وقت خود را برای بررسی الگوریتمی که به صورت اشتباه زنگ هشدار را زده است صرف خواهند کرد. Liu میگوید: ”بنابراین ما اینجا دو چالش داریم که باید بین آنها تعادل برقرار کنیم.”
تیم تلاش کرد که به جای اینکه فقط برای سیستمهای ماهوارهای این تعادل را برقرار کنند، یک چارچوب کلیتر برای تشخیص ناهنجاری ایجاد کند. چارچوبی که میتواند در صنایع نیز کاربرد داشته باشد. آنها به یک سیستم یادگیری عمیق موسوم به شبکه های مولد تخاصمی (generative adversarial networks GAN) که اغلب برای تجزیه و تحلیل تصویر استفاده میشوند، روی آوردند.
GAN از یک جفت شبکه عصبی تشکیل شدهاست. شبکه ”مولد” که تصاویر جعلی ایجاد میکند و شبکه ”متمایزگر” که تصاویر را پردازش میکند و سعی میکند تشخیص دهد که آیا تصاویر واقعی هستند یا تصاویر جعلیای هستند که توسط شبکه ”مولد” ایجاد شدهاند. در طی مراحل این فرآیند، مولد از بازخورد متمایزگر میآموزد و در ایجاد تصاویر جعلی بیش از حد واقعی تبحر مییابد. این روش یادگیری نظارت نشده تلقی میشود، زیرا نیازی به مجموعه دادهای که در آن تصاویر برچسب موضوع خودشان را داشته باشند ندارد. (تهیه مجموعه دادههای بزرگ دارای برچسب دشوار است.)
تیم روش GAN را برای دادههای دنباله زمانی به کار برد. Liu میگوید:”با کمک این روش یادگیری، مدل ما میتواند تشخیص دهد كه كدام نقاط داده طبیعی است و كدام غیرعادی است.” روش GAN این کار را با بررسی اختلافات یعنی ناهنجاریهای احتمالی بین دنباله زمانی واقعی و جعلی تولید شده توسط GAN انجام میدهد. اما این تیم متوجه شد که GANها به تنهایی برای تشخیص ناهنجاری دریک دنبالهی زمانی کافی نیستند، زیرا آنها میتوانند در تعیین دقیق یک قسمت دنباله زمان واقعی که باید با دنباله زمان جعلی مقایسه شود کوتاهی کنند و در نتیجه همانطور که Veeramachaneni میگوید: ”اگر تنها از GAN استفاده کنید، تعداد زیادی مثبت کاذب ایجاد خواهید کرد.”
برای جلوگیری از مثبت کاذب، الگوریتم GAN را با الگوریتمی به نام خود رمز گذار که تکنیک دیگری برای یادگیری عمیق بدون نظارت است تکمیل کردند. برخلاف تمایل GAN به دادن مثبت کاذب، رمزگذاران خودکار مستعد چشمپوشی بر ناهنجاریهای واقعی هستند. دلیل این امر این است که خود رمزگذاران الگوهای زیادی را در دنبالههای زمانی میگیرند و گاهی اوقات یک ناهنجاری واقعی را به عنوان یک نوسان بیضرر تفسیر میکنند. محققان با ترکیب GAN و یک رمزگذار خودکار، یک سیستم تشخیص ناهنجاری ایجاد کردند که تعادل خوبی ایجاد میکند. TadGAN هوشیار است، اما هشدارهای کاذب زیادی ایجاد نمیکند.
رویکرد سنتی پیشبینی دنبالههای زمانی که ARIMA نامیده میشود در دهه 1970 توسعه یافت. Alnegheimish میگوید:”ما میخواستیم ببینیم که چقدر پیشرفت کردهایم و آیا مدلهای یادگیری عمیق میتوانند این روش کلاسیک را بهبود ببخشند؟”
این تیم آزمایشهای تشخیص ناهنجاری را بر روی 11 مجموعه داده انجام داد و ARIMA را در برابر TadGAN و هفت روش دیگر قرار داد. برخی از این روشها توسط شرکتهایی همچون آمازون و مایکروسافت توسعه یافتهاند. TadGAN در مسابقه تشخیص ناهنجاریهای یک دنباله زمانی با نتیجه 11 به 8 ARIMA را شکست داد.
Alnegheimish تأكيد كرد كه هدف آنها نه تنها توسعه يك الگوريتم تشخيص ناهنجاري درجه يك، بلكه استفاده کاربردی از آن نيز بوده است. او میگوید: ”همه ما میدانیم که هوش مصنوعی از مشکل تکثیرپذیری رنج میبرد.” این تیم کد TadGAN را به صورت متنباز منتشر کرده است و آن را به صورت دورهای بروزرسانی میکند. به علاوه، آنها یک سیستم بنچمارک ایجاد کردند که برای مقایسه عملکرد مدلهای مختلف تشخیص ناهنجاری به کاربران کمک کند.
“این بنچمارک متن باز است بنابراین هر فردی میتواند آن را امتحان کند. آنها اگر بخواهند میتوانند مدل خودشان را اضافه کنند. ما میخواهیم این پیشزمینه که هوش مصنوعی تکثیرپذیر نیست را از بین ببریم. ما میخواهیم اطمینان حاصل کنیم که همه چیز درست کار میکند.”
Veeramachaneni امیدوار است TadGAN روزی به طیف گستردهای از صنایع خدمات ارایه بدهد، نه فقط شرکتهای ماهوارهای. به عنوان مثال میتوان از آن برای نظارت بر عملکرد برنامههای رایانهای که در اقتصاد مدرن کاربرد دارند استفاده کرد. وی میگوید :”من برای اداره آزمایشگاه 30 برنامه کاربردی دارم. Zoom، Slack، Github و هر برنامهای که فکرش را بکنید. من به اینکه آنها یکپارچه و برای همیشه کار میکنند اطمینان دارم”. همین امر برای میلیونها کاربر در سراسر جهان نیز صدق میکند.
TadGAN میتواند به شرکتهایی مانند Zoom کمک کند تا سیگنالهای دنباله زمانی را در مرکز داده خود کنترل کند تا از ایجاد وقفه در خدماتش که میتواند سهم بازار شرکت را تهدید کند، جلوگیری کند. این تیم قصد دارد درآینده TadGAN را در قالب یک رابط کاربری در اختیار عموم قرار دهد تا برای تجزیه و تحلیل دنبالههای زمانی پیشرفته به کاربران کمک کند.