یافتن سیگنال­‌های هشدار دهنده پنهان در دنباله‌های زمانی با استفاده از هوش مصنوعی

 

یک الگوریتم جدید یادگیری عمیق می‌­تواند هنگام از کار افتادن سیستم‌­ها (از ماهواره‌ها گرفته تا مراکز داده) اطلاعات پیشرفته‌­ای را ارائه دهد.

محققان دانشگاه MIT یک الگوریتم مبتنی بر یادگیری عمیق برای تشخیص ناهنجاری­ در دنباله‌­های زمانی توسعه داده­‌اند. زمانی که شما مسئول یک ماهواره چند میلیون ‌دلاری هستید که با سرعت هزاران مایل بر ساعت در فضا حرکت می‌کند، باید مطمئن باشید که این ماهواره راحت و آسان در حال حرکت است. دنباله‌­های زمانی دراین مورد می‌توانند به شما کمک کنند. دنباله زمانی تاریخچه‌­ای است که مکررا در طول زمان اندازه‌گیری شده‌­است. این دنباله می‌­تواند عملکرد طولانی مدت و کوتاه مدت سیستم را ردیابی کند. به عنوان مثال می‌­توان به منحنی بدنام موارد ابتلای جدید روزانه Covid-19 و منحنی Keeling اشاره کرد که از سال 1958 میزان دی اکسیدکربن جو را ردیابی کرده‌­است. در عصر داده‌­های بزرگ Kalyan Veeramachaneni می­‌گوید:”دنباله­‌های زمانی در همه جا، از ماهواره گرفته تا توربین‌­ها جمع آوری می‌­شوند. همه این ماشین­‌آلات دارای سنسورهایی هستند که این دنباله‌­های زمانی را در مورد نحوه عملکرد خود جمع‌آوری می­‌کنند.”

اما تجزیه و تحلیل این دنباله‌­های زمانی و مشخص کردن نقاط غیرعادی در آن‌ها می‌­تواند پیچیده باشد. داده‌­ها می­‌توانند پر از خطا و داده‌­های نامربوط باشند. مثلا اگر یک اپراتور دنباله‌­ی شامل خوانش درجه‌حرارت بالای یک ماهواره را ببیند، از کجا بفهمد که این نوسان بی­‌ضرر است یا نشانه گرم ­شدن بیش از حد ماهواره است؟

این مشکلی است که Veeramachaneni رهبر گروه تبدیل داده به هوش مصنوعی در آزمایشگاه سیستم­‌های اطلاعات و تصمیم‌گیری MIT امیدوار است بتواند آن را حل کند. این گروه یک روش مبتنی بر یادگیری عمیق برای مشخص­ کردن ناهنجاری‌­ها در داده­‌های یک دنباله زمانی ایجاد کرده‌­است. روش آن‌ها که TadGAN نامیده می‌­شود بهتر از روش‌­های دیگر عمل می‌­کند. TadGAN می‌­تواند به اپراتورها کمک کند و تغییرات عمده در دنباله‌­های زمانی را در طیف وسیعی از سیستم­‌های با ارزش از ماهواره­‌ای که در فضا پرواز می‌­کند گرفته تا اتاق سرورهایی که در زیرزمین کار می‌­کنند، شناسایی و به آن‌ها واکنش نشان دهد.

این تحقیق در کنفرانس IEEE BigData دسامبر 2020 ارائه شد. نویسندگان مقاله شامل اعضای گروه تبدیل داده به هوش مصنوعی Veeramachaneni، فوق­‌دكتر Dongyu Liu، دانشجوی تحقیق Alexander Geiger و دانشجوی كارشناسی ارشد Sarah Alnegheimish و همچنین Alfredo Cuesta-Infante از دانشگاه Rey Juan Carlosاسپانیا هستند.

برای سیستم پیچیده‌­ای همچون ماهواره، تجزیه و تحلیل دنباله‌­های زمانی باید خودکار باشد. شرکت ماهواره­‌ای SES، که با Veeramachaneni همکاری می­‌کند، انبوهی از دنباله­‌های زمانی یعنی حدود 30000 پارامتر منحصر به فرد برای هر فضاپیما را از ماهواره­‌های ارتباطی خود دریافت می­‌کند. اپراتورهای انسانی در اتاق کنترل SES تنها می‌توانند بخشی از آن دنباله زمانی را که در حال چشمک زدن روی صفحه هستند دنبال کنند. آن‌ها برای مشخص کردن مقادیر خارج از محدوده فقط به یک سیستم هشدار متکی هستند. شرکت SES از تیم Veeramachaneni خواست که برای تجزیه و تحلیل تمام آن دنباله‌­های زمانی و مشخص کردن هرگونه رفتار غیرمعمول، از یادگیری عمیق استفاده کند.

چالش‌­های این درخواست زیاد است. اگر الگوریتم یادگیری عمیق نتواند ناهنجاری را تشخیص دهد، تیم فرصت رفع اشکال را از دست می­‌دهد. اما اگر داده‌­ای که دقیق نیست باعث شود که هربار زنگ خطر بی‌­دلیل به صدا در آید، اعضای تیم وقت خود را برای بررسی الگوریتمی که به صورت اشتباه زنگ هشدار را زده است صرف خواهند کرد. Liu می‌­گوید: ”بنابراین ما اینجا دو چالش داریم که باید بین آن‌ها تعادل برقرار کنیم.”

تیم تلاش کرد که به جای اینکه فقط برای سیستم‌های ماهواره‌ای این تعادل را برقرار کنند، یک چارچوب کلی‌­تر برای تشخیص ناهنجاری ایجاد کند. چارچوبی که می­‌تواند در صنایع نیز کاربرد داشته باشد. آن‌ها به یک سیستم یادگیری عمیق موسوم به شبکه های مولد تخاصمی (generative adversarial networks GAN) که اغلب برای تجزیه و تحلیل تصویر استفاده می‌­شوند، روی آوردند.

GAN از یک جفت شبکه عصبی تشکیل شده‌­است. شبکه ”مولد” که تصاویر جعلی ایجاد می‌­کند و شبکه ”متمایزگر” که تصاویر را پردازش می­‌کند و سعی می­‌کند تشخیص دهد که آیا تصاویر واقعی هستند یا تصاویر جعلی‌ای هستند که توسط شبکه ”مولد” ایجاد شده­‌اند. در طی مراحل این فرآیند، مولد از بازخورد متمایزگر می‌­آموزد و در ایجاد تصاویر جعلی بیش از حد واقعی تبحر می‌­یابد. این روش یادگیری نظارت نشده تلقی می­‌شود، زیرا نیازی به مجموعه داده­‌ای که در آن تصاویر برچسب موضوع خودشان را داشته باشند ندارد. (تهیه مجموعه داده­‌های بزرگ دارای برچسب دشوار است.)

تیم روش GAN را برای داده­‌های دنباله زمانی به کار برد. Liu می‌­گوید:”با کمک این روش یادگیری، مدل ما می‌­تواند تشخیص دهد كه كدام نقاط داده طبیعی است و كدام غیرعادی است.” روش GAN این کار را با بررسی اختلافات یعنی ناهنجاری‌های احتمالی بین دنباله زمانی واقعی و جعلی تولید ­شده توسط GAN انجام می‌­دهد. اما این تیم متوجه شد که GANها به تنهایی برای تشخیص ناهنجاری دریک دنباله‌­ی زمانی کافی نیستند، زیرا آن‌ها می‌­توانند در تعیین دقیق یک قسمت دنباله زمان واقعی که باید با دنباله زمان جعلی مقایسه شود کوتاهی کنند و در نتیجه همان‌طور که Veeramachaneni می­‌گوید: ”اگر تنها از GAN استفاده کنید، تعداد زیادی مثبت کاذب ایجاد خواهید کرد.”

برای جلوگیری از مثبت کاذب، الگوریتم GAN را با الگوریتمی به نام خود ­رمز گذار که تکنیک دیگری برای یادگیری عمیق بدون نظارت است تکمیل کردند. برخلاف تمایل GAN به دادن مثبت کاذب، رمزگذاران خودکار مستعد چشم­‌پوشی بر ناهنجاری‌های واقعی هستند. دلیل این امر این است که خود رمزگذاران الگوهای زیادی را در دنباله‌­های زمانی می‌گیرند و گاهی اوقات یک ناهنجاری واقعی را به عنوان یک نوسان بی‌ضرر تفسیر می‌­کنند. محققان با ترکیب GAN و یک رمزگذار خودکار، یک سیستم تشخیص ناهنجاری ایجاد کردند که تعادل خوبی ایجاد می‌­کند. TadGAN هوشیار است، اما هشدارهای کاذب زیادی ایجاد نمی‌کند.

رویکرد سنتی پیش‌­بینی دنباله­‌های زمانی که ARIMA نامیده می‌­شود در دهه 1970 توسعه یافت. Alnegheimish می‌­گوید:”ما می‌­خواستیم ببینیم که چقدر پیشرفت کرده­‌ایم و آیا مدل­‌های یادگیری عمیق می‌­توانند این روش کلاسیک را بهبود ببخشند؟”

این تیم آزمایش­‌های تشخیص ناهنجاری را بر روی 11 مجموعه داده انجام داد و ARIMA را در برابر TadGAN و هفت روش دیگر قرار داد. برخی از این روش‌­ها توسط شرکت­‌هایی همچون آمازون و مایکروسافت توسعه یافته­‌اند. TadGAN در مسابقه تشخیص ناهنجاری‌­های یک دنباله زمانی با نتیجه 11 به 8 ARIMA را شکست داد.

Alnegheimish تأكيد كرد كه هدف آن‌ها نه تنها توسعه يك الگوريتم تشخيص ناهنجاري درجه يك، بلكه استفاده کاربردی از آن نيز بوده است. او می‌­گوید: ”همه ما می‌­دانیم که هوش مصنوعی از مشکل تکثیرپذیری رنج می‌برد.” این تیم کد TadGAN را به صورت متن‌­باز منتشر کرده است و آن را به صورت دوره­‌ای بروزرسانی می­‌کند. به علاوه، آن‌ها یک سیستم بنچمارک ایجاد کردند که برای مقایسه عملکرد مدل­‌های مختلف تشخیص ناهنجاری به کاربران کمک کند.

“این بنچمارک متن ­باز است بنابراین هر فردی می‌تواند آن را امتحان کند. آن‌ها اگر بخواهند می‌­توانند مدل خودشان را اضافه کنند. ما می‌­خواهیم این پیش‌زمینه که هوش مصنوعی تکثیرپذیر نیست را از بین ببریم. ما می‌خواهیم اطمینان حاصل کنیم که همه چیز درست کار می‌­کند.”

Veeramachaneni امیدوار است TadGAN روزی به طیف گسترده­‌ای از صنایع خدمات ارایه بدهد، نه فقط شرکت‌های ماهواره‌ای. به عنوان مثال می‌­توان از آن برای نظارت بر عملکرد برنامه­‌های رایانه‌­ای که در اقتصاد مدرن کاربرد دارند استفاده کرد. وی می­‌گوید :”من برای اداره آزمایشگاه 30 برنامه کاربردی دارم. Zoom، Slack، Github و هر برنامه‌ای که فکرش را بکنید. من به این‌که آن‌ها یکپارچه و برای همیشه کار می­‌کنند اطمینان دارم”. همین امر برای میلیون‌­ها کاربر در سراسر جهان نیز صدق می­‌کند.

TadGAN می‌­تواند به شرکت­‌هایی مانند Zoom کمک کند تا سیگنال­‌های دنباله زمانی را در مرکز داده خود کنترل کند تا از ایجاد وقفه در خدماتش که می‌­تواند سهم بازار شرکت را تهدید کند، جلوگیری کند. این تیم قصد دارد درآینده TadGAN را در قالب یک رابط کاربری در اختیار عموم قرار دهد تا برای تجزیه و تحلیل دنباله‌­های زمانی پیشرفته به کاربران کمک کند.

لینک کوتاه شده : https://amerandish.com/HPDBW

به اشتراک بگذارید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

_ مطالب مرتبط _

درخواست شما با موفقیت ارسال شد.

ضمن تشکر بابت ارسال پیام، در سریع‌ترین زمان ممکن کارشناسان شرکت عامراندیش درخواست شما را بررسی خواهند نمود.