حمله به زیرساختهای سایبری و شبکههای رایانهای که توسط حفرههای موجود در نرم افزارها انجام میشود، حملات روز صفر نامیده میشوند. این حملات میتوانند به سرعت فرآیند دفاعی سنتی که برای مقابله با نفوذ طراحی شدهاند را از بین ببرند و در نتیجه میتوانند باعث ایجاد میلیاردها دلار خسارت شوند، همچنین به چندین هفته کار سنگین بر روی سیستمها برای رفع خرابیها پس از نفوذ نیاز است. اکنون، تیمی از محققان در دانشگاه پن از علم یادگیری ماشین که بر تکنیکی به عنوان یادگیری عمیق استوار است استفاده کردهاند تا یک سیستم دفاع سایبری سازگار در برابر این حملات ایجاد کنند.
طبق گفته Minghui Zhu، دانشیار مهندسی برق و علوم کامپیوتر در موسسه علوم محاسبات دادههای مشترک: “روشی مبتنی بر یادگیری ماشین برای رفع محدودیتهای فعلی جهت شناسایی و پاسخ به حملات سایبری توسعه داده شده است که از آن به عنوان دفاع متحرک ( MTD ) یاد میشود.”
ژو گفت: “روشهای سنتی نمیتوانند به صورت فعال و پویا پیکربندی شوند و این مسئله سبب میشود تا نتوانند از نفوذ مهاجمان جلوگیری کنند. تکنیکهای دفاعی موجود از دو محدودیت عمده رنج میبرند. اول اینکه انتخاب دستی نوع دفاع میتواند بسیار وقتگیر باشد. ثانیا تنظیمات دستی انتخاب شده ممکن است مقرون به صرفهترین و کارآمدترین روش برای کنترل یک تهاجم نباشد.”
به گفته محققان، که یافتههای خود را در ACM Transactions on Privacy and Security منتشر کردهاند، در حال حاضر پاسخهای مناسب به یک حمله ممکن است تا 15 روز طول بکشد، که میتواند بودجه و منابع قابل توجهی را برای سازمانها مصرف کند. ژو گفت که حملات روز صفر از جمله خطرناکترین تهدیدها برای سیستمهای رایانهای است و میتواند آسیب جدی به سیستمها وارد کند. به عنوان نمونه حمله بد افزار WannaCry، که در ماه مه 2017 رخ داد، بیش از 200000 کامپیوتر با سیستم عامل ویندوز را در 150 کشور جهان هدف قرار داد و تخمین زده شد که خسارتی به ارزش 4 تا 8 میلیارد دلار وارد آورده باشد.
رویکرد این تیم به یادگیری تقویت کننده متکی است که در کنار یادگیری نظارت شده و یادگیری بدون نظارت، سه الگوی اصلی یادگیری ماشین هستند. به گفته محققان، یادگیری تقویت کننده راهی است که یک الگوریتم میتواند با انتخاب آن و با تعادل بخشیدن به بهرهبرداری از تجارب گذشته، اکتشاف راههای جدید و انجام اقدامات خاص، به حداکثر کارآیی دست پیدا کند. لیو گفت: “الگوریتم سیاستها یا اقدامات بهینه را از طریق تعاملات مداوم در یک محیط زمینه یاد میگیرد که تا حدی ناشناخته هستند. بنابراین هنگامی که اطلاعات مهم از اهداف حملات یا مکانهای آسیب پذیر در دسترس نیست سیستم برای دفاع در برابر حملات روز صفر کاملا آماده است.”
محققان الگوریتم خود را در یک شبکه 10 رایانهای آزمایش کردند. آنها گفتند که اگرچه یک شبکه 10 رایانهای خیلی بزرگ به نظر نمی رسد، اما این مقدار برای آزمایش کافی است. این آزمایشات شامل سرورهای وب و نامه، سرور Gateway، سرور SQL و سرور DNS بود. محققان سرورهایی را برای آزمایش انتخاب کردند که آسیب پذیری بالایی دارند تا بتوانند سناریوهای متعددی را برای حمله به آنها و آزمایش الگوریتم خود ایجاد کنند. به گفته محققان نتیجه آزمایشات کاملا مثبت بوده و امید میرود در آیندهای نزدیک به وسیله الگوریتمهای کامپیوتری که بر پایه هوش مصنوعی استوارند سیستمهای رایانهای بتوانند در مقابل هر نوع حمله سایبری مقاوم شوند.