با استفاده از این سیستم و قدرت محاسباتی آن، محققان میتوانند توالی پروتئین ویروسی را شناسایی کنند که میتواند جهشی بزرگ در زمینه ساخت واکسن باشد. تولید وساخت واکسنهای موثر علیه برخی ویروسها از جمله آنفلوانزا و HIV بسیار دشوار است زیرا این ویروسها از نظر ژنتیکی بسیار سریع جهش مییابند. این جهش ژنتیکی به آنها اجازه میدهد تا از طریق پرکاری که به عنوان “فرار ویروسی” شناخته میشود، از پادتنهای تولید شده از یک واکسن خاص فرار کنند.
اکنون محققان موسسه MIT بر اساس مدلهایی که در ابتدا برای تحلیل زبان طبیعی ساخته شده بودند، مدل هوش مصنوعی محاسباتی جدیدی برای فرار ویروسی ابداع کردهاند. این مدل میتواند پیشبینی کند که کدام بخش از پروتئینهای سطح ویروسی ممکن است جهش پیدا کنند و به این گونه تشخیص فرار ویروسی را امکانپذیر میکند. این مدل همچنین میتواند بخشهایی را که احتمال جهش کمتری دارند شناسایی کرده و آنها را به اهدافی خوب جهت تولید واکسنهای جدید تبدیل کند.
بونی برگر، استاد ریاضیات سیمونز و رئیس گروه محاسبات و زیست شناسی در آزمایشگاه علوم رایانهای و هوش مصنوعی MIT، میگوید: “فرار ویروسی یک مشکل بزرگ است. فرار ویروسی توسط پروتئین سطحی آنفلوانزا و پروتئین سطحی اچ آی وی انجام میشود و این دو پروتئین مسئول این هستند که ما واکسن آنفلوانزای جهانی و واکسنی برای اچ آی وی نداریم و هر دو، سالانه صدها هزار نفر را به کام مرگ میکشند.”
در تحقیقی که امروز در Science منتشر شد، برگر و همکارانش اهداف احتمالی این مدل که تولید واکسن علیه آنفلوانزا و اچ آی وی است را شناسایی و تعیین کردند. همچنین از زمان پذیرش این مقاله برای چاپ محققان مدل خود را بر روی انواع جدید SARS-CoV-2 که اخیراً در انگلستان و آفریقای جنوبی ظهور کرده است به کار گرفتند. محققان میگویند: “این تجزیه و تحلیل، که هنوز آغاز نشده در راستای شناسایی توالی ژنتیکی ویروسها است که باید مورد بررسی قرار گیرند.”
بونی برگر و برایان برایسون، استادیار مهندسی بیولوژیک در MIT و عضو موسسه راگون MGH و هاروارد از نویسندگان ارشد این مقاله هستند و نویسنده اصلی آن دانشجوی تحصیلات تکمیلی در MIT، برایان هی است.
زبان پروتئینها
انواع ویروسها با نرخهای مختلف جهش ژنتیکی پیدا میکنند و ویروس HIV و آنفلوانزا از جمله مواردی هستند که سریعترین جهش را دارند. برای اینکه این جهشها باعث فرار ویروسی شوند، ویروس باید شکل پروتئینهای سطح خود را تغییر دهد تا آنتی بادیها دیگر نتوانند به آن متصل شوند. با این حال، پروتئین نمیتواند به گونهای تغییر کند که آنتی بادی را غیرفعال کند.
تیم MIT تصمیم گرفت این معیارها را با استفاده از نوعی مدل محاسباتی که تحت عنوان مدل زبان شناخته میشود، از حوزه پردازش زبان طبیعی (NLP) مدلسازی کند. این مدلها برای تجزیه و تحلیل الگوها در زبان، به ویژه فرکانسی که کلمات خاص با هم تشکیل میدهند طراحی شدهاند. به این ترتیب مدلها میتوانند پیشبینی کنند که کدام کلمات ممکن است برای تکمیل جملهها استفاده شوند مانند این مثال: سالی تخم مرغ برای … در این مثال، یک مدل NLP ممکن است کلمه “صبحانه” یا “ناهار” را پیشبینی کند.
ایده اصلی محققان این بود که این نوع مدلها میتوانند در شناخت اطلاعات بیولوژیکی ویروسها مانند شناخت توالی ژنتیکی اعمال شود. در این حالت، دستور زبان مشابه قوانین رمزگذاری پروتئین توسط یک توالی خاص بوده و معنای کلمات آن مشابه این است که آیا پروتئین میتواند شکل جدیدی به خود بگیرد تا به آن کمک کند از آنتی بادیها فرار کند. بنابراین جهشی که فرار ویروسی را امکانپذیر میکند باید دستورالعملها را حفظ کند و در عین حال ساختار پروتئین را به روشی مفید برای ویروس تغییر دهد.
هی میگوید: “اگر ویروسی قصد داشته باشد تا از سیستم ایمنی بدن انسان فرار کند، نمیخواهد خودش جهش پیدا کند تا ماهیت خود را از بین ببرد یا نتواند همانند سایر ویروسهای هم دسته شود. ویروس میخواهد تناسب اندام و شکل کلی خود را حفظ کند و در عین حال به اندازه کافی تغییر کند تا بتواند خود را پنهان کند و توسط سیستم ایمنی بدن انسان قابل تشخیص نباشد.”
محققان برای مدلسازی این فرآیند، یک مدل NLP را برای تجزیه و تحلیل الگوهای موجود در توالی ژنتیکی ایجاد کردند که به آنها این امکان را میدهد تا توالیهای جدیدی که عملکردهای جدید دارند اما هنوز از قوانین بیولوژیکی ساختار ویروس پیروی میکنند را پیشبینی کنند. یک مزیت قابل توجه در این نوع مدلسازی این است که مدل برای آموزش فقط به اطلاعات توالی ویروسها نیاز دارد که به دست آوردن آنها از ساختارهای پروتئینی بسیار آسان است. این مدل میتواند با اطلاعاتی بسیار کم آموزش ببیند. در این مطالعه، محققان از 60000 توالی اچ آی وی، 45000 توالی آنفلوانزا و 4000 توالی ویروس کرونا برای آموزش سیستم استفاده کردند.
هی میگوید: “مدلهای زبان بسیار قدرتمند هستند زیرا آنها میتوانند ساختار پیچیده توزیعی ویروسها را بیاموزند و از طریق تغییر توالی بینشی در مورد عملکرد اطلاعات کسب کنند. ما این مجموعه بزرگ از دادههای توالی ویروسی را برای هر نوع اسید آمینه داریم و مدل ویژگیهای مربوط به اسید آمینه و تنوع آنها را در دادههای آموزشی فرا میگیرد.”
جلوگیری از فرار
پس از آموزش این مدل، محققان از آن برای پیشبینی توالی پروتئین ویروس کرونا، پروتئین HIV و پروتئین هماگلوتینین آنفلوانزا (HA) استفاده کردند که احتمال جهش ویروسی در آنها وجود دارد.
برای آنفلوانزا، مدل نشان داد که توالیهایی که کمترین احتمال جهش و تولید فرار ویروسی را دارند در ساقه پروتئین هماگلوتینین HA وجود دارند. این نتیجه با مطالعات اخیر که نشان میدهد آنتی بادیهایی که ساقه هماگلوتینین HA را هدف قرار میدهند (عملی که دراکثر افراد آلوده به آنفلوانزا یا واکسینه شده انجام میشود) میتوانند سبب محافظت تقریباً جهانی در برابر هر گونه ازآنفلوانزا باشند.
تجزیه و تحلیل مدل از ویروس کرونا نشان داد که بخشی از پروتئین به نام سنبله احتمالاً سبب ایجاد جهش ژنتیکی و فرار ویروسی میشود. اما هنوز این سوال بیپاسخ باقی مانده که ویروس SARS-CoV-2 با چه سرعتی جهش پیدا میکند. بنابراین معلوم نیست واکسنهایی که اکنون برای مقابله با بیماری همهگیر Covid-19 استفاده میشود چه مدت موثر خواهند بود. شواهد اولیه نشان میدهد که ویروس با سرعتی به اندازه آنفلوانزا یا HIV جهش نمییابد. با این حال محققان اخیراً جهشهای جدیدی را در سنگاپور، آفریقای جنوبی و مالزی شناسایی کردند که به نظر آنها باید برای فرار ویروسی احتمالی مورد بررسی قرار گیرند (این دادهها جدید هنوز مورد بررسی قرار نگرفتهاند).
محققان در مطالعات خود در مورد HIV دریافتند که مناطقی از پروتئین دارای جهشهای ژنتیکی زیادی هستند که با یافتههای قبلی همسو بوده و همچنین توالیهایی پیدا کردند که احتمال فرار آنها کمتر است. محققان اکنون در حال کار با سایر متخصصان برای استفاده از مدل خود جهت شناسایی اهداف احتمالی واکسنهای سرطانی هستند که باعث تحریک سیستم ایمنی بدن شده و تخریب تومورها را در پی دارند.
بریسون میگوید: “فرصتهای زیادی وجود دارد و قسمت خوب اینجاست که آنچه ما به آن نیاز داریم فقط دادههای توالی هستند که بدست آوردن آنها بسیار آسان است.” در پایان گفتنی است که بودجه این تحقیق توسط بخش علوم و مهندسی دفاع ملی از وزارت دفاع و بنیاد ملی علوم تأمین شده است.