زیست شناسان از الگوریتمی محاسباتی برای مدلسازی استفاده کردند تا پیشبینی کنند که چگونه ویروسها برای فرار از سیستم ایمنی بدن تکامل پیدا میکنند. ویروسها ساختار و چرخهای نسبتاً تکراری دارند، آنها ابتدا وارد یک سلول میشوند، سپس کنترل سلول را بدست میگیرند تا آن را به یک دستگاه کپی ویروسی تبدیل کنند و در نهایت این نسخههای کپی شده به سلولهای مشابه دیگر رفته و همان دستورالعملها را تکرار میکنند. بنابراین این چرخه بارها و بارها ادامه مییابد. اما برخی اوقات در میان این تکثیر شدنهای مکرر همه چیز با هم مخلوط میشود و در نسخهها جهش بهوجود میآید.
گاهی اوقات جهش به این معنی است که اسید آمینه ساخته نمیشود و پروتئین حیاتی برای بقای ویروس جمع نمیشود، بنابراین نسخه ویروسی جهش یافته در زبالهدان تاریخ تکاملی قرار میگیرد. گاهی اوقات جهش اتفاق میافتد اما کاری انجام نمیدهد، زیرا توالیهای مختلفی که پروتئینها را کنترل میکنند خطا را جبران میکنند. اما هر چند وقت یکبار روند جهش یافتن کاملا درست پیش میرود. این جهش یافتن بر توانایی ویروس تأثیر نمیگذارد اما در عوض در آنها یک تغییر مفید ایجاد میکند، مانند اینکه به واسطهی یک جهش ویروس دیگر برای سیستم ایمنی بدن انسان قابل تشخیص نیست. هنگامی که ویروس از دست آنتیبادیهای موجود در بدن بگریزد گفته میشود که آن نوع از ویروس جهشیافته فرار کرده است.
دانشمندان همیشه در جستجوی علائم فرار احتمالی هستند. این موضوع برای SARS-CoV-2 کاملا صادق است، زیرا مدام گونههای جدیدی از آن بوجود میآیند و دانشمندان برای ساخت واکسن آن باید مدام تحقیقات طولانی مدت داشته باشند. فرار ویروسی همچنین باعث سردرگمی محققانی است که به مطالعه در خصوص بیماری آنفلوانزا و اچ آی وی میپردازند، ویروسهایی که به طور معمول از سیستم دفاعی بدن ما فرار میکنند. بنابراین محققان در تلاشند تا پیشبینی کنند که چه چیزی پیش خواهد آمد.
محققان در آزمایشگاه جهشهای فرضی ایجاد میکنند و بررسی میکنند که آیا ویروسها میتوانند از آنتیبادیهای گرفتهشده از بیماران یا دریافتکنندگان واکسن فرار کنند یا خیر. اما متاسفانه کد ژنتیکی امکانات زیادی را برای نحوههای مختلف جهش ممکن میکند و این مسئله کار محققان را بسیار دشوار کرده است. اما یک ایده وجود دارد که شاید با آستفاده از آن بتوان مرحلهی بعدی جهش یک ویروس را پیشبینی کرد. برایان هی، متخصص زیست شناسی محاسباتی در MIT در مورد ایدهی خود درباره فرار ویروسی چنین میگوید: “برای فکر کردن به دنبالههای ویروسی باید به زبان نوشتاری فکر کنیم.”
او استدلال كرد كه هر توالي ويروسي میتواند نوعي دستور زبان داشته باشد، مجموعه قوانينی كه بايد براي آن ويروس خاص رعايت شود. وقتی جهشها آن دستور زبان را نقض میکنند، ویروس به بن بست تکاملی میرسد.
میتوان گفت که توالی ژنتیکی دارای نوعی معناشناسی است. برخی توالیها وجود دارد که سیستم ایمنی بدن میتواند آنها را تفسیر کند و بنابراین ویروس را با استفاده از آنتیبادیها و سایر موارد دفاعی متوقف میکند و در برخی از ویروسها بدن هیچ درکی از توالی آنها ندارد. بنابراین میتوان فرار ویروسی را تغییری دانست که دستور زبان را حفظ میکند اما معنی را تغییر میدهد.
مقایسه دارای ظرافتی بسیار ساده بود. اما از نظر برایان هی کاملا عملی است. در سالهای اخیر سیستمهای هوش مصنوعی در مدل سازی اصول دستور زبان و معناشناسی زبان بشر بسیار خوب عمل کردهاند. آنها این کار را با آموزش سیستم به وسیلهی مجموعهای از دادهها که شامل میلیاردها کلمهی مرتب شده در جملات و پاراگرافها است انجام میدهند و سیستم از آنها الگو میگیرد. به این ترتیب سیستم بدون اینکه هیچ قانون خاصی به او گفته شود میآموزد که ویرگولها باید به کجا بروند و چگونه یک بند را ساختاربندی کند.
سیستم همچنین معنای توالیهای خاص کلمات و عبارات را براساس بسیاری از اطلاعات که در کل مجموعه وجود دارد تنظیم میکند و این الگوها را تا انتها ادامه میدهد. به این ترتیب پیشرفتهترین مدلهای زبان مانند GPT-3 محصول کمپانی OpenAI، میتوانند نثری کاملاً دستوری تولید کنند که در یک موضوع نوشته شده باشد و با معیارهای منطقی کاملا همخوانی داشته باشد. یک مزیت بزرگ این سیستم قابل تعمیم بودن آن است.
به گفته جرمی هوارد، محقق هوش مصنوعی در دانشگاه سانفرانسیسکو و یک متخصص سیستمهای تشخیص زبان استفاده از چنین مدلهایی در توالیهای بیولوژیکی میتواند کاملا مثمرثمر باشد. با استفاده از دادههای کافی مثل توالی ژنتیکی ویروسها، مدل به طور ضمنی چیزی درباره چگونگی ساختار ویروس یاد میگیرد. بنابراین آزمایشگاه Berger ایدهی برایان هی را آزمایش کرد و نتایج در مجلهی Science منتشر شده است.
در ابتدا این تیم به ویروس آنفلوانزا و اچ آی وی علاقهمند بودند که هر دو ویروس به دلیل فرار از واکسن مشهور هستند. اما هنگامی که آنها در ماه مارس کار آزمایشگاهی خود را آغاز کردند ویروس کرونا در جهان شیوع پیدا کرد، بنابراین آنها تصمیم گرفتند که این ویروس را هم به آزمایشات خود اضافه کنند.
برایان برایسون، استاد مهندسی بیولوژیک در MIT و یکی از اعضای این تحقیق برای هر سه ویروس توالیهایی را که ویروس جهت ورود به سلولها و تکثیر از آنها استفاده میکنند مشخص کرد. این مکانها هدف اصلی سیستم ایمنی و واکسنها هستند. آنها مکانهایی هستند که آنتیبادی به آن متصل میشود و از ورود ویروس به سلول جلوگیری میکند (برای SARS-CoV-2 ، این پروتئین سنبله است). تیم MIT یک مدل زبان را با استفاده از دادههای توالی ژنتیکی به جای پاراگرافها و جملات معمول به سیستم آموزش داد. سپس آنها بررسی کردند که مدل در مورد توالیها چه چیزی آموخته است.
آنها از دیدن واقعیت خوشحال شدند و دریافتند که بسیاری از بیماریهای ویروسی از یک زبان مشابه با معنایی متفاوت برخوردارند، مانند آنفولانزای مرغی که در سالهای 1918 و 2009 شیوع پیدا کرد از نظر دستوری کاملا مشابه هم بودند اما در معنا باهم تفاوت داشتند. محققان دادههای حاصل از تحقیقات گذشته را برای تعیین میزان جهشهای مختلف و میزان اتصال یا تکثیر آنها در سلولها برای هر سه ویروس جمعآوری کردند و سپس بررسی کردند که مدل از نظر دستوری این توالیها را چگونه ارزیابی میکند.
اما تیم تحقیقاتی میخواستند بدانند که آیا ترکیب این دو میتواند فرار ویروسی را پیشبینی کند. هنگامی که آنها پیشبینیهای مدل خود را با موارد شناخته شده فرار ویروسی مقایسه کردند، مدل آنفلوانزا کاملا قابل پیشبینی بود. اما این نتیجه اصلا تعجبآور نبود زیرا مجموعه دادههایی که از آنها برای آموزش سیستم استفاده کرده بودند شامل سالها توالی آنفلوانزا و انبوه جهشهای شناخته شده برای عبور از سیستم ایمنی بدن انسان بود.
برای SARS-CoV-2، آنها پیشبینیهای خود را در مورد جهشهای فرار که به طور مصنوعی استخراج شده اند، از سرم غنی از آنتیبادی عبور دادند تا فشار بر ویروس سبب ایجاد جهش شده و ویروس را مجبور به کاری کنند که بتواند از آنتی بادیها فرار کند. اما چیز مهمی بدست نیامد زیرا این مدل بیشتر فرارهای واقعی را پرچم گذاری میکند. به عبارت دیگر در حال حاضر در دنیای واقعی چیزی وجود ندارد که نگران آن باشیم. اما این یک شروع است که میتواند به ویروس شناسان کمک کند تا دریابند که جهشهای طبیعی در کجا انجام میشوند.
بنهور لی، میکروبیولوژیست در دانشکده پزشکی Mount Sinai’s Icahn میگوید: “این یک روش خارقالعاده برای محدود کردن دنیای ویروسهای جهشیافته است. وی اضافه میکند که پیشبینیها کاملا بستگی به کیفیت دادههایی دارد که به سیستم وارد میشود و همانطور که محققان متذکر شدند این بدان معناست که مدل همچنان از تفاوتهای ظریف خاصی چشم پوشی میکند، زیرا فرار همیشه فقط تابعی از جهشهای ویروس نیست. HIV نمونه خوبی در این خصوص است. گاهی اوقات، توالی آن تغییر نمیکند و پروتئینهای ویروسی هنوز توسط آنتی بادیها شناخته میشوند، اما پروتئینهای ویروس توسط نوعی ترکیب قندی به نام گلیکان محافظت میشوند.”
لی اشاره کرد که پیشبینی هوش مصنوعی برای گفتن آنچه محققان قبلاً میدانستند خوب است. به عنوان مثال سیستم دو قسمت از سنبله SARS-CoV-2 را که محققان معتقدند تمایل بیشتری برای جهشهای فرار دارند شناسایی کرد و یک بخش دیگر را با ثبات تر تشخیص داد. اما باید دید که آیا پیشبینیهای آن میتواند بینشی کاملاً بدیع ارائه دهد یاخیر. منطقهای که به اعتقاد نویسندگان مقاله مدلهای محاسباتی بسیار مفید خواهند بود، شناسایی جهشهای ترکیبی نام دارد که شامل تغییرات زیادی است که بر روی یکدیگر ساخته شدهاند. اما این شناسایی احتمالاً به دادههای بیشتری احتیاج دارد تا بتواند منجر به تولید هدایای خوبی برای دانشمندان آزمایشگاهی مانند لی شود.
گام بعدی که به زودی با همكاری برایسون در آزمایشگاه دیگری آغاز میشود شامل ایجاد برخی از جهشهای پیشبینی شده SARS-CoV-2 در آزمایشگاه و دیدن نحوه عمل آنها بر روی آنتیبادیهای گرفته شده از افراد بهبود یافته و واكسینه شده است. آنها از نوعی ویروسها استفاده میکنند که به طرز خطرناکی عفونی نیستند و میتوانند میزان خنثیکردن آنتیبادی در ویروسهای خاص را ارزیابی کنند.