کاربرد پردازش گفتار برای درک تحول پروتئین
پژوهشگران دانشگاه مریلند ایالات متحده، اخیرا از روشهای کاربرد پردازش گفتار برای درک تحول پروتئین استفاده کردند. آنها از پردازش زبان طبیعی و الگوریتمهای یادگیری ماشین برای درک چگونگی تغییر مولکولهای پروتئین از یک شکل به شکل دیگر به کار گرفتند. در مقاله اخیر که به تازگی در مجله Nature Communications منتشر شده، توضیح داده شده که برای اولین بار است که از الگوریتم هوش مصنوعی برای مطالعه پویایی سیستمهای بیومولکولی با توجه به تغییر شکل پروتئینها استفاده میشود.
مولکولهای پروتئین میتوانند اشکال مختلفی به خود بگیرند، اما سازوکارهایی که باعث میشود تا پروتئینها از یک شکل به شکل دیگر منتقل شوند، هنوز هم تا حد زیادی ناشناخته است. عملکرد یک مولکول پروتئین با توجه به شکل آن تعریف میشود. به دستآوردن درک بهتر از مکانیزمهای تاثیرگذاری بر شکل و ساختار پروتئین، میتواند دانشمندان را به سوی تولید طراحی روشهای درمانی دارویی و تعیین علت بیماریها رهنمون سازد.
پردازش گفتار برای درک تحول پروتئین ها
مولکولهای بیولوژیکی ثابت نیستند، آنها دائما در واکنش به رویدادهای محیط خود در حال حرکت هستند. فشارهای محیطی میتوانند اغلب به صورت ناگهانی مولکولها را به شکلهای مختلف تغییر دهند. یک مولکول میتواند به صورت ناگهانی به یک ساختار کاملا متفاوت تغییر شکل دهد (در فرایندی که بسیار شبیه به بازشدن سیمپیچ فنر است). در این انتقالها و تغییر شکلها، بخشهای مختلفی از مولکولها باز و بسته میشوند. مطالعه مراحل واسطه اشکال مختلف مولکولی مورد علاقه پژوهشگران است.
پراتیوش تیواری (Pratyush Tiwary)، نویسنده ارشد مقاله نام برده و استادیار دپارتمان شیمی و بیوشیمی دانشگاه مریلند و موسسه علوم جسمی و تکنولوژی، اعلام کرد که برای مدلسازی چگونگی تبدیل و انطباق مولکولها با یکدیگر، میتوان از پردازش گفتار استفاده کرد. وی خاطر نشان کرد که مولکولها زبان ویژهای دارند که با آن سخن میگویند و این زبان، همان حرکات ویژه مولکولها است که قادر به ترجمه به یک زبان انتزاعی است. هنگامی که فرآیند نگاشت حرکت مولکول به الگوهای زبانی انجام میشود، میتوان از تکنیکهای پردازش زبان طبیعی، پردازش گفتار و الگوریتمهای هوش مصنوعی برای “ایجاد داستانهای صحیح زیستشناختی از کلمات انتزاعی حاصل” استفاده کرد.
انتقال مولکول از شکلی به شکل دیگر بسیار سریع رخ میدهد. سرعت این انتقال ممکن است فقط به اندازه یک تریلیونیم ثانیه طول بکشد. چنین سرعت زیادی باعث میشود تا دانشمندان نتوانند با استفاده از روشهایی مانند طیفسنجی یا حتی میکروسکوپهای پرقدرت، تعیین کنند که چه پارامترهایی بر فرایند این انتقال تاثیر میگذارند. به منظور تعیین اینکه چه پارامترهایی بر روند گسترش پروتئینها تأثیر دارند، تیواری و سایر اعضای تیم تحقیقاتی، مدلهای فیزیکی را طراحی کردند که پروتئینها را شبیهسازی میکنند. آنها از مدلهای آماری پیچیده برای ایجاد شبیهسازی پروتئینی استفاده کردند که شکل، مسیر و حرکت مولکولها را تقلید میکند. این مدلها با استفاده از الگوریتم یادگیری ماشین و پردازشگفتار برای درک تحول پروتئین استفاده میکنند.
مدلهای پردازش زبان طبیعی مورد استفاده برای آموزش سیستم یادگیری ماشین، بسیار شبیه الگوریتمهای مورد استفاده در سیستمهای متنی پیشبینی شده توسط Gmail است. در این الگوریتم، پروتئینهای شبیهسازی شده را به عنوان یک زبان در نظر میگیرند که حرکتهای هر یک از آنها به عنوان یک “حرف” تلقی میشود. سپس با پیوند حرفها باهم، واژگان و جملات تشکیل میشوند. الگوریتمهای یادگیری ماشین با توجه به ساختارهای پروتئینها، قادر به یادگیری قوانین گرامری و نحوی زبان پروتئینها هستند. بدین وسلیه آنها تعیین میکنند که کدام شکلها و یا حرکتها، از شکل یا حرکتهای دیگر پیروی میکنند. سپس میتوان با استفاده از این الگوریتمها، پیشبینی نماییم چگونه پروتئینهای ویژه به هم گره میخورند و این گرهخوردگی، چه شکلهایی را پدید میآورد.
محققان در این پژوهش، از یک شبکه حافظه کوتاه مدت طولانی (LSTM) به منظور تجزیهوتحلیل جملات مبتنی بر پروتئینها و پردازش گفتار استفاده کردند. تیم تحقیقاتی همچنین ریاضیاتی را که شبکه بر پایه آنها استوار بود، شناسایی کرد. آنها همچنین بر پارامترهایی به عنوان یادگیری پویایی تحول مولکول نظارت کردند. طبق نتایج مطالعه، این شبکه از منطقی استفاده کرد که شبیه به مفهوم فیزیک ایستایی معروف به آنتروپی مسیر بود. اگر این یافته ثابت بماند، به طور بالقوه میتواند منجر به پیشرفت در شبکههای LSTM شود. تیواری توضیح داد که این کشف برخی از ماهیت جعبه سیاه LSTM را برطرف میکند و به محققان این امکان را میدهد تا درک کنند کدام پارامترها برای عملکرد بهینه تنظیم میشوند.
پژوهشگران به عنوان نمونه آزمایش الگوریتم خود، یک مولکول زیستی به نام ریبوسویچ (riboswitch) را تجزیه و تحلیل کردند. ریبوسویچ قبلا با استفاده از طیفسنجی آنالیز شده بود و هنگامیکه ریبوسویچ با سیستم یادگیری ماشین مورد تجزیه و تحلیل قرار گرفت، مشخص شد که فرمهای پیشبینی شده آن با موارد کشف شده توسط طیفسنجی مطابقت دارد.
تیواری امیدوار است که یافتههای آنها به پژوهشگران اجازه دهد داروهای هدفمندی تولید کنند که عوارض جانبی کمتری داشته باشند. همانطور که تیواری از طریق Phys.org توضیح داد: “شما میخواهید داروهای موثر و کارآمدی داشته باشید که بسیار قوی به مولکول یا پروتئینی که خواهان آن هستید، متصل شود. اگر بتوانیم اشکال مختلفی که مورد علاقه یک مولکول زیستی است، درک کنیم، میتوانیم داروهایی بسازیم که در زمان مناسب و به مدتی که ما میخواهیم به شکل ویژهای از این پروتیینها و یا مولکولها متصل گردند. برای رسیدن به این هدف، شاید تنها راه موجود همان استفاده از پردازش گفتار برای درک تحول پروتئین باشد”.