تشخیص عوارض جانبی دارو به کمک NLP (پردازش زبان طبیعی): پردازش زبان طبیعی در حال افزایش دقت نوار تشخیص عوارض و واکنشهای جانبی دارویی است!
همه ساله، به دلیل عوارض و واکنشهای جانبی به دارو تنها در ایالات متحده، تقریبا حدود 700،000 نفر به بخش اورژانس بیمارستانها منتقل میشوند که از این تعداد 100،000 نفر، نیاز به بستری در بیمارستان دارند. گفته میشود که تقریبا 5 درصد از بیماران بستری در بیمارستانها، ADE یا همان واکنشهای جانبی به دارو را تجربه میکنند. این رویداد، رایجترین نوع خطاهای بستری است. علاوه بر این، کشف بسیاری از این موارد دشوار است زیرا به درستی گزارش نمیشوند. این مسئله با توجه به پیامدهای منفی که شامل درد، رنج و مرگ زودرس است، یک مشکل بزرگ و مهم به شمار میرود.
تشخیص عوارض جانبی دارو به کمک NLP (پردازش زبان طبیعی):
درست است که ارائهدهندگان خدمات و مراقبتهای بهداشتی و شرکتهای دارویی پیش از فروش محصولات دارویی و پزشکی خود آزمایشهای بالینی را برای کشف عوارض جانبی محصولات انجام میدهند اما تعداد کمی دارند. همین امر نظارت بر ایمنی دارو پس از ورود به بازار و کشف عوارض جانبی آن در محیطهای پزشکی را ضروری میسازد. خوشبختانه، با ظهور خدمات ارائه سوابق الکترونیکی سلامت (EHR) و راهحلهای هوشمند پردازش زبان طبیعی، شناسایی دقیق عوارض و واکنشهای جانبی دارویی، کاهش احتمال و اثرگذاری آنها امکانپذیر کرده است.
تشخیص عوارض جانبی دارو با NLP نه تنها برای ایمنی بیمار مهم است، بلکه از نظر تجاری نیز اهمیت بالایی دارد. شركتهاي داروسازي از نظر قانوني موظفاند که عوارض و واکنشهای جانبي داروهای تولیدی خود را اعلام کنند. حالا میخواهد از طريق تماسهاي تلفني بيماران از این عوارض آگاه شده باشند، یا از طریق رسانههاي اجتماعي، یا گفتگو با پزشکان هنگام فروش داروها، یا گزارشهای بيمارستانها و یا هر كانال ديگر. همانطور که میدانید این یک کار بدون قدرت محاسباتی فناوری پردازش زبان طبیعی، بسیار خشک و خستهکننده خواهد بود و احتمالا نتیجه غیر دقیق و غیرقابلاعتماد خواهد داشت.
این اعداد اهمیت فناوری پردازش زبان طبیعی را منعکس میسازند: پیشبینی میشود NLP در بازار بهداشت جهانی از 1.5 میلیارد دلار در سال 2020 به 3.7 میلیارد دلار در سال 2025 رشد کند. این یعنی طی 5 سال آینده رشد اقتصادی این فناوری بیش از دو برابر خواهد شد. گفته میشود استفاده از راهحلهای تشخیص عوارض جانبی دارو به کمک NLP مبتنی بر فضای ابر عامل اصلی رشد آن است. در حقیقت، 77 درصد از پاسخدهندگان یک نظرسنجی با موضوع NLP (پردازش زبان طبیعی) بیان کردند که آنها حداقل از یکی از چهار ارائهدهنده اصلی پردازش زبان طبیعی (NLP) مبتنی بر ابر استفاده میکنند. در این میان گوگل با بیشترین استفاده صدرنشین است. ولی علیرغم محبوبیت این فناوری پاسخدهندگان دو نکته مهم هنگام استفاده از آن را ذکر کردند که جای تامل بسیار دارد: هزینه و دقت.
ناگفته نماند زمانی که موضوع درباره تشخیص عوارض جانبی دارو به کمک NLP (پردازش زبان طبیعی) است، دقت به مهمترین فاکتور تبدیل میشود و این مسئلهای است که دانشمندان علم داده نیز با آن کاملا موافقاند. همان نظرسنجی نشان داد که بیش از 40 درصد از کل پاسخدهندگان دقت را به عنوان مهمترین فاکتور برای ارزیابی راهحلهای پردازش زبان طبیعی (NLP) عنوان کردند و یک چهارم آنان نیز دقت فناوری را به عنوان اصلیترین فاکتور مورد استفاده در ارزیابی خدمات ابر در NLP ذکر کردند. دقت NLP در دامنههای ویژه (مانند مراقبتهای بهداشتی) برای ارائهدهندگان خدمات ابری که فقط مدلهای از قبل آموزش دیده با قابلیت آموزش و تنظیم محدود را ارائه میدهند، یک چالش اساسی به شمار میآید. این امر به چند دلیل چالشهای بزرگی را برای کاربران ایجاد میکند.
زبان بشر، دارای زمینههای بسیار و دامنههای ویژهای است. همین طبیعت زبان بشر است که هنگام آموزش آن به مدل تشخیص عوارض جانبی دارو با NLP ، دردسرهای فراوانی را برای مهندسان و دانشمندان به وجود آورده است. به عنوان مثال، مدلی را در نظر بگیرید که برای استفاده عمومی از واژگان آموزش دیده ولی در تشخیص اصطلاحات هنری در یک دامنه خاص ناتوان است. در این حالت، برای مثال سرویسهای تبدیل گفتار به نوشتار برای رونوشت ویدئویی از یک کنفرانس DevOps ممکن است واژه “دکتر” را به عنوان اسم خاص در نظر بگیرند که همین امر باعث کاهش دقت این فناوری میشود. چنین خطاهایی ممکن است هنگام استفاده از هوش مصنوعی در بازاریابی یا بازیهای آنلاین قابل قبول باشد، اما برای مدلهای تشخیص عوارض جانبی دارو با NLP به هیچ وجه قابلقبول نخواهد بود.
در مقابل، مدلها باید با اصطلاحات پزشکی را آموزش ببینند و مفاهیم دستور زبانی، مانند نفی و پیوند در ساختار زبانی را کاملا درک کنند. به عنوان مثال، یک بیمار را در نظر بگیرید که میگوید: “من مشکل تاری دید و کمی احساس خوابآلودگی دارم ولی هیچ مشکلی در معده ندارم.” برای موثر بودن، مدلها باید بتوانند عوارض و واکنشهای جانبی داروهایی که بیمار مصرف میکند، با علائم گفته شده تطبیق دهند. این میتواند مشکل باشد زیرا همانطور که جمله مثال قبلی نشان میدهد، بیمار هیچ جمله یا واژهای درباره دارو بیان نکرده، بنابراین مدل باید آن را به طور صحیح از پاراگرافهای اطراف نتیجه بگیرد.
این مسئله زمانی پیچیده میشود که درمیابیم به جمعآوری اصطلاحات مربوط به عوارض جانبی (ADE) از منابع گوناگونی نیاز داریم که شکلی کاملا غیرساختاری دارند. این منابع میتوانند یک توییت، خبر، رونوشت یا یادداشت در سیستم CRM، تماس بین پزشک و یک نماینده فروش دارویی یا گزارشهای آزمایش بالینی باشد. استخراج حجم زیادی از دادهها از این منابع، قدرت افشای عواقب جدی یا ناشناخته داروها را دارد که میتواند گامی موثر در تشخیص عوارض جانبی دارو با NLP باشد. اگرچه هیچ راهحلی متناسب با این موارد وجود ندارد، اما پیشرفتهای جدید در قابلیتهای NLP به بهبود این راهحلها، کمک قابل توجهی میکند.
پیشرفت در زمینههایی مانند تشخیص موجودیت (Named Entity Recognition_NER) و طبقهبندی موضوعها، دستیابی به نتایج به موقع و دقیقتر را آسان میسازد. مدل های ADE NER به دانشمندان داده کمک مییکند تا ADE (عوارض جانبی دارویی) و موجودیتهای دارویی را از متن داده شده، استخراج نمایند. دسته بندی کنندگان ADE نیز آموزش میبینند تا به طور خودکار تصمیم بگیرند که آیا یک جمله داده شده، در واقع توصیف عوارض و یا واکنش جانبی دارویی است یا خیر. ترکیبی از NER، طبقهبندیکننده و در دسترس بودن مدلهای از پیش آموزش دیده بالینی برای کارهای ADE در کتابخانههای NLP، میتواند کاربران را از دردسرهای ساخت چنین مدلهایی برهاند و آنان را به سوی تولید بلافاصله محصول خود تشویق نماید.
نکته: (شایان ذکر است که تشخیص موجودیت (NER)، یک وظیفه فرعی استخراج اطلاعات (information extraction_IE) است که موجودیتهای مشخص شده در متون را جستجو و طبقهبندی میکند. NER موجودیتها را در دستههای مختلف طبقهبندی میکند؛ دستههایی مانند افراد، مکانها، سازمانها، اصطلاحات، درصد و ارزشهای پولی.
در برخی موارد، مدلهای تشخیص عوارض جانبی دارو با NLP با تنظیمات بالینی تعبیه شده BioBERT پیشتر آموزش دیده است. امروزه، BioBERT، از کارآمدترین مدلهای زبانی زمینهای در حوزه بالینی به شمار میآید. این امر باعث میشود که این مدلها دقیقتر از همیشه باشند و این دقت ممکن نیست مگر با بهبود آخرین نتایج پژوهشهای پیشرفته در مورد معیارهای استاندارد. مدل های ADE NER را میتوان به صورتها مختلف آموزش داد. این امر مهم کاربران را قادر میسازد تا سیستم را بر اساس مبادله مورد نظر بین قدرت محاسبه و دقت موجود شخصیسازی کنند. راهحلهایی از این دست اکنون در صدها خط لوله از قبل آموزشدیده، برای چندین زبان موجود است و این امر میتواند تاثیر شگرف جهانی داشته باشد.