NLP شاخهای از هوش مصنوعی (AI) است که به رایانهها در درک، تفسیر و دستکاری زبان انسان کمک میکند. گرچه NLP برای مدتی طولانی وجود داشته است، این فناوری به لطف افزایش علاقه تعامل انسان با ماشین و در دسترس بودن دادههای بزرگ و الگوریتمهای پیچیده، به سرعت در حال پیشرفت است. “موتور” NLP در واقع از سه جز تشکیل شده است که برای تسهیل ارتباطات بین فناوری و انسان با هم به صورت هماهنگ کار میکنند.
پردازش زبانطبیعی انگلیسی
- درک زبان طبیعی (NLU): که به “خواندن” ارتباطات انسانی توسط ماشین اشاره دارد. ماشین توسط این فناوری قادر به درک مفاهیم و مقصود انسانهاست.
- پردازش زبان طبیعی (NLP): که فایلهای متنی یا صوتی را به ساختار داده تبدیل میسازد.
- تولید زبان طبیعی (NLG): توضیح میدهد که چگونه رایانه براساس ساختار داده، قادر به جوابگویی پرسشهایی است که از وی سوال میشود.
این فناوری مهم، کل حلقه بازخورد را تولید میکند، زیرا بر خلاف انسانها که با زبانهای متنوعی (نوشتاری و کلامی) مانند انگلیسی، ژاپنی، کرهای و غیره با هم ارتباط برقرار میکنند، رایانهها فقط میتوانند دادههای ساختار یافته را درک نمایند.
چگونه قرار است رایانههایی که از دادههای 0 و 1 تشکیل شدهاند، تفاوتهای گوناگون و ساختارمند ارتباطات انسانی را درک نمایند؟ به عنوان مثال، کنایه را در زبان انسان در نظر بگیرید. وقتی شخصی میگوید “واقعا شرلوک؟” به عنوان یک بشر، هدف این عبارت و احساساتی را که ایجاد میکند، کاملا درک میکنیم. چیزی که برای رایانهها، گنگ و مبهم است.
تمرکز پردازش زبان طبیعی (NLP)، در توانا ساختن رایانهها برای درک فرایند زبان انسان و مقصود و خاستگاه اوست. ایا تاکنون از الکسا پرسشهای عجیبی مانند “الکسا، برای من یک ساندویچ آماده میکنی؟” پرسیدهاید؟…احتمالا با پاسخهای کنایهآمیزی روبهرو شدهاید: “شما یک ساندویچ هستید.”
ارتباطات انسان و فناوری
اجازه دهید نگاهی عمیقتر به تعامل الکسا با انسان پردازیم؛ زیرا به صورت کاملی کارایی موتور NLP را توضیح میدهد. دستگاه شما زمانی که صدایتان را میشنود، فعال میشود و مقصود شما را درک میکند (درک زبان طبیعی_NLU) و سپس بازخوردی (پردازش زبانطبیعی) را در زندگی واقعی و در یک جمله انگلیسی محاورهای (NLG) ارایه میدهد. تعامل کامل توسط موتور NLP امکانپذیر شده است. (هرچند تعاملهای انسان و ماشین در حال انجام است، ولی توجه داشته باشید که آنها از قبل برنامهریزی شدهاند و ما در نقطهای نیستیم که الکسا بتواند به پرسشهای غیرمنتظره و کمی عجیب ما پاسخ دهد). ما نمونههایی از NLP را در چتباتهای واقعی مانند Amazon’s Lex، وبسایتها و اپلیکیشنهایی که روزانه با آنها در ارتباطیم، مشاهده میکنیم.
نمونهای از این موارد در پلتفرم ارتباطات ابری Twilio است که Airbnb، Uber و Nordstrom به عنوان مشتری از آن استفاده میکند. آمازون لکس (Amazon Lex) برای توسعهدهندگان در اپلیکیشنهای Twilio معماری مدولار با رابطهای اپلیکیشن برنامه نویسی (APIs) فراهم میکند تا ساخت و استقرار رباتهای مکالمهای را در پلتفرمهای تلفنهای همراه امکانپذیر سازد. مواردی مانند ترجمه زبان، درک معنا و خلاصه متن در بیشتر فناوریها (به عنوان یک سرویس خدماتی) استفاده میشود.
پس از پردازش زبان طبیعی چیست؟
این عبارت که ” امکانات NLP بیپایان است” سخنی است کاملا قابلقبول. همین امر، فرصت بینهایت بزرگی را در بازار جهانی این فناوری برای همه افراد فراهم میکند. همچنین حوزهای است که استارت آپها و نوآوران فدرال ممکن است با محصولات خود به غولهای فناوری مانند آمازون، گوگل و IBM کمک شایانی نمایند. شرکتهای زبدهای مانند U.Group در حال شکلگیری درکهای مختلفی از واحدهای زبان بشر، کشف چالشهای پیش رو و ایجاد موارد استفاده هستند که میتواند اثباتی بر آینده بسیار روشن و چشمگیر این فناوری باشد.
“بازار” یک اکوسیستم همکاری است که فرصتهای بودجه را کشف میکند و مشارکت بین صنعت و دولت فدرال را تسهیل میبخشد. ما از ابزارهای پردازش زبان طبیعی (NLP) برای تایید مدلهای علم داده استفاده شده در (horizon scanning) استفاده میکنیم.(Horizon scanning، چشم انداز سیستماتیک برای تشخیص علائم اولیه تحولات بالقوه مهم مانند سیگنالهای ضعیف (یا زودرس)، فرایندها و روندها و یا دگر تحولات، مشکلات مداوم، خطرات و تهدیدها است. Horizon scanning شامل مواردی است که در حاشیه تفکر فعلی، فرضیات گذشته را به چالش میکشد).
ابزارهای NLP مورد استفاده شده در علم داده، به ما در درک و شناسایی فرایندها، محل بلوغ فناوری و رهبران این صنعت کمک میکند. در ابتداییترین شکل، ما این کار را با صرف مقادیر انبوهی از دادهها، تمیز کردن و غنیسازی آنها و سپس ساخت الگوریتمهایی برای درک بهتر دادهها انجام میدهیم. با تمرکز بر روی NLG، ما در حال بررسی این مسئله هستیم که چگونه میتوانیم پاسخهای خودکاری بر اساس پاسخ انسان ارائه دهیم و با گذشت زمان در پردازش زبانطبیعی پیشرفت کنیم. در غیر اینصورت، به عنوان سنگبنایی در یادگیری ماشین شناخته میشود.
پردازش زبان فارسی با فارس آوا
یکی از محصولات با کیفیت در زمینه NLP و هوش مصنوعی، در بازار ایران فارس آوا است. فارس آوا با تکیه بر دیتابیس وسیع ۱۰ هزار ساعته، از مهمترین نرمافزارهای تشخیص گفتار است که به صورت وسیعی از زبانفارسی و گویشهای مختلف آن پشتیبانی میکند.
این نرمافزار بر روی دسکتاپ و تلفنهای هوشمند قابل نصب است و نسخهی مخصوص مشاغل خاص همانند وکلا، کارمندلان دادگستری و غیره نیز در دسترس افرادی که به آن نیاز دارند، قرار خواهد گرفت. این محصول از دقت و سرعت بالا در پردازش زبانطبیعی و تبدیل گفتار به متن و تایپ صوتی برخوردار است و همچنین قابلیت بارگزاری انواع فایلهای صوتی و تصویری را به کاربر میدهد.
نکته چشمگیر و مهم دیگر در مورد این نرمافزار بسیار پرکابرد، قابلیت مناسبسازی آن برای مشاغل مختلف است. اگر کسب و کاری به نسخه خاصی نیاز داشته باشد، میتواند فارس آوا را متناسب با نیازهای خود شخصیسازی کند.