این نوشته برای مبتدیان در عرصه هوش مصنوعی مناسب است. بعد از خواندن این نوشته درک پایهای از هوش مصنوعی را کسب خواهید. این که هوش مصنوعی چه کار میتواند انجام دهد و نحوه عملکرد آن مهم است.
این نوشته شامل مفاهیم شبکههای عصبی، بینایی کامپیوتر، پردازش زبان طبیعی و الگوریتمها است.
بینایی کامپیوتر
این که به یک کامپیوتر یاد دهیم که مثل انسان ببیند، کار کمی نیست. میتوانید یک دوربین را بر روی کامپیوتر خود سوار کنید. برای که از طریق این دوربین، کامپیوتر دنیا را مانند انسانها ببیند به بینایی کامپیوتر و تشخیص تصویر نیاز است.
بینایی کامپیوتر همان چیزی است که به یک اسکنر بارکد اجازه میدهد که مجموعهای از خطوط میلهای را تفسیر کند.
بینایی کامیپوتر همان چیزی است که به Apple’s Face ID توانایی این را میدهد تشخیص دهد که آیا چهره موجود، چهره شما است یا نه.
اساسا، یک ماشین، یک تصویر خام را_ مانند یک فایل JPEG، یک تصویر از دوربین_ را میگیرد و پردازش میکند. برای این روند به بینایی کامپیوتر نیاز است.
ساده ترین راه درک این است که بینایی کامپیوتر را به عنوان بخشی از مغز انسان ببینیم. همانطور که مغز اطلاعات دریافت شده توسط چشم را پردازش میکند، بینایی کامیپوتر نیز اطلاعات دریافت شده توسط دوربینها را پردازش میکند.
تشخیص تصویر
یکی از جالب ترین کاربردهای رایانه، از دیدگاه هوش مصنوعی، تشخیص تصویر است. تشخیص تصویر به ماشین اجازه میدهد که تصویر ورودی را تفسیر کند، و آن را طبقه بندی کند.
در اینجا چند نمونه از تشخیص تصویر در کار آمده است:
- برنامه Ebay به شما امکان میدهد که آیتمی را با استفاده از دوربین جستجو کنید.
- نوعی از شبکه عصبی، تصاویر تار و کدر را به تصاویر واضح تبدیل میکند.
- هوش مصنوعی فیس بوک در مورد عکسهای شما چیزهای زیادی میداند.
- هوش مصنوعی به نوعی میتواند ذهن شما را بخواند.
یک نمونه
برای مثال، یک برنامه در زمینه پردازش تصویر به نام Not Hotdog وجود دارد. این برنامه تشخیص میدهد که آیا آیتم موجود در تصویر هات داگ هست یا نه.
این برنامه با استفاده از بینایی کامپیوتر و تشخیص تصویر، بر تصویر موجود قضاوت میکند. درست است که حتی یک کودک هم میتواند هات داگ بودن یا نبودن یک آیتم را تشخیص دهد.
اما تشخیص این امر توسط کامپیوتر و آموزش آن یک کار پیچیده است، و تنها به کمک شبکه عصبی و بینایی کامپیوتر میسر است.
هوش مصنوعی، در این مرحله، بسیار شبیه یک کودک کوچک است. بینایی کامپیوتری که به آن حس بینایی می بخشد، که با درک از جهان فیزیکی حاصل نمی شود. برای همین، هوش مصنوعی دقیقاً مانند کودکان به آموزش نیاز دارد. اگر بارها و بارها شماره یا حرفی را به کودک نشان دهید، دیگر کودک با آن شماره یا حرف آشنایی پیدا میکند.
شبکه عصبی
شبکههای عصبی بیولوژیکی ما در تفسیر اطلاعات تصویری بسیار خوب است. حتی اگر از تصویری که در حال پردازش آن هستیم، هیچ درکی نداشته باشیم.
این که یک کامپیوتر تصاویری مانند، تصاویر QR را تشخیص دهد؛ ساده است. اما زمانی که هم تصویر و هم آیتمهای موجود در تصویر پیچیده شوند، پای تشخیص تصویر به میان میآید.
نحوه کار تشخیص تصویر، به طور معمول، شامل ایجاد یک شبکه عصبی است. این شبکه عصبی تک تک پیکسلهای تصویر را پردازش میکند.
محققین تا جایی که میتوانند تصاویر از قبل برچسب خورده را به این شبکهها میخورانند. این شبکهها به واسطه این تصاویر میتوانند تصاویر مشابه را تشخیص دهند.
در مثال هات داگ بالا، توسعه دهندگان میتوانند هزاران عکس هات داگ را به شبکه وارد کنند. سپس، هوش مصنوعی یک ایده کلی درباره اینکه یک تصویر هات داگ باید چگونه باشد، پیدا میکند.
هنگامی یک تصویر را به یک شبکه عصبی میخورانید، هر پیکسل از تصویر با پیکسل تصویر هات داگ مقایسه میشود. اگر تا تعداد آستانهای از پیکسلها مشابه باشند، هوش مصنوعی، تصویر را هات داگ اعلام میکند.
هر سیستم هوش مصنوعی که اطلاعات بصری را پردازش میکند، معمولاً به دید رایانه متکی است، و افرادی که قادر به شناسایی اشیاء خاص هستند و یا دسته بندی تصاویر را بر اساس محتوای خود، انجام می دهند، تشخیص تصویر را انجام میدهند.
سخن آخر
بینایی کامپیوتر و تشخیص شی برای رباتها بسیار مهم است. رباتها باید به دقت اشیای مختلف را در محیط هوش شناسایی کنند. اشیا را طبقه بندی کنند. برای مثال خودروهای خودران باید عابران پیاده، علائم راهنمایی رانندگی را با استفاده از بینایی کامپیوتر و تشخیص تصویر، شناسایی کنند.