چگونه می‌توان هوش مصنوعی را دموکراتیک‌­تر کرد؟!

امسال GPT-3، یک مدل زبان بزرگ که قادر به درک متن، پاسخ به سوالات و تولید نمونه­‌های جدید نوشتاری است توجه رسانه­‌های بین‌­المللی را به خود جلب کرده است. این مدل توسط OpenAI، که یک سازمان غیرانتفاعی مستقر در کالیفرنیا است و سیستم‌­های هوش مصنوعی‌ای با اهداف عمومی منتشر می‌­کند، ساخته شده­‌است. مدل مذکور توانایی چشم‌گیری در تقلید از نوشتار انسان دارد، اما بسیار بزرگ است. برای ساخت آن، محققان 175 میلیارد پارامتر (نوعی واحد محاسباتی) و بیش از 45 ترابایت متن از Common Crawl، Reddit، ویکی­پدیا و منابع دیگر جمع‌آوری کردند. سپس مدل را در فرایندی آموزش دادند که صدها واحد پردازشی را برای هزاران ساعت اشغال کرد.

GPT-3 گرایش گسترده­‌ای را در هوش مصنوعی نشان می­‌دهد. یادگیری عمیق که در سال‌های اخیر به تکنیک غالب برای ایجاد هوش مصنوعی جدید تبدیل شده‌­است، از مقادیر زیادی داده و توان محاسباتی برای تأمین مدل‌­های پیچیده و دقیق استفاده می‌کند. این منابع محاسباتی بیشتر در دسترس محققان شرکت­‌های بزرگ و دانشگاه‌­های برتر است. در نتیجه، یک مطالعه از دانشگاه وسترن نشان می‌­دهد که در هوش مصنوعی دموکراسی‌­زدایی رخ داده‌­است. یعنی تعداد محققانی که می‌­توانند به پیشرفت هوش مصنوعی کمک کنند در حال کاهش است. این امر باعث می‌­شود افرادی که قادر به تعیین رهنمودهای تحقیق برای این فناوری محوری و دارای پیامدهای اجتماعی هستند محدود شود. حتی ممکن است این نیاز فزاینده به منابع محاسباتی در برخی از چالش‌­های اخلاقی پیش روی توسعه هوش مصنوعی، از جمله حمله به حریم خصوصی، سوگیری نا به جا و تأثیرات زیست محیطی مدل‌های بزرگ، نقش داشته باشد.

برای مقابله با این مشکلات، محققان در تلاشند تا بفهمند که چگونه می‌­توانند کار بیشتری را بدون نیاز به منابع محاسباتی زیادی انجام دهند. یکی از این پیشرفت‌­های اخیر یادگیری “کمتر از یک” (LO-shot learning) نام دارد که توسط ایلیا سوچولوتسکی و ماتیاس شونلاو از دانشگاه واترلو توسعه یافته‌­است. هدف LO-shot این است که بتوان هوش مصنوعی را در مورد اشیا جهان بدون اینکه نیاز باشد در مورد هر چیزی یک مثال به آن داده شود، آموزش داد. نیاز به هزاران مثال برای آموزش تشخیص اشیا، مانع بزرگی برای سیستم‌­های هوش مصنوعی معاصر است. از طرف دیگر، ذهن انسان معمولاً می‌­تواند از نمونه­‌های موجود فاصله بگیرد تا بتواند اشیای جدیدی که قبلاً دیده نشده را تشخیص دهد. به عنوان مثال هنگامی که اشکال مختلف به یک کودک نشان داده می‌­شود، او می‌­تواند به راحتی بین نمونه‌­ها تفاوت قائل شود و روابط بین آن‌ها و شکل‌های جدید را تشخیص دهد.

این تیم ابتدا این نوع یادگیری را از طریق فرآیندی به نام تقطیر نرم معرفی کرد. در این فرایند یک پایگاه داده تصویری، که توسط موسسه ملی استاندارد و فناوری به نام MNIST نگهداری می‌شود و شامل ۶۰،۰۰۰ نمونه عدد نوشته شده از ۰ تا ۹ است، به پنج تصویر که مخلوطی از اعداد مختلف بودند خلاصه شد. پس از این که تنها همین پنج مثال به سیستم نشان داده شد، سیستم دانشگاه واترلو توانست ۹۲ درصد از بقیه تصاویر موجود در پایگاه داده را به درستی طبقه‌بندی کند.

این تیم در آخرین مقاله خود نشان می­‌دهد که از لحاظ تئوریک تکنیک­‌های LO-shot به سیستم­‌های هوش مصنوعی اجازه می‌­دهند تا بتوانند هزاران شی را حتی با داشتن یک مجموعه داده کوچک متشکل از دو مثال، تشخیص بدهند. این یک پیشرفت عالی در سیستم­‌های یادگیری عمیق سنتی، که در آن‌ها تقاضا برای داده‌­ها با افزایش تعداد اشیا افزایش می­‌یابد، است. در حال حاضر، مجموعه داده­‌های کوچک LO-shot باید با دقت مهندسی شده و ویژگی‌های طبقات مختلف اشیا خلاصه شوند. اما سوچولوتسکی در صدد توسعه بیشتر این کار با نگاه کردن به روابط بین اشیای موجود در مجموعه داده‌های کوچک، است.

اگر بتوانیم هوش مصنوعی را با داده‌های بسیار کمتر آموزش بدهیم، مزایای زیادی به دست خواهیم آورد. اول اینکه، می‌­توانیم سیستم را وادار کنیم که فرآیند واقعی یادگیری را به کلاس‌هایی که ندیده است تعمیم دهد. در نتیجه از طریق ایجاد انتزاعاتی که روابط بین اشیا را ثبت می‌کند احتمال سوگیری سیستم کاهش می­‌یابد. در حال حاضر، سیستم‌های یادگیری عمیق طعمه مناسبی برای سوگیری ناشی از ویژگی‌های نامربوط در داده‌هایی هستند که برای آموزش استفاده می­‌شوند. یک نمونه مشهور از این مشکل زمانی رخ می‌­دهد که هوش مصنوعی در تصاویری که سگ‌ها در یک محیط برفی قرار دارند، آن‌ها را به عنوان گرگ طبقه‎بندی می­‌کند. چون گرگ‌ها دربیشتر تصاویر، در نزدیکی برف نشان داده می‌­شوند. اگر سیستم بتواند جنبه‌های مرتبط تصویر را حذف کند، باعث جلوگیری از این اشتباهات می­‌شوند. به این ترتیب و با کاهش نیاز به داده‌ها این سیستم‌ها کم‌تر در معرض سوگیری قرار می‌گیرند.

دوم اینکه هرچه اطلاعات کم‌تری مورد نیاز باشد، برای ساخت الگوریتم‌های بهتر نیاز کمتری به تحت نظر گرفتن افراد وجود دارد. به عنوان مثال تکنیک‌های تقطیر نرم تحقیقات هوش مصنوعی در حوزه پزشکی، که مدل‌های خود را با استفاده از اطلاعات حساس پزشکی آموزش می‌دهند تحت‌تاثیر قرار داده است. در یک مقاله جدید محققان از متد تقطیر نرم در تصاویر اشعه ایکس تشخیصی و بر اساس یک مجموعه داده کوچک و با حفظ حریم خصوصی استفاده کردند.

سرانجام، اگر هوش مصنوعی بتواند برای یادگیری از داده­‌های کمتری استفاده کند به دموکراتیک­سازی حوزه هوش مصنوعی کمک خواهد شد. با هوش مصنوعی کوچک‌­تر، دانشگاهیان می‌­تواند در حوزه هوش مصنوعی فعال‌تر باشند و از خطر به دام افتادن اساتید توسط صنعت جلوگیری می‌­شود. نه تنها یادگیری LO-shot با کاهش هزینه­‌های آموزش و کاهش نیاز به داده­‌ها موانع ورود را کاهش می­‌دهد، بلکه انعطاف‌پذیری بیشتری را برای کاربران فراهم می‌کند تا مجموعه‌ داده‌­های جدیدی ایجاد کنند. در نتیجه امکان آزمایش رویکردهای جدیدتر را نیز برای کاربران فراهم می­‌کند. با کاهش زمان صرف شده برای مهندسی داده­‌ها، محققانی که به دنبال استفاده از هوش مصنوعی هستند می‌­توانند زمان بیشتری را صرف تمرکز بر مشکلات عملی که برای حل آنها در تلاشند، بکنند.

لینک کوتاه شده : https://amerandish.com/UWEUV

به اشتراک بگذارید

2 پاسخ

  1. باعرص سلام وخسته نباشید خدمت همه دانشمندان عزیزمون خصوصا شرکت دانشبنیان عامر اندیش هوشمند که در زمینه حیاتی ومهم هوش مصنوعی فعالیت میکنن،خدا قوت خسته نباشید عزیزان ایران ،ان شاءاللهکه با کمک خداوند وهمت وپشتکار شما عزیزان ایران عزیزمون در اینده خیلی نزدیک اولین قدرتمند ترین فناور ترین وفوق پیشرفته ترین کشور در زمینه هوش مصنوعی خصوصادرقسمت درک هوشمند ویدئو و تصویر بدرخشد با این شرکت وامثال این شرکت عزیز وفوق پیشرفته .بچه ی یاعلی بگید و ایدهاتونو باهم جمع کنید و به محصول فوق پیشرفته هوش مصنوعی تبدیل کنید ،مابه ایید خدا بر قله پیشرفت هوش مصنوئی در جهان تبدیل میشیم .ان شاءالله.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

_ مطالب مرتبط _

راه‌حل‌های پردازش گفتار
پردازش گفتار

راه‌حل‌های پردازش گفتار (SPS) فیلیپس: جریان کاری نسل بعد، استفاده از تشخیص گفتار مبتنی بر هوش مصنوعی

راه‌حل‌های پردازش گفتار شرکت فیلیپس و همکاری آن با شرکت Nuance Communication نسخه جدید جریان کاری فیلیپس برای مشاغل سازمانی، (SpeechExec Enterprise-SEE7.0)، اکنون در بازارهای

درخواست شما با موفقیت ارسال شد.

ضمن تشکر بابت ارسال پیام، در سریع‌ترین زمان ممکن کارشناسان شرکت عامراندیش درخواست شما را بررسی خواهند نمود.