امسال GPT-3، یک مدل زبان بزرگ که قادر به درک متن، پاسخ به سوالات و تولید نمونههای جدید نوشتاری است توجه رسانههای بینالمللی را به خود جلب کرده است. این مدل توسط OpenAI، که یک سازمان غیرانتفاعی مستقر در کالیفرنیا است و سیستمهای هوش مصنوعیای با اهداف عمومی منتشر میکند، ساخته شدهاست. مدل مذکور توانایی چشمگیری در تقلید از نوشتار انسان دارد، اما بسیار بزرگ است. برای ساخت آن، محققان 175 میلیارد پارامتر (نوعی واحد محاسباتی) و بیش از 45 ترابایت متن از Common Crawl، Reddit، ویکیپدیا و منابع دیگر جمعآوری کردند. سپس مدل را در فرایندی آموزش دادند که صدها واحد پردازشی را برای هزاران ساعت اشغال کرد.
GPT-3 گرایش گستردهای را در هوش مصنوعی نشان میدهد. یادگیری عمیق که در سالهای اخیر به تکنیک غالب برای ایجاد هوش مصنوعی جدید تبدیل شدهاست، از مقادیر زیادی داده و توان محاسباتی برای تأمین مدلهای پیچیده و دقیق استفاده میکند. این منابع محاسباتی بیشتر در دسترس محققان شرکتهای بزرگ و دانشگاههای برتر است. در نتیجه، یک مطالعه از دانشگاه وسترن نشان میدهد که در هوش مصنوعی دموکراسیزدایی رخ دادهاست. یعنی تعداد محققانی که میتوانند به پیشرفت هوش مصنوعی کمک کنند در حال کاهش است. این امر باعث میشود افرادی که قادر به تعیین رهنمودهای تحقیق برای این فناوری محوری و دارای پیامدهای اجتماعی هستند محدود شود. حتی ممکن است این نیاز فزاینده به منابع محاسباتی در برخی از چالشهای اخلاقی پیش روی توسعه هوش مصنوعی، از جمله حمله به حریم خصوصی، سوگیری نا به جا و تأثیرات زیست محیطی مدلهای بزرگ، نقش داشته باشد.
برای مقابله با این مشکلات، محققان در تلاشند تا بفهمند که چگونه میتوانند کار بیشتری را بدون نیاز به منابع محاسباتی زیادی انجام دهند. یکی از این پیشرفتهای اخیر یادگیری “کمتر از یک” (LO-shot learning) نام دارد که توسط ایلیا سوچولوتسکی و ماتیاس شونلاو از دانشگاه واترلو توسعه یافتهاست. هدف LO-shot این است که بتوان هوش مصنوعی را در مورد اشیا جهان بدون اینکه نیاز باشد در مورد هر چیزی یک مثال به آن داده شود، آموزش داد. نیاز به هزاران مثال برای آموزش تشخیص اشیا، مانع بزرگی برای سیستمهای هوش مصنوعی معاصر است. از طرف دیگر، ذهن انسان معمولاً میتواند از نمونههای موجود فاصله بگیرد تا بتواند اشیای جدیدی که قبلاً دیده نشده را تشخیص دهد. به عنوان مثال هنگامی که اشکال مختلف به یک کودک نشان داده میشود، او میتواند به راحتی بین نمونهها تفاوت قائل شود و روابط بین آنها و شکلهای جدید را تشخیص دهد.
این تیم ابتدا این نوع یادگیری را از طریق فرآیندی به نام تقطیر نرم معرفی کرد. در این فرایند یک پایگاه داده تصویری، که توسط موسسه ملی استاندارد و فناوری به نام MNIST نگهداری میشود و شامل ۶۰،۰۰۰ نمونه عدد نوشته شده از ۰ تا ۹ است، به پنج تصویر که مخلوطی از اعداد مختلف بودند خلاصه شد. پس از این که تنها همین پنج مثال به سیستم نشان داده شد، سیستم دانشگاه واترلو توانست ۹۲ درصد از بقیه تصاویر موجود در پایگاه داده را به درستی طبقهبندی کند.
این تیم در آخرین مقاله خود نشان میدهد که از لحاظ تئوریک تکنیکهای LO-shot به سیستمهای هوش مصنوعی اجازه میدهند تا بتوانند هزاران شی را حتی با داشتن یک مجموعه داده کوچک متشکل از دو مثال، تشخیص بدهند. این یک پیشرفت عالی در سیستمهای یادگیری عمیق سنتی، که در آنها تقاضا برای دادهها با افزایش تعداد اشیا افزایش مییابد، است. در حال حاضر، مجموعه دادههای کوچک LO-shot باید با دقت مهندسی شده و ویژگیهای طبقات مختلف اشیا خلاصه شوند. اما سوچولوتسکی در صدد توسعه بیشتر این کار با نگاه کردن به روابط بین اشیای موجود در مجموعه دادههای کوچک، است.
اگر بتوانیم هوش مصنوعی را با دادههای بسیار کمتر آموزش بدهیم، مزایای زیادی به دست خواهیم آورد. اول اینکه، میتوانیم سیستم را وادار کنیم که فرآیند واقعی یادگیری را به کلاسهایی که ندیده است تعمیم دهد. در نتیجه از طریق ایجاد انتزاعاتی که روابط بین اشیا را ثبت میکند احتمال سوگیری سیستم کاهش مییابد. در حال حاضر، سیستمهای یادگیری عمیق طعمه مناسبی برای سوگیری ناشی از ویژگیهای نامربوط در دادههایی هستند که برای آموزش استفاده میشوند. یک نمونه مشهور از این مشکل زمانی رخ میدهد که هوش مصنوعی در تصاویری که سگها در یک محیط برفی قرار دارند، آنها را به عنوان گرگ طبقهبندی میکند. چون گرگها دربیشتر تصاویر، در نزدیکی برف نشان داده میشوند. اگر سیستم بتواند جنبههای مرتبط تصویر را حذف کند، باعث جلوگیری از این اشتباهات میشوند. به این ترتیب و با کاهش نیاز به دادهها این سیستمها کمتر در معرض سوگیری قرار میگیرند.
دوم اینکه هرچه اطلاعات کمتری مورد نیاز باشد، برای ساخت الگوریتمهای بهتر نیاز کمتری به تحت نظر گرفتن افراد وجود دارد. به عنوان مثال تکنیکهای تقطیر نرم تحقیقات هوش مصنوعی در حوزه پزشکی، که مدلهای خود را با استفاده از اطلاعات حساس پزشکی آموزش میدهند تحتتاثیر قرار داده است. در یک مقاله جدید محققان از متد تقطیر نرم در تصاویر اشعه ایکس تشخیصی و بر اساس یک مجموعه داده کوچک و با حفظ حریم خصوصی استفاده کردند.
سرانجام، اگر هوش مصنوعی بتواند برای یادگیری از دادههای کمتری استفاده کند به دموکراتیکسازی حوزه هوش مصنوعی کمک خواهد شد. با هوش مصنوعی کوچکتر، دانشگاهیان میتواند در حوزه هوش مصنوعی فعالتر باشند و از خطر به دام افتادن اساتید توسط صنعت جلوگیری میشود. نه تنها یادگیری LO-shot با کاهش هزینههای آموزش و کاهش نیاز به دادهها موانع ورود را کاهش میدهد، بلکه انعطافپذیری بیشتری را برای کاربران فراهم میکند تا مجموعه دادههای جدیدی ایجاد کنند. در نتیجه امکان آزمایش رویکردهای جدیدتر را نیز برای کاربران فراهم میکند. با کاهش زمان صرف شده برای مهندسی دادهها، محققانی که به دنبال استفاده از هوش مصنوعی هستند میتوانند زمان بیشتری را صرف تمرکز بر مشکلات عملی که برای حل آنها در تلاشند، بکنند.
2 پاسخ
باعرص سلام وخسته نباشید خدمت همه دانشمندان عزیزمون خصوصا شرکت دانشبنیان عامر اندیش هوشمند که در زمینه حیاتی ومهم هوش مصنوعی فعالیت میکنن،خدا قوت خسته نباشید عزیزان ایران ،ان شاءاللهکه با کمک خداوند وهمت وپشتکار شما عزیزان ایران عزیزمون در اینده خیلی نزدیک اولین قدرتمند ترین فناور ترین وفوق پیشرفته ترین کشور در زمینه هوش مصنوعی خصوصادرقسمت درک هوشمند ویدئو و تصویر بدرخشد با این شرکت وامثال این شرکت عزیز وفوق پیشرفته .بچه ی یاعلی بگید و ایدهاتونو باهم جمع کنید و به محصول فوق پیشرفته هوش مصنوعی تبدیل کنید ،مابه ایید خدا بر قله پیشرفت هوش مصنوئی در جهان تبدیل میشیم .ان شاءالله.
ممنون از شما و توجهتون