یادگیری عمیق (Deep Learning) یا دیپ لرنینگ یکی از زیر مجموعه از یادگیری ماشین (Machine Learning) است که از شبکههای عصبی مصنوعی با الگوبرداری از عملکرد مغز انسان برای حل مسائل متنوعی مانند تشخیص تصویر، پردازش زبان طبیعی و شناسایی گفتار استفاده میکند. دیپ لرنینگ با استفاده از شبکههای عصبی مصنوعی با چندین لایه (که به آنها لایههای پنهان گفته میشود) دادهها را پردازش کرده تا ویژگیهای دقیقتری را استخراج کند. به کمک این فرایند ماشینها به طور خودکار ویژگیها را یاد میگیرد و به سیستم کمک میکند تا تصمیمگیریهای دقیقی انجام دهد.
در روشهای سنتی ماشین لرنینگ ویژگیها (features) به طور دستی انتخاب میشوند ولی در یادگیری عمیق این ویژگیها توسط مدل یاد گرفته میشوند و فرآیند پیشپردازش دادهها به طور خودکار انجام میشود. این ویژگیها میتوانند از دادههای پیچیدهای مانند تصاویر، صداها یا متون استخراج شوند.
شبکه عصبی در یادگیری عمیق
شبکه عصبی در دیپ لرنینگ شبیه به شبکه عصبی طبیعی مغز انسان است که از نورونها (neurons) تشکیل شده است. هر نورون دادهها را از ورودیها دریافت کرده، محاسباتی روی آنها انجام میدهد و نتیجه را به نورونهای دیگر منتقل میکند. این محاسبات به طور مداوم تا زمانی که مدل به بهترین نتیجه برسد ادامه مییابد. در دیپ لرنینگ به کمک الگوریتمهای خاصی مانند بکپراپگیشن (Backpropagation) وزنها و اتصالات شبکه عصبی به گونهای تنظیم میشوند که مدل به کمترین خطا دست یابد. این فرایند میتواند در مراحل مختلف تکرار شود تا مدل به دقت بالاتری برسد. در نهایت دیپ لرنینگ توانایی پردازش دادههای پیچیده و یادگیری خودکار ویژگیهای پیچیده را دارد که باعث میشود در کارهایی مانند شناسایی تصویر، تشخیص گفتار، پردازش زبان طبیعی و رانندگی خودکار به کار رود.
الگوریتمهای یادگیری عمیق
الگوریتم های یادگیری عمیق معمولاً بر روی مجموعه دادههای بزرگی از دادههای برچسب دار آموزش داده می شوند. در فرایند آموزش یادگیری عمیق، سیستم یاد میگیرد که ویژگیهای مهم دادهها را با برچسبهای صحیح مرتبط کند. به عنوان مثال در تشخیص تصویر الگوریتم ممکن است یاد بگیرد که ویژگیهایی خاصی را در یک تصویر مانند شکل یا رنگ را به برچسبهای مشخصی مانند “سگ” یا “گربه” ارتباط دهد.
مراحل آموزش الگوریتمهای یادگیری عمیق
- آموزش: در مرحله آموزش الگوریتم از دادههای برچسبدار استفاده میکند تا وزنهای مناسب برای هر لایه از شبکه عصبی تعیین شود. این فرایند از طریق تکنیکهای بهینهسازی مانند روش انتشار معکوس (Backpropagation) انجام میشود.
- ارزیابی: پس از آموزش الگوریتم بر روی دادههای آزمایشی مورد ارزیابی قرار میگیرد تا عملکرد آن بررسی شود. معیارهایی مانند دقت، حساسیت و نرخ خطا معمولاً برای ارزیابی کیفیت مدل استفاده میشوند.
- استفاده در دنیای واقعی: پس از اطمینان از عملکرد مناسب مدل میتواند برای پیشبینی دادههای جدید به کار گرفته شود. برای مثال یک الگوریتم یادگیری عمیق که برای شناسایی سگها آموزش داده شده میتواند در کاربردهایی مانند: سیستمهای امنیتی اپلیکیشنهای موبایل یا موتورهای جستجوی تصویری استفاده شود.
کاربردهای متنوع الگوریتمهای یادگیری عمیق
الگوریتمهای یادگیری عمیق در طیف گستردهای از مسائل استفاده میشوند:
- تشخیص تصویر: مانند شناسایی اشیا در تصاویر، دستهبندی تصاویر، یا تشخیص چهره
- پردازش زبان طبیعی: شامل ترجمه ماشینی، تجزیهوتحلیل احساسات، و تولید متن
- تشخیص گفتار: برای کاربردهایی نظیر دستیارهای صوتی و سیستمهای پاسخ صوتی
- سیستمهای توصیهگر: مانند پیشنهاد فیلم، موسیقی، یا محصولات در پلتفرمهای آنلاین
- خودروهای خودران: شناسایی مسیر، موانع، و علائم جادهای
این الگوریتمها با استفاده از معماریهای پیشرفتهای مانند شبکههای پیچشی (CNN)، شبکههای بازگشتی (RNN) و مدلهای توجه (Attention Models) توانستهاند به دقت و کارایی بیسابقهای در حل مسائل دست یابند.
یادگیری عمیق به زبان ساده
برای فهم بهتر یادگیری عمیق یک کودک نوپا را در نظر بگیرید که اولین کلمه ای که یاد گرفته “سگ” است. روشی که این کودک یاد گرفته که یک موجود “سگ” هست یا نه؟ به این صورت که به موجود اشاره میکند و کلمه “سگ” را می گوید. در این زمان والدین او می گویند ” بله آن یک سگ است” یا ” نه آن سگ نیست“. هرچه بیشتر این کودک به موارد مختلفی اشاره کند، بیشتر می فهمد چه نوع موجوداتی جز کلمه “سگ” دسته بندی میشوند. کاری که این کودک نوپا انجام میدهد بدون اینکه خودش بداند در حقیقت به نوعی مشخص کردن یک مفهوم پیچیده است. تعریفی از یک سگ با ساختن سلسه مراتبی است که در آن هر سطح انتزاعی با دانش ایجاد می شود که آن هم به نوبه خود از سلسه مراتب قبلی بدست آمده است و این کار همانند فرآیند یادگیری عمیق است
یادگیری عمیق چگونه کار می کند
برای شناسایی نحوه یادگیری عمیق باید با شبکه های عصبی آشنا باشید. این نوع یادگیری در واقع همان یادگیری به وسیله شبکه های عصبی ای هستند که دارای لایه پنهان زیادی می باشند و هر چقدر در این لایه ها جلو تر بروید به مدل های پیچیده تر و کامل تری می رسید.
یادگیری عمیق در عصر دیجیتال تکامل پیدا کرده است، و این امر باعث شده تا به انفجاری از داده ها در اشکال مختلف در همه ی دنیا داشته باشیم. این دیتا ها که به کلان داده معروف هستند، از منابع متفاوتی مانند شبکه های اجتماعی، موتورهای جست و جوی اینترنت، پلتفورم های تجارت الکترونیکی و… بدست می آیند.
با این حال این نوع داده، که معمولا بدون ساختار هستند، آنقدر وسیع است که شاید برای انسان چندین دهه طول بکشد تا بتواند آن را درک کند و اطلاعات مربوط به این داده ها را استخراج کند. کسب و کارهای مختلف به پتانسیل های بیشمار و باور نکردنی حاصل از این انبوه از اطلاعات پی برده اند و هر روز شاهد کسب و کارهایی هستیم که خود را با هوش مصنوعی سازگار کرده و آن را به دل کسب و کارهای خود می آورند، بخصوص برای اتوماسیون کردن پشتیبانی مشتریان خود.
متد های یادگیری عمیق
متدهای مختلف و متفاوتی برای به وجود آوردن مدل های یادگیری عمیق وجود دارند. این تکنیک ها و متد ها شامل روش های زوال و فروپاشی نرخ یادگیری، انتقال یادگیری، آموزش از طریق چرک نویس ها و داده های از قلم افتاده است.
زوال نرخ یادگیری :
نرخ یادگیری در واقع یک فرا پارامتر محسوب می شود (عملی که یک سیستم را تعریف می کند و یا قبل از فرآیند یادگیری شرایط عملکرد آن را تعیین می کند) که هر بار مقدار تغییرات مدل در پاسخ به اندازه گیری و خطای تخمین زده شده را کنترل می کند. نرخ یادگیری که بیش از حد بالا باشد ممکن است باعث شود فرآیند یادگیری ناپایدار باشد و یا اینکه یادگیری پایین تر از حد مطلوب و استاندارد صورت بگیرد. نرخ یادگیری هایی که بسیار اندک هستند نیز ممکن است فرآیند یادگیری را طولانی کنند که ممکن است باعث گیر افتادن شود.
روش زوال نرخ یادگیری (که به نرخ یادگیری با دوام و یا نرخ یادگیری منطقی نیز شناخته می شود) فرآیندی است برای سازگاری نرخ یادگیری به منظور افزایش کارایی به همراه کاهش زمان آموزش. ساده ترین و رایج ترین روش سازگاری میزان نرخ یادگیری در طول آموزش و شامل تکنیک هایی برای کاهش سرعت یادگیری در طول زمان است.
یادگیری جایگزین:
این فرآیند شامل بهسازی مدلی است که از قبل آموزش دیده است و نیاز به یک رابط کاربری داخلی یک شبکه پیش بینی شده دارد. اول ، کاربران داده های جدید شبکه موجود را که حاوی طبقه بندی های قبلی ناشناخته است ، تغذیه می کنند. پس از ایجاد تنظیمات در شبکه ، می توان کارهای جدیدی را با قابلیت طبقه بندی خاص تر انجام داد. این روش این مزیت را دارد که نیاز به داده های بسیار کمتری نسبت به سایرین دارد ، بنابراین زمان محاسبه را به دقیقه یا ساعت کاهش می دهد.
یادگیری از چرک نویس ها:
این روش به یک توسعه دهنده نیاز دارد تا یک مجموعه داده بزرگ برچسب دار را جمع کند و یک معماری شبکه را تنظیم کند که بتواند ویژگی ها و مدل را بیاموزد. این تکنیک به خصوص برای برنامه های جدید و همچنین برنامه های کاربردی با تعداد زیادی دسته بندی خروجی مناسب است. با این حال ، به طور کلی ، این رویکرد کمتر متداول است ، زیرا به مقادیر بسیار زیادی از داده ها نیاز دارد و باعث می شود روزها یا هفته ها آموزش طول بکشد.
حذفی ها و از قلم افتادگی:
در این روش سعی شده تا مشکل آموزش بیش از حد اتصالات در شبکه هایی با مقادیر زیادی پارامتر با رها کردن تصادفی واحدها و اتصالات آنها از شبکه عصبی در حین آموزش حل شود. ثابت شده است که این می تواند عملکرد شبکه های عصبی را بر روی تسک های یادگیری نظارت شده در زمینه هایی مانند تشخیص گفتار ، طبقه بندی اسناد و… بهبود بخشد.
یادگیری عمیق چه استفاده ای دارد؟
امروزه موارد استفاده از یادگیری عمیق شامل انواع برنامه های کاربردی تجزیه و تحلیل داده های بزرگ ، به ویژه مواردی است که در پردازش زبان طبیعی ، ترجمه زبان ، تشخیص پزشکی ، سیگنال های معاملات سهام بورس ، امنیت شبکه و تشخیص تصویر شده اند.
استفاده هایی که در حال حاضر از یادگیری عمیق می شود شامل موارد زیر است:
- تجربه ی مشتری. مدل های یادگیری عمیق قبلاً برای چت روم ها استفاده می شدند. و همچنان که به تکامل خود ادامه می دهد ، انتظار می رود که یادگیری عمیق در مشاغل مختلف به منظور بهبود تجربیات مشتری و افزایش رضایت مشتری اجرا شود.
- تولید متن. به ماشين ها دستور زبان و سبك يك متن داده مي شود و سپس از اين مدل استفاده مي كنند تا بطور خودكار متني كاملاً جديد متناسب با املای مناسب ، دستور زبان و سبك متن اصلي را بسازد.
- هوافضا و نظامی. از یادگیری عمیق برای شناسایی اشیاء از ماهواره هایی که مناطق مورد نظررا شناسایی می کنند ، و همچنین برای تشخیص مناطق امن یا نا امن برای سربازان استفاده می شود.
- اتوماسیون صنعتی. یادگیری عمیق با ارائه خدماتی که به طور خودکار در نزدیکی یک کارگر یا شیء به ماشین نزدیک می شود ، ایمنی کارگران را در محیط هایی مانند کارخانه ها و انبارها بهبود می بخشد.
- اضافه کردن رنگ. با استفاده از مدل های یادگیری عمیق ، می توان رنگ ها و عکس ها و فیلم ها را به تصاویر های سیاه و سفید اضافه کرد. در گذشته ، این یک فرایند دستی بسیار وقت گیر بود.
- تحقیقات پزشکی. محققان سرطان به عنوان روشی برای تشخیص خودکار سلول های سرطانی ، از یادگیری عمیق را در کارهای خود استفاده می کنند.
- دید رایانه ای. یادگیری عمیق باعث افزایش چشم انداز رایانه شده است ، و دقت بالایی برای رایانه ها در تشخیص اشیاء و طبقه بندی تصویر ، ترمیم و تقسیم بندی فراهم می کند.
یادگیری عمیق در مقابل یادگیری ماشین
یادگیری عمیق زیر مجموعه ای از یادگیری ماشین است که که وجه تمایز آن روش حل مشکلات است. یادگیری ماشین برای شناسایی بیشتر ویژگی های کاربردی به یک متخصص دامنه نیاز دارد. از طرف دیگر ، یادگیری عمیق ویژگی ها را به صورت تدریجی فرا می گیرد ، بنابراین نیاز به تخصص دامنه را از بین می برد. این امر باعث می شود الگوریتم های یادگیری عمیق نسبت به الگوریتم های یادگیری ماشین که فقط به چند ثانیه تا چند ساعت زمان نیاز دارند ، زمان بیشتری برای آموزش نیاز داشته باشند. با این حال ، در هنگام آزمایش ، برعکس صادق است. الگوریتم های یادگیری عمیق نسبت به الگوریتم های یادگیری ماشین که زمان آزمون به همراه اندازه داده ها افزایش می یابد ، زمان کمتری برای اجرای تست ها می گیرند.
بعلاوه ، یادگیری ماشینی به همان ماشینهای پرهزینه و پرمصرف و GPU هایی با کارایی بالا نیاز ندارد که یادگیری عمیق یه همه ی آن ها نیاز دارد.
در پایان ، بسیاری از دانشمندان داده ها به دلیل تفسیر برتر آن ، یا توانایی در درک راه حل ها ، یادگیری ماشین سنتی را از طریق یادگیری عمیق انتخاب می کنند. همچنین الگوریتم های یادگیری ماشین نیز وقتی داده های کوچک هستند ترجیح داده می شوند.
مواردی که یادگیری عمیق ترجیح داده می شود شامل موقعیت هایی است که مقدار زیادی از داده ها وجود دارد ، مانند عدم درک دامنه برای درون نویسی ویژگی ها یا مشکلات پیچیده ، مانند تشخیص گفتار و پردازش زبان طبیعی.
نکتهای که باید راجع به یادگیری عمیق بدانید
یادگیری ماشین در حقیقت یک روش یادگیری ماشین است که روش یادگیری و آموزش طبیعی انسانها را برای سیستمهای کامپیوتری تقلید میکند یعنی در واقع یادگیری از طریق مثال و آزمون. یادگیری عمیق تکنولوژی پشت صحنه اتومبیلهای خودران، کلیدهای کنترل صدا در دستگاههای هوشمند و… است. یادگیری عمیق اخیرا مورد توجه بسیاری قرار گرفته است و باعث شده تا راهحلهای بسیاری برای مسائل ایجاد شوند که قبلا امکانپذیر نبودند.
در یادگیری عمیق، یک مدل رایانهای یاد میگیرد که که کارهای طبقهبندی را مستقیما از روی تصاویر، صدا یا متن انجام دهد. مدلهای یادگیری عمیق میتوانند با دقت و پیشرفتهترین حالت و حتی گاهی بهتر از عملکرد انسانی برسند. مدلها با استفاده از دادههای برچسب گذاری شده و معماری شبکههای عصبی با لایههای بسیار زیاد آموزش داده میشوند.
چگونه یادگیری عمیق به چنین نتایج خوبی میرسد؟
در یک کلام، دقت. یادگیری عمیق در سطح بالاتری نسبت به گذشته میباشد. یادگیری عمیق است که کمک میکند تا لوازم الکترونیکی هوشمند انتظارات کاربر را برآورده کند یا برنامههای کاربردی با اهمیتی که در اتومبیلهای خودران و سایر برنامههای امنیتی مهم استفاده میشود، بسیار مهم است. پیشرفتهای اخیر در یادگیری عمیق به حدی پیشرفت داشته است که در برخی از حوزهها مانند طبقه بندی اشیاء در تصاویر، از انسان فراتر میرود.
تئوری یادگیری عمیق برای اولین بار در دهه 1980 مطرح شد و به دو دلیل عمده در سالهای اخیر به پیشرفتهای فراوانی دست یافته است که عبارتند از:
- یادگیری عمیق به مقادیر زیادی از دادههای برچسبدار نیاز دارد. به عنوان مثال، پیشرفت ماشینهای خودران به میلیونها تصویر و هزاران ساعت فیلم نیاز دارد.
- یادگیری عمیق به قدرت محاسباتی قابل توجهی نیاز دارد. GPUهای با کارایی بالا دارای معماری موازی هستند که برای یادگیری عمیق بسیار کارآمد است. هنگامی که با خوشهها یا محاسبات ابری ترکیب می شود، این مسئله باعث میشود تیمهای توسعه بتوانند مدت زمان آموزش برای یک شبکه یادگیری عمیق را از هفتهها به ساعت یا کمتر کاهش دهند.
یادگیری عمیق چگونه کار می کند؟
اکثر روشهای یادگیری عمیق از معماری شبکه عصبی استفاده میکنند، به همین دلیل اغلب از مدلهای یادگیری عمیق به عنوان شبکه عصبی عمیق یاد میشود. اصطلاح “عمیق” معمولاً به تعداد لایههای پنهان در شبکه عصبی اشاره دارد. شبکههای عصبی سنتی تنها شامل 2 تا 3 لایه پنهان هستند، در حالی که شبکههای عصبی عمیق میتوانند تا 150 لایه داشته باشند.
مدلهای یادگیری عمیق با استفاده از مجموعههای بزرگی از دادههای برچسب گذاری شده و معماری شبکه عصبی، آموزش داده میشوند که ویژگیها را مستقیماً از دادهها، بدون نیاز به استخراج ویژگی به صورت دستی، یاد میگیرند.
یکی از محبوبترین انواع شبکههای عصبی عمیق، به عنوان شبکههای عصبی حلقوی (CNN یا ConvNet) شناخته میشود. CNN ویژگیهای آموخته شده را با دادههای ورودی به کار میبرد و از لایههای حلقوی 2D استفاده میکند و این معماری را به خوبی برای پردازش دادههای 2D مانند تصاویر مناسب میکند.
CNN ها نیاز به استخراج ویژگی دستی را از بین میبرند، بنابراین نیازی به شناسایی ویژگیهای استفاده شده برای طبقه بندی تصاویر ندارید. CNN با استخراج ویژگیهای مستقیم از تصاویر کار میکند این ویژگیهای مربوطه از پیش آماده نشده است.. استخراج ویژگی خودکار باعث میشود که مدلهای یادگیری عمیق برای کارهای بینایی کامپیوتر مانند طبقه بندی شیء بسیار دقیق باشند.
CNN ها یاد میگیرند تا با استفاده از دهها یا صدها لایه پنهان، ویژگیهای مختلف تصویر را تشخیص دهند. هر لایه پنهان پیچیدگی و ویژگیهای تصویر آموخته شده را افزایش میدهد. به عنوان مثال، اولین لایه پنهان میتواند نحوه تشخیص لبهها را بیاموزد و در آخر یاد میگیرد که چگونه اشکال پیچیدهتر را کشف کنیم و بطور خاص شکل شیء مورد نظر را تشخیص دهیم.
انتخاب بین یادگیری ماشین و یادگیری عمیق
یادگیری ماشین تکنیکها و مدلهای متنوعی را ارائه میدهد که میتوانید بر اساس برنامه خود، اندازه دادههای پردازش شده و نوع مشکلی که می خواهید حل کنید را انتخاب کنید. برای یادگیری عمیق موفقیت آمیز، نیاز به مقدار بسیار زیادی از دادهها (برای مثال هزاران تصویر) برای آموزش مدل و همچنین GPU یا واحد پردازش گرافیک برای پردازش سریع دادهها دارد.
هنگام انتخاب بین یادگیری ماشین و یادگیری عمیق ، توجه داشته باشید که آیا از GPU با کارایی بالا و دادههای دارای برچسب زیادی برخوردار هستید یا خیر. اگر هر یک از این موارد را ندارید، میتوان به جای یادگیری عمیق از یادگیری ماشین استفاده شود. یادگیری عمیق عموما پیچیدهتر است، بنابراین برای به دست آوردن نتایج قابل اعتماد، حداقل به چند هزار تصویر نیاز دارید. داشتن یک پردازنده گرافیکی با کارایی بالا به معنای این است که مدل زمان کمتری برای تجزیه و تحلیل همه آن تصاویر خواهد داشت.
نحوه ایجاد و آموزش مدلهای یادگیری عمیق
سه نوع از متداول ترین روشهای که افراد از یادگیری عمیق برای انجام طبقه بندی شی استفاده میکنند عبارتند از:
آموزش از چرک نویسها
برای آموزش یک شبکه عمیق از ابتدا، یک مجموعه داده برچسب گذاری شده بسیار بزرگ جمع میکنید و یک معماری شبکه طراحی میکنید که ویژگی ها و مدلها را یاد میگیرد. این مسئله برای برنامههای جدید یا برنامههایی که تعداد زیادی از دستههای خروجی را دارند مناسب است. این روش کمتر متداول است زیرا با وجود تعداد زیادی از دادهها و میزان یادگیری، این شبکهها به طور معمول روزها یا هفتهها به آموزش میپردازند.
انتقال یادگیری
بیشتر برنامههای یادگیری عمیق از روش انتقال یادگیری استفاده میکنند، فرایندی که شامل تنظیم دقیق یک مدل از پیش آماده شده است. میتوانید با یک شبکه موجود مانند AlexNet یا GoogLeNet شروع کنید و دادههای جدیدی را که شامل کلاسهای قبلی ناشناخته است تغذیه کنید. بعد از ایجاد برخی ترفندها در شبکه، برای مثال میتوانید یک کار جدید مانند دسته بندی سگها یا گربهها به جای 1000 شیء مختلف انجام دهید. همچنین این فرآیند نیاز به دادههای بسیار کمتری دارد (پردازش هزاران تصویر به جای میلیون ها)، بنابراین زمان محاسبه به دقیقه یا ساعت کاهش می یابد.
یادگیری انتقال نیاز به رابط کاربری داخلی شبکه از قبل موجود دارد ، بنابراین می توان آنرا برای عمل جدید اصلاح و جراحی کرد. متلب دارای ابزارها و کارکردهایی است که به شما کمک می کند یادگیری را انتقال دهید.
استخراج ویژگی
یک رویکرد کمی کمتر متداول و تخصصیتر برای یادگیری عمیق استفاده از شبکه به عنوان استخراج کننده ویژگی است. از آن جا که همه لایهها وظیفه یادگیری ویژگیهای خاص از تصاویر را دارند، میتوانیم این ویژگیها را در هر زمان و در طی فرآیند آموزش از شبکه داشته باشیم. این ویژگیها میتوانند به عنوان ورودی به یک مدل یادگیری ماشین مانند ماشینهای بردار پشتیبانی (SVM) استفاده شوند.
تسریع مدلهای یادگیری عمیق با GPU
آموزش یک الگوی یادگیری عمیق، از روزها تا هفتهها میتواند زمان زیادی ببرد. استفاده از شتاب GPU میتواند روند کار را به میزان قابل توجهی سرعت ببخشد. استفاده از MATLAB با GPU، زمان لازم برای آموزش شبکه را کاهش میدهد و میتواند مدت زمان آموزش برای یک مشکل طبقهبندی تصویر را از روزها به ساعتها کاهش دهد. در آموزش مدلهای یادگیری عمیق، MATLAB از GPU استفاده میکند (در صورت وجود) بدون اینکه شما را مجبور به درک نحوه برنامه ریزی صریح GPUها کند.
یادگیری ماشین و یادگیری عمیق برای بخش خدمات مشتریان چه معنی دارد؟
بسیاری از برنامههای هوش مصنوعی امروز در بخش سرویسدهی به مشتری از الگوریتمهای یادگیری ماشین استفاده میکنند. این الگوریتمها تا به امروز در بخشهای مختلفی همانند رانندگی بدون راننده، افزایش بهرهوری عوامل انسانی و اطمینان بیشتر گردش فرآیند کار استفاده شدهاند.
دادههای وارد شده در الگوریتمها از پرس و جوهایی که از مشتریان میشود شکل میگیرند، که شامل اطلاعاتی در زمینههای مرتبط با موضوعاتی است که مشتریان با آن روبرو هستند. جمع کردن این اطلاعات به یک برنامه هوش مصنوعی نیاز دارد که به نوبه خود منجر به ایجاد پیشبینیهای سریعتر و دقیقتر میشود. این امر باعث شده است تا هوش مصنوعی چشم انداز مهیجی در بسیاری از مشاغل باشد، به طوری که رهبران صنعت حدس میزنند که عملیترین کاربردهای هوش مصنوعی مربوط به تجارت برای خدمات به مشتریان خواهد بود.
هرچه یادگیری عمیق بیشتر اصلاح شود، کاربردهای پیشرفتهتری از هوش مصنوعی در خدمات به مشتری خواهیم داشت. یک مثال عالی برای این از پاسخ چت بات Zendesk است که یک الگوی یادگیری عمیق برای درک مفاهیم مربوط به بلیط، پشتیبانی و یادگیری مطالب کمک کننده برای مشتری است.
یادگیری عمیق در واقع یک شبکه عصبی بزرگ است
اندرو نگ از کورسرا و دانشمند ارشد تحقیقات بایدو رسماً Google Brain را تأسیس کرد که در نهایت منجر به تولید فن آوری های یادگیری عمیق در تعداد زیادی از خدمات Google شد. او درباره اینکه یادگیری عمیق چیست و امکان خوبی برای شروع است، صحبت کرده و نوشته است.
در گفتگوهای اولیه در مورد یادگیری عمیق، اندرو یادگیری عمیق را جزء شبکه های عصبی مصنوعی سنتی توصیف کرد. در گفتگویی در سال 2013 با عنوان “یادگیری عمیق ، یادگیری خودآموز و یادگیری ویژگی بدون نظارت” وی ایده یادگیری عمیق را اینگونه توصیف کرد:
:با استفاده از شبیه سازی مغز ، امید است:
– بتوان الگوریتم های یادگیری را بسیار بهتر و آسانتر استفاده کرد.
– پیشرفت های انقلابی در یادگیری ماشین و هوش مصنوعی ایجاد کرد.
من معتقدم که این بهترین پیشرانه ما در پیشرفت به سمت هوش مصنوعی واقعی است.”
هسته اصلی یادگیری عمیق طبق گفته اندرو این است که امروزه ما کامپیوترهایی به اندازه کافی سریع و دادههای کافی داریم تا درواقع شبکههای عصبی بزرگ را آموزش دهیم. وقتی در این مورد مثلا در ExtractConf 2015 صحبت میکنیم که چرا حالا زمان آن است که یادگیری عمیق در حال جهش است، در گفتگویی با عنوان “آنچه دانشمندان باید درباره یادگیری عمیق بدانند” است، اندرو اظهار داشت:
شبکههای عصبی بسیار بزرگ و مقادیر عظیمی از داده هایی چیزی است که ما اکنون به آنها دسترسی داریم.
وی همچنین در مورد نکته مهمی صحبت کرد که همه چیز در مورد مقیاس است و این مسئله که ایجاد شبکههای عصبی بزرگتر و آموزش آنها با اطلاعات بیشتر و عملکرد رو به افزایش است. این به طور کلی با سایر تکنیکهای یادگیری ماشین که در عملکرد به فلات می رسند متفاوت است.
سرانجام ، او کاملاً روشن در مورد این نکته صحبت میکند که مزایای یادگیری عمیق که در عمل شاهد آن هستیم از یادگیری نظارت شده ناشی میشود. وی در گفتگویی در ExtractConf در سال 2015 اظهار داشت:
تقریباً تمام ارزش امروز یادگیری عمیق از طریق یادگیری نظارت شده یا یادگیری از دادههای برچسب گذاری شده است.
پیش از این نیز وی در گفتگویی با دانشگاه استنفورد با عنوان “یادگیری عمیق” در سال 2014 ، او نظری مشابه داشت:
یکی از دلایلی که یادگیری عمیق به شکل خارقالعادهای به اوج رسیده است، به این دلیل است که در یادگیری نظارت شده پیشرقت کرده است.
اندرو غالباً خاطرنشان می کند که ما باید، و حتما در آینده، از طرف یادگیری تحت نظارت فواید بیشتری کسب کنیم و میبینیم که این حوزه برای مقابله با فراوانی دادههای بدون برچسب در دسترس، بالغ می شود.
جف دین عضوی از Wizard و Google Senior Fellow در گروه سیستم ها و زیرساختهای گوگل است و در مقیاس بندی و اتخاذ یادگیری عمیق در گوگل نقش داشته و شاید تا حدودی مسئول آن باشد. جف درگیر پروژه Google Brain و توسعه نرم افزار یادگیری عمیق در مقیاس بزرگ DistBelief و بعداً TensorFlow شد.
او در گفتگویی در سال 2016 با عنوان “یادگیری عمیق برای ساخت سیستم های رایانهای هوشمند” وی در همین رابطه اظهار نظری کرد که یادگیری عمیق واقعاً در مورد شبکههای عصبی بزرگ است.
“وقتی اصطلاح یادگیری عمیق را میشنوید، فقط باید به یک شبکه عصبی بزرگ عمیق فکر کنید. Deep به تعداد طور معمول اشاره دارد، بنابراین اصطلاحی عامیانه است که در مطبوعات به تصویب رسیده است. من به طور کلی از آنها به عنوان شبکههای عصبی عمیق یاد میکنم.”
وی چندین بار این گفتگو را ارائه داده و در مجموعه اسلایدهای تغییر یافته برای همان گفتگو، مقیاس پذیری شبکههای عصبی را برجسته میکند و نشان میدهد که نتایج با دادههای بیشتر و مدلهای بزرگتر بهتر می شوند، که به نوبه خود برای آموزش نیاز به محاسبات بیشتری دارد.
یک پاسخ
خيلي ممنون مطالب بسيار مفيد است