فناوریهای پردازش گفتار مانند الکسا (Alexa)، کورتانا (Cortana)، دستیار گوگل (Google Assistant) و سیری (Siri) راههایی تعامل همگان با وسایل الکترونیکیشان، خانههایشان، پیشههایشان و خودروهایشان را دگرگون کرده است. این فناوری به ما این اجازه را میدهد تا با رایانه یا دستگاه خود گفتگو نماییم و این وسایل آنچه را که ما تلاش در گفتن آن داریم را دریافت کنند و پاسخی درخور پرسش یا دستور ما دهند. با عامر اندیش همراه باشید تا با کاربرد پردازش گفتار در زندگی روزمره خود بیشتر آشنا شویم.
پردازش گفتار
با داشتن پیشینه دراز در پیشرفت و نوآوری، آشناسازی این فناوری جدید مبنی برای هوش مصنوعی به بازار پردازش صوت بود که چشمانداز این فناوری را در سده 21 به تمامی دگرگون ساخت.
با فراگیر شدن کاربرد دستیاران دیجیتالی در همگی ابعاد زندگی، تواناییها و کاربردهایشان برای افراد، تجارت و سازمانها بسیار مهم شده است.
کاربرد پردازش گفتار و دستیار دیجیتالی بازشناسایی صدا
دستیار دیجیتالی برای کمک به کارکرد بهتر مردم یا آراسته ساختن وظایف پایهایشان و همچنین پاسخ به پرسشها و جستارهایشان طراحی و ساخته شده است.
این رباتها با توانایی دستیابی به اطلاعات از پایگاه دادههای گسترده و منابع دیجیتالی گوناگون را دارند و اینگونه به حل دشواریها در زمان راستین (real time)، افزایش تجربه کاربر و بهرهوری انسان کمک میکنند.
پرآوازهترین دستیاران دیجیتالی شامل:
- الکسا آمازون
- سیری اپل
- دستیار گوگل
- کورتانا مایکروسافت
کاربرد پردازش گفتار در سامانههای مختلف جامعه امروزی
فناوری شناسایی گفتار و کاربرد دستیار دیجیتالی به تندی از گوشیهای همراهمان به سوی خانههایمان، صنایعمان، تجارتمان، بازارهایمان، سامانههای بانکداری و بهداشتیمان حرکت کرده است. در دنباله با برجستهترین کاربرد این فناوری در زندگی روزمره آشنا خواهیم شد:
1- در مکانهای کاری و اداری
فناوری تشخیص گفتار در جایگاههای کاری دربرگیرنده آمیزش کارهای ساده، برای بالابردن بازده و کارایی بیشتر ماست. همچنین این فناوری ورای وظایفی که افراد به صورت سنتی ناچار به انجام آن اند، آشکار شده است. در زیر با نمونههایی از کاربرد پردازش گفتار و دستیار دیجیتالی که توانایی انجام برخی از وظایف انسان را دارد، آشنا میشویم:
- جستوجو اخبار یا سندهای تازه از روی رایانه
- آفریدن گراف یا جدول با استفاده از دادهها
- دیکته دادههایی که میخواهید بر روی یک سند درج شود
- چاپ سندهای درخواستی
- آغاز ویدیوهای کنفرانسی
- برنامه نشستها
- ضبط دقیقهها
- ساماندهی سفر
با پاندمی COVID-19 جلسات ویدئویی و تماسهای کنفرانسی بیشتر شدند و از پردازش گفتار به عنوان سرویسی برای رونویسی سریع و قابل اعتماد در جلسات استفاده شد.
2- کاربرد پردازش گفتار در بانکداری
هدف از صنعت مالی و بانکداری برای فناوری شناسایی گفتار، افزایش آسایش برای مشتری است. سامانههای بانکداری با فناوری پردازش گفتار تا اندازه بسیاری میتواند نیاز به خدمات مشتری انسانی را کاهش دهد که به کاهش هزینههای کارمندان میانجامد. یک دستیار ویژه بانکی میتواند مایه رضایت و باور عمیق مشتری به کارکرد عالی سامانههای بانکی شود.
حال پرسش اینجاست چگونه شناسایی آوا میتواند مایه بهبود در کارکارد بانکها شود:
- بدون نیاز به باز کردن گوشی همراه خود، از دادههای درخواستی وابسته به مانده حساب، ریزتراکنشهای مالی و عادات هزینههای مالی آگاه شوید
- دریافت دادهها در باره تاریخچه ریزتراکنشها
- اطلاع از پرداختیها
به عنوان مثال ، بانک سلطنتی کانادا (RBC) به مشتریان این امکان را میدهد که صورتحساب خود را با استفاده از دستورات صوتی پرداخت کنند. USAA همچنین به اعضا این امکان را میدهد تا از طریق آمازون الکسا به اطلاعات مربوط به مانده حساب، معاملات و الگوهای هزینه دسترسی پیدا کنند.
همچنین با پرسیدن سوالات ساده از دستیار هوشمند بانک ایالات متحده، مانند: “ماه گذشته چقدر در [نام فروشگاه] هزینه کردم؟” “ماه گذشته چند بار به [نوع مشاغل] رفتم؟” میتوانید به بینشی از هزینههای خود برسید.
سایر دستیاران مجازی بانکی نه تنها به شما در انجام معاملات کمک میکنند، بلکه به شما کمک میکنند هزینههای خود را پیگیری کرده و بینشی را در مورد اینکه پول شما کجا میرود، به شما نشان دهند. به عنوان مثال، بانک اریکای آمریکا چندین دیدگاه کلیدی در مورد امور مالی شما ارائه میدهد، از جمله:
نمودار هفتگی هزینهها
جستجوی معاملات گذشته
نظارت بر هزینههای مکرر
اعلان تغییرات در امتیاز اعتباری FICO
پیگیری روند موجودی حساب
بیومتریک صدا در اینجا نیز به کار میآید. صدای شما میتواند به عنوان یک شناسه منحصر به فرد برای دسترسی ایمن به حسابهای شما استفاده شود.
3- کاربرد پردازش گفتار در بازار
جستجوی آوایی پتانسیل افزودن بعد تازهای به بازاریابی دارد که میتواند بازاریابها را به مشتریان آماج (هدف) نزدیک سازد. بازاریابها، با رویآوری به دگرگونی در شیوه تعامل مردم با دستگاههایشان، باید به دنبال گسترش روند در دادهها و رفتار کاربران باشند.
- داده: با شناسایی گفتار، گونه تازهای از دادهها، در دسترس بازایابها برای واکاوی قرار خواهد گرفت. ایشان با استفاده از دادههایی همچون حسابهای بانکی مردم، الگوهای گفتاریشان و واژگانشان میتوانند موقعیت جغرافیایشان، سنشان و دیگر دادههای وابسته به قومیت، فرهنگ و پیوستگیشان آگاه شوند.
- رفتار: تایپ کردن، نیازمند چکیدهنویسی و کوتاهی است. درحالیکه گفتمان توانایی مکالمههای طولانیتری را فراهم میآورد. بازاریابان و بهینهسازان برای بدست آوردن پیروزی و کامیابی در این صنعت، ممکن است نیاز به تمرکز بر کلید واژگان و تولید محتواهای گفتاری طولانی مدت را داشته باشند، که با کاربرد پردازش گفتار در سویههای گوناگون زندگی، این امر به سادگی شدنی خواهد بود.
الگو جستوجوی تند و چابک میتواند کاربران را بیشکیبتر ساخته و آنان را به صورت فزایندهای به اینترنت برای گزینش دادههای مورد نیاز به عنوان برجستهترین سرچشمه اطلاعاتی، وابستهتر سازد. به همین علت، میزان زمانی که کاربران در پای مانیتورهای خود صرف میکنند، کم و کمتر خواهد شد. بازاریابها باید توجه کنند که این مهم برای محتواهای دیداری و بصری چه معنایی خواهد داشت، زیرا احتمال اینکه تمرکز کاربران در آینده بیشتر به سوی محتواهای شنیداری و سنگین جلب شود، بسیار بالا خواهد بود.
4- کاربرد پردازش گفتار سامانه بهداشت و تندرستی
در محیطی که ثانیهها ارزش ویژهای دارند و شرایط استریل در برترین جایگاهها قرار دارد، دسترسی چابکانه و پرشتاب به دادهها میتواند کارایی چشمگیر در تندرستی بیماران و افزایش بازده سامانه پزشکی داشته باشد. این برتریها به قرار زیر خواهد بود:
- پیدا نمودن پرشتاب و چالاکانه دادهها از رکوردهای پزشکی
- پرستاران به سادگی میتوانند فرایندها یا دستورکار ویژهای را یادآوری نمایند
- پرستاران میتوانند به دادههای اداری همچون شمار بیماران در هرطبقه و یا شمار بخشهای موجود به سادگی دسترسی داشته باشند
- در خانه، پدر و مادر میتوانند از نشانههای معمول بیماریها آگاه شده و متوجه شوند که چگونه باید از کودک بیمار خود نگاهداری نمایند.
- کاغذبازی کمتر
- زمان کمتر برای وارد ساختن دادهها
- گردشکار بهبود یافته
برجستهترین نگرانی در کاربرد پردازش گفتار در سامانههای بهداشت و تندرستی، میزان دسترسی به محتواهای دیجیتالی است. توجه داشته باشید که محتواهای تولید شده باید توسط موسسات پزشکی تایید شوند تا گزینه مناسب و درخور آسودگی برای بیماران و دیگر افراد باشد.
5- همه چیز یعنی اینترنت With the Internet of Things (IoT)
در آیندهای نه چندان دور، سیری میتواند با اتصال به چراغها و ترموستاتهای هوشمند، زیر کتری روی اجاق گاز را به سادگی روشن کند.
IOT تنها یک گمانه ساده در آینده نیست که ممکن است به وجود بیاید، بلکه با پیشرفت روزافزون این فناوری، برهمه چیز در اطراف ما عمیقا تاثیرگذار خواهد بود.
هم اکنون، یکی از برجستهترین کاربرد پردازش گفتار در IOT، خودروهاست. این خودرها توانا به راهبرد خود بدون نیاز به رانندهاند. از برتریهای آن میتوان در دگرگونی روش رانندگی و تعامل هر چه ژرفتر ما با خودرویمان یاد کرد. در کل بنیادیترین آماج این فناوری، کاهش حواسپرتی راننده است.
کاربرد دستیار دیجیتالی در خودروها:
- گوش کردن به پیامها در حال رانندگی بدون استفاده از دستهای خود
- کنترل رادیو
- دستیار دیجیتالی در پیدا کردن مسیر کمک بزرگی است
- گوش فرا دادن به دستورهای آوایی
6- کاربرد پردازش گفتار در زبان
یکی از کاربردهای فناوری پردازش صدا از دیدگاه انسان که مایه دگرگونی ژرفی در زندگانی ما شده است، رفع موانع زبانی و مرزهای فرهنگی در سویههای گوناگون زندگی اجتماعی و کاری ماست.
جهانی بدون سد زبانی، تواناییهای خوبی را برای همکاری در میان کشورها و فرهنگهای گوناگون باز خواهد کرد. شاید این امر انگیزه افزایش آهنگ نوآوریها باشد.
7- کاربرد پردازش گفتار در خانه
جستوجوی صوتی رایج ترین کاربرد پردازش گفتار در خانه است. انتظار می رود تا سال 2022 تعداد افرادی که از دستیار های صوتی استفاده میکنند به 6.4 میلیارد نفر در جهان برسد! در حال حاضر رایج ترین دستیارهای صوتی، Siri ،Google Assistant و Amazon Alexa هستند.
30 درصد از کاربران دستیارهای صوتی میگویند که در آمازون اکو یا Google Home سرمایه گذاری کردهاند تا از فناوری خانه هوشمند مبتنی بر صدا برای کنترل همه چیز از ساعت، بلندگو، چراغ، زنگ در، دوربین، پرده پنجره و سایر لوازم خانگی استفاده کنند.
در این سال ها علاوه بر بلندگوی هوشمندُ صفحه نمایش هوشمند نیز توجه بسیاری در خانه ها به خود جلب کرده است. این صفحات هوشمند در واقع بلندگوی هوشمندی همراه با یک صفحه لمسی هستند. برای مثال، نمایشگرهای هوشمند مانند پورتال Sber روسی یا صفحه هوشمند چینی Xiaodu مجهز به چندین عملکرد مبتنی بر هوش مصنوعی، از جمله تعامل صوتی دوربرد هستند.
در سال 2020، فروش نمایشگرهای هوشمند 21 درصد افزایش یافت و به 9.5 میلیون دستگاه رسید، در حالی که فروش بلندگوهای اصلی هوشمند 3 درصد کاهش یافتند و این روند احتمالاً ادامه خواهد داشت. پاندمی COVID-19 نیز استفاده از پردازش گفتار را در خانهها افزایش داد.
8- کاربرد پردازش گفتار در صنعت خودرو
بسیاری از نوآوری ها در فناوری پردازش گفتار توسط صنعت خودرو ایجاد شده است. شرکتهایی مانند اپل، گوگل و نوانس شیوه استفاده از فعالسازی صدا در خودروها را تغییر داده اند.
برای مثال سیری به شما کمک میکند بین لیست پخش جابجا شوید، به نزدیکترین پمپ بنزین بروید، پیامهای متنی ارسال کنید و تماسها را بدون دست پاسخ دهید. پلتفرم Dragon Drive Nuance میتواند الگوهای صدای طبیعی را به مراتب پیچیدهتر از رقبای خود پردازش کند. Nuance همچنین توانسته قابلیتهای بیومتریک صدا را برای تمایز بین افرادی که در داخل وسیله نقلیه صحبت میکنند، ترکیب کند.
کاربرد آینده اپلیکیشنها
این فناوری هنوز در دوران خردسالی خود قرار دارد، ولی با تئوری”پذیرش بیش از حد” که مصرفکنندگان گرایش به پذیرش فناوریهای تازه (بسیار پرشتابتر از گذشته) دارند، گمانه رشد و پیشرفت این فناوری با تندی هر چه بیشتر، بسیار زیاد است. این گام از چرخه زندگی فناوری، داشتن اندیشهای روشن از پتانسیلهای فناوری و گمانه تبدیل شدن فناوری به جامعهای در زندگی روزانه، در آیندهای نزدیک امری مهم و حیاتی است. کسبوکارها باید قادر به گنجاندن فناوری شناسایی گفتار به راهبرد دیجیتال مارکتینگ و بودجه خود داشته باشند. در حالیکه افراد باید در انتظار کاربرد پردازش گفتار در تمامی فعالیتهای روزانه خود باشند. با پیشرفت آهنگ و تیزنگری و موشکافی این فناوریها و همچنین افزایش درخواستهای خریداران، انتظار داریم تا نیاز روزافرون به جایگاههای گفتار محور و بنابراین استخدامهای بیشتری نسبت به گذشته را گواه باشیم.