فناوری پردازش گفتار ، فناوری است که رشد بیسابقهای در مارکت جهانی تجربه خواهد نمود. براساس پیشبینیها این فناوری رشدی 17.2 درصدی را تا سال 2025 تجربه خواهد کرد. بدینترتیب سود جهانی این مارکت از 10.34 بیلیون دلار در 2019 به 26.79 بیلیون دلار در سال 2025 خواهد رسید. با عامراندیش همراه باشید تا با این فناوری به روز دنیا بیشتر آشنا شویم.
فناوری پردازش گفتار
تکنولوژی پردازش گفتار امکان کنترل بدون تماس را به چندین دستگاه و تجهیزات ممکن میسازد و اطلاعات ورودی را به صورت خودکار برای ترجمه و متن آماده چاپ، تحویل میدهد.
وسایل تشخیص گفتار این ظرفیت را خواهند داشت تا به دستورات صوتی عمل کنند. رشد بازار تشخیص گفتار و صدا، اساسا بسته به فاکتورهایی مانند افزایش همزمان پذیرش تکنولوژی پیشرفته با افزایش تقاضای مصرفکننده برای وسایل هوشمند، افزایش امنیت دادههای شخصی، افزایش استفاده از پرداختهای صوتی و خرید توسط خردهفروشان است.
در ایران نیز با ورود اپلیکیشن فارس آوا شاهد این رشد هستیم. فارس آوا اپلیکیشنی است که با استفاده از فناوری پردازش گفتار، اختصاصا برای زبان فارسی طراحی شده است. در ادامه با شرکتهای مطرح دنیا که از این فناوری به صورت گسترده تولید و استفاده میکنند، آشنا خواهیم شد.
شرکت ارتباطات Nuance در ایالات متحده (Nuance Communications)
این شرکت در سال 2001 تاسیس شد و مقر آن در برلینگتون، ماساچوست آمریکاست. محصولات شرکت Naunce متمرکز بر هوش مصنوعی، سیستمهای هدایت تماسهای تلفنی مشتریان، سیستمها و نرمافزارهای بازنویسی دارویی است. این شرکت راهحلهای بسیاری مانند خدمات مراقبتهای پزشکی، مدیریت مشتری امنیکانل (omnichannel)، تشکیلات اقتصادی و صنعت خودرو را ارائه کرده است.
75% از شرکای این شرکت، جز 100 کمپانیهای ثروتمند جهاناند و حدود 1000 سازمان جهانی در زمینه بهداشت و مراقبتهای سلامتی از راهحلهای ارائه شده توسط این شرکت استفاده میکنند.
فناوری پردازش گفتار در گوگل LLC (ایالت متحده)
این شرکت در سال 1998 تاسیس شد و مقر اصلی آن کالیفرنیا، آمریکاست. Google LLC یکی از اولین پیشگامان جهانی در تولید محصولات و خدمات اینترنت محور است. سبد محصولات گوگل از موتورهای جستجو، محاسبات ابری، فناوریهای تبلیغات آنلاین و سختافزار و نرمافزار رایانهای متغیر است. علاوه بر محصولات و خدمات نام برده در بالا، Google LLC جا پای خود را مستقیم یا با واسطه از طریق شرکتهای تابع در صنعت اتوماسیون منزل (home automation industry) محکم کرده است. گوگل شبکه قدرتمند جهانی است که بیش از 70 دفتر مختلف در 50 کشور مختلف جهان در شمال آمریکا، اروپا، آسیای شرقی، آمریکای لاتین، خاورمیانه و آفریقا دارد. گوگل در زمینه فناوری پردازش گفتار، از جمله شرکتهای پیشرو در جهان است.
فناوری پردازش گفتار آمازون (Amazon.com, Inc)
آمازون در سال 1994 تاسیس شد و مقر اصلی آن واشنگتن دیسی در ایالات متحده است. فعالیت اصلی این شرکت در 3 بخش اصلی خلاصه شده است: شمال آمریکا، بینالملل وبخش سرویس وب آمازون در فروش محصولات خردهفروشی به مشتریان. این شرکت اساسا بر فناورهای پیشرفتهای چون هوش مصنوعی، محاسبات ابری، مشتری الکترونیکی، تجارت الکترونیک و digital streeing متمرکز است.
آمازون در شمال آمریکا، اروپا، آسیای شرقی و دیگر جهان شعبههای فعال دارد.
فناوری پردازش گفتار در اپل
این شرکت در سال 1977 تاسیس شد و مقر اصلی آن کوپرتینو (Cupertino)، کالیفرنیا است. این شرکت در چندین بخش مانند طراحی، تولید، بازاریابی، فروش موبایل، وسایل رسانهای و رایانه در مقیاس جهانی فعالیت دارد. اپل محصولات و خدمات خود را از طریق نیروی مستقیم فروش، مغازههای آنلاین و خرده فروش، از طریق شرکتهای مخابراتی شخص ثالث، فروشندگان و عمدهفروشان به فروش میرساند. این شرکت با شرکتهای تابع و توزیع قدرتمند شبکه جای پای خود را در اروپا، خاورمیانه، آمریکای لاتین، آفریقا و شمال آمریکا محکم کرده است.
فناوری پردازش گفتار درماکروسافت Microsoft Corporation
ماکروسافت در سال 1975 تاسیس شد و دفتر مرکزی آن در ردموند (Redmond) واشینگن آمریکاست. شرکت مایکروسافت یک شرکت چند ملیتی است. این شرکت برای محصولات نرمافزاریش که بیشتر بر اساس مرورگر وب اینترنت اکسپلورر (Internet Explorer)، مایکروسافت ویندوز OS، ماکروسافت آفیس و Edge Web browsers شناخته میشود. این شرکت در آمریکای شمالی، اروپا، آسیای شرقی، آمریکای لاتین، آفریقا و خاورمیانه حضوری فعال و قدرتمند دارد.
شرکت آمریکایی IBM
این شرکت در سال 1911 تاسیس شد. دفتر مرکزی آن در آرمونک (Armonk)، نیویورک است. IBM در 5 بخش اصلی مانند راهحلهای شناختی، خدمات تکنولوژی و پلتفرم ابری، فناوری پردازش گفتار، سرویس و سیستمهای جهانی تجارت، سیستمهای جهانی تامین مالی فعالیت دارد. این شرکت در تولید و فرووش سختافزار و نرمافزار و ارایه آنها به تعداد زیادی از سرویسهای خدمات میزبانی (hosting) و مشاوره از پردازندههای اصلی تا دامنههای نانوتکنولوژی فعال است. این شرکت محصولات وسیعی را تولید میکند که شامل هوش مصنوعی، Io T، محاسبات ابری، امنیت و غیر است.
فناوری پردازش گفتار در شرکت چینی Baidu
این شرکت در سال 2000 تاسیس شد. دفتر اصلی آن در پکن، چین است. Baidu به صورت وسیعی در 2 بخش فعالیت دارد که شامل Baidu Core و iQIYI است. بایدو (Baidu) شامل اپلیکیشن بایدو (Baidu App)، بایدو پست بار (Baidu Post Bar)، نقشه بایدو (Baidu Map)، Baidu IME وBaidu Knows، دانشنامه بایدو و تجارتهای جدید هوش مصنوعی است. این شرکت محصولات خود را به صورت مستقیم در شهرهای پکن، دونگوان، گوانگژو، شانگهای، شنژن و سوژو به فروش میرساند.
این شرکت خدمات مختلفی مانند موتور جستجوی چینی، بیش از 50 سرویس جستوجو و اجتماع (search & community services) که شامل Baidu Baike و یک انجمن بحثوگفتگو مبنی بر کلمات کلیدی است، ارایه میدهد.
شرکت آمریکایی سنسوری
این شرکت در سال 1994 تاسیس شد و دفتر مرکزی آن در سانتا کلارا (Santa Clara) در کالیفرنیا آمریکاست. سنسوری یک شرکت نرمافزار خصوصی است که از فناوری یادگیری ماشین مانند پردازش صدا و گفتار برای افزایش تجربه کاربر فعالیت دارد. این شرکت، شبکه عصبی برای تشخیص کفتار برای مصرفکنندگان الکترونیکی ارایه میدهد. این شرکت در شهرهای پرتلند (Portland)، بولدر (Boulder)، توکیو، سئول و هنگهنگ شعبه دارد.
فناوری پردازش گفتار در شرکت چینی iFLYTEK
این شرکت چینی در سال 1999 تاسیس شد که دفتر مرکزی آن در هفی (Hefei) ، ایالات آنهویی (Anhui) چین است. این شرکت، از پیشرفتهترین شرکتها در زمینه تحقیق و توسعه تکنولوژیهایی مانند فناوری تشخیص و پردازش صدا و گفتار، سرویسهای اطلاعاترسانی گفتاری، یکپارچهسازی سیستمهای الکترونیکی دولتی (e-government systems) و بهبود محصولات chip و نرمافزارها است.
این شرکت به همراه شرکتهای تابع و شبکه قدرتمند توزیع در شمال آمریکا، اروپا، اروپای شرقی، آمریکای لاتین، آفریقا و خاورمیانه فعال است.
شرکت آمریکایی .LumenVox LLC
این شرکت در سال 2001 تاسیس شد. دفتر اصلی آن سن دیگو، کالیفرنیا آمریکاست. LumenVox LLC یکی از مهمترین پیشروان در صنعت تکنولوژی پردازش صدا و گفتار است. محصول نخست این شرکت موتور LumenVox Speech است که از مشخصات گرامری (دستور زبان) تشخیص گفتار برای ساخت و تعریف و دستور زبان استفاده میکند. این محصول با چندین پلتفرمهای مهم صوتی مانند Aculab، BroadSoft’s BroadWorks و پرتابل پاسخ تعالی صوتی آوایا (Avaya) ادغام شده است.
ای شرکت همچنین گزارشهای جامعی در زمینه اندازه تخمینی بازار جهانی، آنالیز اشتراک بازار، میزان بازده، پوشش موضوعات کلیدی و رویهها را ارائه میدهد.