کاربرد فناوری تشخیص صدا در اینترنت اشیاء

گفتار روشی بسیار قدرتمند برای بیان افکار و خواست‌های انسان‌ها است. به‌همین دلیل تعداد دستگاه‌های که از طریق فرمان‌‎های صوتی کنترل می‌شوند رو به افزایش هستند. همانطور که کاربردهای اینترنت اشیاء گسترش می‌یابد روش‌های جدید و نوآورانه‌ای برای تعامل و ارتباط دستگاه با انسان ارائه می‌شود.

کاربرد فناوری تشخیص صدا در ایترنت اشیاء

اینترنت اشیا چیست؟

اینترنت اشیاء (Internet of Things) که به اختصار به آن IoT نیز گفته می‌شود به ارتباط اینترنتی بین اشیاء و تجهیزاتی می‌گویند، که در محیط پیرامون ما قرار دارند.

4 دلیل اصلی برای استفاده از سیستم‌ IoT

  1. شکل معمول ارتباط برای انسان، صدا است (بیان دستورات به صورت شفاهی برای انسان‌ها ساده تر است)
  2. تشخیص صدا، زمانی که دستان بند است درگیر کار دیگری هستید یا حوصله بلند شدن از جای خود را ندارید.
  3. تلفن صوتی وسیله‌ای موثر برای ارتباط صوتی دو طرفه با سیستم اینترنت اشیا است که بدون نیاز به دستورالعمل‌های پیچیده، می‌تواند گوش و پاسخ دهد.
  4. صرفه جویی در هزینه: عدم نیاز به صفحه نمایش لمسی در دستگاه‌های هوشمند

سیستم‌های اینترنت اشیا را می‌توان از دیدگاه تعامل و ارتباط صوتی به 3 دسته تقسیم بندی کرد:

  1. ارتباط صوتی دو طرفه (کاربر سوال یا دستور خود را بیان می‌کند و سیستم نتیجه را به صورت صوتی می‌خواند)
  2. ارتباط صوتی یک طرفه (دستورات از طریق اپلیکیشن یا سیستم انجام‌ میشود و سیستم تنها نتجیه را به کاربر اطلاع می‌دهد)
  3. تشخیص صدا (سیستم قادر به فهم و دریافت فرامان‌های صوتی است)
کاربر تشخیص صدا در ایترنت اشیا

فهم گفتار

یکی از سخت‌ترین بخش‌های طراحی سیستم‌های اینترنت اشیا، فهم و درک مقصود گوینده است. در بسیاری از مواقع به دلیل دور بودن گوینده یا وجود نویز‌های محیطی مثل روشن بودن تلویزیون یا هم همه به دلیل مهونی تشخیص صدای گوینده کاری سخت و دشوار است. همچنین وجود لهجه‌های متفاوت نباید اختلالی در کارکرد سیستم به وجود بیاورد. فارس‌آوا یک نرم افزار‌های قدرتمند تبدیل گفتار به متن فارسی است، که امکان ارائه سرویس به صورت لوکال (نصب بر روی سرور داخلی مشتریان) و همچنین از طریق API را نیز دارد.

سخن گفتن

سیستم تبدیل متن به گفتار یا TTS وظیفه تبدیل متن به یک صدای شبیه به انسان را دارد. این فرآیند معکوس، سیستم تشخیص گفتار می‌باشد. فناوری تبدیل متن به گفتار در بعضی از محصولات نرم افزاری و سخت افزاری پیاده سازی شده است. محصول TTS شرکت عامراندیش قادر است متون فارسی با کیفیت خوبی بخواند و امکان ارائه api یا نصب روی سرورهای مشتریان را نیز دارد.

برای کسب اطلاعات بیشتر می‌توانید فرم صفحه تماس با ما را تکمیل کنید یا با شماره تلفن 22556400-021 در ساعات اداری تماس بگیرید.

4.5/5 - (2 امتیاز)
لینک کوتاه شده : https://amerandish.com/QmGqv

به اشتراک بگذارید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

_ مطالب مرتبط _

اهمیت پردازش تصویر در چیست؟

اهمیت استفاده از پردازش تصویر

اهمیت پردازش تصویر و کاربردهای هوش مصنوعی در سال‌های اخیر چند برابر شده است و پیشبینی می‌شود که در سال‌های آینده اهمیت بیشتری نیز پیدا

پردازش تصویر

پنج عرصه پر کاربرد تشخیص چهره

تا به امروز قفل در را با کلید باز می‌کردید، شاید عجیب باشد بگویم که از این پس می‌توانید با چهره خود در خانه‌تان را

درخواست شما با موفقیت ارسال شد.

ضمن تشکر بابت ارسال پیام، در سریع‌ترین زمان ممکن کارشناسان شرکت عامراندیش درخواست شما را بررسی خواهند نمود.