تایپ صوتی در گوگل ، مزایا و معایب
۱۳۹۸-۱۱-۲۰ 0

در این مقاله قصد داریم تا یکی از پرکاربرد ترین قابلیت‌های گوگل را بررسی کنیم و ببینیم که چه مزایا و معایبی دارد. قابلیت مورد نظر ما تایپ صوتی در گوگل است که به کاربران این اجازه را می‌دهد تا بدون نیاز به تایپ کردن تنها با گفتن چیزی متن آن را داشته باشند. در ادامه با ما همراه باشید.

تایپ صوتی در گوگل چیست؟

اگر بخواهیم تعریف دقیقی از این فناوری داشته باشیم، می‌توانیم بگوییم که تایپ صوتی در گوگل یک ابزار رایگان برای دیکته گفتن در سرویس‌هایی همانند Google Docs، Google Slides و پردازنده کلمات آنلاین گوگل و ابزارهای پرزنت و ارائه آن می‌باشد. از آنجایی که بیشتر نرم افزارهایی که برای تایپ کردن از آن‌ها استفاده می‌شود، قابلیت برخورداری از این سرویس گوگل را دارند، به طور کلی می‌توان گفت که تایپ صوتی گوگل قابلیت استفاده برای همه را دارد.

تایپ صوتی گوگل در روی کیبرد اکثر گوشی‌های هوشمند وجود دارد و در حقیقت همان نشانه‌ی میکروفونی است که در پایین کیبرد و در سمت چپ دکمه فاصله قرار گرفته است. در رایانه‌های شخصی هم با استفاده از مرورگر کروم می‌توانید از سرویس Google Doc کمک گرفته و از این فناوری استفاده نمایید.

سرویس هایی که از تایپ صوتی گوگل برخوردارند

در بروزترین نسخه این سرویس قادر است از 119 زبان زنده دنیا پشتیبانی کند و محتوای موجود در صوت‌های این زبان‌ها را به متن تبدیل کند. سرویس رایگان تایپ صوتی گوگل نیز برای کاربران فارسی زبان و بر روی زبان فارسی نیز در دسترس عموم می‌باشد.

چگونه از تایپ صوتی گوگل استفاده کنیم؟

کاربرانی که از گوشی‌های هوشمند استفاده می‌کنند با زدن دکمه‌ی میکروفون بر روی کیبرد گوشی خود می‌توانند از تایپ صوتی گوگل بهره‌مند شوند. در تصویر زید می‌توانید محل این دکمه را مشاهده نمایید.

دکمه کیبرد برای استفاده از تایپ صوتی

اگر از Google Docs استفاده می‌کنید با مراجعه به منو، قسمت Tools را باز کرده و گزینه Voice typing را فعال نمایید.

تایپ صوتی در گوگل داک

لازم به ذکر است که قابلیت تبدیل صوت به متن گوگل برای سازندگان اپلیکیشنی که می‌خواهند از قابلیت تایپ صوتی بر روی اپ خود استفاده کنند در دسترس می‌باشد و با پرداخت هزینه می‌توانند api تایپ صوتی گوگل را دریافت نمایند.

آیا قابلیت تایپ صوتی گوگل بر روی زبان فارسی در ایران هم کاربرد دارد؟

بله، قابلیت تایپ صوتی گوگل بر روی زبان فارسی هم در دسترس کاربران فارسی زبان می‌باشد. با استفاده از راه‌هایی که گفته شد کاربران می‌توانند از مزایای سرویس تبدیل گفتار به نوشتار گوگل در زبان فارسی بصورت رایگان بهره‌مند شوند. پس از فعال کردن قابلیت تبدیل گفتار به نوشتار می‌توانید به آیکون زبان مراجعه کرده و پیش فرض زبان را تغییر داده و زبان فارسی را انتخاب نمایید. پس از اطمینان از صحت عملکرد و کیفیت میکروفونی که دارید می‌توانید از تایپ صوتی بهره‌مند شوید.

مزایای تایپ صوتی در گوگل چیست؟

گوگل در چند سال اخیر سرمایه‌گذاری سرسام آوری را بر روی فناوری زبان بر روی زبان‌های مختلف در دنیا انجام داده است. نتیجه‌ی این سرمایه‌گذاری فوق‌العاده فناوری شده که در بسیاری از زبان‌ها با کیفیت خوب گفتار را درک کرده و آن را به نوشتار تبدیل می‌نماید. از مزایای تایپ صوتی فوق‌العاده گوگل می‌توان به موارد زیر اشاره نمود:

سرعت فوق‌العاده

قدرت تایپ کلمات یک فرد عادی بین 38 تا 40 کلمه در دقیقه می‌باشد که این تعداد برابر است با به طور میانگین 2400 کلمه در ساعت. اگر به جای روش‌های تایپ قدیمی از تایپ صوتی گوگل استفاده شود این سرعت را می‌توان تا چیزی حدود 4 برابر افزایش داد. یعنی در هر دقیقه به صورت میانگین 150 کلمه.

دسترسی بالا

از آنجایی که تایپ صوتی گوگل بر روی پلتفرم‌های متفاوتی در دسترس است و در گوشی‌های هوشمند نیز می‌توان در هر کجا از آن استفاده کرد، می‌توان در هر کجا از آن استفاده نمود. دیگر لازم نیست همانند روش‌های قدیمی یک جا نشسته و ساعت‌ها به تایپ کردن مشغول شوید.

دقت بالا

یک تایپیست معمولی به صورت میانگین از هر 100 کلمه 8 کلمه را اشکال دارد. در صورتی که با استفاده از تبدیل گفتار به نوشتار گوگل میزان خطا تا حد زیادی کاهش میابد. زیرا به جای نوشتن کلمات با استفاده از کیبرد، کلمات مستقیما به هوش مصنوعی گوگل گفته شده و او نیز آن‌ها را به نوشته تبدیل کرده است.

توانایی تبدیل صوت به متن در هر پلتفرمی

به کمک سرویس تبدیل گفتار به نوشتار گوگل می‌توانید فایل‌ها را به هر فرمتی که می‌خواهید ذخیره کنید. زیرا بسیاری از نرم افزارهایی که از آن‌ها استفاده می‌شوند قابلیت وصل شدن به سرویس تایپ صوتی را دارند. در غیر این صورت نیز می‌توانید از پلتفرم‌های گوگل برای تبدیل گفتار به نوشتار استفاده نموده و پس از ویرایش فایل نهایی آن را در پلتفرم مورد نظر کپی کرده و با فرمت دلخواه ذخیره نمایید.

پر واضح است اگر بخواهیم مزایای تایپ صوتی گوگل را بنویسیم، می‌توانیم یک مقاله را به آن اختصاص دهیم. اما قصد ما در این مقاله بررسی کلی این قابلیت است و می‌خواهیم از تمام جوانب به آن نگاهی بندازیم.

معایب تایپ صوتی در گوگل چیست؟

شاید عنوان این بخش برای شما سوال بر انگیز باشد و بگویید مگر ممکن است که سرویسی که گوگل با آن همه عظمت ارائه می‌دهد عیب و یا مشکلی داشته باشد؟ باید بگوییم که برای کاربرانی که کارهای کوچکی با تایپ صوتی دارند و نمی‌خواهند به طور پیشرفته از آن استفاده کنند، این سرویس همانگونه که هست بسیار عالی خواهد بود و نقدی بر آن نیست. مشکل از جایی شروع می‌شود که بخواهیم از تایپ صوتی برای مقاصد پیشرفته‌تر استفاده نماییم. در این بخش ممکن است با مشکلات زیر مواجه شویم:

نیاز به اتصال دائمی اینترنت

شاید بتوان گفت یکی از معایب این تایپ صوتی گوگل بخصوص در زبان فارسی آن است که در زمان استفاده از آن حتما باید به اینترنت دسترسی دائم داشته باشید. این مسئله شاید در استفاده‌های محدود و کم به چشم نیاید اما زمانی که نیاز دارید تا گفتارهای طولانی را به متن تبدیل کنید و یا در مکان‌هایی قرار دارید که دسترسی مناسبی به اینترنت ندارید، بسیار مشکل آفرین می‌شود.

سرور خارج از ایران

یکی از مشکلاتی که سازمان‌های داخلی با آن روبه‌رو هستند، آن است که طبیعتا چون گوگل یک شرکت‌های خارجی است، سرورهای آن نیز در خارج از کشور قرار دارد و سازمان‌ها و شرکت‌هایی که دارای داده‌هایی هستند که نمی‌خواهند به خارج از سازمان برود، عملا نمی‌توانند از تایپ صوتی گوگل استفاده کنند. زیرا آن‌ها به سرویس‌هایی نیاز دارند که به صورت لوکال بر روی سرورهای خودشان نصب شود و هیچ اطلاعاتی را به بیرون از سازمان نفرستند.

عام بودن گفتار به نوشتار

یکی از مشکلاتی که کاربران فارسی زبان در استفاده از تایپ صوتی گوگل با آن مواجهه هستند، آن است که این سرویس تنها قادر است گفتار عام در زبان فارسی را متوجه شود و کلمات تخصصی در زبان فارسی که برخی کسب‌وکارها، همانند وکلا و حقوقدانان و…، از آن‌ها به کرات استفاده می‌کنند را به درستی متوجه نمی‌شود. به همین خاطر کسب‌وکارهای این چنینی برای تبدیل گفتار به نوشتار و تایپ صوتی نمی‌توانند بر کمک گوگل اتکا کنند.

نفهمیدن لهجه‌های مختلف زبان فارسی

زبان فارسی پر است از لهجه‌ها و گویش‌های مختلف. اگر نرم افزاری بخواهد در زبان فارسی به خوبی کار کند نیاز دارد که تمام این لهجه‌ها را متوجه شود. متاسفانه همانطور که در مورد قبل به آن اشاره شد تایپ صوتی گوگل گفتار عام زبان فارسی را متوجه می‌شود و باز هم کاربران فارسی زبان با مشکلات بسیاری در این زمینه روبه‌رو هستند.

پولی بودن api سرویس تایپ صوتی گوگل

بسیاری از توسعه دهندگان اپلیکیشن که می‌خواهند از قابلیت تایپ صوتی در اپلیکیشن خود استفاده نمایند، اول از همه به سراغ سرویس گوگل می‌روند. برعکس اینکه تایپ صوتی گوگل بر روی سرویس‌هایی که خود ارائه می‌دهد رایگان می‌باشد، برای دریافت api آن به صورت دقیقه‌ای باید هزینه پرداخت نمود. چون این هزینه به دلار محاسبه می‌شود برای کاربران داخلی استفاده از آن به صرفه نمی‌باشد و عملا نمی‌توانند از تایپ صوتی گوگل استفاده نمایند.

زمانی که تایپ صوتی گوگل در زبان فارسی مشکل آفرین می‌شود چه کنیم؟

اگر شما هم در استفاده از تایپ صوتی در گوگل به معایبی که گفته شد و یا مشکلات دیگری برخوردید، تنها راه شما روی آوردن به سرویس‌های تایپ صوتی دیگر است. سرویس‌هایی که بتواند همان کیفیت را با استانداردهای مورد نیاز شما در اختیارتان قرار دهد. اگر به دنبال چنین سرویسی هستید، ما فارس آوا را به شما معرفی می‌کنیم. سرویس فارس آوا یکی از بهترین موتورهای تبدیل گفتار به نوشتار در زبان فارسی می باشد.

تایپ صوتی فارسی چیست؟

محصول فارس آوا تبدیل گفتار به نوشتار را به صورت تخصصی برای زبان فارسی انجام می دهد و قادر است ارتباط کلامی بین شما و کامپیوتر یا موبایلتان را فراهم کند. محصول فارس آوا با تکیه بر دانش متخصصان هوش مصنوعی ایرانی و با بهره گیری از آخرین تکنولوژی های روز دنیا تولید شده است و به دلیل جمع آوری بزرگ ترین دیتاسِت موجود در زبان فارسی و تمرکز ویژه روی این زبان، ضمن بهره مندی از تنوع گفتاری بسیار وسیع موفق شده است تا در رقابت با شرکت های بزرگی چون گوگل (بر روی زبان فارسی) دارای ضریب دقت بالایی باشد.

محصول فارس آوا دارای قابلیت های زیر می باشد:

  • تبدیل گفتار به متن فارسی با دقت و سرعت بالا
  • بهره مندی از آخرین تکنولوژیهای یادگیری عمیق
  • تبدیل گفتار به متن بصورت همزمان (Real-Time)
  • تشخیص گفتار و صوت در محیط های نویزی
  • پشتیبانی از انواع لهجه ها و گویش ها
  • قابلیت تبدیل گفتار محاوره ای به متن
  • پشتیبانی از انواع فرمتهای صوتی و ویدیویی
  • تبدیل گفتار انگلیسی به متن انگلیسی
  • غیر وابسته به گوینده و عدم نیاز به آموزش برای هر فرد
  • ارائه API محصول فارس آوا و SDK تبدیل گفتار به متن در قالب وب سرویس
  • ارائه پنل تحت وب برای آپلود کردن فایلها جهت پردازش
  • قابل نصب روی سرور مشتری و عدم نیاز اتصال به اینترنت
  • بهره مندی از دایره واژگان (فرهنگ لغت) بسیار وسیع
  • تبدیل گفتار به نوشتار به کمک هوش مصنوعی

با توجه به قابلیت های ذکر شده، محصول فارس آوا می تواند چنین کاربرد هایی داشته باشد:

  • امکان استفاده در تمامی سیستم های عامل (Android, IOS, Mac, Windows, Linux)
  • امکان استفاده برای تمامی برنامه های تحت موبایل (تمامی پلتفرمها)
  • امکان استفاده در برنامه هایی از قبیل دستیارهای شخصی هوشمند در موبایل
  • امکان استفاده های عمومی از قبیل : تایپ گفتاری و اجرای دستورات صوتی
  • امکان سفارشی سازی برای تشخیص دستورات خاص صوتی
  • امکان سفارشی سازی برای کاربردهای خاص و افزایش دقت
  • پردازش داده های حجیم گفتاری

علاوه بر آن فارس آوا دارای دو محصول جانبی می‌باشد که می‌تواند عملیات تبدیل متن به گفتار (TTS) و استخراج کلمات کلیدی (KWS) را انجام دهد. چنانچه قصد دارید با محصول فارس آوا بیشتر آشنا شوید به صفحه محصول فارس آوا مراجعه کنید و اگر درخواست دمو دارید به صفحه تماس با ما مراجعه نمایید.

نظر بدهید

چت بات

چت بات
گفتار به نوشتار
تشخیص چهره
اپراتور هوشمند