آیا تا به حال پیش آمده که برای تبدیل گفتار به نوشتار به سراغ سرویسهایی همانند گوگل رفته باشید که بتوانند تایپ صوتی را برای شما انجام دهند؟ تجربه شما در استفاده از این سرویس چه بود؟ آیا توانست تمامی نیازهایتان را برطرف نماید؟ اگر تجربهای مشابه آنچه که گفته شد دارید، در ابتدا از پنل زیر استفاده کنید (با زدن بر روی علامت میکروفن به ضبط گفتار بپردازید) و سپس در ادامه مقاله با ما همراه باشید تا با هم به بررسی تایپ صوتی گوگل بپردازیم و ببینیم که آیا میتوانیم راهحلهای دیگری را پیدا کنیم یا خیر!
تایپ صوتی در گوگل چیست؟
اگر بخواهیم تعریف دقیقی از این فناوری داشته باشیم، میتوانیم بگوییم که تایپ صوتی در گوگل یک ابزار رایگان (فقط نسخه همزمان تبدیل صدا به متن گوگل رایگان است و نسخه ای که بتوان در آن فایل صوتی آپلود کرد، رایگان نیست.) برای دیکته گفتن در سرویسهایی همانند Google Docs، Google Slides و پردازنده کلمات آنلاین گوگل و ابزارهای ارائه آن میباشد. از آنجایی که بیشتر نرمافزارهایی که برای تایپ کردن از آنها استفاده میشود، قابلیت برخورداری از این سرویس گوگل را دارند، به طور کلی میتوان گفت که تایپ صوتی گوگل قابلیت استفاده برای همه افراد را دارد و اولین گزینه در دسترس همه کاربران است.

تایپ صوتی گوگل در کیبورد اکثر گوشیهای هوشمند وجود دارد و در حقیقت همان نشانهی میکروفونی است که در پایین کیبورد و در سمت چپ دکمه فاصله قرار گرفته است. در رایانههای شخصی هم با استفاده از مرورگر کروم میتوانید از سرویس Google Doc کمک گرفته و از این فناوری استفاده نمایید.
گوگل در بروزترین نسخه این سرویس قادر است از 119 زبان زنده دنیا پشتیبانی و محتوای موجود در صوتهای این زبانها را به متن تبدیل کند. سرویس رایگان تایپ صوتی گوگل برای کاربران فارسی زبان و بر روی زبان فارسی نیز در دسترس عموم میباشد.
تایپ صوتی گوگل در ویندوز
برای استفاده از قابلیت تایپ صوتی گوگل در کامپیوتر باید با مرورگر گوگل کروم وارد سایت گوگل داکس شوید. اگر برای تبدیل گفتار به نوشتار گوگل از کامپیوتر استفاده میکنید نیاز به یک میکروفن هم دارید.
- با استفاده از مرورگر گوگل کروم به اکانت جیمیل خود متصل شود و سپس وارد سایت Google Docs شوید.
- یک سند جدید در قسمت new document بسازید یا یکی از سندهای قبلی را باز کنید.
- صفحه جدیدی برای شما باز خواهد شد در بالای این صفحه منو سایت گوگل داکس قرار دارد. در منو سایت قسمت Tools را باز کرده و گزینه Voice typing را فعال نمایید.
- در سمت چپ برای شما یک کادر جدید با آیکون میکرفون نبه وجود خواهد آمد. در حالت پیش فرض بر روی زبان انگلیسی تنظیم شده است برای تغییر زبان کافیست روی قسمتی که زبان را نوشته کلیک کنید تا یک منو کشویی برای شما باز شود از منوی کشویی زبان فارسی را انتخاب کنید.
- بر روی آیکون میکروفون کلیک کنید و شروع به صحبت کردن بکنید تا گوگل آنها را تبدیل به متن کنند.
لازم به ذکر است که قابلیت تبدیل صوت به متن گوگل برای سازندگان اپلیکیشنی که میخواهند از قابلیت تایپ صوتی بر روی اپ خود استفاده کنند نیز در دسترس میباشد و برنامه نویسان با پرداخت هزینه میتوانند api تایپ صوتی گوگل را دریافت نمایند.
برای اطلاع از نحوه دریافت api تایپ صوتی سرویس تبدیل گفتار به نوشتار فارسآوا به این صفحه مراجعه کنید.
تایپ صوتی گوگل در موبایل
در دو مقاله به صورت کامل و تصویری نحوه فعال سازی تایپ صوتی در اندروید و آیفون را توضیح دادیم برای خواندن این مقالات بر روی لینک زیر کلیک کنید.
کاربرانی که از گوشیهای هوشمند استفاده میکنند با زدن دکمهی میکروفون بر روی کیبورد گوشی خود میتوانند از تایپ صوتی گوگل بهرهمند شوند. در تصویر زیر میتوانید محل این دکمه را مشاهده نمایید.

آیا قابلیت تایپ صوتی گوگل بر روی زبان فارسی در ایران هم کاربرد دارد؟
بله، قابلیت تایپ صوتی گوگل بر روی زبان فارسی هم در دسترس کاربران فارسی زبان میباشد. با استفاده از راههایی که گفته شد کاربران میتوانند از مزایای سرویس تبدیل گفتار به نوشتار گوگل در زبان فارسی بصورت رایگان بهرهمند شوند. پس از فعال کردن قابلیت تبدیل گفتار به نوشتار میتوانید به آیکون زبان مراجعه کرده و پیش فرض زبان را تغییر داده و زبان فارسی را انتخاب نمایید. پس از اطمینان از صحت عملکرد و کیفیت میکروفونی که دارید میتوانید از تایپ صوتی بهرهمند شوید.
مزایای تایپ صوتی در گوگل چیست؟
گوگل در چند سال اخیر سرمایهگذاری سنگینی را بر روی فناوری شناسایی گفتار در زبانهای مختلف انجام داده است. نتیجهی این سرمایهگذاری فوقالعاده سرویسی شده که در بسیاری از زبانها با کیفیت خوب گفتار را درک کرده و آن را به نوشتار تبدیل مینماید. از مزایای تایپ صوتی فوقالعاده گوگل میتوان به موارد زیر اشاره نمود:
1. سرعت فوقالعاده
قدرت تایپ کلمات یک فرد عادی بین 38 تا 40 کلمه در دقیقه میباشد که این تعداد برابر است با به طور میانگین 2400 کلمه در ساعت. اگر به جای روشهای تایپ قدیمی از تایپ صوتی گوگل استفاده شود این سرعت را میتوان تا چیزی حدود 4 برابر افزایش داد. یعنی در هر دقیقه به صورت میانگین 150 کلمه.
2. دسترسی بالا
از آنجایی که تایپ صوتی گوگل بر روی پلتفرمهای متفاوتی در دسترس است و در گوشیهای هوشمند نیز میتوان در هر کجا از آن استفاده کرد، میتوان در هر کجا از آن استفاده نمود. دیگر لازم نیست همانند روشهای قدیمی یک جا نشسته و ساعتها به تایپ کردن مشغول شوید.
3. دقت بالا
یک تایپیست معمولی به صورت میانگین از هر 100 کلمه 8 کلمه را اشکال دارد. در صورتی که با استفاده از تبدیل گفتار به نوشتار گوگل میزان خطا تا حد زیادی کاهش میابد. زیرا به جای نوشتن کلمات با استفاده از کیبورد، کلمات مستقیما به هوش مصنوعی گوگل گفته شده و او نیز آنها را به نوشته تبدیل کرده است.
4. توانایی تبدیل صوت به متن در هر پلتفرمی
به کمک سرویس تبدیل گفتار به نوشتار گوگل میتوانید فایلها را به هر فرمتی که میخواهید ذخیره کنید. زیرا بسیاری از نرم افزارهایی که از آنها استفاده میشوند قابلیت وصل شدن به سرویس تایپ صوتی را دارند. در غیر این صورت نیز میتوانید از پلتفرمهای گوگل برای تبدیل گفتار به نوشتار استفاده نموده و پس از ویرایش فایل نهایی آن را در پلتفرم مورد نظر کپی کرده و با فرمت دلخواه ذخیره نمایید.
پر واضح است اگر بخواهیم مزایای تایپ صوتی گوگل را بنویسیم، میتوانیم یک مقاله را به آن اختصاص دهیم. اما قصد ما در این مقاله بررسی کلی این قابلیت است و میخواهیم از تمام جوانب به آن نگاهی بندازیم. به همین دلیل صحبت در مورد مزایا را تمام کرده و به مشکلاتی که ممکن است با استفاده از سرویس تایپ صوتی گوگل برای کاربران فارسی زبان پیش بیاید میپردازیم.
معایب تایپ صوتی در گوگل چیست؟
شاید عنوان این بخش برای شما سوال برانگیز باشد و بگویید مگر ممکن است که سرویسی که گوگل با آن همه عظمت ارائه میدهد عیب و یا مشکلی داشته باشد؟ باید بگوییم که برای کاربرانی که کارهای کوچکی با تایپ صوتی دارند و نمیخواهند به طور پیشرفته از آن استفاده کنند، این سرویس همانگونه که هست بسیار عالی خواهد بود و نقدی بر آن نیست. مشکل از جایی شروع میشود که بخواهیم از تایپ صوتی در زبان فارسی برای مقاصد پیشرفتهتر استفاده کنیم. در این بخش ممکن است با مشکلات زیر مواجه شویم:
1. نیاز به اتصال دائمی اینترنت
شاید بتوان گفت یکی از معایب این تایپ صوتی گوگل بخصوص در زبان فارسی، آن است که در زمان استفاده حتما باید به اینترنت دسترسی دائم داشته باشید. این مسئله شاید در استفادههای محدود و کم به چشم نیاید اما زمانی که نیاز دارید تا گفتارهای طولانی را به متن تبدیل کنید و یا در مکانهایی قرار دارید که دسترسی مناسبی به اینترنت ندارید، بسیار مشکل آفرین میشود.
2. سرور خارج از ایران
یکی از مشکلاتی که سازمانهای داخلی با آن روبهرو هستند، این است که چون گوگل یک شرکت خارجی است، سرورهای آن نیز در خارج از کشور قرار دارد و سازمانها و شرکتهایی که دارای دادههایی هستند که نمیخواهند به خارج از سازمان برود، عملا نمیتوانند از تایپ صوتی گوگل استفاده کنند. زیرا آنها به سرویسهایی نیاز دارند که به صورت لوکال بر روی سرورهای خودشان نصب شود و هیچ اطلاعاتی را به بیرون از سازمان نفرستد.
3. عام بودن گفتار به نوشتار
یکی از مشکلاتی که کاربران فارسی زبان در استفاده از تایپ صوتی گوگل با آن مواجهه هستند، آن است که سرویس گوگل تنها قادر است گفتار عام در زبان فارسی را متوجه شود و کلمات تخصصی در زبان فارسی که برخی کسبوکارها، همانند وکلا و حقوقدانان و…، از آنها به کرات استفاده میکنند را به درستی متوجه نمیشود. به همین خاطر کسبوکارهای این چنینی برای تبدیل گفتار به نوشتار و تایپ صوتی نمیتوانند بر کمک گوگل اتکا کنند.
4. نفهمیدن لهجههای مختلف زبان فارسی
زبان فارسی پر است از لهجهها و گویشهای مختلف. اگر سرویسی میخواهد در زبان فارسی به خوبی کار کند نیاز دارد که تمام این لهجهها را متوجه شود. همانطور که در مورد قبل به آن اشاره شد درست است که تایپ صوتی گوگل گفتار عام زبان فارسی را متوجه میشود اما باز هم کاربران فارسی زبان در تبدیل گفتار با لهجههای مختلف با مشکلات بسیاری در این زمینه روبهرو هستند.
5. پولی بودن api سرویس تایپ صوتی گوگل
بسیاری از توسعه دهندگان اپلیکیشن که میخواهند از قابلیت تایپ صوتی در اپلیکیشن خود استفاده نمایند، اول از همه به سراغ سرویس گوگل میروند. برعکس اینکه تایپ صوتی گوگل بر روی سرویسهایی که خود ارائه میدهد رایگان میباشد، برای دریافت api آن به صورت دقیقهای باید هزینه پرداخت نمود. چون این هزینه به دلار محاسبه میشود برای کاربران داخلی استفاده از آن به صرفه نمیباشد و عملا نمیتوانند از تایپ صوتی گوگل استفاده نمایند.
زمانی که تایپ صوتی گوگل در زبان فارسی مشکل آفرین میشود چه کنیم؟
محصول فارس آوا تبدیل گفتار به نوشتار را به صورت تخصصی برای زبان فارسی انجام می دهد و قادر است ارتباط کلامی بین شما و کامپیوتر یا موبایلتان را فراهم کند. محصول فارس آوا با تکیه بر دانش متخصصان هوش مصنوعی ایرانی و با بهرهگیری از آخرین تکنولوژی های روز در دنیا تولید شده است و به دلیل جمعآوری بزرگترین دیتاست موجود در زبان فارسی و تمرکز ویژه روی این زبان، ضمن بهرهمندی از تنوع گفتاری بسیار وسیع موفق شده است تا در رقابت با شرکتهای بزرگی چون گوگل (بر روی زبان فارسی) دارای ضریب دقت بالایی باشد.
برای تست میتوانید از پنل فارس آوا استفاده کنید که ویدئو آموزشی کار با آن در ادامه برای شما آورده شده است. با ثبت نام در پنل فارس آوا میتوانید از هدیه یک ساعت تبدیل گفتار به نوشتار رایگان بهرهمند شوید.
سرویس تبدیل گفتار به نوشتار فارسآوا چه قابلیتهایی دارد؟
فارس آوا میتواند با استفاده از هوش مصنوعی ابزاری هوشمند برای رونویسی و تایپ گفتار ارائه دهد. این سرویس از ترکیبی از مدلهای گفتاری، شبکههای عصبی و الگوریتمهایی برای کاهش نویز پس زمینه، برای افزایش تمرکز روی اصطلاحات و لغات تخصصی مشاغل مختلف و همچنین تمایز بین گویندهها بدون در نظر گرفتن لهجه و همچنین تشخیص لحن گفتار زبان فارسی، استفاده میکند. از قابلیتهای فارسآوا میتوان به موارد زیر اشاره کرد:
تبدیل گفتار به متن فارسی با دقت و سرعت بالا
فارسآوا در دو نسخه تبدیل همزمان صوت به متن و همچنین تبدیل فایل صوتی در کوتاهترین زمان ممکن ارائه شده است. بر اساس آمار، میانگین تایپ در افراد معمولی، بین 40 تا 50 کلمه در دقیقه است؛ اما بعضی از گیمرها، برنامهنویسها یا نابغهها میتوانند 90 تا 100 کلمه در دقیقه نیز تایپ کنند! اما طبق بررسیهای صورت گرفته سرعت تایپ فارسآوا، تقریبا 10 برابر یک فرد حرفه ای است و میتونه حتی بیشتر از 1000 کلمه در دقیقه تایپ کند.
تبدیل گفتار به متن به صورت همزمان (Real-Time)
فارسآوا قابلیت تایپ همزمان با بالاترین کیفیت را نیز دارد. این قابلیت در مواقع مختلفی به کمکتان میآید. برای مثال نویسندگان به جای تایپ و یا دستی نوشتن مطالبشان میتوانند داستان را بلند بلند لخوانند تا فارسآوا تایپ کند و…
تشخیص گفتار و صوت در محیطهای نویزی
دقت فارسآوا زمانی که محیط یا صدا نویزی و یا شلوغ میشود کمی پایین میآید اما با این وجود از سرویسهای تبدیل گفتار به نوشتار دیگر بهتر عمل میکند و قابلیت تشخیص صوت را دارد. اما در نظر داشته باشید که هرقدر کیفیت فایل صوتی بهتر و بالاتر باشد،دقت تایپ متن توسط فارسآوا بسیار بالاتر میرود.
پشتیبانی از انواع لهجهها
فارسآوا به صورت کاملا بومی در ایران توسعه داده شده و به همین دلیل قابلیت تشخیص انواع لهجهها و گویشهای ایران را دارد. این بدان معناست که اگر کسی مثلا با لهجه ترکی به فارسی صحبت کند، فارسآوا قابلیت فهم و تایپ آن را دارد، اما اگر فردی کاملا به ترکی صحبت کند ممکن است بسیاری از کلمات را فارسآوا پوشش ندهد.
قابلیت تبدیل گفتار محاورهای به متن
یکی از ایرادهایی که بر سرویسهای خارجی تبدیل گفتار به نوشتار و یا سرویسهای داخلی که از موتورهای تبدیل گفتار به نوشتار خارجی برای تبدیل صوت فارسی به متن استفاده میکنند، وارد است توانایی این سیستمها در فهم گفتار عام زبان فارسی است. در استفاده از اینگونه سرویسها، همان طور که قبلا به آن اشاره کردیم، عدم فهم مناسب کلمات یا واژههای تخصصی و یا جملات و واژههایی است که به گفتار عام راهی ندارند. اگر از سرویس گوگل استفاده کرده باشید متوجه میشوید که گاهی کلمات محاورهای را متوجه نمیشود و یا به صورت رسمی مینویسد! اما فارسآوا قابلیت درک جملات و کلمات محاورهای شما را دارد و میتواند همانگونه که کلمات تلفظ شده است، آن را بنویسد. محصول فارسآوا میتواند گفتار رسمی در زبان فارسی را از گفتار محاورهای تشخیص دهد. از آنجا که در زبان فارسی فاصله زیادی بین گفتار محاوره و گفتار رسمی وجود دارد، سرویس تبدیل گفتار به متن کاربردی باید بتواند این دو را از یکدیگر تمیز دهد. بدین ترتیب ناگفته پیدا است که تمرکز اصلی فارس آوا بر روی فهم کامل گفتار عام و خاص زبان فارسی و متناسب با نیازهای کاربر فارسی زبان است. مسئلهی دیگری نیز که باید مورد توجه قرار بگیرد آن است که در آیندهای نزدیک نسخه فارس آوا مخصوص به مشاغل خاصی مانند وکلا نیز به بازار عرضه خواهد شد تا کاربرانی که در مشاغلشان از عبارتهای بخصوص استفاده میکنند بتوانند از آن بهره ببرند.
پشتیبانی از انواع فرمتهای صوتی و ویدیویی
گاهی شما یک فایل ویدئویی دارید که نیاز به متن آن دارید. اما تبدیل آن به صوت و سپس متن بسیار وقت گیر است. اما ویژگی منحصر به فرد فارسآوا این است که شما هر صوت و هر ویدئویی را با هر فرمتی میتوانید تبدیل به متن کنید! در فارسآوا هیچ محدودیتی در خصوص صوت و ویدئو وجود ندارد.
تبدیل گفتار انگلیسی به متن انگلیسی
سرویس تبدیل گفتار به نوشتار گوگل قابلیت تبدیل همزمان صوت انگلیسی به متن انگلیسی را دارد، اما نمیتوان در آن یک فایل از پیش ضبط شده را تبدیل به متن کرد. اما فارسآوا میتواند فایل صوتی انگلیسی را به متن انگلیسی تبدیل کند.

غیر وابسته به گوینده و عدم نیاز به آموزش برای هر فرد
برای فارسآوا مهم نیست یک نفر صحبت کند یا چندین نفر! فارسآوا قابلیت تشخیص همزمان صدای چند نفر را دارد و بدون معطلی هر صوتی را تبدیل به متن میکند.
ارائه API محصول فارس آوا و SDK تبدیل گفتار به متن در قالب وب سرویس
از فارسآوا روی هر پلتفرم، سایت و اپلیکیشنی میتوان بهره گرفت. توسعه دهندگان میتوانند با دریافت API فارسآوا از این سرویس روی پلتفرمهای مختلف استفاده کنند. برای دریافت اطلاعات بیشتر در این خصوص میتوانید با ما تماس بگیرید.
ارائه پنل تحت وب برای آپلود کردن فایلها جهت پردازش
مزیت مهم دیگر فارسآوا آن است که نیازی نیست برای استفاده از این سرویس حتما اپلیکیشنی روی تلفن همراه یا سیستم خود نصب کنید! فارس آوا بر روی پنل تحت وب قابل دسترسی است و شما با هر دستگاهی میتوانید به صورت آنلاین از آن بهره ببرید.
قابل نصب روی سرور مشتری و عدم نیاز اتصال به اینترنت
سازمانها با وجود فارسآوا دیگر نگران بیرون رفتن اطلاعاتشان از سرور خود نباشند! فارسآوا قابلیت نصب روی سرور سازمانها را دارد. همچنین با نصب فارسآوا بر سرور سازمان کاربران مختلف میتوانند بدون نیاز به اینترنت و به صورت آفلاین گفتار خود را به نوشتار تبدیل کنند. به این ترتیب مشکل کاربرانی که نمیخواهند در طول فرآیند تبدیل گفتار به متن توسط هوش مصنوعی و تایپ صوتی سیستمشان به اینترنت متصل باشد، استفاده از فارس آوا راه حلی مناسب و کاربردی خواهد بود.
بهرهمندی از دایره واژگان (فرهنگ لغت) بسیار وسیع
فارسآوا بیش از 300 هزار لغت در خود جا داده است که این لغات شامل کلماتی است که از زبانهای دیگر وارد زبان فارسی شده اند و یا در زبان فارسی بسیار پرتکرار هستند.
با توجه به قابلیتهای ذکر شده، محصول فارس آوا میتواند چنین کاربرد هایی داشته باشد:
- امکان استفاده در تمامی سیستم های عامل (Android, IOS, Mac, Windows, Linux)
- امکان استفاده برای تمامی برنامه های تحت موبایل (تمامی پلتفرمها)
- امکان استفاده در برنامه هایی از قبیل دستیارهای شخصی هوشمند در موبایل
- امکان استفاده های عمومی از قبیل : تایپ گفتاری و اجرای دستورات صوتی
- امکان سفارشی سازی برای تشخیص دستورات خاص صوتی
- امکان سفارشی سازی برای کاربردهای خاص و افزایش دقت
- پردازش داده های حجیم گفتاری
علاوه بر آن فارس آوا دارای دو محصول جانبی برای مشتریان سازمانی میباشد که میتواند عملیات تبدیل متن به گفتار (TTS) و استخراج کلمات کلیدی (KWS) را انجام دهد. همان طور که در بالا هم به این مسئله اشاره کردیم، فارس آوا میتواند جایگزین بسیار مناسبی برای تایپ صوتی گوگل باشد. این سرویس میتواند نیازهای کاربران فارسی زبان را به خوبی رفع کند و عملکرد و کیفیت بالایی را بر روی زبان فارسی داشته باشد. فارس آوا برای یک کاربر فارسی زبان نه تنها مزایای سرویس گوگل را به همراه خواهد داشت، بلکه در بسیاری از زمینههای دیگر نیز او را بینیاز از سایر سرویسهای تبدیل گفتار به نوشتار میکند.
برای کسب اطلاعات بیشتر درباره فارس آوا و استفاده از آن وارد صفحه فارسآوا شوید؛ به نظر شما در زبان فارسی، سرویس تبدیل گفتار به نوشتار گوگل بهتر است یا فارسآوا؟ نظر خود را با ما به اشتراک بگذارید.
3 پاسخ
واقعا سایته خوبی هست از شما ممنونم. مچکررررررررررر
واقعا بدرد نخور فقط حرف (و)تشخیص میده
سلام
نسخه لایو و پنل فارس آوا مورد تست و بررسی قرار گرفت و بدون هیچ مشکل کار میکرد.
در صورتی هنوز هم مشکل دارید ممنون میشم که بگید با چه دستگاهی واد سایت شدید و از کدوم نسخه استفاده کردید؟