سرویس تایپ صوتی گوگل توانایی تبدیل گفتار به متن را دارد. به عبارت دیگر، این سرویس به کاربران اجازه میدهد تا به صورت آنلاین با استفاده از صدای خود یک متن را دیکته کنند تا هوش مصنوعی به صورت خودکار آن را تایپ کند. با ما همراه شوید تا درمورد تایپ صوتی گوگل صحبت کنیم.
روی علامت میکروفن 🎙 کلیک کنید تا صدای شما به متن تبدیل شود
تایپ صوتی گوگل چیست؟
تایپ صوتی در گوگل، یک ابزار رایگان برای دیکته گفتار در سرویسهایی مانند Google Docs، Google Slides و جیبورد گوگل میباشد. (فقط تایپ صوتی گوگل رایگان است و قسمت تبدیل فایل صوتی به متن گوگل رایگان نیست)
این ابزار توانایی تبدیل صدا به متن را دارد و در دسترس تمامی کاربران است. تایپ صوتی گوگل به عنوان اولین گزینه در دسترس همه است.
- تایپ صوتی گوگل در گوشیهای هوشمند با فشردن دکمه میکروفن در کیبورد قابل دسترس است (در صورتی که برای شما کار نکرد آموزش فعال سازی تایپ صوتی گوگل در گوشی را مطالعه کنید).
- تایپ صوتی گوگل در کامپیوتر و لپ تاپ هم میتوانید از مرورگر کروم و سرویس Google Doc و Google Slides جهت تبدیل صدا به متن نیز استفاده کنید.
در نسخه جدید تایپ صوتی گوگل از 119 زبان زنده دنیا از جمله فارسی پشتیبانی میکند و میتواند محتوای صوتی این زبانها را به متن تبدیل میکند.
آموزش فعال سازی تایپ صوتی گوگل داکس برای کامپیوتر و لپ تاپ
برای استفاده از قابلیت تایپ صوتی گوگل در کامپیوتر باید با مرورگر گوگل کروم وارد سایت گوگل داکس شوید.
نکته 1: برای اتصال به سرویس های گوگل نیاز به یک حساب کاربری Gmail نیز میباشید
نکته 2: اکثر لپ تاپها مجهز به میکروفن داخلی هستند اما اگر برای تبدیل گفتار به نوشتار گوگل از کامپیوتر استفاده میکنید، نیاز به یک میکروفن مجزا هم دارید.
- با استفاده از مرورگر گوگل کروم به اکانت جیمیل خود متصل شوید و سپس وارد سایت Google Docs شوید.
- یک نوشته جدید از قسمت new document ایجاد کنید یا یکی از نوشتههای قدیمی خود را باز کنید.
- صفحه جدیدی برای شما باز خواهد شد در بالای صفحه منو سایت گوگل داکس قرار دارد. در منو سایت قسمت Tools را باز کرده و گزینه Voice typing را فعال نمایید.
- در سمت چپ برای شما یک کادر جدید با آیکون میکرفون نبه وجود خواهد آمد. در حالت پیش فرض بر روی زبان انگلیسی تنظیم شده است برای تغییر زبان کافیست روی قسمتی که زبان را نوشته کلیک کنید تا یک منو کشویی برای شما باز شود از منوی کشویی زبان فارسی را انتخاب کنید.
- بر روی آیکون میکروفون کلیک کنید و شروع به صحبت کردن بکنید تا گوگل آنها را تبدیل به متن کنند.
لازم به ذکر است که قابلیت تبدیل صوت به متن گوگل برای سازندگان اپلیکیشنی که میخواهند از قابلیت تایپ صوتی بر روی اپ خود استفاده کنند نیز در دسترس میباشد و برنامه نویسان با پرداخت هزینه میتوانند api تایپ صوتی گوگل را دریافت نمایند.
برای اطلاع از نحوه دریافت api تایپ صوتی سرویس تبدیل گفتار به نوشتار فارسآوا به این صفحه مراجعه کنید.
تایپ صوتی گوگل در موبایل
در دو مقاله به صورت کامل و تصویری نحوه فعال سازی تایپ صوتی در اندروید و آیفون را توضیح دادیم برای خواندن این مقالات بر روی لینک زیر کلیک کنید.
کاربرانی که از گوشیهای هوشمند استفاده میکنند با زدن دکمهی میکروفون بر روی کیبورد گوشی خود میتوانند از تایپ صوتی گوگل بهرهمند شوند. در تصویر زیر میتوانید محل این دکمه را مشاهده نمایید.
آیا تایپ صوتی گوگل از زبان فارسی پشتیبانی میکنند؟
بله، قابلیت تایپ صوتی گوگل بر روی زبان فارسی در ایران برای کاربران فارسی زبان در دسترس میباشد. با استفاده از راههایی که گفته شد کاربران فارسی زبان میتوانند از مزایای سرویس تبدیل گفتار به نوشتار گوگل به صورت رایگان بهرهمند شوند. پس از فعال کردن قابلیت تبدیل گفتار به نوشتار میتوانید به قسمت زبانها مراجعه کرده و زبان پیش فرض را به زبان فارسی را تغییر دهید.
تایپ صوتی گوگل از چند زبان دنیا پشتیبانی میکند؟
تایپ صوتی گوگل بیش از ۱۰۰ زبان دنیا را پشتیبانی میکند. این شامل زبانهای مانند: انگلیسی، اسپانیایی، فرانسوی، آلمانی، چینی، یاپونی، روسی و بسیاری زبانهای دیگر است. گوگل با پشتیبانی از اکثر زبانهای دنیا سعی در ارائه خدمات گستردهای در زمینه تایپ صوتی برای تمام افراد در سراسر جهان را دارد.
مزایای تایپ صوتی در گوگل چیست؟
گوگل در چند سال اخیر سرمایهگذاری سنگینی را بر روی فناوری شناسایی گفتار در زبانهای مختلف انجام داده است. نتیجهی این سرمایهگذاری فوقالعاده سرویسی شده که در بسیاری از زبانها با کیفیت خوب گفتار را درک کرده و آن را به نوشتار تبدیل مینماید. از مزایای تایپ صوتی فوقالعاده گوگل میتوان به موارد زیر اشاره نمود:
1. سرعت فوقالعاده
قدرت تایپ کلمات یک فرد عادی بین 38 تا 40 کلمه در دقیقه میباشد که این تعداد برابر است با به طور میانگین 2400 کلمه در ساعت. اگر به جای روشهای تایپ قدیمی از تایپ صوتی گوگل استفاده شود این سرعت را میتوان تا چیزی حدود 4 برابر افزایش داد. یعنی در هر دقیقه به صورت میانگین 150 کلمه.
2. دسترسی بالا
از آنجایی که تایپ صوتی گوگل بر روی پلتفرمهای متفاوتی در دسترس است و در گوشیهای هوشمند نیز میتوان در هر کجا از آن استفاده کرد، میتوان در هر کجا از آن استفاده نمود. دیگر لازم نیست همانند روشهای قدیمی یک جا نشسته و ساعتها به تایپ کردن مشغول شوید.
3. دقت بالا
یک تایپیست معمولی به صورت میانگین از هر 100 کلمه 8 کلمه را اشکال دارد. در صورتی که با استفاده از تبدیل گفتار به نوشتار گوگل میزان خطا تا حد زیادی کاهش میابد. زیرا به جای نوشتن کلمات با استفاده از کیبورد، کلمات مستقیما به هوش مصنوعی گوگل گفته شده و او نیز آنها را به نوشته تبدیل کرده است.
4. توانایی تبدیل صوت به متن در هر پلتفرمی
به کمک سرویس تبدیل گفتار به نوشتار گوگل میتوانید فایلها را به هر فرمتی که میخواهید ذخیره کنید. زیرا بسیاری از نرم افزارهایی که از آنها استفاده میشوند قابلیت وصل شدن به سرویس تایپ صوتی را دارند. در غیر این صورت نیز میتوانید از پلتفرمهای گوگل برای تبدیل گفتار به نوشتار استفاده نموده و پس از ویرایش فایل نهایی آن را در پلتفرم مورد نظر کپی کرده و با فرمت دلخواه ذخیره نمایید.
پر واضح است اگر بخواهیم مزایای تایپ صوتی گوگل را بنویسیم، میتوانیم یک مقاله را به آن اختصاص دهیم. اما قصد ما در این مقاله بررسی کلی این قابلیت است و میخواهیم از تمام جوانب به آن نگاهی بندازیم. به همین دلیل صحبت در مورد مزایا را تمام کرده و به مشکلاتی که ممکن است با استفاده از سرویس تایپ صوتی گوگل برای کاربران فارسی زبان پیش بیاید میپردازیم.
معایب تایپ صوتی در گوگل چیست؟
شاید عنوان این بخش برای شما سوال برانگیز باشد و بگویید مگر ممکن است که سرویسی که گوگل با آن همه عظمت ارائه میدهد عیب و یا مشکلی داشته باشد؟ باید بگوییم که برای کاربرانی که کارهای کوچکی با تایپ صوتی دارند و نمیخواهند به طور پیشرفته از آن استفاده کنند، این سرویس همانگونه که هست بسیار عالی خواهد بود و نقدی بر آن نیست. مشکل از جایی شروع میشود که بخواهیم از تایپ صوتی در زبان فارسی برای مقاصد پیشرفتهتر استفاده کنیم. در این بخش ممکن است با مشکلات زیر مواجه شویم:
1. نیاز به اتصال دائمی اینترنت
شاید بتوان گفت یکی از معایب این تایپ صوتی گوگل بخصوص در زبان فارسی، آن است که در زمان استفاده حتما باید به اینترنت دسترسی دائم داشته باشید. این مسئله شاید در استفادههای محدود و کم به چشم نیاید اما زمانی که نیاز دارید تا گفتارهای طولانی را به متن تبدیل کنید و یا در مکانهایی قرار دارید که دسترسی مناسبی به اینترنت ندارید، بسیار مشکل آفرین میشود.
2. سرور خارج از ایران
یکی از مشکلاتی که سازمانهای داخلی با آن روبهرو هستند، این است که چون گوگل یک شرکت خارجی است، سرورهای آن نیز در خارج از کشور قرار دارد و سازمانها و شرکتهایی که دارای دادههایی هستند که نمیخواهند به خارج از سازمان برود، عملا نمیتوانند از تایپ صوتی گوگل استفاده کنند. زیرا آنها به سرویسهایی نیاز دارند که به صورت لوکال بر روی سرورهای خودشان نصب شود و هیچ اطلاعاتی را به بیرون از سازمان نفرستد.
3. عام بودن گفتار به نوشتار
یکی از مشکلاتی که کاربران فارسی زبان در استفاده از تایپ صوتی گوگل با آن مواجهه هستند، آن است که سرویس گوگل تنها قادر است گفتار عام در زبان فارسی را متوجه شود و کلمات تخصصی در زبان فارسی که برخی کسبوکارها، همانند وکلا و حقوقدانان و…، از آنها به کرات استفاده میکنند را به درستی متوجه نمیشود. به همین خاطر کسبوکارهای این چنینی برای تبدیل گفتار به نوشتار و تایپ صوتی نمیتوانند بر کمک گوگل اتکا کنند.
4. نفهمیدن لهجههای مختلف زبان فارسی
زبان فارسی پر است از لهجهها و گویشهای مختلف. اگر سرویسی میخواهد در زبان فارسی به خوبی کار کند نیاز دارد که تمام این لهجهها را متوجه شود. همانطور که در مورد قبل به آن اشاره شد درست است که تایپ صوتی گوگل گفتار عام زبان فارسی را متوجه میشود اما باز هم کاربران فارسی زبان در تبدیل گفتار با لهجههای مختلف با مشکلات بسیاری در این زمینه روبهرو هستند.
5. پولی بودن api سرویس تایپ صوتی گوگل
بسیاری از توسعه دهندگان اپلیکیشن که میخواهند از قابلیت تایپ صوتی در اپلیکیشن خود استفاده نمایند، اول از همه به سراغ سرویس گوگل میروند. برعکس اینکه تایپ صوتی گوگل بر روی سرویسهایی که خود ارائه میدهد رایگان میباشد، برای دریافت api آن به صورت دقیقهای باید هزینه پرداخت نمود. چون این هزینه به دلار محاسبه میشود برای کاربران داخلی استفاده از آن به صرفه نمیباشد و عملا نمیتوانند از تایپ صوتی گوگل استفاده نمایند.
زمانی که تایپ صوتی گوگل در زبان فارسی مشکل آفرین میشود چه کنیم؟
محصول فارس آوا تبدیل گفتار به نوشتار را به صورت تخصصی برای زبان فارسی انجام می دهد و قادر است ارتباط کلامی بین شما و کامپیوتر یا موبایلتان را فراهم کند. محصول فارس آوا با تکیه بر دانش متخصصان هوش مصنوعی ایرانی و با بهرهگیری از آخرین تکنولوژی های روز در دنیا تولید شده است و به دلیل جمعآوری بزرگترین دیتاست موجود در زبان فارسی و تمرکز ویژه روی این زبان، ضمن بهرهمندی از تنوع گفتاری بسیار وسیع موفق شده است تا در رقابت با شرکتهای بزرگی چون گوگل (بر روی زبان فارسی) دارای ضریب دقت بالایی باشد.
برای تست میتوانید از پنل فارس آوا استفاده کنید که ویدئو آموزشی کار با آن در ادامه برای شما آورده شده است. با ثبت نام در پنل فارس آوا میتوانید از هدیه یک ساعت تبدیل گفتار به نوشتار رایگان بهرهمند شوید.
سرویس تبدیل گفتار به نوشتار فارسآوا چه قابلیتهایی دارد؟
فارس آوا میتواند با استفاده از هوش مصنوعی ابزاری هوشمند برای رونویسی و تایپ گفتار ارائه دهد. این سرویس از ترکیبی از مدلهای گفتاری، شبکههای عصبی و الگوریتمهایی برای کاهش نویز پس زمینه، برای افزایش تمرکز روی اصطلاحات و لغات تخصصی مشاغل مختلف و همچنین تمایز بین گویندهها بدون در نظر گرفتن لهجه و همچنین تشخیص لحن گفتار زبان فارسی، استفاده میکند. از قابلیتهای فارسآوا میتوان به موارد زیر اشاره کرد:
تبدیل گفتار به متن فارسی با دقت و سرعت بالا
فارسآوا در دو نسخه تبدیل همزمان صوت به متن و همچنین تبدیل فایل صوتی در کوتاهترین زمان ممکن ارائه شده است. بر اساس آمار، میانگین تایپ در افراد معمولی، بین 40 تا 50 کلمه در دقیقه است؛ اما بعضی از گیمرها، برنامهنویسها یا نابغهها میتوانند 90 تا 100 کلمه در دقیقه نیز تایپ کنند! اما طبق بررسیهای صورت گرفته سرعت تایپ فارسآوا، تقریبا 10 برابر یک فرد حرفه ای است و میتونه حتی بیشتر از 1000 کلمه در دقیقه تایپ کند.
تبدیل گفتار به متن به صورت همزمان (Real-Time)
فارسآوا قابلیت تایپ همزمان با بالاترین کیفیت را نیز دارد. این قابلیت در مواقع مختلفی به کمکتان میآید. برای مثال نویسندگان به جای تایپ و یا دستی نوشتن مطالبشان میتوانند داستان را بلند بلند لخوانند تا فارسآوا تایپ کند و…
تشخیص گفتار و صوت در محیطهای نویزی
دقت فارسآوا زمانی که محیط یا صدا نویزی و یا شلوغ میشود کمی پایین میآید اما با این وجود از سرویسهای تبدیل گفتار به نوشتار دیگر بهتر عمل میکند و قابلیت تشخیص صوت را دارد. اما در نظر داشته باشید که هرقدر کیفیت فایل صوتی بهتر و بالاتر باشد،دقت تایپ متن توسط فارسآوا بسیار بالاتر میرود.
پشتیبانی از انواع لهجهها
فارسآوا به صورت کاملا بومی در ایران توسعه داده شده و به همین دلیل قابلیت تشخیص انواع لهجهها و گویشهای ایران را دارد. این بدان معناست که اگر کسی مثلا با لهجه ترکی به فارسی صحبت کند، فارسآوا قابلیت فهم و تایپ آن را دارد، اما اگر فردی کاملا به ترکی صحبت کند ممکن است بسیاری از کلمات را فارسآوا پوشش ندهد.
قابلیت تبدیل گفتار محاورهای به متن
یکی از ایرادهایی که بر سرویسهای خارجی تبدیل گفتار به نوشتار و یا سرویسهای داخلی که از موتورهای تبدیل گفتار به نوشتار خارجی برای تبدیل صوت فارسی به متن استفاده میکنند، وارد است توانایی این سیستمها در فهم گفتار عام زبان فارسی است. در استفاده از اینگونه سرویسها، همان طور که قبلا به آن اشاره کردیم، عدم فهم مناسب کلمات یا واژههای تخصصی و یا جملات و واژههایی است که به گفتار عام راهی ندارند. اگر از سرویس گوگل استفاده کرده باشید متوجه میشوید که گاهی کلمات محاورهای را متوجه نمیشود و یا به صورت رسمی مینویسد! اما فارسآوا قابلیت درک جملات و کلمات محاورهای شما را دارد و میتواند همانگونه که کلمات تلفظ شده است، آن را بنویسد. محصول فارسآوا میتواند گفتار رسمی در زبان فارسی را از گفتار محاورهای تشخیص دهد. از آنجا که در زبان فارسی فاصله زیادی بین گفتار محاوره و گفتار رسمی وجود دارد، سرویس تبدیل گفتار به متن کاربردی باید بتواند این دو را از یکدیگر تمیز دهد. بدین ترتیب ناگفته پیدا است که تمرکز اصلی فارس آوا بر روی فهم کامل گفتار عام و خاص زبان فارسی و متناسب با نیازهای کاربر فارسی زبان است. مسئلهی دیگری نیز که باید مورد توجه قرار بگیرد آن است که در آیندهای نزدیک نسخه فارس آوا مخصوص به مشاغل خاصی مانند وکلا نیز به بازار عرضه خواهد شد تا کاربرانی که در مشاغلشان از عبارتهای بخصوص استفاده میکنند بتوانند از آن بهره ببرند.
پشتیبانی از انواع فرمتهای صوتی و ویدیویی
گاهی شما یک فایل ویدئویی دارید که نیاز به متن آن دارید. اما تبدیل آن به صوت و سپس متن بسیار وقت گیر است. اما ویژگی منحصر به فرد فارسآوا این است که شما هر صوت و هر ویدئویی را با هر فرمتی میتوانید تبدیل به متن کنید! در فارسآوا هیچ محدودیتی در خصوص صوت و ویدئو وجود ندارد.
تبدیل گفتار انگلیسی به متن انگلیسی
سرویس تبدیل گفتار به نوشتار گوگل قابلیت تبدیل همزمان صوت انگلیسی به متن انگلیسی را دارد، اما نمیتوان در آن یک فایل از پیش ضبط شده را تبدیل به متن کرد. اما فارسآوا میتواند فایل صوتی انگلیسی را به متن انگلیسی تبدیل کند.
غیر وابسته به گوینده و عدم نیاز به آموزش برای هر فرد
برای فارسآوا مهم نیست یک نفر صحبت کند یا چندین نفر! فارسآوا قابلیت تشخیص همزمان صدای چند نفر را دارد و بدون معطلی هر صوتی را تبدیل به متن میکند.
ارائه API محصول فارس آوا و SDK تبدیل گفتار به متن در قالب وب سرویس
از فارسآوا روی هر پلتفرم، سایت و اپلیکیشنی میتوان بهره گرفت. توسعه دهندگان میتوانند با دریافت API فارسآوا از این سرویس روی پلتفرمهای مختلف استفاده کنند. برای دریافت اطلاعات بیشتر در این خصوص میتوانید با ما تماس بگیرید.
ارائه پنل تحت وب برای آپلود کردن فایلها جهت پردازش
مزیت مهم دیگر فارسآوا آن است که نیازی نیست برای استفاده از این سرویس حتما اپلیکیشنی روی تلفن همراه یا سیستم خود نصب کنید! فارس آوا بر روی پنل تحت وب قابل دسترسی است و شما با هر دستگاهی میتوانید به صورت آنلاین از آن بهره ببرید.
قابل نصب روی سرور مشتری و عدم نیاز اتصال به اینترنت
سازمانها با وجود فارسآوا دیگر نگران بیرون رفتن اطلاعاتشان از سرور خود نباشند! فارسآوا قابلیت نصب روی سرور سازمانها را دارد. همچنین با نصب فارسآوا بر سرور سازمان کاربران مختلف میتوانند بدون نیاز به اینترنت و به صورت آفلاین گفتار خود را به نوشتار تبدیل کنند. به این ترتیب مشکل کاربرانی که نمیخواهند در طول فرآیند تبدیل گفتار به متن توسط هوش مصنوعی و تایپ صوتی سیستمشان به اینترنت متصل باشد، استفاده از فارس آوا راه حلی مناسب و کاربردی خواهد بود.
بهرهمندی از دایره واژگان (فرهنگ لغت) بسیار وسیع
فارسآوا بیش از 300 هزار لغت در خود جا داده است که این لغات شامل کلماتی است که از زبانهای دیگر وارد زبان فارسی شده اند و یا در زبان فارسی بسیار پرتکرار هستند.
با توجه به قابلیتهای ذکر شده، محصول فارس آوا میتواند چنین کاربرد هایی داشته باشد:
- امکان استفاده در تمامی سیستم های عامل (Android, IOS, Mac, Windows, Linux)
- امکان استفاده برای تمامی برنامه های تحت موبایل (تمامی پلتفرمها)
- امکان استفاده در برنامه هایی از قبیل دستیارهای شخصی هوشمند در موبایل
- امکان استفاده های عمومی از قبیل : تایپ گفتاری و اجرای دستورات صوتی
- امکان سفارشی سازی برای تشخیص دستورات خاص صوتی
- امکان سفارشی سازی برای کاربردهای خاص و افزایش دقت
- پردازش داده های حجیم گفتاری
علاوه بر آن فارس آوا دارای دو محصول جانبی برای مشتریان سازمانی میباشد که میتواند عملیات تبدیل متن به گفتار (TTS) و استخراج کلمات کلیدی (KWS) را انجام دهد. همان طور که در بالا هم به این مسئله اشاره کردیم، فارس آوا میتواند جایگزین بسیار مناسبی برای تایپ صوتی گوگل باشد. این سرویس میتواند نیازهای کاربران فارسی زبان را به خوبی رفع کند و عملکرد و کیفیت بالایی را بر روی زبان فارسی داشته باشد. فارس آوا برای یک کاربر فارسی زبان نه تنها مزایای سرویس گوگل را به همراه خواهد داشت، بلکه در بسیاری از زمینههای دیگر نیز او را بینیاز از سایر سرویسهای تبدیل گفتار به نوشتار میکند.
برای کسب اطلاعات بیشتر درباره فارس آوا و استفاده از آن وارد صفحه فارسآوا شوید؛ به نظر شما در زبان فارسی، سرویس تبدیل گفتار به نوشتار گوگل بهتر است یا فارسآوا؟ نظر خود را با ما به اشتراک بگذارید.
3 پاسخ
واقعا سایته خوبی هست از شما ممنونم. مچکررررررررررر
واقعا بدرد نخور فقط حرف (و)تشخیص میده
سلام
نسخه لایو و پنل فارس آوا مورد تست و بررسی قرار گرفت و بدون هیچ مشکل کار میکرد.
در صورتی هنوز هم مشکل دارید ممنون میشم که بگید با چه دستگاهی واد سایت شدید و از کدوم نسخه استفاده کردید؟