امروزه دیگر نیاز نیست برای تهیه یک فایل نوشتاری ساعتها پشت سیستم بنشینید و تایپ کنید. به کمک ابزارهای تبدیل گفتار به نوشتار میتوانید چه در محل کار، یا از راه دور و در حین ملاقات با یک مشتری، فایلهای نوشتاری ایجاد کنید و آنها را مستقیماً از دستگاه تلفن همراه خود ویرایش و قالببندی کنید و به اشتراک بگذارید. اما چالش اصلی آنجایی شروع میشود که به دنبال یک نرمافزار و یا سرویس مناسب برای تبدیل گفتار به نوشتار، مخصوصا تبدیل گفتار به نوشتار فارسی، میگردید. به این منظور باید تعدادی از محصولات موجود در بازار را امتحان کرده تا از عملکرد بهینه آنها مطمئن شوید. این کار ممکن است زمانبر باشد و حتی در نهایت نرم افزار واقعا کاربردی و دلخواهتان را پیدا نکنید.
در صورتی که به یک سرویس تبدیل گفتار به نوشتار نیاز دارید میتوانید تا پایان این مقاله با ما همراه باشید. برای تبدیل گفتار به نوشتار به صورت زنده نیز میتوانید از پنل زیر استفاده نمایید. (با زدن بر روی علامت میکروفن به ضبط گفتار بپردازید)
ما در این مقاله ضمن ارائه توضیح مختصری در مورد سرویسها و برنامههای تبدیل گفتار به نوشتار مختلف، چندین روش انجام تایپ صوتی را برایتان شرح میدهیم. در پایان نیز قصد داریم تا یک سرویس تبدیل گفتار به نوشتار که به صورت اختصاصی برای کاربران فارسی زبان تولید شده و میتواند نیازهای وی را به طور کامل برطرف نماید را به شما معرفی کنیم. پس تا پایان مقاله با ما همراه باشید.
سرویس تبدیل گفتار به نوشتار چیست؟
تبدیل گفتار به نوشتار یا تایپ صوتی، در حقیقت به معنی دیکته گفتن به کامپیوتر یا گوشی هوشمند است. این فناوری یکی از زیر شاخههای فناوری شناسایی گفتار یا همان Speech Recognition است که عملیات تبدیل گفتار به متن قابل ویرایش را انجام میدهد. گوشی هوشمند و یا کامپیوتر میتواند به وسیلهی یک نرم افزار تایپ صوتی، آنچه را که میشنود با دقت زیاد به نسخه متن آن گفتار تبدیل کند. به کمک این سرویسها دیگر لازم نیست زمانی طولانی را پشت میز کامپیوتر بنشینید و کلمات را یکی یکی تایپ کنید بلکه تنها با دیکته گفتن به کامپیوتر یا گوشی هوشمند خود میتوانید آنچه که نیاز دارید را تایپ کرده و در پایان نیز برای اطمینان از بینقص بودن متن خروجی آن را در زمانی کوتاه ویرایش کنید.
برنامهها، اپلیکیشنها و سرویسهای مختلفی برای تبدیل گفتار به نوشتار وجود دارند که دارای قابلیتها و پیچیدگیهای متفاوتی هستند. این محصولات معمولا علاوه بر پشتیبانی از دستگاهها و پلتفرمهای متنوع، از فایلهای صوتی دارای فرمتهای متفاوت نیز پشتیبانی میکنند. بعضی از آنها با هدف کم کردن تعداد خطاها و با استفاده از یادگیری ماشین پیشرفته، مرتباً خطاهایی را که توسط کاربرانشان مشخص شدهاست، اصلاح میکنند. همچنین بعضی از این محصولات امکان تبدیل گفتار به نوشتار به زبان فارسی و پشتیبانی از گویشها، اصطلاحات، لهجهها و هر آنچه که مخصوص زبان فارسی میباشد، را نیز دارند.
تبدیل گفتار به نوشتار در نرم افزار word چه امکاناتی را به کاربر میدهد؟
استفاده از نرم افزار تبدیل گفتار به نوشتار در word علاوه بر بینیاز کردن کاربر از تایپ با کیبورد، امکانات متنوع دیگری نیز به کاربر ارائه میدهد. مزیتهای این سرویسها به شرح زیر است:
- سرعت: قدرت تایپ کلمات یک فرد عادی بین ۳۸ تا ۴۰ کلمه در دقیقه و به طور متوسط 2400 کلمه در ساعت میباشد. اما با تایپ صوتی مبتنی بر هوش مصنوعی، این سرعت را میتوان تا چیزی حدود 25 برابر افزایش داد. یعنی در هر دقیقه به صورت میانگین 1000 کلمه.
- دسترس پذیری: امروزه تایپ صوتی بر روی پلتفرمهای متفاوت در دسترس است. در نتیجه میتوان در گوشیهای هوشمند، تبلت، لپ تاپ، سیستمهای کامپیوتر خانگی یا اداری و… از این نرم افزارهای برای تبدیل گفتار به نوشتار استفاده کرد.
- دقت بالا: یک تایپیست معمولی به صورت میانگین از هر ۱۰۰ کلمه ۸ کلمه را اشتباه تایپ میکند. در صورتی که با استفاده از نرم افزارهای تایپ صوتی و استفاده از الگوریتمهای هوش مصنوعی میزان خطا حداقل 3 برابر کاهش میبابد. ویدیو زیر میزان خطاهای تایپ صوتی توسط موتور هوشمند گوگل و نرم افزار مشابه ایرانی فارس آوا را را نشان میدهد برای تماشای ویدیو بر روی آن کلیک کنید.
- تمرکز بالا: استفاده از نرم افزارهای تایپ صوتی، به شما کمک میکند تا بر روی مسئلهای که در مورد آن صحبت میکنید متمرکزتر شوید و راحتتر آن چه در ذهنتان میگذرد را به نوشتار تبدیل کنید.
- نزدیکی بیان و نوشته : استفاده از فناوری تبدیل گفتار به نوشتار به دلیل افزایش تمرکز و دقتی که در کار ایجاد میکند، باعث میشود که متن نهایی بسیار نزدیک به آنچه که در ذهنتان بود و قصد بیانش را داشتید باشد. زیرا به کمک تایپ صوتی، شما تمام ذهن خود را بر بیان آنچه در افکارتان میگذرد متمرکز میکنید.
- پویایی و بدنی سالم: نشستنهای طولانی مدت پشت کامپیوتر در هنگام تایپ بیماریهایی نظیر کمردرد، خشکی چشم و… را به همراه دارد. با استفاده از فناوری تبدیل گفتار به نوشتار دیگر لازم نیست زمان زیادی را پشت کامپیوتر صرف کنید، بلکه تنها کافی است آنچه در افکارتان میگذرد را بیان کنید تا نرم افزار آن را برای شما تایپ کند.
چگونه از تبدیل گفتار به نوشتار در word استفاده کنیم؟
نرم افزار Microsoft Word یکی از ابزارهای بسیار پرکاربرد است که اکثریت افرادی که به نوشتن میپردازند از آن استفاده میکنند. این نرم افزار خوشبختانه از تبدیل گفتار به متن پشتیبانی میکند و این قابلیت به شما امکان آن را میدهد که متن دلخواهتان را بدون استفاده از کیبورد تایپ کنید. بدین ترتیب افراد میتوانند به صورت مستقیم محتوای صوتی یا صحبتهای خود را به یک متن قابل ویرایش تبدیل کنند. همچنین ممکن است این کار را در یک نرم افزار تبدیل گفتار به نوشتار مستقل انجام دهند و در نهایت متن گفتار را به صورت یک خروجی قایل ویرایش و حتی در فرمت Word تحویل بگیرند.
برای تبدیل گفتار به نوشتار در قالب یک فایل خروجی Word ، سه راه حل عمده وجود دارد:
- تبدیل گفتار به نوشتار در word با استفاده از Voice Dictation
- تبدیل گفتار به نوشتار با استفاده از سرویسهای قابل ادغام با نرم افزار word
- تبدیل گفتار به نوشتار در یک محیط تایپ صوتی جداگانه
- تبدیل گفتار به نوشتار در Word با استفاده از Dictation
در این روش بدون نیاز به نصب نرم افزار اضافی میتوان در داخل محیط Word گفتار را به نوشتار تبدیل کرد. اولین مرحله برای انجام تایپ صوتی در تمام روش ها، این است که مطمئن شوید میکروفن شما نصب بوده و کار می کند. سپس مراحل زیر را انجام دهید:
- در Microsoft Word از طریق سر برگ Home که در بالای صفحه قرار دارد، بر روی Dictate کلیک کنید. ممکن است بار اول از شما خواسته شود تا میکروفون سیستم خود را فعال کنید.
- یک نماد میکروفون ظاهر میشود. اندکی منتظر شوید تا روشن شود و با شنیدن صدای بیپ مطمئن شوید که سیستم شروع به گوش دادن کرده است.
- شروع به صحبت کنید. علائم نگارشی را با صراحت بیان کنید.
- هنگامی که صحبتهایتان تمام شد، با زدن Close(X) در سربرگ Home میکروفون را خاموش کنید.
از طریق ویدئو زیر میتوانید نحوه کار با Voice Dictation را ببینید.
بدون نیاز به خاموش کردن میکروفون میتوانید اشتباهات خود را از طریق صفحه کلید یا از طریق پیشنهادهای دیکشنری مایکروسافت تصحیح کنید. این قابلیت جدید، از تعدادی از دستورات صوتی مانند دستورات پاک کردن و ویرایش کردن متن تایپشده پشتیبانی میکند. اما با همه این تفاسیر متاسفانه Dictate از زبان فارسی پشتیبانی نمیکند.
- سرویسهای قابل ادغام با نرم افزار word
معروفترین این سرویسها، سرویس تبدیل گفتار به نوشتار شرکت گوگل است که قابلیت ادغام با نرم افزار Microsoft Word را دارد. سرویس تبدیل گفتار به نوشتار شرکت گوگل به کاربر این امکان را میدهد تا به تایپ صوتی بپردازند. برای انجام تایپ صوتی، پس از اطمینان از روشن بودن میکروفن خود مراحل زیر را طی کنید:
- برای شروع مرورگر Chrome خود را باز کرده و به صفحه Google Drive و سپس به Google Docs بروید. میتوانید با تایپ کردن عبارت “new” در نوار آدرس مرورگر کروم خود به طورمستقیم یک فایل جدید Google Docs به وجود آورید.
- سپس برای فعال سازی تایپ صوتی، به منوی Tools بروید و روی گزینه Voice Typing کلیک کنید. با فشردن کلید میانبر ” Ctrl+Shift+S ” در ویندوز میتوانید تایپ صوتی را فعال کنید.
- پنجرهای کوچک دارای آیکون میکروفن بر روی صفحه ظاهر میشود. برای شروع روی آن کلیک کنید.
- اگر به طور خودکار زبان شما را متوجه نشد، روی سه نقطه بالای پنجره آیکون میکروفون کلیک کنید و سپس از بین زبانهای موجود، زبان مورد نظر خود را انتخاب کنید.
- زمانی که صحبت شما تمام شد روی آیکون میکروفن کلیک کنید.
این سرویس قابلیت پشتیبانی از مجموعهای از دستورات صوتی برای نگارش متن و استفاده از علائم نگارشی را دارد. هنگام استفاده از این سرویس، واضح و با سرعت طبیعی صحبت کنید. اگر این سرویس در فهم کلمات ادا شده توسط شما مشکل داشت، مطمئن شوید زبان صحیح را از منو انتخاب کردهاید. این سرویس از زبان فارسی پشتیبانی میکند اما قابلیت پشتیبانی از گویشهای مختلف زبان فارسی را ندارد.
- تبدیل گفتار به نوشتار در یک محیط تایپ صوتی جداگانه
این دسته از نرم افزارها، تایپ صوتی را در پلتفرم خودشان انجام میدهند و کاربر در نهایت میتواند یک فایل خروجی Word از آنها بگیرد. مدلهای مختلفی از این نرم افزارها در بازار یافت میشوند. مزیت این نرم افزارها این است که میتوانند خروجیهایی با فرمتهای مختلف به کاربر ارائه بدهند. برعکس دسته قبل که تنها میتوانستند آنچه را که به صورت زنده میشنود تایپ کنند، میتوان فایلهای صوتی از قبل ضبط شده را با فرمتهای مختلف به این نرم افزارها داد و خروجیهایی با فرمتهای متنوع از آنها گرفت.
یکی از نمونههای این نرم افزارها، پلتفرم تحت وب فارسآوا است. برای انجام تایپ صوتی توسط فارسآوا مراحل زیر را انجام دهید:
- ابتدا به صفحه فارسآوا وارد شوید و روی ورود به پنل کلیک کنید.
- سپس ثبت نام کنید و وارد پنل خود شوید.
- پس از ثبت نام 30 دقیقه اعتبار رایگان برای آپلود فایل دارید. از منوی کرکرهای سمت راست، آپلود فایل تکی یا آپلود فایل گروهی را انتخاب کنید.
- در این قسمت میتوانید فایل صوتی را آپلود و سپس متن را به صورت word دریافت کنید.
- در صورتی که میخواهید به صورت همزمان صوت را به متن تبدیل کنید، مجددا از منوی کرکرهای سمت راست، گزینه “تبدیل در لحظه” را انتخاب کنید.
- برای شروع تایپ، روی میکروفون بالا در سمت راست کلیک کنید تا فرآیند شنیدن صدای شما و تشخیص گفتار و تبدیل آن به متن نوشتاری، آغاز شود. اگر بار اول است که از این پلتفرم استفاده میکنید، مرورگر شما برای روشن کردن میکروفون از شما اجازه خواهد گرفت.
این پلتفرم به صورت کامل از زبان فارسی پشتیبانی میکند و قابلیت درک تمامی لهجههای فارسی، کلمات رسمی و محاورهای و… را دارد. در ادامه این مقاله سرویس تبدیل گفتار به نوشتار فارسآوا را به صورت کامل معرفی خواهیم کرد.
در ویدئو زیر نحوه استفاده از پنل فارس آوا برای تبدیل گفتار به نوشتار و تهیه خروجیهای مختلف، نشان داده شده است.
سرویس تبدیل گفتار به نوشتار فارسآوا
محصول فارس آوا، تبدیل گفتار به نوشتار را به صورت تخصصی و به زبان فارسی انجام میدهد. این محصول قادر است ارتباط کلامی بین شما و کامپیوتر یا موبایلتان فراهم کند. محصول فارس آوا با تکیه بر دانش متخصصان هوش مصنوعی ایرانی و با بهرهگیری از آخرین تکنولوژیهای روز دنیا تولید شدهاست. فارس آوا به دلیل جمع آوری بزرگترین دیتاسِت موجود در زبان فارسی و تمرکز ویژه بر روی این زبان، ضمن بهرهمندی از تنوع گفتاری بسیار وسیع و ضریب دقت بالا در زمینه تبدیل گفتار به نوشتار فارسی، موفق به رقابت با شرکتهای بزرگی چون گوگل شدهاست.
فارس آوا با استفاده از هوش مصنوعی ابزاری هوشمند برای رونویسی و تایپ گفتار ارائه دهد. این سرویس از ترکیبی از مدلهای گفتاری، شبکههای عصبی و الگوریتمهایی برای کاهش نویز پس زمینه، برای افزایش تمرکز روی اصطلاحات و لغات تخصصی مشاغل مختلف و همچنین تمایز بین گویندهها بدون در نظر گرفتن لهجه و همچنین تشخیص لحن گفتار زبان فارسی، استفاده میکند.
مزیتهای نرمافزار گفتار به نوشتار فارسآوا:
- تشخیص لهجه و گویش: زبان فارسی سرشار از گویشها و لهجههای مختلف است و یک نرم افزار برای اینکه بتواند به خوبی با زبان فارسی کار کند، باید بتواند تمام این گویشها و لهجهها را تشخیص دهد. محصول فارس آوا میتواند گویشها و لهجههای مختلف را در زبان فارسی تشخیص دهد و آنها را تبدیل به متن نماید. از آنجایی که این محصول بر روی زبان فارسی متمرکز شده است تمام این لهجهها به آن آموزش داده شده و کسانی که میخواهند از این محصول استفاده کنند دیگر لازم نیست نگران تشخیص گفتار در گویش و لهجههای متفاوت باشند.
- تشخیص گفتار رسمی و محاورهای: همانند تشخیص لهجه و گویشهای مختلف در زبان فارسی، محصول فارسآوا میتواند گفتار رسمی در زبان فارسی را از گفتار محاورهای تشخیص دهد. از آنجا که در زبان فارسی فاصله زیادی بین گفتار محاوره و گفتار رسمی وجود دارد، سرویس تبدیل گفتار به متن کاربردی باید بتواند این دو را از یکدیگر تمیز دهد.
- سفارشی سازی تبدیل گفتار به نوشتار: برخی از کسبوکارها مانند حقوق و وکالت، دارای اصطلاحات تخصصی در زبان فارسی هستند که این کلمات تخصصی به سرویس تایپ صوتی فارسآوا آموزش داده شدهاند. در نتیجه فارس آوا میتواند برای کسبوکارهای مختلف سفارشی سازی شود.
- قابلیت پردازش فایلهای صوتی از پیش ضبط شده: یکی از مزیتهای محصول فارسآوا، قابلیت پردازش فایلهای صوتی از پیش ضبط شده است. شما میتوانید فایلهای صوتی با فرمتهای مختلف را به محصول فارسآوا بدهید و متن این فایلها را به عنوان خروجی دریافت نمایید.
- قابلیت تبدیل گفتار به نوشتار به صورت آفلاین: محصول فارسآوا برای مشتریان سازمانی به صورت نصب بر روی سرور مشتری و استفاده آفلاین از آن قابل دسترسی است. در نتیجه کاربران آن سازمان میتوانند بدون نیاز به اینترنت و به صورت آفلاین گفتار خود را به نوشتار تبدیل کنند.
- تبدیل گفتار به متن فارسی با دقت و سرعت بالا:
- بهرهمندی از آخرین تکنولوژیهای یادگیری عمیق
- تبدیل گفتار به متن به صورت همزمان (Real-Time)
- تشخیص گفتار و صوت در محیطهای دارای نویز
- عدم وابستگی به گوینده و عدم نیاز به آموزش نرمافزار برای هر فرد جدید
- توسعه و تولید کاملاً بومی و داخلی
- ارائه API و SDK تبدیل گفتار به متن در قالب وبسرویس
- ارائه پنل تحت وب برای بارگزاری فایلها جهت پردازش
- قابل نصب روی سرور مشتری
- بهرهمندی از دایره واژگان (فرهنگ لغت) بسیار وسیع
کاربردهای نرم افزار گفتار به نوشتار فارسآوا:
- امکان استفاده در انواع سیستم عاملهای ویندوز، لینوکس و Mac
- امکان استفاده در تمامی پلتفرمهای تلفنهای هوشمند (اندروید وiOS)
- قابل استفاده در برنامههایی از قبیل دستیارهای شخصی هوشمند در موبایل
- امکان استفادههای عمومی از قبیل: تایپ گفتاری و اجرای دستورات صوتی
- امکان سفارشیسازی برای تشخیص دستورات خاص صوتی
- امکان سفارشیسازی برای کاربردهای خاص و افزایش دقت
- پردازش دادههای حجیم گفتاری
فارسآوا همچنین دارای دو محصول جانبی به نامهای: تبدیل متن به گفتار (TTS) و استخراج کلمات کلیدی (KWS) میباشد.
محصول تبدیل متن به گفتار (Text-to-Speech)
این سرویس قادر است تا متنهای دادهشده را دریافت کند و سپس آن را به به گفتار صوتی تبدیل نماید. در جدیدترین نسخه این محصول، نوع گفتار پخششده بسیار نزدیک به گفتار یک انسان واقعی میباشد.
محصول استخراج کلمات کلیدی (Keyword spotting)
محصول استخراج کلمات کلیدی قادر است تا فایلهای صوتی را با دقت بیشتری (۲۰%) نسبت به تبدیل گفتار به متن، فهمیده و کلمات کلیدی یک فایل را تشخیص داده و آنها را استخراج کند. با این سرویس میتوان بدون گوشکردن کامل فایل صوتی متوجه شد که یک کلمه خاص مثل نام یک محصول در آن استفاده شده است یا خیر. سرویس KWS قادر است تا حتی زمان استفاده از آن کلید واژه را به تفکیک مشخص نماید.
برای آشنایی بیشتر با محصول فارس آوا میتوانید به پنل محصول فارس آوا مراجعه کنید و با ثبت نام در این پنل از هدیه 30 دقیقه تبدیل گفتار به نوشتار بدون تاریخ انقضا، بهرهمند شوید.
7 پاسخ
به نا م خدا
باتشکر از توضیحات خوبتان .دعاگوی .جود شریفتان هستم.متشکر
سلام علیکم
درود بر شما با سایت کاربردی تان
کار مرا راحت کردید به راحتی فیلم های آموزشی به متن تبدیل شدند
تشکر
سلام.نیاز به تایپ صوتی دارم راهنمایی میکنید.تشکر. شماره بنده *******0919
سلام آقای شیری
اطلاعات شما برای تیم پشتیبانی ارسال شد به زودی با شما تماس میگیرند.
با سلام.
دو سوال داشتم. آیا بصورت آفلاین هم تبدیل صوت به متن فارسی را انجام میدهد؟
و درصورت مثبت بودن جواب، هزینه نرم افزار را لطفا بفرمایید.
با تشکر
سلام، قابلیت استفاده آفلاین از نرم افزار فارسآوا تنها برای شرکتها و سازمانها وجود دارد و برای دریافت قیمت با شماره 22556400-021 تماس بگیرید.
سلام و درود