خانه » تبعیض در سامانه‌های تشخیص گفتار ، آیا مشکلی قابل حل است؟

تبعیض در سامانه‌های تشخیص گفتار ، آیا مشکلی قابل حل است؟

یک استارت‌اپ هوش مصنوعی نوعی آرتی (Artie)، پلتفرمی برای شناسایی تبعیض در سامانه‌های تشخیص گفتار، را منتشر کرد

استارت‌اپ آرتی (Artie) پلتفرمی منتشر کرده است که هرگونه نشانه‌های تبعیض را در سامانه‌های تشخیص گفتار اندازه می‌گیرد. استارت‌اپ (Artie Bais Corpus (ABC با استفاده از دستیار صوتی موزیلا و رونویسی 1712 فایل صوتی افراد مجزا این پلتفرم را تولید کرده است. با عامراندیش همراه باشید تا درباره این سامانه جالب بیشتر بدانید.

تبعیض در سامانه‌های تشخیص گفتار

استارت‌اپ هوش مصنوعی آرتی (Artie) امیدواراست که توسعه‌دهندگان نرم‌افزارها و پلتفرم‌های تشخیص گفتار با استفاده از این پلتفرم هر گونه نشانه‌های تبعیض را در سامانه‌های خود شناسایی کنند؛ تا در نهایت سامانه‌هایی کاملا عاری از هرگونه تبعیض، اعم از تبعیض نژادی، ملی، فرهنگی، مذهبی، قومیتی، سن، جنسیتی، لهجه و غیره از داشته باشیم.

کلیپ‌ها 2.4 ساعت از کل فایل‌های صوتی را تشکیل می‌دهد که شامل فایل ضبظ شده افراد مختلفی است که به 17 لهجه مختلف انگلیسی تکلم می‌کنند. این افراد به 8 گروه سنی گوناگون بین 18 تا 80 سال با 3 دسته جنسیت مختلف طبقه‌بندی شدند. تمامی این اطلاعات جمعیتی به صورت انفرادی و با رضایت گوینده جمع‌آوری شده است.

استارت‌اپ آرتی امید بسیاری دارد تا تمامی شرکت‌ها و استارت‌اپ‌هایی که به نوعی در زمنیه پردازش گفتار فعالیت دارند، با استفاده از این پلتفرم، هرگونه نشانی از تبعیض نژادی، جنسیتی، قومی، مذهبی، لهجه و گویش و دیگر فاکتورها را در سامانه‌های خود به صفر کاهش دهند. برای مثال، در پژوهش‌های اخیر مشخص شده است که تبعیض در سامانه‌های تشخیص گفتار پیشرو شرکت‌هایی مانند اپل، آمازون و گوگل درخور توجه است. برای مثال، آهنگ خطای سامانه برای صداهای سیاه‌پوستان 35% است درحالیکه این آهنگ خطا برای صدای سفیدپوستان تنها 19% است.

استارت‌اپ آرتی پلتفرم خود را برای موبایل، به عنوان اهرم نفوذ هوش مصنوعی، نیز بسط و توسعه داده است. این پلتفرم در نهایت و بدون در نظر گرفتن صنعت مربوطه، می‌تواند در هر سامانه تولیدی هوش مصنوعی برای ارزیابی میزان تبعیض نژادی موجود در آن سامانه مورد استفاده وسیع قرار بگیرد.

طبق گفته‌های دانشمند برجسته آرتی و محقق موزیلا، جاش مایر (Josh Meyer)، بسیاری از قومیت‌ها و ملت‌ها به دلیل تبعیض در سامانه‌های تشخیص گفتار، استفاده از آن‌ها را تحریم می‌کنند و این مسئله می‌تواند ضرر بزرگی را متوجه شرکت‌ها و استارت‌‌اپ‌های تولید کننده، کند. وی خاطر نشان کرد که حتی برای زبانی به فراگیری انگلیسی، بهترین سامانه‌های تشخیص گفتار برای فهمیدن لهجه بومی‌ها مشکل دارند و شوربختانه صدای مردان را بهتر از زنان تشخیص می‌دهند. پلتفرم جدید استارت‌اپ ارتی تمامی این مشکلات را برطرف ساخته است.

آرتی برای آزمایش پلتفرم خود مدل‌های منبع باز موزیلا (DeepSpeech Model) را آنالیز کرد و متوجه شد که در این دستار صوتی موزیلا، لهجه‌های آمریکایی و بریتانیایی به دیگر لهجه‌های انگلیسی برتری دارند. این پلتفرم همچنین دریافت که وجود تبعیض جنسیتی در یک مدل همگانی گوگل نسبت به همتای خود در آمازون بسیار بیشتر است.

سخن آخر

پژوهش‌ها حاکی از این است که تبعیض در چنین سامانه‌هایی از مشکلات اساسی فراهم آورندگان آن‌ها است، یا اینکه این تبعیض‌ها از تبعیض‌های نژادی در بسیاری از سامانه‌های تشخیص چهره کمتر است.