یک استارتاپ هوش مصنوعی نوعی آرتی (Artie)، پلتفرمی برای شناسایی تبعیض در سامانههای تشخیص گفتار، را منتشر کرد
استارتاپ آرتی (Artie) پلتفرمی منتشر کرده است که هرگونه نشانههای تبعیض را در سامانههای تشخیص گفتار اندازه میگیرد. استارتاپ (Artie Bais Corpus (ABC با استفاده از دستیار صوتی موزیلا و رونویسی 1712 فایل صوتی افراد مجزا این پلتفرم را تولید کرده است. با عامراندیش همراه باشید تا درباره این سامانه جالب بیشتر بدانید.
تبعیض در سامانههای تشخیص گفتار
استارتاپ هوش مصنوعی آرتی (Artie) امیدواراست که توسعهدهندگان نرمافزارها و پلتفرمهای تشخیص گفتار با استفاده از این پلتفرم هر گونه نشانههای تبعیض را در سامانههای خود شناسایی کنند؛ تا در نهایت سامانههایی کاملا عاری از هرگونه تبعیض، اعم از تبعیض نژادی، ملی، فرهنگی، مذهبی، قومیتی، سن، جنسیتی، لهجه و غیره از داشته باشیم.
کلیپها 2.4 ساعت از کل فایلهای صوتی را تشکیل میدهد که شامل فایل ضبظ شده افراد مختلفی است که به 17 لهجه مختلف انگلیسی تکلم میکنند. این افراد به 8 گروه سنی گوناگون بین 18 تا 80 سال با 3 دسته جنسیت مختلف طبقهبندی شدند. تمامی این اطلاعات جمعیتی به صورت انفرادی و با رضایت گوینده جمعآوری شده است.
استارتاپ آرتی امید بسیاری دارد تا تمامی شرکتها و استارتاپهایی که به نوعی در زمنیه پردازش گفتار فعالیت دارند، با استفاده از این پلتفرم، هرگونه نشانی از تبعیض نژادی، جنسیتی، قومی، مذهبی، لهجه و گویش و دیگر فاکتورها را در سامانههای خود به صفر کاهش دهند. برای مثال، در پژوهشهای اخیر مشخص شده است که تبعیض در سامانههای تشخیص گفتار پیشرو شرکتهایی مانند اپل، آمازون و گوگل درخور توجه است. برای مثال، آهنگ خطای سامانه برای صداهای سیاهپوستان 35% است درحالیکه این آهنگ خطا برای صدای سفیدپوستان تنها 19% است.
استارتاپ آرتی پلتفرم خود را برای موبایل، به عنوان اهرم نفوذ هوش مصنوعی، نیز بسط و توسعه داده است. این پلتفرم در نهایت و بدون در نظر گرفتن صنعت مربوطه، میتواند در هر سامانه تولیدی هوش مصنوعی برای ارزیابی میزان تبعیض نژادی موجود در آن سامانه مورد استفاده وسیع قرار بگیرد.
طبق گفتههای دانشمند برجسته آرتی و محقق موزیلا، جاش مایر (Josh Meyer)، بسیاری از قومیتها و ملتها به دلیل تبعیض در سامانههای تشخیص گفتار، استفاده از آنها را تحریم میکنند و این مسئله میتواند ضرر بزرگی را متوجه شرکتها و استارتاپهای تولید کننده، کند. وی خاطر نشان کرد که حتی برای زبانی به فراگیری انگلیسی، بهترین سامانههای تشخیص گفتار برای فهمیدن لهجه بومیها مشکل دارند و شوربختانه صدای مردان را بهتر از زنان تشخیص میدهند. پلتفرم جدید استارتاپ ارتی تمامی این مشکلات را برطرف ساخته است.
آرتی برای آزمایش پلتفرم خود مدلهای منبع باز موزیلا (DeepSpeech Model) را آنالیز کرد و متوجه شد که در این دستار صوتی موزیلا، لهجههای آمریکایی و بریتانیایی به دیگر لهجههای انگلیسی برتری دارند. این پلتفرم همچنین دریافت که وجود تبعیض جنسیتی در یک مدل همگانی گوگل نسبت به همتای خود در آمازون بسیار بیشتر است.
سخن آخر
پژوهشها حاکی از این است که تبعیض در چنین سامانههایی از مشکلات اساسی فراهم آورندگان آنها است، یا اینکه این تبعیضها از تبعیضهای نژادی در بسیاری از سامانههای تشخیص چهره کمتر است.