فایل منبع باز AI و تشخیص گفتار فیسبوک: با نام RAG، یک نوآوری جدید در پردازش مدلهای زبان طبیعی (NLP) و تشخیص گفتار
فیسبوک با همکاری Hugging Face، یک الگوریتم منبع باز تشخیص گفتار و مدل پردازش زبان طبیعی (NLP) با نام (Retrieval Augmented Generation_RAG) تولید کرد. RAG به مدلهای تشخیص گفتار و NLP اجازه میدهد تا مرحله آموزش خود را مجددا را پشت سر گذاشته و اطلاعات خود را بهروزرسانی نماید. سپس، با استفاده از آنها و یک مولد پیشرفته seq2seq برای تولید نتایج استفاده کنند. RAG یک مدل NLP و تشخیص گفتاری است که در مقایسه با مدلهای معمول NLP و تشخیص گفتار با کاربردهای عادیتر، پیشرفتهتر، زمینهسازتر است. نوآوری برای آموزش کامپیوترها برای درک نحوه نوشتن و صحبت کردن مانند یک انسان ضروری است.
همه چیز درباره فایل منبع باز AI و تشخیص گفتار فیسبوک با نام مدل RAG
sRAG به محققان و مهندسان این امکان را میدهد تا تنها با پنج خط کد، سریعا راه حلهایی برای وظایف پرمشغله خود تهیه و استقرار دهند. RAG به عنوان بخشی از کتابخانه ترانسفورماتور Hugging Face در دسترس قرار گرفته است. با مجموعه جدید مجموعه دادهها، منبع دانش نمایه شده RAG را فراهم میکند. این از دادههای ورودی برای بازیابی مجموعهای از اسناد مربوطه از یک پایگاه داده مانند ویکی پدیا استفاده میکند.
RAG از نوعی “همجوشی دیرهنگام” برای ادغام دانش از اسناد بازیابی شده استفاده میکند. به عنوان مثال، پیش از انتشار نمرات نهایی پاسخهایی نهایی سندهای پرسش محور را پیشبینی میکند. عملکرد RAG، وقتی به اسنادی که حاوی سرنخها و راهحلهاست، بیشتر بهبود مییابد.
همچنین در ایجاد پرسشهای با الهام از Jeopardy در پرسشهای زبان طبیعی متمرکز بر دانش، که توسط فیسبوک کاوش می شود، بسیار عالی است. با توجه به توانایی RAG در ترکیب پاسخها با استفاده از اطلاعات متفاوت از منابع گوناگون، پرسشهای Jeopardy تولید شده، متنوعتر و واقعیتر از مدلهای قابلمقایسهای در دسترس است. فایل منبع باز AI و تشخیص گفتار فیسبوک یک فایل و مدل چندحالته است و با استفاده از چندین منبع دانش به طور همزمان کار کند