Meta сoздaлa языкoвую мoдeль искусствeннoгo интeллeктa, нe являющуюся клoнoм ChatGPT. Oб этoм сooбщaeт Engadget.
Прoeкт кoмпaнии Massively Multilingual Speech (MMS) мoжeт рaспoзнaвaть бoлee 4000 рaзгoвoрныx mp3city.com.ua
языкoв и вoспрoизвoдить вeщaниe нa бoлee нежели 1100 языках. Как и относительная других своих публично объявленных проектов в области искусственного интеллекта, пока Meta предоставляет открытый приступ к MMS, чтобы помочь сохранить диверсификация языка и поощрить исследователей совершенствовать его на этой основе.
Модели распознавания речи и преобразования текста в речи привычно требуют обучения на тысячах часов аудиозаписей с сопроводительными транскрипционными метками. (Метки имеют решающее толкование для машинного обучения, позволяя алгоритмам как положено классифицировать и «понимать» данные.) Хотя для языков, которые неважный (=маловажный) широко используются в индустриально развитых странах – многие с которых находятся под угрозой исчезновения в ближайшие десятилетия, – «сих данных просто не существует», отмечают в Meta.
Meta применила самобытный подход к сбору аудиоданных: аускультация аудиозаписей переведенных религиозных текстов. «А и содержание аудиозаписей является религиозным, выше- анализ показывает, что сие не влияет на в таком случае, что модель производит побольше религиозного языка, – пишет Meta. – Я считаем, что это благодаря тому что, что мы используем подъезд коннекционистской временной классификации (CTC), что является гораздо более ограниченным по мнению сравнению с большими языковыми моделями (LLM) alias моделями последовательности для распознавания речи».
Задним числом обучения модели выравнивания, так чтобы сделать данные более пригодными в целях использования, Меtа использовала wav2vec 2.0, пример «самоконтролируемого обучения речевого представления», которая может штудировать на немаркированных данных. Meta сравнила MMS с Whisper с OpenAI, и результаты превзошли ожидания: «Да мы с тобой обнаружили, что модели, обученные данным Massively Multilingual Speech, имеют вдвойне меньший процент ошибок в словах, так Massively Multilingual Speech включает в 11 раз больше языков».
Meta предупреждает, подобно как ее новые модели никак не идеальны. «Например, существует измеренн риск того, что прототип превращения языка в текст может сикось-накость перевести отдельные слова либо фразы», – пишет шатия.
Читайте также
ЕС оштрафовал Meta в $1,3 миллиарда из-из-за передачи данных Facebook средь ЕС и США