Искусственный интеллект Meta сможет распознавать несколько тысяч языков

Meta сoздaлa языкoвую мoдeль искусствeннoгo интeллeктa, нe являющуюся клoнoм ChatGPT. Oб этoм сooбщaeт Engadget.

Прoeкт кoмпaнии Massively Multilingual Speech (MMS) мoжeт рaспoзнaвaть бoлee 4000 рaзгoвoрныx mp3city.com.ua
языкoв и вoспрoизвoдить вeщaниe нa бoлee нежели 1100 языках. Как и относительная других своих публично объявленных проектов в области искусственного интеллекта, пока Meta предоставляет открытый приступ к MMS, чтобы помочь сохранить диверсификация языка и поощрить исследователей совершенствовать его на этой основе.

Модели распознавания речи и преобразования текста в речи привычно требуют обучения на тысячах часов аудиозаписей с сопроводительными транскрипционными метками. (Метки имеют решающее толкование для машинного обучения, позволяя алгоритмам как положено классифицировать и «понимать» данные.) Хотя для языков, которые неважный (=маловажный) широко используются в индустриально развитых странах – многие с которых находятся под угрозой исчезновения в ближайшие десятилетия, – «сих данных просто не существует», отмечают в Meta.

Meta   применила самобытный подход к сбору аудиоданных: аускультация аудиозаписей переведенных религиозных текстов. «А и содержание аудиозаписей является религиозным, выше- анализ показывает, что сие не влияет на в таком случае, что модель производит побольше религиозного языка, – пишет Meta. –   Я считаем, что это благодаря тому что, что мы используем подъезд коннекционистской временной классификации (CTC), что является гораздо более ограниченным по мнению сравнению с большими языковыми моделями (LLM) alias моделями последовательности для распознавания речи».

Задним числом обучения модели выравнивания, так чтобы сделать данные более пригодными в целях использования, Меtа использовала wav2vec 2.0, пример «самоконтролируемого обучения речевого представления», которая может штудировать на немаркированных данных. Meta сравнила MMS с Whisper с OpenAI, и результаты превзошли ожидания: «Да мы с тобой обнаружили, что модели, обученные данным Massively Multilingual Speech, имеют вдвойне меньший процент ошибок в словах, так Massively Multilingual Speech включает в 11 раз больше языков».

Meta предупреждает, подобно как ее новые модели никак не идеальны. «Например, существует измеренн риск того, что прототип превращения языка в текст может сикось-накость перевести отдельные слова либо фразы», – пишет шатия.

Читайте также
ЕС оштрафовал Meta в $1,3 миллиарда из-из-за передачи данных Facebook средь ЕС и США

Комментирование и размещение ссылок запрещено.

Комментарии закрыты.