«Яндекс» представил новую нейросеть для генерации русскоязычных текстов




10:09 27.06.2022 |   6081



Это самая продвинутая подобная модель, опубликованная в свободном доступе, утверждают в компании.

Компания «Яндекс» выложила в открытый доступ YaLM 100B — нейросеть для генерации и обработки текстов на русском и английском языках. 

YaLM 100В содержит 100 млрд параметров, больше, чем какая-либо из существующих моделей для русского языка, что позволяет использовать ее для решения большого круга задач, связанных с обработкой естественного языка, утверждают в компании. В частности, ее  можно использовать для создания рекламы, описания товаров, генерировать любые тексты, даже стихи, классифицировать тексты, например по стилю.

Модель обучали на суперкомпьютерах «Яндекса», признанных самыми мощными в Восточной Европе. В процессе обучения YaLM 100B обработала около 2 Тбайт текстов на английском и русском языках. Модель предоставляется по открытой лицензии Apache 2.0 и выложена на GitHub.

Летом 2021 года «Яндекс» представил нейросетевой алгоритм генерации текстов YaLM. На его базе работал сервис «Балабола», в котором пользователи могли пообщаться с нейросетью. Однако затем доступ к нему был закрыт.

Самой мощной языковой моделью в мире сейчас считается GPT-3 компании OpenAI, основанная на 175 млрд параметров. Она способна генерировать текст высокого уровня сложности. Осенью 2020 года в The Guardian опубликовали заметку, написанную при помощи GPT-3. 

Свою нейросеть для генерации русскоязычных текстов представлял и «Сбер»; ее бета-версия находится в открытом доступе. Она построена на 760 млн параметров.


Теги: Яндекс Нейронные сети Искусственный интеллект Машинное обучение Обработка естественного языка
На ту же тему: