Систему распознавания марийской речи создали в Марий Эл, сейчас она проходит апробацию. Об этом рассказали на заседании правительственной комиссии по государственным языкам Марий Эл.
Система нужна для перевода речи в текст, а также создания голосовых помощников. Для этого был сформирован аудиокорпус с образцами марийской речи. В него вошли озвученные произведения как написанные на марийском языке, так и переведенные на него.
На сайте corp.marnii.ru размещен национальный корпус марийского языка, который включает в себя более 20 миллионов словоупотреблений. На базе языкового корпуса создаются монографические исследования, изданы «Словарь сравнений марийского языка» и «Словарь эпитетов марийского языка», начато составление «Словаря антонимов марийского языка». Набирает ход работа по созданию горномарийского подкорпуса Национального корпуса марийского языка.
В работе по цифровизации марийского языка принимают участие научные сотрудники, сотрудники Республиканского центра марийской культуры, студенты-практиканты МарГУ и ПГТУ, а также добровольцы-волонтёры.