В Telegram появился чат-бот, понимающий марийский язык. Программу разработали марийский лингвист Андрей Чемышев и его сподвижники.
Бот предназначен для преобразования марийской речи в текст. Для этого ему необходимо записать голосовое сообщение на микрофон или скинуть аудиофайл.
В дальнейшем авторы идеи планируют собрать аудиокорпус с образцами речи на марийском языке, чтобы создать отдельную программу для распознавания речи. Сейчас собраны 257 часов записи, тексты на марийском языке читали 424 волонтера. Из них проверен 71%. Чемышев отметил, что до конца года намерен собрать минимум 300 часов записи.
Чат-бот есть в открытом доступе, им можно воспользоваться бесплатно.