Проекты

Преобразование казахского текста в речь

Инструкция по демонстрации синтеза казахской речи:

– Вставьте казахский текст в поле ниже (Используйте только Кириллицу и знаки препинания, числа и другие специальные символы должны быть написаны в текстовой форме. Для лучшего результата, разделите длинный текст на более короткие сегменты)
– Затем нажмите кнопку “GET AUDIO”
– Страница перезагрузится, и вы найдете аудио вашего текста под полем. Затем нажмите кнопку “Play” чтобы прослушать звук.

В целях развития научных исследований и инноваций, а также продвижения использования казахского языка в цифровой сфере, Институт умных систем и искусственного интеллекта Назарбаев Университета разработал проект синтеза речи на казахском языке. Преобразование текста в речь – это искусственное производство человеческой речи. Оно позволяет преобразовать письменный текст в речевой сигнал.  Такая технология – это важный компонент многих приложений, таких как интерактивные виртуальные ассистенты, навигационные системы, системы оповещения, вспомогательные технологии для слабовидящих где требуется озвучивание компьютером казахского текста. Она обеспечивает взаимодействие человека с технологией, не требуя визуального и тактильного интерфейса.

Для построения системы синтеза казахской речи мы разработали и использовали базу данных KazakhTTS. KazakhTTS – это высококачественная речевая база данных с открытым доступом, которая содержит более 90 часов аудио, записанных двумя профессиональными дикторами (мужчина и женщина). База данных общедоступна как для академического, так и для коммерческого использования по запросу в соответствии с международной лицензией Creative Commons Attribution 4.0.

Если вы используете базу данных ISSAI KazakhTTS в коммерческих целях, пожалуйста, добавьте это предложение к своему продукту или услуге:

В нашем продукте используется ISSAI KazakhTTS (https://doi.org/10.48342/bkzq-tp58), доступный по международной лицензии Creative Commons Attribution 4.0.

Если вы используете базу данных ISSAI  KazakhTTS для исследования, пожалуйста, процитируйте ее как:

Mussakhojayeva, S., Janaliyeva, A., Mirzakhmetov, A., Khassanov, Y. and Varol, H.A., 2021. KazakhTTS: An Open-Source Kazakh Text-to-Speech Synthesis Dataset. arXiv preprint arXiv:2104.08459

Видео-ролик об истории Коркыт ата, озвученный мужским синтетическим голосом по имени Исеке
Видео-ролик об истории Дины Нұрпеисовой, озвученный женским синтетическим голосом по имени Райя