1 февраля команда Института умных систем и искусственного интеллекта (ISSAI) презентовала гостям цифрового форума Digital Almaty 2024 приложение ISSAI Dauys, которое позволяет преобразовывать тексты на казахском языке в речь в один клик.
ISSAI Dauys App создан на основе крупномасштабного набора данных Kazakh TTS2. Набор данных состоит из 271 часа высококачественного транскрибированного аудио пяти профессиональных спикеров. На данный момент приложение доступно для скачивания для Android пользователей в Google Play. В скором времени ожидается запуск iOS версии.
Чтобы конвертировать текст в аудио формат, необходимо в панель ввода добавить текст, выбрать понравившийся голос и получить мгновенный результат. Офлайн доступ, отсутствие рекламы, бесплатное пользование и качественные голоса – то, что делает приложение уникальным в своем сегменте.
Разработчиками приложения выступили студенты Назарбаев университета, выпускники летней научно-исследовательской программы Summer Research Program 2023: Олжас Мукаев, Руслан Тасмуханов, Нурали Рахай, Еламан Фазыл, Алишер Кунболсын.