Проекты

Корпус Казахского Языка

Корпус казахской речи содержит около 335 часов аудиозаписей, включающей более 154 000 предложений, произнесенных участниками из разных регионов РК, возрастных групп и пола. Корпус был тщательно проверен носителями казахского языка в целях обеспечения высокого качества. Корпус казахской речи – это крупнейшая общедоступная база данных, разработанная для продвижения различных приложений обработки казахской речи и языка, таких как распознавание речи и синтез речи. База данных Корпуса казахской речи доступна для публичного и коммерческого использования по запросу в соответствии с международной лицензией Creative Commons Attribution 4.0.

Если вы используете базу данных ISSAI Kazakh speech corpus в коммерческих целях, пожалуйста, добавьте это предложение к своему продукту или услуге:

В нашем продукте используется ISSAI Kazakh speech corpus (https://doi.org/10.48342/nyyn-y551), доступный по международной лицензии Creative Commons Attribution 4.0.

Если вы используете базу данных ISSAI Kazakh speech corpus для исследования, пожалуйста, процитируйте ее как:

Khassanov, Y., Mussakhojayeva, S., Mirzakhmetov, A., Adiyev, A., Nurpeiissov,M., Varol, H.A.: A crowdsourced open-source Kazakh speech corpus and initial speech recognition baseline. In: Proceedings of the 16th Conference of the European Chapter of the Association for Computational Linguistics: Main Volume. pp. 697–706. Association for Computational Linguistics, 2021.

Внизу демонстрация автоматической системы распознавания речи, построенной с использованием Корпуса казахской речи. Пожалуйста, нажмите кнопку “ЗАПИСАТЬ” и начните говорить сразу, пока обратный отсчет не достигнет нуля. Распознанный результат речи отобразится над кнопкой “ЗАПИСАТЬ” через несколько секунд (10+ секунд).

  • Нажмите кнопку “ЗАПИСАТЬ” и сразу начните говорить (на казахском языке), пока обратный отсчет не достигнет нуля
  • Распознанный результат речи в виде текста отобразится над кнопкой “ЗАПИСАТЬ” через несколько секунд (10+ секунд).

В некоторых версиях браузеров запись аудио не поддерживается. Просьба зайти на данную страничку, используя обновленный браузер с настольного устройства (PC/ноутбук).