ISSAI Datasets

Корпус казахской речи (KSC)

KSC является крупнейшим общедоступным набором данных, разработанным для продвижения различных приложений для обработки казахской речи и языка. Он содержит около 335 часов аудио, записанного вручную, содержащего более 154 000 высказываний, произнесенных участниками из разных регионов Казахстана.

Лицензия: Creative Commons Attribution 4.0 International License (https://creativecommons.org/licenses/by/4.0/)

Code Download
KazakhTTS

KazakhTTS - это высококачественный набор данных речи с открытым исходным кодом, который содержит более 90 часов аудио, записанных профессиональными дикторами (мужской и женский голоса).

Лицензия: Creative Commons Attribution 4.0 International License (https://creativecommons.org/licenses/by/4.0/)

Code Download
SpeakingFaces

Крупномасштабный общедоступный набор данных, предназначенный для развития исследований в областях аутентификации пользователей, распознавания лиц, распознавания речи и взаимодействия человека и компьютера.

Лицензия: Creative Commons Attribution 4.0 International License (https://creativecommons.org/licenses/by/4.0/)

Code Download
Корпус узбекской речи (Uzbek Speech Corpus)

Корпус узбекской речи - это корпус речи с открытым исходным кодом, разработанный в сотрудничестве между ISSAI и Лабораторией обработки изображений и речи кафедры компьютерных систем Ташкентского университета информационных технологий (https://tuit.uz/en/kompyuter-tizimlari). Корпус был записан 958 разными спикерами, и состоит, в общей сложности, из 105 часов записанных аудиозаписей.

Лицензия: Creative Commons Attribution 4.0 International License (https://creativecommons.org/licenses/by/4.0/)

Code Download
Корпус русской речи (Russian Speech Corpus)

Openstat-CS334 - это вручную переписанное 334-часовое чистое суб-набор OpenSTT-CS334 (https://github.com/snakers4/open_stt). Набор данных содержит записи только из книг и YouTube.

Лицензия: Creative Commons Attribution-NonCommercial 4.0 International License (https://creativecommons.org/licenses/by-nc/4.0/)

Code Download
Английский язык с казахским акцентом (Kazakh-accented English)

Набор данных состоит из записей английского языка с казахским акцентом (~7,7 часа), извлеченных из Speaking Faces (https://doi.org/10.48333/smgd-yj77 ). Например, носители казахского языка, произносящие английские словесные команды такие как ‘выключить свет", ‘включить следующую песню" и тд, отдаваемые виртуальным помощникам и другим смарт-устройствам.

Лицензия: Creative Commons Attribution 4.0 International License (https://creativecommons.org/licenses/by/4.0/)

Code Download
WiFine

Последовательный набор данных более высокого уровня сил сигналов (RSS), принятых через Wi-Fi. Набор данных содержит 290 траекторий, собранных на 3 этажах здания C4 Назарбаев Университета. Значения RSS с соответствующими координатами положения (x, y, z) записываются примерно каждые 5 секунд.

Лицензия: Creative Commons Attribution 4.0 International License (https://creativecommons.org/licenses/by/4.0/)

Code
IMUWiFine

Последовательный набор данных более высокого уровня сил сигналов (RSS), принятых через IMU и Wi-Fi. Набор данных содержит 120 траекторий, охватывающих совокупное расстояние более 14 километров. Набор данных был собран на 3 этажах здания C4 Назарбаев Университета.

Лицензия: Creative Commons Attribution 4.0 International License (https://creativecommons.org/licenses/by/4.0/)

Code Download