Говорящие Лица

Крупно-масштабный общедоступный набор данных, предназначенный для стимулирования исследований в общих областях аутентификации пользователей, распознавания лиц, распознавания речи и взаимодействия человека и компьютера.


“Говорящие Лица” состоит из хорошо выровненных потоков тепловых и визуальных спектров высокого разрешения изображений полностью обрамленных лиц, синхронизированных с аудиозаписями каждого субъекта, говорящего 100 императивных фраз. Данные были собраны у 140 субъектов, что позволило получить 14 000 экземпляров синхронизированных необработанных данных (7,5 ТБ).


Области применения:

Биометрическая аутентификация | Спикер распознавания лица | Распознавание аудио + Визуальная + Тепловая речь | Распознавание взаимодействия человека и компьютера | Передача домена | Перевод изображений | Чтение по губам с визуальных / тепловых изображений

SpeakingFaces: A Large-Scale Dataset of Voice Commands with Visual and Thermal Video Streams

The protocol for this study was approved by the Institutional Research Ethics Committee of Nazarbayev University.