Проекты

Speaking Faces

Крупно-масштабный общедоступный набор данных, предназначенный для стимулирования исследований в общих областях аутентификации пользователей, распознавания лиц, распознавания речи и взаимодействия человека и компьютера.

“Говорящие Лица” состоит из хорошо выровненных потоков тепловых и визуальных спектров высокого разрешения изображений полностью обрамленных лиц, синхронизированных с аудиозаписями каждого субъекта, говорящего 100 императивных фраз. Данные были собраны у 140 субъектов, что позволило получить 14 000 экземпляров синхронизированных необработанных данных (7,5 ТБ).

Области применения:

Биометрическая аутентификация | Спикер распознавания лица | Распознавание аудио + Визуальная + Тепловая речь | Распознавание взаимодействия человека и компьютера | Передача домена | Перевод изображений | Чтение по губам с визуальных/тепловых изображений

Speaking Faces

Speaking Faces: A Large-Scale Dataset of Voice Commands with Visual and Thermal Video Streams

M. Abdrakhmanova, A. Kuzdeuov, S.Jarju, M. Lewis, Y.Khassanov, H.A. Varol