Новости

cover

12 Июля 2022

Исследовательская работа ISSAI представлена на Odyssey 2022: Семинар по распознаванию речи и языка

Исследовательская работа “Исследование мультимодальной верификации личности с использованием аудиовизуальных и тепловых данных” Мадины Абдрахмановой, Сании Абушакимовой, Ерболата Хасанова и Хусейна Атакана Варола была представлена Мадиной Абдрахмановой, аналитиком данных ISSAI на семинаре Odyssey 2022: Семинар по распознаванию речи и языка.

В статье авторы исследуют подход к мультимодальной верификации личности с использованием аудио, визуальных и тепловых модальностей. Ранее уже было доказано, что сочетание аудио и визуальных методов является эффективным методом проверки личности. С этой точки зрения авторы данной научной работы исследуют влияние дальнейшего увеличения числа модальностей путем добавления тепловых изображений. Проведенный эксперимент продемонстрировал превосходную производительность системы верификации с использованием аудио, визуальных и тепловых модальностей. В целях обеспечения Авторы разместили свой код, предварительно обученные модели и предварительно обработанный набор данных в свободном доступе в репозитории GitHub, чтобы обеспечить воспроизводимость эксперимента и облегчить исследование мультимодальной проверки личности.

В этом году семинар Odyssey 2022: Распознавание речи и языка был организован Университетом Цинхуа в Пекине, Китай, с 28 июня по 01 июля 2022 года. Мероприятие представляет собой исследовательский семинар, организованный Международной ассоциацией речевой коммуникации (ISCA) и проводимый в сотрудничестве с группой специальных интересов ISCA Характеристика спикера и языка.

Целью этого семинара является содействие взаимодействию между исследователями в области распознавания речи и языка. Ранее семинары Odyssey проводились в разных городах, таких как Сингапур (2012), Йоэнсуу (2014), Бильбао (2016), Ле-Сабль-д’Олон (2018) и Токио (2020).