Наша статья под названием “OpenThermalPose2: Расширение открытого аннотированного тепловизионного датасета человеческих поз с добавлением новых данных, объектов и поз” (авторы: Аскат Куздеуов, Мирас Закарянов, Алим Тлеулиев и профессор Хюсейн Атакан Варол) принята к публикации в журнале IEEE Transactions on Biometrics, Behavior, and Identity Science (Q1).
Оценка поз человека применяется в таких направлениях, как распознавание действий, взаимодействие человека с роботами, захват движений, дополненная реальность, спортивный анализ и здравоохранение. Хотя для работы в видимом спектре существует множество датасетов и моделей глубокого обучения, они не всегда эффективны при плохом освещении и могут вызывать проблемы с конфиденциальностью. Эти ограничения можно частично устранить, используя тепловизионные камеры, однако количество доступных аннотированных тепловизионных датасетов всё ещё невелико.
Для решения этой проблемы мы расширили исходный датасет OpenThermalPose. Обновлённая версия — OpenThermalPose2 — включает 11 391 тепловизионное изображение и 21 125 объектов, аннотированных ограничивающими рамками и 17 ключевыми точками. Эффективность датасета продемонстрирована с помощью обучения моделей YOLOv8-pose и YOLO11-pose. Также были выполнены оптимизация моделей и их развёртывание на платформе NVIDIA Jetson AGX Orin 64GB для практического применения.
Датасет и предварительно обученные модели находятся в открытом доступе и могут быть использованы для дальнейших исследований. Полный текст статьи доступен на платформе IEEE Xplore, а материалы — на GitHub.