Жаңалықтар

cover

29 Қазан 2025 г.

ISSAI Испанияның Мадрид қаласында өткен IEEE Industrial Electronics Society-дің 51-ші жыл сайынғы конференциясында екі ғылыми жұмысын таныстырды

ISSAI институтының жетекші деректер ғалымы Аскат Күздеуов және Ғылыми ассистент Артур Муратов 2025 жылғы 14–17 қазан аралығында Испанияның Мадрид қаласындағы Melia Castilla қонақ үйінде өткен IEEE Industrial Electronics Society (IECON) ұйымының 51-ші жыл сайынғы конференциясына қатысты.

IEEE IECON — бұл IEEE Industrial Electronics Society ұйымының басты жыл сайынғы конференциясы. Ол робототехника мен мехатроника, қуат электроникасы, киберқауіпсіздік, жаңартылатын энергия көздері, «ақылды» электр желілері, цифрлық егіздер, өндірістік процестердегі жасанды интеллект және Industry 5.0 сияқты бағыттардағы жаңа идеялар мен зерттеу нәтижелерін талқылауға арналған халықаралық алаң болып табылады.

Аскат Күздеуов «Real-Time Multispectral Human Pose Estimation» («Нақты уақыттағы мультиспектралды адам қалпын бағалау») атты жұмысын профессор Хусейн Атакан Варолмен бірлесіп орындап, AI and Signal & Image Processing Methodologies секциясында таныстырды. Сонымен қатар, ол осы секцияның тең төрағасы ретінде де қызмет атқарды.

Бұл зерттеуде мультиспектралды адам қалпын бағалау (MHPE) үшін YOLO11-pose модельдерін оқытуға арналған деректерге бағытталған тәсіл ұсынылды. Нәтижесінде YOLO11x-pose моделі OpenThermalPose2 деректер жиынында AP50:95-pose = 95,23% нәтижеге қол жеткізіп, жаңа көрсеткіш орнатты. Сондай-ақ, ол COCO деректер жиынының валидациялық бөлігінде AP50:95-pose = 69,89% көрсетіп, бастапқы YOLO11x-pose моделінен сәл жоғары нәтиже көрсетті.

Модельдер NVIDIA Jetson AGX Orin 64GB құрылғысына оңтайландырылып, орналастырылды. TensorRT технологиясын қолданған FP16 дәлдіктегі модельдер жылдамдық пен дәлдіктің ең тиімді тепе-теңдігін қамтамасыз етіп, нақты уақыт режиміндегі қосымшаларға жарамды болды. Алдын ала үйретілген модельдер осы саладағы зерттеулерді қолдау мақсатында ашық түрде қолжетімді: https://github.com/IS2AI/multispectral-motion-analysis.

Артур Муратов дәл осы секцияда «Multilingual Speech Command Recognition with Language Identification» («Тілді анықтау мүмкіндігі бар көптілді дауыс командаларын тану») атты жұмысын таныстырды. Бұл зерттеу Аскат Күздеуов және профессор Хюсеин Атақан Варолмен бірлесіп дайындалған.

Жоба аясында ортақ энкодер мен екі арнайы шығыс басын қолдана отырып, дауыс командаларын тану (SCR) және тілді анықтау (LID) міндеттерін бір уақытта орындайтын біріккен көпміндетті модель ұсынылды. Ұсынылған тәсіл 15 тілде сыналды: қазақ, орыс, ағылшын, татар, араб, түрік, француз, неміс, каталан, испан, поляк, нидерланд, парсы, киньяруанда және итальян тілдері.

Модель SCR үшін 90,73%, ал LID үшін 90,99% орташа дәлдікке қол жеткізді, бұл LID модулінсіз көптілді SCR моделінен және тек LID моделінен жоғары нәтижені көрсетті. Осы саладағы зерттеулерді дамыту мақсатында бастапқы код пен алдын ала үйретілген модельдер ашық түрде жарияланды: https://github.com/IS2AI/Keyword-MLP-LangID.

Екі жұмыс та ауызша және постерлік сессияларда ұсынылып, ғылыми қауымдастықтың айтарлықтай қызығушылығын тудырды. Сонымен қатар, ISSAI зерттеушілері түрлі салалардағы жетекші мамандармен, соның ішінде әйгілі профессор Тошио Фукудамен ғылыми идеялар алмасу мүмкіндігіне ие болды.

« of 4 »