Жаңалықтар

cover

30 қантар 2023 ж.

Назарбаев Университетінің ғалымдары сөйлеуді автоматты түрде танудың түркі тілдерінде арналған технологиясын жасады

Сөйлеуді автоматты түрде тану (ASR) – бұл компьютерлердің көмегімен адамның сөйлеуін тиісті мәтінге айналдыру міндеті. Мысалы, Siri және Alexa сияқты виртуалды көмекшілер және дауыс жүйелер технологиялары ASR пайдалану жағдайларына жатады. Назарбаев Университетінің (NU) Ақылды жүйелер мен жасанды интеллект институтының (ISSAI) зерттеушілері бұрын қазақ тіліне арналған ASR жүйелерін жасаған. он түркі тілін — қазақ, әзірбайжан, башқұрт, өзбек, қырғыз, саха, татар, түрік, ұйғыр және чуваш тілдерін танитын жаңа модель әзірледі. Модель сонымен қатар ағылшын және орыс тілдерін тани алады. Модель сөйлем он түркі тілінің қайсысында айтылғанын анықтай алады және айтылған сөзінің мәтінін экранда көрсетеді.

“Әдетте, сөйлеуді тану технологиялары Интернетте жақсы ұсынылған және сөйлеу деректерінің үлкен көлемі ашық түрде қол жетімді ағылшын, қытай немесе жапон сияқты тілдерге бағытталған. Біздің мақсатымыз түркі тілдері үшін сөйлеуді тану моделін әзірлеу болды, олардың көпшілігі үшін мұндай деректер өте аз”, – дейді ISSAI деректер талдаушысы Саида Мұсаходжаева. “Лексика, фонология және морфология тұрғысынан түркі тілдерінің жалпы ерекшеліктерін пайдалана отырып, біз зерттеуімізде он түркі тілі бір-бірінен өзара пайда әкелетін сенімді бірлескен модель әзірлеуге тырыстық”.

Сөйлеуді тану модельдерінің өнімділігі, әдетте, айтылған сөз мәтінінде дұрыс болжанбаған таңбалар мен сөздердің пайызы бойынша бағаланады. Осылайша, бұл пайыз нөлге неғұрлым жақын болса, соғұрлым модель дәлірек және болжамды мәтінде қателер азырақ болады. Мысалы, Чуваш мәлімдемесін тану кезінде ISSAI көптілді моделінің болжамды мәтінінде таңбалардағы 4,9% қате және сөздегі 17,2% қате анықталған. “Бұл нәтижелер әлі де мінсіз емес деп айтуға болады, бұл шындық. Бірақ, бір түркі тіліне арналған бір тілді модельдер біздің модельмен салыстырғанда көбінесе нашарлау нәтижелер береді”, – дейді NU-дің төртінші курс студенті және ISSAI ғылыми қызметкері Қайсар Дәулетбек. “Біздің модель түркі тілдерінің туыстығын және керемет ұқсастығын пайдаланады. Егер біз кейбір тілдер үшін тек қол жетімді бірнеше ресурстарды пайдаланып, бір тілді модельдерді құра отырып, мәселені шешуге тырыссақ, бұл нәтижелер мүмкін болмас еді. Мысалы, башқұрт, қазақ, татар, түрік, ұйғыр және өзбек тілдері үшін біздің модель жіберген рәміздердегі қателіктердің пайызы 5% – дан аз.”

Сондай-ақ, ISSAI зерттеушілері жасаған көптілді ASR моделі түркі тілдерін тануға қабілетті алғашқы бірлескен модель болып табылады және оны ISSAI веб-сайтында еркін тексеруге болады. Сонымен қатар, барлық әзірленген модельдер, сондай-ақ зерттеу жобасында пайдаланылған деректер жиынтығы мен кодтар сол веб-сайтта жүктеу үшін ашық қол жетімді. “ISSAI әрқашан ұстанған негізгі этикалық принциптердің бірі – ашықтық принципі”, – дейді ISSAI техникалық жазушысы Рүстем Ешпанов. “Қарапайым тілмен айтқанда, Институт жүзеге асыратын әрбір зерттеу қызметі мен жобасы хаттамалар мен нәтижелерді жариялау арқылы қоғамдық бақылауға ашық. Біз ISSAI-де жүргізілген кез келген зерттеудің дизайнын, әдістерін, қорытындыларын, шектеулерін және тәуекелдерін ашып, осылайша көптілді Asr моделін әзірлеуде қолданылатын барлық ресурстарды сөйлеуді өңдеу энтузиастарынан бастап жергілікті әзірлеушілер мен халықаралық бизнес кәсіпкерлеріне дейін барлығына қолжетімді ету қажет деп санаймыз.”

ISSAI-дің түркі тілдеріне арналған көптілді Asr моделін жасауға қызығушылығы кездейсоқ емес. Қазіргі уақытта ISSAI ашық бастапқы коды бар қазақ тілінің алғашқы корпустарын (KSC және KSC2), ашық бастапқы коды бар қазақ тіліндегі мәтінді сөйлеуге түрлендіретін ауқымды корпустарды (KazakhTTS және kazakhtts2), сондай-ақ аталған объектілерді қазақ тілінде тануға арналған ең ірі жалпыға қолжетімді деректер жинағын (KazNERD) құруда жетістіктерге жетті. “Институт 2019 жылы құрылғаннан бері цифрлық әлемде қазақ тілін ілгерілету үшін тұрақты және елеулі күш – жігер жұмсады”, – дейді профессор Хусейн Атакан Варол, ISSAI негізін қалаушы директоры. “Алайда институттың тіл мен сөйлеу технологияларына деген қызығушылығы қазақ тілімен шектелмейді, басқа түркі тілдеріне де таралады. Осылайша, біздің институт Түркі әлемі мен Еуразиядағы жасанды интеллект пен деректер туралы ғылымның ғылыми орталықтарының біріне айналады”

Біз бұл жобалардың ең маңызды нәтижесі Қазақстанның технологиялық дамуын ынталандырып, сонымен қатар басқа елдерде технологияларды ілгерілетуге жәрдемдесу үшін өзінің кәсіби білімі мен тәжірибесін охотыласпен бөлісетін және қолданатын, сол арқылы болашақ ұрпақ үшін жақсы әлем құратын жоғары білікті техникалық сарапшыларды даярлау болып табылады деп санаймыз”, – дейді профессор Варол.