Жақында Қазақ тілі корпусы және Қазақ тілі мен сөзін автоматты түрде тану жобалары туралы хабарландыру Egemen.kz, Informburo.kz, Elorda.info, inform.kz, today.kz, ainews.kz, Kazakh-tv және басқа жергілікті БАҚ-тың жаңалықтар порталдарында жарияланды.
Өз мақалаларында олар жоба туралы барлық негізгі ақпаратты, оның мақсаттары мен нәтижелерін қамтыды. Сонымен қатар, олар Қазақ тілі корпусы және Қазақ тілі мен сөзін автоматты түрде тану жобаларының сілтемені енгізді.
Жергілікті БАҚ – тағы жарияланымдардан басқа, жоба авторлары – ISSAI постдокторанты Ерболат Хасанов пен компьютер инженері Алмас Міржахметов “Хабар” ұлттық жаңалықтар арнасына берген сұхбатында жоба туралы айтып, оның қалай жұмыс істейтінін көрсетті.
Еске алайық, ISSAI мерейтойына орай тағы бір маңызды жетістігі туралы хабарлайды: Қазақ тілі корпусы және Қазақ тілін автоматты түрде тану.
Жоба цифрлық әлемде қазақ тілін пайдалануды қолдау, және виртуалды көмекшілер және ақылды үйлер сияқты цифрлық бағдарламалармен пайдаланғанда қазақ тілін танымал ету үшін іске қосылды.
Ғалымдар 2000-нан астам адамнан жиналған 300 сағаттан астам тұратын, қазақ тіліндегі ең үлкен дауыстық деректер базасын құрды. Келесі, бұл деректер базасы қазақша сөз тану және синтезі технологияны әзірлеу үшін жасалды. Мұндай технологияларды Siri және Alexa сияқты виртуалды көмекшілерде, сонымен қатар ерекше қажеттіліктері бар адамдарға көмектесетін дауыстық және мәтіндік бағдарламаларда қолданады.
Осы сілтеме арқылы http://test-test-issai.nu.edu.kz/kz-speech-corpus/ қазақ тілі жиналған деректер базасына қол жеткізуге, сондай-ақ қазақ тілін тану жүйесін тексеруге болады.