Жобалар

Қазақ мәтінді сөзге түрлендіру – 2 (Kazakh TTS2)

Зерттеулерді ынталандыру және цифрлық технологияларды қазақшалау мақсатында екі мың жиырма бірінші жылы Ақылды жүйелер мен жасанды интеллект институты “KazakhTTS” атты деректер жиынтығын әзірледі.

KazakhTTS – жалпы ұзақтығы тоқсан сағаттан астам қазақ тіліндегі аудиожазбалардан тұратын жоғары сапалы деректер жиынтығы. Бұл деректер жиынтығы кәсіби спикерлердің көмегімен жазылған ер мен әйел дауыстарынан тұрады. Деректер жиынтығы ғылым және өнеркәсіп өкілдерінің тарапынан үлкен сұраныс тудыра отырып, бір жылдың ішінде 500 астам рет жүктелген болатын.

Жұмысымызды жалғастыру үшін біз KazakhTTS2 деп аталатын жаңа деректер жиынтығын ұсынамыз. KazakhTTS2 жиынтығы көбірек деректер мен кәсіби спикерлер дауыстарымен қатар бірнеше жаңа тақырыптарды қамтиды. Атап айтқанда, бұл жиынтықта біз деректер көлемін 271 сағатқа дейін арттырдық. Үш жаңа спикер – екі әйел мен бір ер адамды қостық. Әр спикердің оқыған деректер үлесі 25 сағаттан асады. Тақырыптардың қамтылу аясын кітап пен Уикипедия мақалаларымен әртараптандырдық.

Қазақ мәтінді дауысқа түрлендіру технологиясының негізіндегі бағдарламалар мен қолданбаларды әзірлеу үшін, кәсіби мамандар KazakhTTS2 деректер жиынтығын жүктей алады. Деректер жиынтығын көптеген бағдарламалық жасақтама құру үшін пайдалануға болады. Мысалы: интерактивті ақылды көмекшілер, навигациялық жүйелер, ескерту жүйелері және ерекше қажеттіліктері бар адамдарға арналған қолданбалар.

KazakhTTS2 деректер жиынтығын қалай пайдалануға болатынын көрсету үшін Институт қазақ мәтінін бес дауысқа түрлендіре алатын демо-бағдарламаны әзірледі. Демо-бағдарлама Институттың веб-сайтында орналасқан.

Қазақша сөйлеу синтезін көрсетуге арналған нұсқаулық:

– Төмендегі өріске қазақ мәтінін енгізіңіз (Тек Кириллица әріптері мен тыныс белгілерін қолданыңыз, сандар мен басқа арнайы белгілер мәтін түрінде жазылуы керек. Жақсырақ синтездеу үшін ұзын мәтінді қысқа сегменттерге бөліңіз.)
– Содан кейін «GET AUDIO» батырманы басыңыз
– Веб-бет қайта ашылады және сіз енгізген мәтіннің астында аудионы таба аласыз. Аудионы тыңдау үшін «Play» батырманы басыңыз.
Жобаның демо-нұсқасын және қазақ мәтінінің дыбыстандыруын тек игілікті мақсаттарда ғана пайдалануды, былапыт сөйлеу үшін пайдаланбауды, сондай-ақ әдеп нормаларын сақтауды сұраймыз.

ISSAI invites academic and industrial organizations to download the dataset and contribute to the use of the Kazakh language in the digital world.

GitHub icon
Powered by GitHub
TTS деректерін жүктеу Кодты жүктеу

Назар аударыңыз: бұл KazakhTTS ДЕРЕКТЕР ЖИЫНТЫҒЫ. Ол қазақ мәтінін сөйлеуге түрлендіру технологиясының демо-версиясы емес (дыбыстандыру/"озвучивание" емес)