Зерттеулерді ынталандыру және цифрлық технологияларды қазақшалау мақсатында екі мың жиырма бірінші жылы Ақылды жүйелер мен жасанды интеллект институты “KazakhTTS” атты деректер жиынтығын әзірледі.
KazakhTTS – жалпы ұзақтығы тоқсан сағаттан астам қазақ тіліндегі аудиожазбалардан тұратын жоғары сапалы деректер жиынтығы. Бұл деректер жиынтығы кәсіби спикерлердің көмегімен жазылған ер мен әйел дауыстарынан тұрады. Деректер жиынтығы ғылым және өнеркәсіп өкілдерінің тарапынан үлкен сұраныс тудыра отырып, бір жылдың ішінде 500 астам рет жүктелген болатын.
Жұмысымызды жалғастыру үшін біз KazakhTTS2 деп аталатын жаңа деректер жиынтығын ұсынамыз. KazakhTTS2 жиынтығы көбірек деректер мен кәсіби спикерлер дауыстарымен қатар бірнеше жаңа тақырыптарды қамтиды. Атап айтқанда, бұл жиынтықта біз деректер көлемін 271 сағатқа дейін арттырдық. Үш жаңа спикер – екі әйел мен бір ер адамды қостық. Әр спикердің оқыған деректер үлесі 25 сағаттан асады. Тақырыптардың қамтылу аясын кітап пен Уикипедия мақалаларымен әртараптандырдық.
Қазақ мәтінді дауысқа түрлендіру технологиясының негізіндегі бағдарламалар мен қолданбаларды әзірлеу үшін, кәсіби мамандар KazakhTTS2 деректер жиынтығын жүктей алады. Деректер жиынтығын көптеген бағдарламалық жасақтама құру үшін пайдалануға болады. Мысалы: интерактивті ақылды көмекшілер, навигациялық жүйелер, ескерту жүйелері және ерекше қажеттіліктері бар адамдарға арналған қолданбалар.
KazakhTTS2 деректер жиынтығын қалай пайдалануға болатынын көрсету үшін Институт қазақ мәтінін бес дауысқа түрлендіре алатын демо-бағдарламаны әзірледі. Демо-бағдарлама Институттың веб-сайтында орналасқан.
Қазақша сөйлеу синтезін көрсетуге арналған нұсқаулық:
ISSAI invites academic and industrial organizations to download the dataset and contribute to the use of the Kazakh language in the digital world.
Назар аударыңыз: бұл KazakhTTS ДЕРЕКТЕР ЖИЫНТЫҒЫ. Ол қазақ мәтінін сөйлеуге түрлендіру технологиясының демо-версиясы емес (дыбыстандыру/"озвучивание" емес)