Essai du prononceur LIA_PHON
Dernière mise à jour (Last update):
LIA_PHON
(créé par un universitaire Français sous licence
GNU) est un outil qui fait la première passe d'analyse d'un
texte, et crée des données de prononciation
(phonèmes), et durée et de fréquence (prosodie). Le
fichier résultant peut ensuite être passé à
MBROLA qui le prononce.
Je travaille sur Linux RedHat 8.0 . MBROLA ne marche pas trop mal avec
le script text2phone, mais je voulais essayer un autre outil. C'est pour
générer des fichiers audio à partir de livres
choisis sur le Projet Gutenberg, pour mon père qui devient
aveugle.
Après avoir reçu une version corrigée de l'auteur,
"make ressource" marche !
Je lance:
$LIA_PHON_REP/script/lia_text2mbrola < resu.txt > resu.ola
mbrola -I $LIA_PHON_REP/data/initfile.lia ~/install/mbrola-fr/fr resu.ola resu.wav
Et la qualité est nettement meilleure que French-tts ! Ecouter
ici le début de la Vie de
Molière avec LIA_PHON
Encouragé, je lance mes 3787 mots de la Vie de Molière
par Voltaire (environ 25 mn audio); ça tourne en 15 secondes! Il
répond:
En cours : phrase 100
ce qui est un peu alarmant, mais non c'est bien la fin du texte ...
Ensuite MBROLA tourne en 23 secondes et produit 6 messages:
Saturation on kk-ee
mais ça marche quand même!
Il reste à accélérer un peu la vitesse de
prononciation. Pour ça je ne trouve rien dans README.txt; normal
c'est dans MBROLA qu'on peut fixer la vitesse; j'ai ajouté -t 0.90 à la commande mbrola . Il faudrait aussi
essayer d'autres voix.
J'ai modifié les en-têtes /bin/csh dans :
script/lia_genere_phrase_mbrola
script/lia_make_lexique_reacc
script/lia_taggreac
script/lia_text2mbrola
script/lia_text2phon