Recherche
Plan du site
Nous contacter
Newsletter

Parole d'experts > C'est votre ordinateur qui vous parle�!

C'est votre ordinateur qui vous parle�! (1)
Un bref aper�u de la technologie de synth�se de la parole � partir du texte ainsi qu'une liste de produits existants et de packages gratuits.

Par Denis Susac

Suite de l'article

Cr�er une application vocale est quasiment devenu un jeu d'enfant gr�ce aux progr�s en mati�re d'informatique, de linguistique, de traitement du signal et m�me de psychologie. L'un des �l�ments cl�s de ce type d'applications est la technologie de synth�se de la parole � partir du texte (TTS) ou moteur de synth�se vocale. La capacit� de convertir du texte en phrases et mots compr�hensibles et intelligibles est essentielle pour toute application, n�cessitant une interaction humaine, spontan�e. D'autre part, l'exploration de milliers de r�gles de prononciation et d'inflexion n�cessite une grande puissance de traitement�: plus simplement, tout le tract vocal de l'Homme doit �tre model� et mim� pour une application TTS afin de parvenir � une qualit� de voix humaine.

Il existe deux approches de base de la synth�se vocale�: la synth�se par formant qui cr�e un discours totalement num�ris� et synth�tique�� partir de ��scratch��; la synth�se par concat�nation par laquelle des segments de voix enregistr�es sont stock�s et serviront � convertir du texte en parole. La premi�re m�thode n�cessite un petit CPU et de la configuration m�moire, elle pr�sente l'avantage de s'adapter aux diff�rentes langues, d'autant que la hauteur et la dur�e des mots peuvent �tre facilement modifi�s. La qualit� sonore est g�n�ralement inf�rieure et le discours g�n�r� para�t assez m�canique. L'approche ��concat�native�� permet de stocker des fragments enregistr�s de discours humains dans des bases de donn�es, pour les regrouper par la suite afin de former des mots et des phrases complets. La longueur des fragments individuels varie�: la plus petite unit� du discours qui diff�rencie un �nonc� d'un autre est appel�e phon�me. Cependant, les sons individuels peuvent varier en fonction des sons qui suivent et pr�c�dent les diff�rents phon�mes. De plus longues unit�s de discours diminuent la densit� des points de concat�nation, engendrant ainsi des discours de meilleure qualit�. Les diphones, unit�s qui commencent au milieu d'un phon�me stable et s'ach�ve au milieu du phon�me suivant, sont souvent choisis comme solutions. Des unit�s plus larges du discours telles que des triphones, tetraphones de m�me que des mots entiers sont utilis�s avec la nouvelle g�n�ration de moteurs de TTS, n�cessitant de plus grandes bases de donn�es et des m�thodes de recherche et de stockage plus efficaces

Quelque soit la m�thode utilis�e, les outils TTS renferment en r�gle g�n�rale deux modules�: un module de traitement automatique du langage naturel (TAL) qui transcrit phon�tiquement le texte �crit, et un module de traitement du signal num�rique qui transforme les r�sultats de la section TAL en mots vocalis�s. A la base, le processus de synth�se vocale d�bute par l'�tape dite de normalisation du texte, qui �tablit comment chaque mot doit �tre prononc�. Il est � rappeler que des mots qui � premi�re vue s'�crivent de la m�me mani�re, ne se prononcent pas n�cessairement de la m�me mani�re (exemple du mot ��read�� en anglais qui peut se prononcer ��red�� ou ��reed�� en fonction du contexte). Certains mots doivent �tre d�velopp�s ou m�me remplac�s�: chiffres, abbr�viations, dates, heures, acronymes, etc. Les chiffres sont de bons candidats pour les analyseurs de contexte�: un bon outil de TTS pour le march� am�ricain ��saura�� que 556-9872 est certainement un num�ro de t�l�phone et ne lira pas cinq cent cinquante six�Une fois le groupe de mots non ambig� extrait, la commande passe au convertisseur de phon�me qui tente de trouver le mot juste dans une base de donn�e de prononciation ou d'appliquer des r�gles de lettre � son (letter-to-sound). Pourtant m�me les meilleurs outils, dot�s de base de donn�es �labor�es, devront s'appuyer sur des dictionnaires d'exception, stockant des mots qui d�fient toutes les autres r�gles de prononciation. La partie la plus ardue reste � venir, c'est la g�n�ration de la prosodie. Le terme prosodie renvoie � la variation des param�tres de hauteur, l'intensit� et la dur�e syllabique. Le discours cr�� ne para�tra naturel que si cette �tape est effectu�e correctement�: autrement le son sera monotone et ennuyeux, ce qui peut �tre �puisant � long terme.

Les progr�s en mati�re d'informatique et d'algorithmes de g�n�ration du discours sont � l'origine de multiples outils de TTS capables de g�n�rer un discours quasi indiff�renciable du discours humain. RealSpeak de Lernout & Hauspie s'appuie sur des algorithmes de concat�nation, il est id�al pour les secteurs de l'industrie, tel que la t�l�phonie qui n�cessite une qualit� haute d�finition. RealSpeak de L&H fait partie de la gamme de produits TTS qui inclut TTS3000 et L&H TruVoice, chacun disposant de CPU et de m�moire diff�rents. La nouvelle version (5.0) de L&H Voice Xpress permet aux d�veloppeurs de rendre leurs applications compatibles � la voix en s'appuyant sur le Mod�le Objet Composant de Microsoft (COM- Component Object Model) et la technologie standard ActiveX et l'Interface de Programmation d'Application Vocale (SAPI), d�finissant la fonctionnalit� reconnaissance/g�n�ration du discours. La nouvelle fonction de transcription permet aux utilisateurs d'enregistrer leurs dict�es dans un fichier wave et de disposer du texte, fichiers alternatifs et audio �tant stock�s ensemble. Les utilisateurs peuvent s�lectionner une partie du texte et commencer une lecture du texte s�lectionn� avec la voix enregistr�e de l'utilisateur et effectuer des corrections par le discours ou transmettre les fichiers � un tiers pour correction. Les langues actuellement support�es sont l'anglais am�ricain et britannique, le fran�ais, le danois et l'espagnol, on trouve �galement des listes de vocabulaire dans diff�rents domaines d'application.

Suite de l'article


Recommander Agentland  -  Partenariat  -  Confidentialit�  -  Cr�dits -  Goodies
Recherche  -  Plan du site  -  Nous contacter  -  Newsletter  -  Presse
agent-land.fr / AgentLand.com


NEWSLETTER
Chaque semaine, recevez les derni�res actualit�s des agents  

TOP 10 AGENTS