C'est votre ordinateur qui vous parle�!

	Recherche

	Plan du site

	Nous contacter

	Newsletter

Parole d'experts > C'est votre ordinateur qui vous parle�!

C'est votre ordinateur qui vous parle�! (2)

Un bref aper�u de la technologie de synth�se de la parole � partir du texte ainsi qu'une liste de produits existants et de packages gratuits.

Par Denis Susac

Lucent's Text-to-speech engine est un autre syst�me TTS au son naturel et intelligible. Il est �quip� d'outils de r�glage de la vitesse, du volume, de la hauteur et du tract vocal. L'entr�e du texte n'est pas restreinte et une voix aussi bien f�minine que masculine peut �tre utilis�e. Le moteur offre des abbr�viations en fonction du contexte, expansion et une architecture ouverte de m�me que de riches options de pr�traitement pour l'e-mail et le Web. Il supporte l'anglais am�ricain, le fran�ais, le fran�ais canadien, l'espagnol (sud am�ricain et castillan), l'allemand, l'italien. D'autres utilitaires comprennent l'�diteur de dictionnaire personnalisable, objet audio customis� et ActiveX control pour la cr�ation de fichiers .wav � partir de texte.

Impl�ment� en tant que Windows DLL, SoftVoice TTS est l'un des rares moteurs � utiliser l'approche de synth�se par formant. S'appuyant sur les avantages de cette technologie, le programmateur peut modifier n'importe quelle voix virtuellement de multiples fa�ons, afin d'en cr�er de toutes nouvelles. Un lot complet de plus de 30 commandes dif�rentes peuvent �tre int�gr�es dans le texte pour contr�ler les sorties vocales, de m�me qu'un support pour le chant ! Des mouvements de l�vres pr�cis peuvent �tre anim�s � partir de donn�es fournies par un synth�tiseur vocale. Le syst�me SoftVoice utilise les r�gles lettres � sons (letter to sound), un pr�processeur num�rique et un dictionnaire permettant d'identifier la prononciation ad�quate. Les programmateurs ou utilisateurs peuvent �galement utiliser l'�diteur de dictionnaire d'exceptions de SoftVoice pour cr�er leurs propres dictionnaires de mots et d'abbr�viations mal prononc�es. Il supporte l'anglais et l'espagnol.

e-Language d'Elan Informatique est une nouvelle gamme d'outils logiciels sophistiqu�s con�us pour offrir aux utilisateurs une nouvelle g�n�ration d'interface pour PDA, t�l�phones intelligents, syst�mes d'aide � la navigation, etc. Il comprend le module Prosel qui extrait la prosodie d'une voix naturelle et l'applique � la voix synth�tique, de m�me que Lexitool, un module qui permet de cr�er une base de donn�es lexicale personnalis�e pour les exceptions et les abbr�viations sp�cifiques � l'application. Speech Cube et Proverbe fournissent un support logiciel et hardware multilingue (anglais am�ricain, britannique, espagnol, allemand, fran�ais, russe, br�silien, portuguais, italien) et multi-canaux pour des serveurs d'applications TTS sous Windows NT, SCO, Linux, Qnx et Solaris. Les solutions bureautiques incluent Speech Engine SDK- version DLL, Speech Engine SAPI et Speech Engine pour OS/2. Elan propose �galement un large support pour les syst�mes embarqu�s, y compris sous Windows CE.

Le Microsoft Speech SDK est un choix naturel pour la plupart des d�veloppeurs utilisant la plateforme Windows. La nouvelle version 5.0 inclut un certain nombre d'am�liorations, des mises � jour d'outils de d�veloppement, �chantillons, documentation et des versions am�lior�es du moteur de Reconnaissance Vocale Continue de Microsoft (MCSR) et le moteur de synth�se de la parole par concat�nation. Il est possible d'allier les capacit�s vocales avec l'Interface de Programmation d'Applications de T�l�phonie (TAPI) pour cr�er des applications en t�l�phonie avanc�e. La plupart des moteurs d�crits dans cet article peuvent �tre utilis�s avec Speech SDK- vous pouvez installer un nombre de produits TTS et s�lectionner uniquement le moteur souhait� en utilisant une mini application de contr�le.

Le moins connu, mais n�anmoins de haute qualit�, est EULER 2.00 du laboratoire TCTS (Th�orie des Circuits et de Traitement du Signal). Il est disponible gratuitement (GNU C++), facile � utiliser, facile � d�velopper, un TTS g�n�rique pour Windows 95/98/NT. Il supporte actuellement le fran�ais, mais d'autres langues vont suivre. Un port Mac est en cours, de m�me que Unix/Linux. Un autre grand projet de TCTS est MBROLA, dont le but est de r�aliser une gamme de synth�tiseurs vocaux pour autant de langues possibles, et les mettre � disposition gratuitement pour des applications non-commerciales. Au c�ur du projet MBROLA, une multiplateforme de synth�tiseur vocal qui s'appuie sur la concat�nation de diphones. Ce n'est pourtant pas un syst�me TTS au sens g�n�ral du terme, d'autant qu'il n'accepte pas comme entr�e du texte brut. D'autre part, il supporte actuellement 24 (�!) langues, permettant une large acceptation de ce syst�me dans le monde entier. Le Festival Speech Synthesis System est un syst�me vocal multilingue g�n�raliste et tr�s puissant, il est consid�r� comme un standard en mati�re de recherche TTS. Il offre un texte entier au syst�me vocal avec diff�rents API, de m�me qu'un environnement pour le d�veloppement et la recherche des techniques de synth�ses de la parole. Il est �crit en C++. Festival peut �tre connect� � MBROLA et peut par cons�quent supporter un grand nombre de langues.

Si vous souhaitez d�battre des moteurs de synth�se de la parole � partir du texte ou de tout autre sujet li� � l'intelligence artificielle, rejoignez le forum d'AgentLand .

Recommander Agentland - Partenariat - Confidentialit� - Cr�dits - Goodies

Recherche - Plan du site - Nous contacter - Newsletter - Presse

agent-land.fr / AgentLand.com


			NEWSLETTER
			Chaque semaine, recevez les derni�res actualit�s des agents

			TOP 10 AGENTS