Résumé:
Le synthétiseur vocal est un outil, appareil, une machine ou un logiciel produisant une voix artificielle qui n’est pas prononcée par un être humain. Cette thèse a pour objectif le développement d’un synthétiseur numérique en vue de la modélisation d’une large gamme de timbres vocaux. Nous nous intéressons particulièrement aux troubles de la voix, ainsi qu’au timbre de voix chantée. La synthèse des timbres de la voix, soit normale ou pathologique, soit parlée ou chantée aide à mieux comprendre la production de la voix et permet le test de la fiabilité et de la validité des indices acoustiques des timbres vocaux utilisés dans les systèmes de reconnaissance automatique et de vérification automatique des locuteurs. La synthèse des voix dysphoniques est largement utilisée dans le domaine médical.
Les synthétiseurs d'usage général ne sont pas capables de simuler un large éventail de timbres. Nous proposons un synthétiseur basé sur le modèle de chevauchement de sinusoïde à phase retardée (PDOS : phase delayedoverlappingsinusoid) pour simuler les vibrations des plis vocaux et l’aire glottique. Le débit d’air glottique est modélisé par la solution numérique du modèle de Rothenberg. Une concaténation de résonateurs (synthétiseur à formants de configuration cascade de Klatt) est utilisée pour simuler l’effet de filtrage du conduit vocal.
Le synthétiseur est utilisé pour simuler les timbres de voix présentant des perturbations cycle-à-cycle de la durée du cycle vocal (la gigue vocale) et des troubles dus à la dynamique des cordes vocales telles que la diplophonie ou la biphonation. Nous simulons aussi le timbre de voix des perturbations dus au bruit additif à l’excitation glottique. Le shimmy vocal apparait comme une conséquence de la distorsion de la fréquence de la gigue vocale dans le conduit vocal. Le synthétiseur est aussi utilisé pour simuler le timbre de la voix chantée normale.
Un autre synthétiseur basé sur la concaténation des cycles de la voix en utilisant une technique appelée la synthèse numérique directe (DDS : direct digital synthesis) est développé. L’avantage du synthétiseur DDS est de pouvoir générer le timbre de voix caractérisées par des perturbations de la gigue vocale seule, du shimmy vocal seul ou des deux simultanément.
Dans cette thèse nous investiguons perceptivement l’effet de la gigue vocale et du shimmy vocal sur le timbre de la voix. L’effet de filtrage du conduit vocal sur la mesure des perturbations vocales est aussi investigué.