Résumé:
L’analyse du signal de parole est un moyen privilégié pour l’évaluation clinique de la
qualité de la voix en vue d’un diagnostic et d’une documentation quantitative des
pathologies du larynx. L’analyse acoustique du signal de parole permet une évaluation non
invasive et peu coûteuse des troubles de la voix contribuant ainsi un diagnostic plus
efficace, rapide et objectif.
Le travail de recherche présentée dans cette thèse est dédié à la classification automatique
des voix pathologiques dans le but de fournir une méthode complémentaire d’évaluation
clinique de la qualité de la voix permettant aux cliniciens le suivi des patients atteints de
troubles de la voix. La méthode proposée utilise conjointement les séparateurs à vaste
marge (SVM : support vector machine) et les modèles de Markov cachés (HMM : hidden
Markov models) afin de profiter des avantages des deux méthodes simultanément. La
classification par SVM est basée sur l’apprentissage automatique supervisé avec pour
principe de séparer les données de différentes natures par un hyperplan alors que la
classification par HMM basée sur l’apprentissage automatique non supervisé avec pour
principe de suivre la règle de décision de Bayes.
Ces méthodes de classifications ont été appliquées sur un corpus contenant 251 fichiers
composés de deux phrases concaténées suivies de la voyelle [a] produites par des sujets
normophoniques et des sujets dysphoniques avec différents degrés de dysphonie. Les
résultats de classification de la méthode hybride HMM-SVM sont comparés aux résultats
obtenus par des méthodes de référence basées sur les SVMs et les HMMs séparément. Les
résultats montrent que la combinaison de ces deux méthodes de classification améliore
nettement le taux de classification