Résumé:
Aujourd'hui avec le développement d'internet nous sommes en présence d'une quantité
énorme d'information électronique particulièrement les données textuelles. Le cout de plus en plus faible du stockage fait en sorte que cette quantité augmente continuellement.
Parallèlement, les sources de données ne cessent de se diversifier, aujourd'hui pour accéder à une information on peut avoir recours d des journaux électroniques,à des sites spécialisés, à des réseaux sociaux...
Pour pouvoir gérer cette quantité grandissante de données et en tirer le plus d'information
possible il devient nécessaire de l'organiser et de la classifier.
Ayant l'objectif de rendre un programme informatique capable d'assigner des documents
textuels d leur classe d'appartenance la classification de textes est rendue possible grâce à l'apprentissage supervisé. Un entrainement du programme est effectué sur un ensemble de documents auxquels des étiquettes de catégorie ont déjà été assignées par des humains. Or, la constitution de cet ensemble d'entrainement se révèle un processus long et coûteux.
A l'égard des différentes méthodes de classification automatique de textes, nous avons
introduit une utilisation du classifieur < réseaux de neurone )) avec des textes codés en ( sac de mots > basée sur une architecture multicouche.
Mots Clés : Classification, Texte, Apprentissage supervisé, Évaluation, Réseaux de neurone.