Résumé:
L‟exploitation des données massives (Big Data) stockées dans les lacs de données nécessite une étape de découverte et d‟exploration des lacs de données pour connaître le contenu du lac, la diversité et nature des données qui l‟alimentent ; cette exploration pouvant être suivie par des activités d‟apprentissage automatique, de fouille de données ou autres.
Le travail présenté dans ce mémoire a pour objectif de réaliser un système d‟exploration autour de lacs de données composé de différentes sources NoSQL, qui permet de découvrir, visualiser et explorer le contenu de lac de données en se basant sur un modèle de métadonnées complet. Ce système est appliqué aux données du réseau StackExchange en suivant le processus de développement 2TUP d‟une manière allégée, et peut être extensible à d‟autres types de sources.