Résumé:
Les data lakes (lacs de données) permettent de stocker les données massives (BigData) à des fins d'utilisations diverses (décisionnelles, apprentissage automatique...). Les métadonnées jouent un rôle primordial dans le sens qu'elles permettent de connaitre et d'accéder aux données renfermées dans le data lake.
Le travail présenté dans ce mémoire a pour objectif de développer un système basé sur les graphes qui permet de gérer les métadonnées dans un data lake composé de sources NoSQL (graphes, documents et relationelles).