Projet de recherche doctoral numero :8589

Description

Date depot: 28 septembre 2023
Titre: Smart Zeenea : Services Intelligents pour la Maintenance et l’Enrichissement de Catalogues de Données
Directeur de thèse: Bernd AMANN (LIP6)
Encadrant : Rafael ANGARITA AROCHA (LIP6)
Encadrante : Camelia CONSTANTIN (LIP6)
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Données et connaissances

Resumé: La société Zeenea fournit à ses clients des outils pour l’exploration et l’exploitation de leur patrimoine de données en utilisant une solution basée entièrement sur le cloud (SAAS). Une gestion déclarative et manuelle des catalogues de données ne permet pas d’intégrer un grand nombre de jeux de données pour répondre aux besoins d’un nombre grandissant d’utilisateurs et avec un cycle de vie de plus en plus dynamique. Dans ce contexte, l’utilisation de l’intelligence artificielle dans le catalogue de données permettra d’automatiser certaines tâches pour réduire les couts de maintenance d’un catalogue et de démocratiser l’usage de la donnée. L’objectif de ce projet doctoral est d’étendre le système Zeenea avec de nouvelles fonctionnalités pour assister les concepteurs d’un catalogue Zeenea. L'objectif est de construire des catalogues intelligents qui sont capables de s’adapter automatiquement à l’évolution d’un datalake et de faciliter l’exploration de ses datasets par de nouveaux services intelligents pour la génération et la maintenance de documentation, la classification sémantique des datasets (par rapport au glossaire métier), la classification et détection de données personnelles et la prédiction et suggestion de liens entre des datasets et les différents objets métiers.

Résumé dans une autre langue: Zeenea provides its customers with tools for exploring and exploiting their data assets using an entirely cloud-based solution (SAAS). Manual, declarative management of data catalogues means that it is not possible to integrate a growing number of datasets to meet the needs of a rising number of users and with an increasingly dynamic lifecycle. In this context, the use of artificial intelligence in the data catalogue will make it possible to automate certain tasks to reduce catalogue maintenance costs and democratise the use of data. The aim of this doctoral project is to extend the Zeenea system with new functionalities to assist the designers of a Zeenea catalogue. The motivation is to build intelligent catalogues that are capable of adapting automatically to the evolution of a datalake and of facilitating the exploration of its datasets by means of new intelligent services for the generation and maintenance of documentation, the semantic classification of datasets (in relation to the business glossary), the classification and detection of personal data and the prediction and suggestion of links between datasets and the various business objects.



Doctorant.e: Aknouche Anis