Fiche de CAPPUZZO Riccardo

Informations professionnelles


Statut: Docteur ED
ED: EDITE
Unité de recherche: Eurecom
Employeur: Eurecom


Date de debut de thèse: 1 octobre 2018
Date soutenance de thèse: 1 avril 2022
Directeur de thèse: Paolo PAPOTTI (Eurecom)
Sujet de thèse: Automated methods for data cleaning Thématique : Données et connaissances



Soutenance de thèse

Données générales

Titre : Modèles d'apprentissage profond pour le nettoyage des données tabulaires
Date : 1 avril 2022
Heure: 09:00
Résumé : La conservation des données est un sujet omniprésent et de grande envergure, qui touche tous les domaines, du monde universitaire à l'industrie. Les solutions actuelles reposent sur le travail manuel des utilisateurs du domaine, mais elles ne sont pas adaptées. Nous étudions comment appliquer l'apprentissage profond à la conservation des données tabulaires. Nous concentrons notre travail sur le développement de systèmes de curation de données non supervisés et sur la conception de systèmes de curation qui modélisent intrinsèquement les valeurs catégorielles dans leur forme brute. Nous implémentons d'abord EmbDI pour générer des embeddings pour les données tabulaires, et nous traitons les tâches de résolution d'entités et de correspondance de schémas. Nous passons ensuite au problème de l'imputation des données en utilisant des réseaux neuronaux graphiques dans un cadre d'apprentissage multi-tâches appelé GRIMP.
Lieu : EURECOM, Sophia Antipolis

Rapporteurs/ Rapporteuses

Personne Qualité Etablissement
Mme. Herschel Mélanie Professeure des universités Applications of Parallel and Distributed Systems, Université de Stuttgart (Allemagne)
M. Velegrakis Yannis Professeur des universités Data Intensive Systems, Université d'Utrecht (Pays-Bas)

Composition du jury

Personne Qualité Etablissement
M. Troncy Raphael Maître de Conférences EURECOM, Sorbonne Université
M. Merialdo Paolo Professeur des universités Département d'ingénierie, Université de Roma Tre (Italie)
M. Papotti Paolo Professeur des universités EURECOM, Sorbonne Université, Eurecom
Mme. Herschel Mélanie Professeure des universités Applications of Parallel and Distributed Systems, Université de Stuttgart (Allemagne)
M. Velegrakis Yannis Professeur des universités Data Intensive Systems, Université d'Utrecht (Pays-Bas)