Projet de recherche doctoral numero :7247

Description

Date depot: 15 mai 2020
Titre: Production d’annotations sémantiques pour des jeux de données tabulaires à partir de plongements pour l’indexation et la recommandation
Directeur de thèse: Ulrich FINGER (Eurecom)
Encadrant : Raphael TRONCY (Eurecom)
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Intelligence artificielle

Resumé: L'objectif de cette thèse est de développer une méthode et de concevoir et d'implémenter des outils capables d'établir des correspondances entre les attributs composant un jeu de données tabulaires et des concepts et relations issus de graphes de connaissances généraliste ou métier. En premier lieu, un prototype baseline reprenant les idées les plus pertinentes de la littérature sera implémenté afin de servir de référence. Dans un second temps, nous chercherons à proposer des algorithmes d’annotation sémantique se basant sur des plongements de graphes Wikidata et DBpedia, et des algorithmes de clustering afin de réaliser la désambiguïsation des entités, le typage des colonnes et, si possible, l’identification des relations entre ces dernières. Le deuxième objectif de la thèse est la conception et l’implémentation d’outils permettant de valoriser les annotations sémantiques. Il s’agira notamment d’intégrer des outils de recherche tirant partie des informations structurelles des tables ainsi que des concepts et des relations identifiées lors de la phase d’annotation sémantique. Dans un deuxième temps, nous nous intéresserons à l’utilisation des annotations sémantiques à des fins de recommandations.



Doctorant.e: Liu Jixiong