Informations professionnelles
Statut: Docteur ED
ED: EDITE
Unité de recherche: ISIR (EDITE)
Employeur: BNP Date de debut de thèse: 1 septembre 2018 Date soutenance de thèse: 5 juillet 2022 Directeur de thèse: Patrick GALLINARI (ISIR (EDITE)) Directrice de thèse: Laure SOULIER (ISIR (EDITE)) Sujet de thèse: Deep Learning pour la transduction données, texte Thématique : Intelligence artificielle
Employeur: BNP Date de debut de thèse: 1 septembre 2018 Date soutenance de thèse: 5 juillet 2022 Directeur de thèse: Patrick GALLINARI (ISIR (EDITE)) Directrice de thèse: Laure SOULIER (ISIR (EDITE)) Sujet de thèse: Deep Learning pour la transduction données, texte Thématique : Intelligence artificielle
Soutenance de thèse
Données générales
Titre : Towards Controllable and Factual Data-to-Text Generation Models
Date : 5 juillet 2022
Heure: 14:00
Résumé : Data-to-Text Generation (DTG) concists in describing complex data using Natural Language such that humans can better understand it. Automated systems for DTG traditionally consist in a collection of complex rules, crafted using domain expertise. Recently, approaches based on Neural Networks (NN) have been proposed. NN alleviate the need for costly domain expertise and are able to produce fluent and in-domain descriptions. Unfortunately, descriptions written by NN tend to include incorrect statements, a behaviour called hallucination. This is mostly due to noisy data, where training descriptions do not completely align with their associated inputs, causing NN to learn spurious alignments and including fasle information in their outputs. This PhD tackles this issue along three axes. We've proposed 1) hierarchical models that better handle complex data; 2) training frameworks, so models can learn to from noisy examples; 3) an automated metric for semantic evaluation in DTG
Lieu : Jussieu, laboratoire ISIR ou salle SCAI
Rapporteurs/ Rapporteuses
Personne | Qualité | Etablissement |
---|---|---|
M. Gravier Christophe | Professeur des universités | Laboratoire Hubert Curien, Univ. Jean Monnet-Saint-Etienne |
M. Dymetman Marc | Industriel (HDR) | NAVER LABS, Naver |
Composition du jury
Personne | Qualité | Etablissement |
---|---|---|
M. Gallinari Patrick | Professeur des universités | Institut des Systèmes Intelligents et de Robotique, Sorbonne Université |
Mme. Soulier Laure | Maîtresse de Conférences (HDR) | Institut des Systèmes Intelligents et de Robotique, Sorbonne Université |
M. Tannier Xavier | Professeur des universités | Laboratoire d'Informatique Médicale et d'Ingénierie des Connaissances en e-Santé, Sorbonne Université |
Mme. Gardent Claire | Directrice de recherche (HDR) | Laboratoire Lorrain de Recherche en Informatique et ses Applications, CNRS |
M. Gravier Christophe | Professeur des universités | Laboratoire Hubert Curien, Univ. Jean Monnet-Saint-Etienne |
M. Dymetman Marc | Industriel (HDR) | NAVER LABS, Naver |
M. Scoutheeten Geoffrey | Industriel | https://getalma.eu/ |