Fiche de REBUFFEL Clement

Informations professionnelles


Statut: Docteur ED
ED: EDITE
Unité de recherche: ISIR (EDITE)
Employeur: BNP


Date de debut de thèse: 1 septembre 2018
Date soutenance de thèse: 5 juillet 2022
Directeur de thèse: Patrick GALLINARI (ISIR (EDITE))
Directrice de thèse: Laure SOULIER (ISIR (EDITE))
Sujet de thèse: Deep Learning pour la transduction données, texte Thématique : Intelligence artificielle



Soutenance de thèse

Données générales

Titre : Towards Controllable and Factual Data-to-Text Generation Models
Date : 5 juillet 2022
Heure: 14:00
Résumé : Data-to-Text Generation (DTG) concists in describing complex data using Natural Language such that humans can better understand it. Automated systems for DTG traditionally consist in a collection of complex rules, crafted using domain expertise. Recently, approaches based on Neural Networks (NN) have been proposed. NN alleviate the need for costly domain expertise and are able to produce fluent and in-domain descriptions. Unfortunately, descriptions written by NN tend to include incorrect statements, a behaviour called hallucination. This is mostly due to noisy data, where training descriptions do not completely align with their associated inputs, causing NN to learn spurious alignments and including fasle information in their outputs. This PhD tackles this issue along three axes. We've proposed 1) hierarchical models that better handle complex data; 2) training frameworks, so models can learn to from noisy examples; 3) an automated metric for semantic evaluation in DTG
Lieu : Jussieu, laboratoire ISIR ou salle SCAI

Rapporteurs/ Rapporteuses

Personne Qualité Etablissement
M. Gravier Christophe Professeur des universités Laboratoire Hubert Curien, Univ. Jean Monnet-Saint-Etienne
M. Dymetman Marc Industriel (HDR) NAVER LABS, Naver

Composition du jury

Personne Qualité Etablissement
M. Gallinari Patrick Professeur des universités Institut des Systèmes Intelligents et de Robotique, Sorbonne Université
Mme. Soulier Laure Maîtresse de Conférences (HDR) Institut des Systèmes Intelligents et de Robotique, Sorbonne Université
M. Tannier Xavier Professeur des universités Laboratoire d'Informatique Médicale et d'Ingénierie des Connaissances en e-Santé, Sorbonne Université
Mme. Gardent Claire Directrice de recherche (HDR) Laboratoire Lorrain de Recherche en Informatique et ses Applications, CNRS
M. Gravier Christophe Professeur des universités Laboratoire Hubert Curien, Univ. Jean Monnet-Saint-Etienne
M. Dymetman Marc Industriel (HDR) NAVER LABS, Naver
M. Scoutheeten Geoffrey Industriel https://getalma.eu/