Fiche de FORMAL Thibault

Informations professionnelles


Statut: Docteur ED
ED: EDITE
Unité de recherche: ISIR (EDITE)
Employeur: Naver


Date de debut de thèse: 2 décembre 2019
Date soutenance de thèse: 27 avril 2023
Directeur de thèse: Benjamin PIWOWARSKI (ISIR (EDITE))
Sujet de thèse: Interactivité et diversification dans les moteurs de recherche d'information basés sur l'apprentissage profond Thématique : Intelligence artificielle



Soutenance de thèse

Données générales

Titre : Towards Effective, Efficient and Explainable Neural Information Retrieval
Date : 27 avril 2023
Heure: 14:00
Résumé : In this thesis, we first propose an original approach to the ad-hoc retrieval problem by learning how to represent queries and documents as sparse vectors in the vocabulary space. This results in a model that is effective, efficient, robust, and whose representations can be interpreted by design. We then propose to analyze neural ranking models from an IR perspective, by focusing on lexical match and term importance. We first show how ColBERT -- a state-of-the-art approach -- relies on such aspects despite its semantic nature. We additionally extend the findings to other models by showing how the ability to perform keyword matching is architecture-dependent and heavily influenced by the presence of query terms in the training set -- questioning the generalization capabilities of neural ranking models when it comes to exactly matching important query terms.
Lieu : Campus Jussieu Salle 304 : Tour 65-66 3ème étage (à confirmer)

Rapporteurs/ Rapporteuses

Personne Qualité Etablissement
M. Gaussier Éric Professeur des universités Laboratoire d'Informatique de Grenoble, Univ. Grenoble Alpes
Mme. Rosset Sophie Directrice de recherche (HDR) Laboratoire Interdisciplinaire des Sciences du Numérique

Composition du jury

Personne Qualité Etablissement
M. Piwowarski Benjamin Chargé de recherche (HDR) Institut des Systèmes Intelligents et de Robotique, Sorbonne Université, CNRS
M. Clinchant Stéphane Directeur de recherche NAVER LABS
M. Tannier Xavier Professeur des universités Laboratoire d'Informatique Médicale et d'Ingénierie des Connaissances en e-Santé, Sorbonne Université
M. Yates Andrew Maître de Conférences IRLab, Univ. d'Amsterdam (Pays-Bas)
Mme. Rosset Sophie Directrice de recherche (HDR) Laboratoire Interdisciplinaire des Sciences du Numérique
M. Gaussier Éric Professeur des universités Laboratoire d'Informatique de Grenoble, Univ. Grenoble Alpes