Informations professionnelles
Statut: Docteur ED
ED: EDITE
Unité de recherche: ISIR (EDITE)
Employeur: Naver Date de debut de thèse: 2 décembre 2019 Date soutenance de thèse: 27 avril 2023 Directeur de thèse: Benjamin PIWOWARSKI (ISIR (EDITE)) Sujet de thèse: Interactivité et diversification dans les moteurs de recherche d'information basés sur l'apprentissage profond Thématique : Intelligence artificielle
Employeur: Naver Date de debut de thèse: 2 décembre 2019 Date soutenance de thèse: 27 avril 2023 Directeur de thèse: Benjamin PIWOWARSKI (ISIR (EDITE)) Sujet de thèse: Interactivité et diversification dans les moteurs de recherche d'information basés sur l'apprentissage profond Thématique : Intelligence artificielle
Soutenance de thèse
Données générales
Titre : Towards Effective, Efficient and Explainable Neural Information Retrieval
Date : 27 avril 2023
Heure: 14:00
Résumé : In this thesis, we first propose an original approach to the ad-hoc retrieval problem by learning how to represent queries and documents as sparse vectors in the vocabulary space. This results in a model that is effective, efficient, robust, and whose representations can be interpreted by design. We then propose to analyze neural ranking models from an IR perspective, by focusing on lexical match and term importance. We first show how ColBERT -- a state-of-the-art approach -- relies on such aspects despite its semantic nature. We additionally extend the findings to other models by showing how the ability to perform keyword matching is architecture-dependent and heavily influenced by the presence of query terms in the training set -- questioning the generalization capabilities of neural ranking models when it comes to exactly matching important query terms.
Lieu : Campus Jussieu
Salle 304 : Tour 65-66 3ème étage (à confirmer)
Rapporteurs/ Rapporteuses
Personne | Qualité | Etablissement |
---|---|---|
M. Gaussier Éric | Professeur des universités | Laboratoire d'Informatique de Grenoble, Univ. Grenoble Alpes |
Mme. Rosset Sophie | Directrice de recherche (HDR) | Laboratoire Interdisciplinaire des Sciences du Numérique |
Composition du jury
Personne | Qualité | Etablissement |
---|---|---|
M. Piwowarski Benjamin | Chargé de recherche (HDR) | Institut des Systèmes Intelligents et de Robotique, Sorbonne Université, CNRS |
M. Clinchant Stéphane | Directeur de recherche | NAVER LABS |
M. Tannier Xavier | Professeur des universités | Laboratoire d'Informatique Médicale et d'Ingénierie des Connaissances en e-Santé, Sorbonne Université |
M. Yates Andrew | Maître de Conférences | IRLab, Univ. d'Amsterdam (Pays-Bas) |
Mme. Rosset Sophie | Directrice de recherche (HDR) | Laboratoire Interdisciplinaire des Sciences du Numérique |
M. Gaussier Éric | Professeur des universités | Laboratoire d'Informatique de Grenoble, Univ. Grenoble Alpes |