Informations professionnelles
Statut: Docteur ED
ED: EDITE
Unité de recherche: ISIR (EDITE)
Employeur: Facebook Date de debut de thèse: 20 juillet 2020 Date soutenance de thèse: 4 octobre 2023 Directeur de thèse: Sylvain LAMPRIER (LERIA) Sujet de thèse: Apprentissage par renforcement en ligne dans les environnements non-stationnaires Thématique : Intelligence artificielle
Employeur: Facebook Date de debut de thèse: 20 juillet 2020 Date soutenance de thèse: 4 octobre 2023 Directeur de thèse: Sylvain LAMPRIER (LERIA) Sujet de thèse: Apprentissage par renforcement en ligne dans les environnements non-stationnaires Thématique : Intelligence artificielle
Soutenance de thèse
Données générales
Titre : Efficient adaptation of reinforcement learning agents: from model-free exploration to symbolic world models
Date : 4 octobre 2023
Heure: 09:00
Résumé : This thesis presents novel strategies within the framework of Meta-Reinforcement Learning, aiming to equip RL agents with the ability to adapt to out-of-domain tasks. The first part of the thesis focuses on model-free techniques to learn effective exploration strategies. We consider two scenarios: one where the agent is provided with a set of training tasks, enabling it to explicitly model the tasks and learn generalizable task representations; and another where the agent learns without rewards to maximize its state coverage.
In the second part, we investigate into the application of symbolic regression, a powerful tool for developing predictive models that offer interpretability and exhibit enhanced robustness against distribution shifts. These models are subsequently integrated with model-based RL agents to improve their performance in out-of-domain tasks.
Lieu : Meta Paris
Rapporteurs/ Rapporteuses
Personne | Qualité | Etablissement |
---|---|---|
M. Filliat David | Professeur des universités | Unité d'Informatique et d'Ingénierie des Systèmes |
M. Rachelson Emmanuel | Professeur des universités | ISAE-SUPAERO |
Composition du jury
Personne | Qualité | Etablissement |
---|---|---|
M. Denoyer Ludovic | Professeur des universités | |
M. Lamprier Sylvain | Professeur des universités | Laboratoire d'Etude et de Recherche en Informatique d'Angers, Univ. d’Angers |
M. Pietquin Olivier | Professeur des universités | |
M. Sigaud Olivier | Professeur des universités | Institut des Systèmes Intelligents et de Robotique, Sorbonne Université |
Mme. Silva Sara | Chargée de recherche | University of Lisbon (Portugal) |
M. Filliat David | Professeur des universités | Unité d'Informatique et d'Ingénierie des Systèmes |
M. Rachelson Emmanuel | Professeur des universités | ISAE-SUPAERO |