Fiche de KAMIENNY Pierre-alexandre

Informations professionnelles


Statut: Docteur ED
ED: EDITE
Unité de recherche: ISIR (EDITE)
Employeur: Facebook


Date de debut de thèse: 20 juillet 2020
Date soutenance de thèse: 4 octobre 2023
Directeur de thèse: Sylvain LAMPRIER (LERIA)
Sujet de thèse: Apprentissage par renforcement en ligne dans les environnements non-stationnaires Thématique : Intelligence artificielle



Soutenance de thèse

Données générales

Titre : Efficient adaptation of reinforcement learning agents: from model-free exploration to symbolic world models
Date : 4 octobre 2023
Heure: 09:00
Résumé : This thesis presents novel strategies within the framework of Meta-Reinforcement Learning, aiming to equip RL agents with the ability to adapt to out-of-domain tasks. The first part of the thesis focuses on model-free techniques to learn effective exploration strategies. We consider two scenarios: one where the agent is provided with a set of training tasks, enabling it to explicitly model the tasks and learn generalizable task representations; and another where the agent learns without rewards to maximize its state coverage. In the second part, we investigate into the application of symbolic regression, a powerful tool for developing predictive models that offer interpretability and exhibit enhanced robustness against distribution shifts. These models are subsequently integrated with model-based RL agents to improve their performance in out-of-domain tasks.
Lieu : Meta Paris

Rapporteurs/ Rapporteuses

Personne Qualité Etablissement
M. Filliat David Professeur des universités Unité d'Informatique et d'Ingénierie des Systèmes
M. Rachelson Emmanuel Professeur des universités ISAE-SUPAERO

Composition du jury

Personne Qualité Etablissement
M. Denoyer Ludovic Professeur des universités Facebook
M. Lamprier Sylvain Professeur des universités Laboratoire d'Etude et de Recherche en Informatique d'Angers, Univ. d’Angers
M. Pietquin Olivier Professeur des universités Google
M. Sigaud Olivier Professeur des universités Institut des Systèmes Intelligents et de Robotique, Sorbonne Université
Mme. Silva Sara Chargée de recherche University of Lisbon (Portugal)
M. Filliat David Professeur des universités Unité d'Informatique et d'Ingénierie des Systèmes
M. Rachelson Emmanuel Professeur des universités ISAE-SUPAERO