Projet de recherche doctoral numero :2806

Description

Date depot: 1 janvier 1900
Titre: Approches bayésiennes et sélection de modèle pour l'apprentissage par renforcement
Directeur de thèse: Olivier CAPPE (LTCI (EDMH))
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Non defini

Resumé: Le but de cette thèse est de développer de nouveaux algorithmes d'apprentissage par renforcement, en envisageant tout d'abord une exploration bayésienne des MDP (Processus Décisionnels de Markov). On s'intéressera par la suite à des problèmes plus généraux de planification dans des MDP, ou des problèmes de bandits contextuels.

Doctorant.e: Kaufmann Emilie