Description
Date depot: 27 décembre 2021
Titre: Combiner qualité et diversité en apprentissage par renforcement profond
Directeur de thèse:
Olivier SIGAUD (ISIR (EDITE))
Encadrant :
Nicolas PERRIN-GILBERT (ISIR (EDITE))
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Intelligence artificielle
Resumé: Les méthodes d'apprentissage par renforcement profond (Deep Reinforcement Learning, DRL) sont confrontées à un problème d'exploration. Nous souhaitons remédier à cette limitation importante des
méthodes de DRL en nous inspirant des méthodes d’exploration de Quality Diversity. Contrairement à l’exploration pratiquée classiquement dans les approches de DRL, la méthode développée permettra de définir un espace de recherche d’intérêt, puis d’explorer directement cet espace. La difficulté centrale du travail consistera à définir une métrique de nouveauté dans l’espace de comportements afin d’encourager les agents de DRL à l’explorer efficacement. Pour identifier cette métrique de nouveauté, nous envisagerons notamment d’étudier des techniques d’apprentissage de la dynamique de l’environnement.
Doctorant.e: Macé Valentin