Description
              
              
              
              Date depot:  27 décembre 2021  
              Titre:  Combiner qualité et diversité en apprentissage par renforcement profond  
              
  
    
        
        
        Directeur de thèse: 
        
        
         Olivier SIGAUD (ISIR (EDITE))
    
   
    
    
    Encadrant : 
    
        Nicolas PERRIN-GILBERT (ISIR (EDITE))
    
              Domaine scientifique:  Sciences et technologies de l'information et de la communication  
              Thématique CNRS :  Intelligence artificielle  
              Resumé:  Les méthodes d'apprentissage par renforcement profond (Deep Reinforcement Learning, DRL) sont confrontées à un problème d'exploration. Nous souhaitons remédier à cette limitation importante des
méthodes de DRL en nous inspirant des méthodes d’exploration de Quality Diversity. Contrairement à l’exploration pratiquée classiquement dans les approches de DRL, la méthode développée permettra de définir un espace de recherche d’intérêt, puis d’explorer directement cet espace. La difficulté centrale du travail consistera à définir une métrique de nouveauté dans l’espace de comportements afin d’encourager les agents de DRL à l’explorer efficacement. Pour identifier cette métrique de nouveauté, nous envisagerons notamment d’étudier des techniques d’apprentissage de la dynamique de l’environnement.  
              
              
                 
              
              
              
              
              Doctorant.e: Macé Valentin