Informations professionnelles
      
      
        
        
            
            
            
            Statut:  Docteur ED 
            
            
            
        
      
      ED: EDITE 
      
      Unité de recherche:  ISIR (EDITE)
Employeur: Sorbonne Université Date de debut de thèse: 1 novembre 2019 Date soutenance de thèse: 10 mars 2023 Directeur de thèse: Olivier SIGAUD (ISIR (EDITE)) Encadrant : Nicolas PERRIN (ISIR (EDITE)) Sujet de thèse: Apprentissage par renforcement pour le mouvement articulé
    
    
     
     
    
       
    
    
    
    
     
    
  
   
    
    
    
      Employeur: Sorbonne Université Date de debut de thèse: 1 novembre 2019 Date soutenance de thèse: 10 mars 2023 Directeur de thèse: Olivier SIGAUD (ISIR (EDITE)) Encadrant : Nicolas PERRIN (ISIR (EDITE)) Sujet de thèse: Apprentissage par renforcement pour le mouvement articulé
Soutenance de thèse
Données générales
                      Titre : Autonomous learning of complex robotics behaviors from a single demonstration. 
                      Date : 10 mars 2023
                      Heure: 14:00
                      Résumé : This thesis evaluates the applicability of Deep Reinforcement Learning and Neuro-Evolution for learning neural control policies in robotics. 
After highlighting the limitations of Neuro-Evolution, we present a new Deep Reinforcement Learning approach. This approach uses a single demonstration to learn a goal-conditioned policy (GCP). This GCP is trained to control the robots between successive low-dimensional goals that are extracted from the demonstration. The robot reproduces the demonstrated complex behavior by achieving those successive goals. 
For example, in a humanoid robot locomotion task, the GCP can be used to control the robot between successive humanoid torso positions which results in walking behavior.
We propose several variants of this approach and apply it to different robotic tasks, including grasping and locomotion tasks.
                      Lieu : Sorbonne Université 
Campus Pierre et Marie Curie
Tour 66
Salle 310
                  
          Rapporteurs/ Rapporteuses
| Personne | Qualité | Etablissement | 
|---|---|---|
| M. Konidaris George | Professeur des universités | Department of Computer Sc., Brown University, Providence RI (États-Unis) | 
| M. Kober Jens | Maître de Conférences (HDR) | Université Technologique de Delft (Pays-Bas) | 
Composition du jury
| Personne | Qualité | Etablissement | 
|---|---|---|
| M. Perrin-gilbert Nicolas | Chargé de recherche | Institut des Systèmes Intelligents et de Robotique, Sorbonne Université | 
| M. Sigaud Olivier | Professeur des universités | Institut des Systèmes Intelligents et de Robotique, Sorbonne Université | 
| M. Pietquin Olivier | Professeur des universités | |
| Mme. Billard Aude | Professeure des universités | EPFL (Suisse) | 
| M. Konidaris George | Professeur des universités | Department of Computer Sc., Brown University, Providence RI (États-Unis) | 
| M. Kober Jens | Maître de Conférences (HDR) | Université Technologique de Delft (Pays-Bas) |