Informations professionnelles
Statut: Doctorant en quatrième année
ED: EDITE
Unité de recherche: ISIR (EDITE)
Equipe: AMAC
Employeur: Sorbonne Université Date de debut de thèse: 1 novembre 2019 Directeur de thèse: Olivier SIGAUD (ISIR (EDITE)) Encadrant : Nicolas PERRIN (ISIR (EDITE)) Sujet de thèse: Apprentissage par renforcement pour le mouvement articulé Date de prévisionnelle de soutenance: 10 mars 2023
Equipe: AMAC
Employeur: Sorbonne Université Date de debut de thèse: 1 novembre 2019 Directeur de thèse: Olivier SIGAUD (ISIR (EDITE)) Encadrant : Nicolas PERRIN (ISIR (EDITE)) Sujet de thèse: Apprentissage par renforcement pour le mouvement articulé Date de prévisionnelle de soutenance: 10 mars 2023
Soutenance de thèse
Données générales
Titre : Autonomous learning of complex robotics behaviors from a single demonstration.
Date : 10 mars 2023
Heure: 14:00
Résumé : This thesis evaluates the applicability of Deep Reinforcement Learning and Neuro-Evolution for learning neural control policies in robotics.
After highlighting the limitations of Neuro-Evolution, we present a new Deep Reinforcement Learning approach. This approach uses a single demonstration to learn a goal-conditioned policy (GCP). This GCP is trained to control the robots between successive low-dimensional goals that are extracted from the demonstration. The robot reproduces the demonstrated complex behavior by achieving those successive goals.
For example, in a humanoid robot locomotion task, the GCP can be used to control the robot between successive humanoid torso positions which results in walking behavior.
We propose several variants of this approach and apply it to different robotic tasks, including grasping and locomotion tasks.
Lieu : Sorbonne Université
Campus Pierre et Marie Curie
Tour 66
Salle 310
Rapporteurs/ Rapporteuses
Personne | Qualité | Etablissement |
---|---|---|
M. Konidaris George | Professeur des universités | Department of Computer Sc., Brown University, Providence RI (États-Unis) |
M. Kober Jens | Maître de Conférences (HDR) | Université Technologique de Delft (Pays-Bas) |
Composition du jury
Personne | Qualité | Etablissement |
---|---|---|
M. Perrin-gilbert Nicolas | Chargé de recherche | Institut des Systèmes Intelligents et de Robotique, Sorbonne Université |
M. Sigaud Olivier | Professeur des universités | Institut des Systèmes Intelligents et de Robotique, Sorbonne Université |
M. Pietquin Olivier | Professeur des universités | |
Mme. Billard Aude | Professeure des universités | EPFL (Suisse) |
M. Konidaris George | Professeur des universités | Department of Computer Sc., Brown University, Providence RI (États-Unis) |
M. Kober Jens | Maître de Conférences (HDR) | Université Technologique de Delft (Pays-Bas) |