Description
Date depot: 11 avril 2019
Titre: Apprentissage de la coopération et estimation de la contribution individuelle pour la robotique en essaim adaptative
Directeur de thèse:
Nicolas BREDECHE (ISIR (EDITE))
Directeur de thèse:
Nicolas MAUDET (LIP6)
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Non defini
Resumé:
Cette thèse porte sur la conception d'algorithmes distribués pour l'apprentissage en ligne dans le cadre d'un essaim de robot en environnement ouvert. Il s'agit d'un problème d'apprentissage par renforcement dont la solution algorithmique repose sur l'échange de messages entre robots de l'essaim, sous contrainte de capacités de communication et de calcul limitées.
On s'intéresse en particulier à l'estimation en ligne et embarquée des synergies et des contributions marginales des robots au sein d'un essaim pour accomplir une tâche collective nécessitant de la coopération entre robots. Comme les méthodes classiques sont couteuses sur le plan du calcul et de l'information (valeur de Shapley, power index de Banzhaf) et/ou nécessitent un traitement centralisé avec replay (méthode de P. Stone pour l'approximation de Shapley en robotique), nous explorerons au cours de cette thèse les méthodes permettant de construire à la volée une fonction objective embarquée sur chaque robot qui puisse capturer l'utilité locale réelle du robot en fonction des interactions passées et d'une information (partielle ou complète) de la performance globale de l'essaim.
Cette thèse comporte un volet théorique et un volet expérimental. D'un coté, il s'agit d'étudier le problème sous l'angle de la prise de décision collective dans le cadre simplifié d'un graphe dynamique où les noeuds représentent les robots et les arcs les liens de communication entre robots. On s'intéressera en particulier à l'utilisation des modèles graphiques en théorie des jeux évolutionnaires afin de modéliser des problèmes de coopération en robotique en essaim. De l'autre coté, les algorithmes développés devront être implémentés et validés en situation réelle en utilisant un essaim de 200+ robots Kilobots disponible dans le laboratoire, c'est à dire avec des limitations techniques fortes (mémoire et capacité de traitement limitées) et dans un environnement réel (défaillance logicielle et matérielle, évaluation bruitée).
Doctorant.e: Fontbonne Nicolas