Projet de recherche doctoral numero :4187

Description

Date depot: 1 janvier 1900
Titre: Acquisition automatique de concepts sensori-moteurs par un robot
Directeur de thèse: Stéphane DONCIEUX (ISIR (EDITE))
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Non defini

Resumé: Dans notre vie quotidienne, nous réalisons des tâches qu’un robot pourrait prendre en charge : ranger, nettoyer, faire des courses, etc. Certaines de ces tâches peuvent être spécifiées de façon claire et sans ambiguité, par exemple aspirer les saletés dans un espace peu encombré. Cela a permis le développement de robots aspirateurs dédiés sur la base de l’approche dite de robotique comportementale. Ces robots, les seuls robots autonomes ayant passé à ce jour le seuil du marché de masse, disposent d’un comportement pré-cablé n’utilisant que peu d’informations. Ils n’ont pas non plus besoin d’interagir avec leur utilisateur autrement que par l’appui sur un bouton ou l’émission d’un signal sonore. Il existe un gap très important entre des robots autonomes dédiés à une unique tâche et des robots d’assistance polyvalents. Un robot d’assistance capable de nettoyer un appartement, de vider un lave vaisselle, de faire des courses, de plier du linge, de ranger, ... doit disposer de capacités sensori-motrices bien plus complexes que celles des robots aspirateurs. Son répertoire comportemental doit être bien plus riche, ce qui pose de nombreuses questions : – comment construire ce répertoire de comportements ? – comment interagir avec un tel robot, que ce soit pour lui confier une mission, pour s’assurer de son exécution ou pour s’enquérir de ses éventuels problèmes ? Ces questions posent le problème de la définition des concepts (perceptions, actions, com- portements, mais aussi concepts plus abstraits) sur lesquels s’appuieront à la fois le système de planification et de résolution de tâches du robot ainsi que son interface de communication avec les humains. Cette question est en fait celle de la réduction de la dimensionnalité. En effet, les capteurs permettant de s’informer efficacement sur l’environnement sont de grande dimension (caméras, microphone, lidar) et les robots polyvalents sont dotés de nombreux degrés de liberté. Ces capacités de perception et d’action sont définies dans des espaces continus. Se pose donc la question de faire le lien entre ces espaces sensori-moteurs continus et de grande dimension et des espaces de dimension réduite permettant de planifier, d’apprendre ou d’interagir efficacement avec des humains. Pour éviter le problème de l’ancrage de symboles survenant lorsque les concepts sont donnés a priori et le difficile choix rendu nécessaire par le besoin de réduire la dimensionnalité du pro- blème, la question centrale de cette thèse est celle de la création, de façon autonome, du répertoire minimal de concepts nécessaires et faisant sens par rapport à la mor- phologie, à l’environnement et aux missions du robot. L’objectif est de doter le robot de la capacité à construire et mettre à jour son modèle du monde au travers de ses interactions avec son environnement (cognitive bootstrapping. L’approche proposée est celle de la robotique développementale. Dans ces approches s’inspirant des connaissances sur le développement de l’enfant, les concepts abstraits se construisent progressivement depuis les compétences sensori- motrices jusqu’à des concepts plus abstraits. Il est ainsi proposé d’adopter une approche itérative dans laquelle (1) des données sont générées par le robot sur la base d’un algorithme de babillage, (2) des modèles candidats sont appris pour expliquer ces données, reproduire intentionnellement les comportements observés et prédire les conséquences d’une action et (3) de nouvelles données sont générées dans le but de discriminer les modèles candidats, de les affiner et d’en proposer de nouveaux plus simples. Cette thèse a pour but de proposer une implémentation de ces principes s’appuyant sur les compétences des deux directeurs de thèse, à savoir : (1) des algorithmes évolutionnistes pour l’étape de babillage sensorimoteur (S. Doncieux) ; (2) des réseaux bayésiens pour la modélisation des données observées (C. Gonzales) ; (3) pour la réduction de la dimensionnalité, il sera considéré : – une analyse des traces de l’apprentissage (S. Doncieux) ; – l’apprentissage et l’exploitation de modèles bayésiens relationnels (C. Gonzales). L’acquisition de nouveaux concepts nécessite de disposer d’un ensemble de données disponibles aussi complet que possible et couvrant les différentes capacités du robot. Cela nécessite d’explo- rer dans un espace de grande dimension sur la base de politiques comportementales exprimées dans des espaces continus (tant du point de vue des perceptions que des actions), problème pour lequel les algorithmes évolutionnistes se sont révélés très compétitifs. L’apprentissage en robo- tique est un problème difficile compte tenu des non-linéarités et du caractère multi-modal des fonctions de récompenses qui peuvent guider un tel apprentissage, c’est difficile à tel point qu’un apprentissage guidé uniquement par un critère de nouveauté peut s’avérer plus efficace qu’un apprentissage guidé par un critère de performance. Les travaux du doctoran

Doctorant.e: Maestre Carlos