Description
Date depot: 16 avril 2020
Titre: Modélisation multimodale de l’expressivité et de l’alignement pour l’interaction humain-machine
Directrice de thèse:
Catherine PELACHAUD (ISIR (EDITE))
Directeur de thèse:
Nicolas OBIN (STMS)
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Non defini
Resumé:
Dans un contexte où les assistants personnels et les interactions avec les machines deviennent une réalité quotidienne pour l’être humain, cette thèse vise à mieux comprendre et à modéliser les mécanismes qui régissent l’interaction multi-modale (voix et geste) entre un humain et une machine, pour permettre d’élaborer un agent conversationnel capable de s’adapter de manière naturelle et cohérente à un interactant humain. Pour répondre à ce challenge, cette thèse sera coordonnée par deux laboratoires (STMS et ISIR) aux compétences complémentaires en intelligence artificielle, humanité numérique, et robotique sociale, pour développer des algorithmes d’apprentissage neuronaux et par imitation capable de reproduire de manière extrêmement réaliste le comportement d’être humain. En particulier, la thèse visera à répondre à deux limitations extrêmement importantes des agents conversationnels actuels : le manque d’expressivité de l’agent, qui rend l’interaction rapidement monotone pour l’interactant humain, et le manque d’adaptation de l’agent au profil de l’utilisateur, qui nuit très fortement à l’efficacité de l’interaction. Pour répondre à ce challenge, la thèse se focalisera sur deux limitations majeures des modèles actuels : 1) la modélisation générative par réseaux de neurones de la synchronicité entre les différentes modalités d’interaction (e.g., voix, geste) de l’agent et 2) l’adaptation interactive du comportement de l’agent par imitation de l’humain. Les résultats produits au cours de la thèse seront notamment intégrés à la plateforme d’agent virtuel GRETA développée par l’ISIR.
Doctorant.e: Fares Mireille