Projet de recherche doctoral numero :3742

Description

Date depot: 1 janvier 1900
Titre: Traitement du contenu verbal et analyse des sentiments dans les systèmes d'interactions humain-agent
Directrice de thèse: Catherine PELACHAUD (ISIR (EDITE))
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Non defini

Resumé: Secteur: Traitement Automatique du Langage Naturel, Dialogue Homme-Machine Le domaine du sentiment analysis et de l’opinion mining est un domaine en plein essor avec l’arrivée en masse de données textuelles sur le web comportant des expressions d’opinions par les citoyens (critiques de films, débats sur les commentaires de forums, tweets) (El-Bèze et al. 2010)). Les recherches en traitement automatique des langues se mobilisent sur le développement de méthodes de détection d’opinion dans les textes en s’appuyant sur ces nouvelles ressources. La diversité des données et des applications industrielles faisant appel à ces méthodes multiplient les défis scientifiques à relever avec, notamment, la prise en compte des différents contextes d’énonciation (e.g., contexte social et politique, personnalité du locuteur) et la définition du phénomène d’opinion à analyser en fonction du contexte applicatif. Ces méthodes d’analyse des sentiments dans les textes s’étendent également depuis peu à l’oral en passant par l’analyse des transcriptions automatiques issues de systèmes de reconnaissance automatique de la parole pour des problématiques d’indexation d’émissions radiophoniques ou de centres d’appels (Clavel et al., 2013), et peuvent être ainsi corrélées aux méthodes d’analyse acoustique/prosodique des émotions (Clavel et al., 2010). Autre domaine scientifique en plein essor, celui des agents conversationnels animés (ACA) fait intervenir des personnages virtuels intéragissant avec l’humain. Les ACA peuvent prendre un rôle d’assistant comme les agents conversationnels présents sur les sites de vente (Suignard, 2010), de tuteur dans le cadre des Serious Games (Chollet et al. 2012) ou encore de partenaire dans le cadre des jeux vidéos. Le défi scientifique majeur pour ce domaine est l’intégration, au sein de l’ACA, de la composante affective de l’interaction. Il s’agit d’une part de prendre en compte les comportements affectifs et des attitudes sociales de l’humain et d’autre part de les générer de façon pertinente. Nous proposons pour cette thèse de travailler sur la détection des opinions et des sentiments dans un contexte d’interaction multimodale de l’humain avec un agent conversationnel animé, sujet jusqu'à maintenant peu étudié par la “communauté agent”. En effet, d’un côté, les ACA réagissent à des contenus émotionnels essentiellement non verbaux (Schröder et al., 2011) et de l’autre côté, les ACA “assistant” réagissent à partir des contenus verbaux informatif (Suignard, 2010) sans prendre en compte les opinions ou les sentiments exprimés par l’utilisateur. Des premières études ont été réalisées sur la reconnaissance de l’affect dans le langage dans un contexte d’interaction avec un agent (Osherenko et al., 2009) mais celles-ci restent envisagées indépendamment de la stratégie de dialogue. Les développements de la thèse s’intègreront dans la plateforme GRETA qui repose sur l’architecture SAIBA, une architecture globale unifiée développée par la “communauté agent” pour la génération de comportements multimodaux (Niewiadomski et al., 2011). Greta permet de communiquer avec l’humain en générant chez l’agent une large palette de comportements expressifs verbaux et non verbaux (Bevacqua et al., 2012). Elle peut simultanément montrer des expressions faciales, des gestes, des regards et des mouvements de têtes. Cette plateforme a notamment été intégrée dans le cadre du projet SEMAINE avec le développement d’une architecture temps-réel d’interaction humain-agent (Schröder et al., 2011) qui inclut des analyses acoustiques et vidéos, un système de gestion du dialogue et, du côté de la synthèse, le système Text To Speech OpenMary et l’agent virtuel de la plateforme GRETA. A l’instar de ce projet, la détection d’opinions et de sentiments envisagée dans la thèse interviendra en entrée des modèles d’interactions multi-modaux de la plateforme. La stratégie de dialogue multimodale associée à ces entrées relatives au contenu verbal devra être définie et intégrée dans la plateforme GRETA.

Doctorant.e: Langlet Caroline