Projet de recherche doctoral numero :5682

Description

Date depot: 1 février 2019
Titre: Apprentissage de motifs dans les graphes sémantiques
Directrice de thèse: Marie-Jeanne LESOT (LIP6)
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Non defini

Resumé: L'évolution des supports de diffusion de l'information, en particulier la démocratisation du Web, a fortement modifié le contexte de l'acquisition d'information : tout un chacun peut devenir pourvoyeur d'informations, grâce aux moyens aisés de production et de publication. Pour faire face aux quantités de données disponibles, qui ne sont pas toujours équivalentes en termes de qualité, deux opérations sont particulièrement utiles : le filtrage, qui opère une sélection parmi l'ensemble des informations disponibles, pour ne conserver que celles qui présentent un intérêt, et l'agrégation, qui résume l'ensemble d'informations, réduisant elle aussi la quantité d'éléments à mémoriser et manipuler.Le sujet de thèse s'intéresse à ces questions pour des données représentées dans le formalisme des graphes conceptuels : celui-ci est en effet particulièrement approprié pour les informations sémantiques, pour lesquelles il offre un cadre formel flexible, riche et très expressif, qui est de plus muni d'outils de manipulation performants. Un des problèmes rencontrés lors de l'utilisation des graphes conceptuels dans des applications réelles est la difficulté, pour l'analyste expert en charge du traitement des informations disponibles, à définir le modèle de situation mis en oeuvre pour la tâche de filtrage.L'objectif de la thèse est de proposer des outils permettant d'aider l'analyste dans la tâche de définition du modèle de situation, en mettant en oeuvre une approche d'apprentissage  automatique : les outils ont pour but d'exploiter des exemples d'informations intéressantes pour la tâche d'analyse des informations disponibles et d'en extraire un schéma général qui soit complet et pertinent.Il s'agit donc de développer des méthodes d'apprentissage de motifs dans les graphes  sémantiques, dont les caractéristiques seront à préciser et à formaliser. A titre d'exemple, les questions à traiter porteront sur le caractère conjonctif, disjonctif ou plus nuancé de la combinaison des graphes conceptuels fournis en exemples. De plus, les exemples d'informations intéressantes pourront bien sûr être complétés de l'ensemble des informations disponibles, soulevant la question d'un cadre d'apprentissage semi-supervisé éventuellement plus riche qu'une approche basée sur les seuls exemples. La problématique de la thèse porte donc sur la définition de méthodes originales de synthèse de graphes conceptuels. En particulier, il pourra être intéressant d'autoriser des agrégations pondérées : il sera possible d'enrichir l'information donnée par un analyste en ajoutant son classement sur le niveau de criticité ou d'intérêt de chaque instance d'information afin de guider la construction du modèle et permettre de choisir entre différents points de fusion des structures. Il sera également intéressant de considérer des poids dans les graphes construits eux-mêmes, par exemple pour avoir des degrés d'exigence différente sur la présence de  certains sous-graphes.

Doctorant.e: Faci Adam