Description
Date depot: 1 octobre 2020
Titre: Métriques topologiques discriminantes
Directeur de thèse:
Julien TIERNY (LIP6)
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Non defini
Resumé:
Ce sujet de thèse se place dans le contexte de l'analyse topologique de données, qui représente une classe de techniques émergentes en sciences des données, notamment pour la visualisation et l'analyse de données complexes. Ces techniques visent à retrouver des informations structurelles cachées au sein des données, afin d'en faciliter et d'en améliorer le traitement.
Un outil populaire en analyse topologique de données est le diagramme de persistance, qui peut être interprété comme un 'code barre' des structures topologiques présentes au sein d'un jeu de données. Grâce à sa stabilité et sa concision, ce descripteur est un élément central dans les frameworks d'analyse topologique de données, notamment pour: le calcul efficace et robuste de distances entre jeux de données, le calcul de barycentres, le clustering, ou encore l'analyse de données variant dans le temps.
Cependant, dans de nombreuses applications, le diagramme de persistance n'est pas assez discriminant: plusieurs jeux de données notoirement différents d'un point de vue applicatif peuvent admettre des diagrammes similaires voire identiques.
Dans cette thèse, nous souhaitons redémarrer l'effort de recherche entrepris sur l'exploitation du diagramme de persistance en analyse topologique de données, mais cette fois en démarrant l'étude à partir de descripteurs clairement plus discriminants, en particulier l'arbre de jointure ('merge tree'). Nous travaillerons donc sur la définition d'un framework d'analyse topologique de données, spécifiquement conçu autour des arbres de jointure et définirons pour ça des algorithmes dédiés pour le calcul de distances, de barycentres, de clustering et de suivi temporel.
Doctorant.e: Pont Mathieu