Description
Date depot: 4 avril 2022
Titre: Analyse Topologique de Données Distribuées
Directeur de thèse:
Julien TIERNY (LIP6)
Directeur de thèse:
Pierre FORTIN (CRISTAL)
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Informatique graphique et géométrique, IHM et réalité virtuelle
Resumé: L'analyse topologique de données est une thématique de recherche qui propose d'extraire, de mesurer et de comparer des informations structurelles cachées au sein de données complexes. Elle connaît un essor important depuis quelques années, dû principalement à ses succès récents en science des données et en apprentissage automatique ainsi qu'aux développements open-source la mettant en œuvre. L'analyse topologique de données repose aujourd'hui sur une boite à outils de représentations topologiques de données (comme le diagramme de persistance, le graphe de Reeb, le complexe de Morse-Smale) dont la concision et la pertinence pratique ont été documentées dans de nombreuses applications, comme en imagerie médicale, en astrophysique, ou encore en monitoring de simulations numériques de haute performance. Cependant, la construction de ces outils est encore coûteuse en temps et difficilement envisageable pour des jeux de données de très grande taille (au-delà de 10^9 points), typiquement rencontrés dans des applications intensives à haute performance. Dans cette thèse, nous nous focaliserons sur la théorie de Morse discrète, grâce à laquelle l'équipe a déjà obtenu des résultats préliminaires très prometteurs pour le calcul de diagrammes de persistance ainsi que sur les implémentations pour mémoire distribuée. L'objectif de la thèse est donc de permettre le calcul de représentations topologiques de jeux de données d'une taille sans précédent dans un contexte haute performance à mémoire distribuée (i.e. sur un super-calculateur), mais aussi de traiter de gros volumes de données sur de petits matériels (e.g. ordinateur portable) en mode out-of-core.
Doctorant.e: Le Guillou Eve