Description
Date depot: 1 janvier 1900
Titre: Subspace clustering et interprétabilité
Directeur de thèse:
Christophe MARSALA (LIP6)
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Non defini
Resumé:
Cette thèse se place dans le contexte de l'apprentissage non-supervisé. Le clustering, à partir d'un ensemble de données (vues comme des vecteurs) consiste à identifier des groupes (les clusters) présentant une forte similarité interne, et une forte dissimilarité externe. Le subspace clustering est une généralisation du problème qui, pour identifier les groupes de données similaires, doit également déterminer les sous-espaces dans lesquels ils se trouvent. La métrique servant à identifier les clusters peut alors être adaptée aux différents sous-espaces.
Cependant, cette généralisation revient à relâcher le critère de dissimilarité externe : en identifiant les clusters selon des dimensions différentes, on masque leurs différences entre les données qui les peuplent.
Dans cette thèse, nous souhaitons étudier la formalisation de l'interprétabilité, en particulier dans le cadre du clustering.
Doctorant.e: Guillon Arthur