Description
Date depot: 5 avril 2024
Titre: Mesures et intégrale de Choquet pour des approches interprétables d'apprentissage d'arbres de décision
Directeur de thèse:
Christophe MARSALA (LIP6)
Directrice de thèse:
Agnès RICO (ERIC)
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Intelligence artificielle
Resumé: Cette thèse se place dans le domaine de l'intelligence artificielle explicable (eXplainable Artificial Intelligence, XAI) et concerne l'apprentissage automatique par arbres de décision, considérée comme une des approches parmi les plus explicables. Cet algorithme d'apprentissage repose sur l'évaluation du pouvoir de prédiction des variables de description relativement au label (ou classe) à prédire pour les ordonner dans le but de trouver la plus performante. Ce pouvoir de prédiction s'évalue grâce à une mesure d'information, comme l'entropie de Shannon ou l'index de Gini, qui permet de justifier formellement le choix de la variable. L'objectif de cette thèse est d'utiliser une intégrale de Choquet conditionnelle pour définir de nouvelles mesures d'information. Pour cela, une étude des propriétés requises pour une telle mesure, des formes conditionnelles à utiliser, et de leur validation sera à réaliser, et il sera alors nécessaire d'avoir à la fois une analyse théorique et pratique de la problématique.
Résumé dans une autre langue: This thesis is related to eXplainable Artificial Intelligence (XAI) and automatic learning of decision trees. This approach is one of the most explainable approaches in Machine learning (ML). This ML algorithm is based on the evaluation of the predictive power of the description variables relative to the label (or class) to be predicted. Thus, a ranking of these variables can be done so as to find the best performing one. The predictive power of a variable is evaluated using an information measure, such as Shannon entropy or Gini index, which formally validates the choice of the variable.
The aim of this thesis is to use a conditional Choquet integral to define new information measures. In order to do that, a study of the properties required for such a measure, of the conditional forms to be used, and of their validation will have to be carried out. Both a theoretical and a practical analysis of the problem will be needed to fulfill this aim.