Projet de recherche doctoral numero :3272

Description

Date depot: 1 janvier 1900
Titre: DÉCOUVERTE AUTOMATIQUE DE CARACTÉRISTIQUES
Directeur de thèse: Patrick GALLINARI (ISIR (EDITE))
Directeur de thèse: Ludovic DENOYER (Facebook)
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Non defini

Resumé: {Contexte} L’apprentissage statistique s’intéresse depuis quelques années au traitement de données de plus en plus complexes telles que les données sous forme de graphes ou d’arbres, et trouve de nouvelles applications dans les domaines émergents du Web et des réseaux sociaux par exemple. Tandis qu’historiquement, les méthodes d’apprentissage ont principalement été développées pour le traitement de données vectorielles, l’apprentissage avec des données structurées nécessitent de représenter ces données sous forme de vecteurs de caractéristiques. Typiquement, l’apprentissage d’une fonction linéaire de régression f_θ de paramètres θ sur des données structurées x s’écrit habituellement sous la forme f_θ (x)=<Φ(x),θ> où Φ(x) est une fonction qui transforme la donnée x en un vecteur. Ce vecteur représente conjointement la structure et le contenu. La performance de tels algorithme dépend grandement du choix de la fonction Φ est ce travail est aujourd’hui majoritairement effectué manuellement, à l’aide d’un expert du domaine. Cela rend les méthodes actuelles peu automatiques. Parallèlement, le domaine de l’apprentissage par renforcement approché qui s’intéresse à l’apprentissage de prises de décision séquentielles dans des grands espaces de décision est aujourd’hui en plein essor. Tandis qu’il était jusqu’alors principalement un champ d’étude théorique, il commence à trouver des débouchés dans des applications réelles, et notamment dans le domaine de la prédiction et de la transformation de données structurées, rejoignant par là-même les problématiques plus classiques de l’apprentissage statistique. Cependant, les méthodes d’apprentissage reposent elles-aussi sur la définition manuelle de vecteurs de caractéristiques. Typiquement, un agent d’un processus séquentiel doit pouvoir apprendre, pour chaque état s du processus et pour chaque action possible a une fonction score qui renseigne sur la pertinence de choisir l’action a dans cet état. Ce score est calculé, comme dans le cas de la régression présenté précédemment, comme une fonction f_θ (à apprendre) définie sur l’espace des caractéristiques Φ(s,a) qui représentent conjointement l’état s et l’action a sous forme de vecteurs. Ici encore, la fonction caractéristique est décidée manuellement, et la performance des systèmes de renforcement dépend grandement de la qualité de cette fonction. Dans les deux domaines présentés, la conception de « bons » vecteurs de caractéristiques est un point décisif pour la performance des méthodes qui est aujourd’hui résolue manuellement. Il y a donc un besoin réel à développer des méthodes automatiques pour résoudre ce problème de génération. Ce problème a été très peu étudié actuellement. {Sujet de thèse} Nous proposons dans cette thèse de nous intéresser à la génération de caractéristiques dans les processus de décision markoviens, avec comme champ d’application aussi bien des problématiques classiques de l’apprentissage par renforcement ainsi que des problèmes d’apprentissage statistique sur des données structurées. L’étudiant retenu s’intéressera à deux familles de méthodes de génération de caractéristiques : * La première piste est directement issue du domaine de l’apprentissage statistique classique et consiste en l’utilisation de réseaux de neurones profonds dans les processus de décision markoviens. * La seconde consiste à envisager le problème de génération de caractéristiques comme un problème de prise de décisions séquentielles et à utiliser les méthodes d’apprentissage par renforcement – au lieu d’algorithmes génétiques au comportement plus aléatoire - pour résoudre ce problème. Pour ces deux pistes de recherche, il envisagera différents contextes d’apprentissage pour la découverte de caractéristiques et particulièrement le contexte du transfert où des caractéristiques communes à plusieurs tâches seront découvertes conjointement. Génération de caractéristique et réseaux profonds Le domaine de l’apprentissage statistique a vu émerger récemment des méthodes innovantes, appelées méthodes à architectures profondes [1],[2], [3] permettant le calcul automatique de caractéristiques pour des problèmes de classification et de régression classiques. Ces méthodes sont issues des recherches effectuées dans les années 70 sur les réseaux de neurones multicouches et proposent une nouvelle famille d’algorithme d’apprentissage sur ces réseaux. L’idée est qu’un réseau de neurone multicouche peut être considéré comme une machine dans laquelle chaque couche cachée correspond à une représentation « de plus haut niveau » des données de la couche précédente. Ainsi, dans cette vision, un réseau profond – avec beaucoup de couches cachées – correspond à un algorithme qui, étant donné une donnée d’entrée, la transforme successivement dans des espaces de représentation de niveau et de complexité de plus en plus élevés, et prend sa décision sur la représentation finale de ces données. Les niveaux intermédiaires

Doctorant.e: Dulac-Arnold Jean-Kristian Gabriel