Description
Date depot: 1 janvier 1900
Titre: Apprentissage statistique par réseaux de neurones profonds pour la modélisation de dynamiques spatio-temporelles
Directeur de thèse:
Patrick GALLINARI (ISIR (EDITE))
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Non defini
Resumé:
Contexte
Les interactions des individus avec le web, les services mobiles, les artefacts et les objets communicants génèrent des flots de données dynamiques complexes. L’analyse de ces traces d’interaction permet leur intégration dans des applications offrant des services aux utilisateurs. Analyser ces données qui proviennent souvent de sources multiples et hétérogènes, intégrer leurs dimensions structurelle, sémantique et temporelle se révèle un véritable challenge. L’objectif de la thèse est de développer des modèles formels et des algorithmes d’apprentissage statistique visant à permettre de comprendre, modéliser et analyser ce type de signaux possédant des dynamiques temporelles et spatio-temporelles complexes. Pour cela, on propose d’explorer des idées provenant de l’apprentissage de représentation, une thématique récente dans le domaine de l’apprentissage statistique (Bengio 2013, Lecun 2006). En particulier, on étudiera des modèles basés sur les réseaux de neurones profonds qui sont aujourd’hui les modèles phares dans ce domaine. Pour valider ces modèles formels et guider certains aspects du travail de thèse, on s’appuiera sur deux cas d’étude qui sont représentatifs de deux grandes familles d’applications et qui demandent des capacités différentes pour ces modèles formels : la diffusion d’information sociale et l’étude de dynamiques urbaines.
Objectifs
L’objectif de la thèse est de développer des modèles et des algorithmes pour l’analyse de données relationnelles complexes provenant de signaux d’interaction. Le but est d’une part de revisiter pour ce type de données des problématiques classiques de l’apprentissage comme la classification, la prédiction ou le clustering, et d’autre part de proposer des solutions à des problèmes spécifiques de ces données comme la modélisation et la prédiction de la diffusion de contenus ou de la dynamique de trajectoires. Nous proposons pour cela un travail en deux temps. Tout d’abord apprendre à représenter des dynamiques et des trajectoires dans des espaces latents qui permettent de capturer les principaux facteurs sous-jacents à ces observations. La représentation des séquences d’observations dans ces espaces latents sera ainsi modélisée par des processus spatio-temporels. Le temps est inhérent aux phénomènes observés, l’espace peut correspondre à un espace physique ou un espace latent. Dans un deuxième temps, nous étudierons des modèles statistico-mécaniques. Il s’agit de s’inspirer des travaux sur la modélisation physique de processus spatio-temporels, en l’occurrence les équations de réaction-diffusion pour apprendre à transférer les connaissances de ces modèles physiques dans des modélisations statistiques d’où la dénomination de « modèles statistico-mécaniques ». On initie ainsi une nouvelle démarche scientifique qui vise à développer des ponts entre ces deux familles d’approches développées dans deux communautés séparées. Ces deux étapes sont décrites ci-dessous.
Apprentissage de représentations pour données dynamiques
L’objectif est de développer des méthodes d’apprentissage de représentation pour des traces multi-sources modélisées comme des séquences multiples de processus temporels ou spatiaux temporels. On considèrera trois tâches génériques : la classification, la prédiction et l’ordonnancement d’évènements. On détaille ci-dessous le cas de la prévision, la démarche étant similaire pour les autres problèmes. Cette tâche générique à de nombreuses applications en analyse de mobilité (e. g. prévision d’indicateurs de mobilité) ou pour l’analyse de données sociales (e.g. modélisation des dynamiques de diffusion d’information, prédiction d’indicateurs quantitatifs). Nous proposons d’apprendre des représentations de séquences qui capturent les dépendances entre différentes sources. Un modèle typique aura deux composantes : une composante représentation qui fournit le lien entre les observations et leur représentation latente et une composante spatio-temporelle pour modéliser la dimension dynamique des données dans cet espace latent.
• Pour la représentation, deux schémas principaux seront considérés. Ils correspondent à deux paradigmes d’apprentissage qui sont respectivement l’apprentissage inductif et transductif : dans le premier la représentation est liée fonctionnellement aux données observées et dans le second elle est inférée par un processus d’optimisation à partir des données, sans établir de lien fonctionnel entre données et représentations. Ces deux paradigmes couvrent des situations différentes.
• La dynamique des données sera modélisée dans l’espace latent et non dans l’espace des observations. Le processus sera modélisé comme la prévision de séries multiples d’un processus spatial. Suivant les problèmes, les dépendances spatiales peuvent être fournies explicitement dans un espace physique par le problème (comme souvent en mobilité urbaine) ou inférées dans un espace latent à partir des données (cas des données socia
Doctorant.e: Pajot Arthur, Benjamin