Projet de recherche doctoral numero :6291

Description

Date depot: 12 septembre 2019
Titre: Espace latent & données hétérogènes: apprentissage, exploitation et intégration de contraintes pour le raisonnement
Directeur de thèse: Patrick GALLINARI (ISIR (EDITE))
Directeur de thèse: Vincent GUIGUE (ISIR (EDITE))
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Intelligence artificielle

Resumé: Les techniques de machine learning reposant sur des variables latentes sont nombreuses et permettent d’attaquer divers proble ́matiques. Les re ́seaux de neurones utilisent des architectures de plus en plus pro- fondes, impliquant nombre de variables cache ́es sur des donne ́es de type signal [9], image [5] ou texte [4]. Des techniques re ́centes ont montre ́ qu’il e ́tait possible de raisonner en effectuant des ope ́rations directe- ment dans l’espace latent. Certaines ope ́rations fonctionnent directement dans un espace se ́mantique appris sur une base de textes [8], d’autres sont explicitement apprises sur des bases de connaissances [1, 10]. Dans les re ́fe ́rences pre ́ce ́dentes, l’espace latent est appris pour mode ́liser la langue (les enchainements de mots) ou pour raisonner sur des triplets. L’enrichissement des espaces latents est un challenge qui impacte plusieurs domaines applicatifs : en recommandation, il est par exemple possible d’enrichir les profils des utilisateurs et/ou des items en utilisant les informations textuelles [6]. La notion de temps permet aussi d’inte ́grer les phe ́nome`nes de mode et l’e ́volution des profils utilisateurs [2, 7]. En matching de profils, nous avons de ́ja` travaille ́ sur le couplage entre CV et offres d’emplois [3]. L’enjeu sera d’agre ́ger efficacement diffe ́rentes sources d’information potentiellement he ́te ́roge`nes pour ame ́liorer les performances d’une application cible.

Doctorant.e: Gainon Clara