Description
Date depot: 10 juillet 2019
Titre: Combiner extraction d’information multilingue et sémantique pour comprendre et enrichir des programmes TV Titre
Directeur de thèse:
Bernard MERIALDO (Eurecom)
Encadrant :
Raphael TRONCY (Eurecom)
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Non defini
Resumé:
L'objectif de cette thèse est de développer de nouvelles méthodes pour automatiser l’annotation sémantique, la compréhension et l’enrichissement de programmes TV. Pour remplir cet objectif, cette thèse se propose d’améliorer notre compréhension scientifique quant à l’analyse automatique de documents textuels multilingues (typiquement, des sous-titres) et de leur enrichissement sémantique en utilisant des bases de connaissances et d’autres ressources disponibles sur le web.
Cette thèse visera en particulier à résoudre les problèmes suivants :
conceptualiser les ontologies nécessaires pour décrire des documents audiovisuels; développer un système intelligent qui permet d’extraire automatiquement certaines informations dans du texte et de les enrichir avec des bases de connaissances en faisant appel à des techniques d’apprentissage profond; étudier le rôle des plongements lexicaux multilingues ainsi que les techniques de transfert d’apprentissage pour l’extraction d’information dans plusieurs langues; développer de nouveaux algorithmes de recommandation qui permettront d’enrichir des extraits de programmes audiovisuels en se basant sur la similarité de contenu, sur de la connaissance générale de contexte mais aussi sur la viralité de ces contenus dès lors qu’ils sont partagés sur les réseaux sociaux.
Doctorant.e: Harrando Ismail