Projet de recherche doctoral numero :8070

Description

Date depot: 8 mars 2021
Titre: Analyse de mouvement de flux vidéo par apprentissage profond auto-supervisé
Directeur de thèse: Hichem SAHBI (LIP6)
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Non defini

Resumé: Les récents progrès en apprentissage automatique ont permis la construction de systèmes d’analyse d’images robustes notamment grâce à la popularisation des réseaux de neurones profonds. En particulier, l’efficacité de l’apprentissage profond supervisé a suscité un vif intérêt de la part de la communauté de vision par ordinateur pour traiter diverses problématiques: classification d’image, détection d’objets d’intérêt, segmentation... Il requiert cependant une quantité importante de données annotées pour la résolution de chaque nouvelle tâche ou nouvel environnement. Cette thèse s’intéresse à une alternative émergente à l’apprentissage supervisé qui est l’apprentissage auto-supervisé. L’auto-supervision consiste à exploiter les relations entre les signaux d’entrée pour générer automatiquement les annotations d’apprentissage. Les vidéos sont particulièrement adaptées à cette approche grâce à la richesse de l’information spatio-temporelle qu’elles contiennent et au grand nombre de datasets disponibles. Les tâches auto-supervisées telles que la prédiction de frames futures, la colorisation, la reconstruction, la permutation d’images ou de sous-parties, encouragent indirectement (par ”proxy”) l’apprentissage de caractéristiques à haut niveau sémantique. La tâche de reconstruction photométrique permet en plus de résoudre d’autres tâches sous-jacentes par contraintes géométriques telles que la profondeur monoculaire, l’ego-mouvement et le flot optique.

Doctorant.e: Marsal Rémi