Projet de recherche doctoral numero :3756

Description

Date depot: 1 janvier 1900
Titre: Représentations d'images complexes pour la classification
Directeur de thèse: Matthieu CORD (ISIR (EDITE))
Directeur de thèse: Nicolas THOME (ISIR (EDITE))
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Non defini

Resumé: Extraire des représentations adéquates des données visuelles est une étape critique pour l'analyse sémantique des images. Pour des taches de catégorisation de scènes ou d'objets, les méthodes de l'état de l'art reposent sur des travaux issues de l'indexation textuelle s'appuyant sur le formalisme «Bag of Words » (BoW, sac de mots). Différentes extensions et alternatives à la méthode BoW ont été développées. Elles concernent d'une part des travaux sur la mise en place de représentations plus fines pour encoder un ensemble de descripteurs locaux sur un dictionnaire visuel [NEC ECCV 2011]. D'autre part, d'autres travaux reposent sur la définition de mesures de similarité directement calculées sur les descripteurs locaux, qui permettent d'éviter l'approximation issue du calcul d'un dictionnaire. De nombreuses fonctions de similarité utilisant des fonctions noyaux ont été proposées récemment dans ce contexte. Les « Fisher kernels » offrent aujourd’hui les meilleurs résultats de l’état de l’art en classification sur de nombreuses bases d’images très difficiles [Perronnin CVPR2011]. L'équipe MALIRE a développé de nombreuses méthodes de représentation d’images avec apprentissage [Cord CVIU08]. En particulier, nous avons proposé des fonctions noyaux pour traiter des problèmes de classification et d’indexation d’images et de vidéos [Goss CIVR07, Zhao MTAP10].

Doctorant.e: Engilberge Martin