Description
Date depot: 1 janvier 1900
Titre: Analyse d'images à partir de descripteurs spatiaux fondés sur la modélisation des forces d'attractions entre régions
Directeur de thèse:
Laurent WENDLING (LIPADE)
Directeur de thèse:
Camille KURTZ (LIPADE)
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Non defini
Resumé:
Une importante croissance des capacités de stockage, liée à une diversification et une accessibilité accrue des dispositifs d’acquisition, et aux réseaux à large bande, a créé un contexte technologique qui a drastiquement changé les usages de l’information visuelle telle que l’image et la vidéo. Dans de nombreux domaines, les quantités d’images et de vidéos acquises deviennent de plus en plus importantes, formant de véritables masses de données. Face à la grande complexité de ces dernières, les approches automatiques de traitement et d'analyse d'images, purement fondées sur des caractéristiques bas-niveaux extraites du contenu des images, montrent leurs limites et peuvent produire des résultats qui parfois ne sont pas suffisamment pertinents pour les besoins applicatifs de l’utilisateur.
Une approche maintenant communément employée par la communauté scientifique consiste à prendre en compte des descripteurs de formes et les relations spatiales des objets d'intérêt présents dans les images lors du processus d’analyse et de reconnaissance des formes. De nombreuses méthodes de reconnaissance des formes sont fondées sur le calcul de descripteurs de formes sur des régions extraites à partir d’une phase de segmentation. Il existe en particulier des familles d’approches globales qui associent à la forme un vecteur de caractéristiques mais elles ne prennent généralement pas en compte les disparités de cette dernière. Dans le cadre de travaux [2] menés par l'équipe Systèmes Intelligents de Perception (SIP) du LIPADE, de nouvelles catégories axées sur l’aspect structurel et se référant aux primitives décrivant la forme ont été proposées et ont montré des résultats prometteurs sur l'analyse d'images à niveaux de gris. Ceci permet d’intégrer plus facilement l’aspect spatial mais les approches sont souvent sensibles au bruit et requiert des simplifications grossières et/ou une phase d’appariement coûteuse en temps lors de la mise en correspondance.
Dans le contexte de ce projet de thèse de doctorat en Informatique, nous proposons de définir une nouvelle représentation qui combine représentation globale et un mécanisme de description spatiale fondé sur le calcul d’un histogramme de forces [2], entre couples de régions, qui intègre efficacement distance et forces d’attraction dans sa composition. L'originalité de ces travaux consistera notamment à étendre cette approche à l'analyse d'images couleurs et à l'intégration de connaissances sémantiques a priori sur les relations spatiales afin de guider le processus d'analyse d'images vers des résultats plus en attente avec les besoins applicatifs de l'utilisateur.
Programme initial de travail
Le travail demandé se décomposera en plusieurs étapes. Tout d'abord, pour se familiariser avec le sujet et acquérir les compétences requises, une première approche structurelle originale, combinant segmentation par Mean-Shift [3], calcul des relations spatiales et des attributs de forme, sera définie et intégrée dans la plate-forme logiciel de l'équipe SIP. La validation sur différentes bases d'images devrait pouvoir donner lieu à une publication en conférence internationale de premier plan. Parallèlement, le doctorant étudiera les principaux axes de recherche en reconnaissance des formes au sein d'images couleurs par analyse spatiale, le but étant de produire un état de l'art comparatif des approches existantes en vue d'une publication en revue. La suite du travail sera axée sur la proposition de nouvelles méthodologies d'analyse d'images via des descripteurs de formes et de relations spatiales fondés sur la modélisation des forces d’attraction entre régions, puis sur l'évaluation et la comparaison de ces approches sur plusieurs bases d'images. L'étude portera également sur la transcription de ces méthodes sous la forme de patchs circulaires pour aider à la segmentation et à l’évaluation de la densité de régions en lien avec le graphe d'adjacences associé dans des images complexes.
Doctorant.e: Clement Michael