Description
Date depot: 1 janvier 1900
Titre: Vidéo protection et nouveaux capteurs 3D
Directeur de thèse:
Jean-Luc DUGELAY (Eurecom)
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Non defini
Resumé:
On a pu constater un regain d’intérêt extraordinaire pour le cinéma 3D, la télévision en relief (3DTV), la stéréovision et les applications multi-vues. C’est vrai au niveau de la production au cinéma (cf. le film Avatar) mais aussi au niveau des technologies d’acquisitions et restitutions (avec ou sans lunettes; pour les télévisons ou même les téléphones mobiles). Il faut également mentionner ici les nouvelles caméras ToF (Time of Flight) et surtout le phénomène autour du capteur Primesense (i.e. Kinect) qui délivre à bas coût des informations 3D sur la scène filmée. Huit millions de capteurs Kinect (Infrared Structured Light) ont été vendus en deux mois seulement.
La vidéosurveillance (par ailleurs également en pleine croissance depuis plusieurs années) suit toujours, certes avec un temps de retard important, les progrès technologiques. Lorsque l’on visite un centre de vidéosurveillance comme celui qui existe à Cannes, on peut mesurer la distance parcourue entre les équipements d’aujourd’hui et les premiers systèmes « noir et blanc » où l’on pouvait à peine reconnaître les personnes, même proches. On peut donc assurément prévoir que dans quelques années la technologie 3D, multi-vues notamment, arrivera également dans ce secteur. Plusieurs questions se posent alors immédiatement :
• Quelles technologies 3D seront adaptées à la vidéosurveillance, en termes d’acquisition, transmission et visualisation ?
• Quelles nouvelles fonctionnalités peut-on imaginer et mettre au point en termes de traitement d’images en utilisant ces nouvelles technologies (nouveaux algorithmes, algorithmes plus rapides, performants, complets : nouvelles mesures automatiques, etc.) ?
• A quels usages se prête cette technologie en matière de sécurité des personnes et des biens ?
Dans cette thèse, nous nous intéresserons plus particulièrement aux problèmes classiques mais encore non entièrement résolus dans le cadre d’une acquisition standard et ce malgré les nombreux travaux existants, à savoir:
- Détection du fond et des changements ;
- Suivi d’objets ;
- Classification et identifications d’objets ou de personnes ;
- Classification d’activités et de comportements ;
- Analyse de foule.
Lors de la première année, nous nous attacherons à travailler sur le problème de l’estimation de la taille des objets. A ce jour, les systèmes automatiques ont beaucoup de difficultés à différencier une valise abandonnée d’un journal laissé au sol. Egalement, l’estimation du nombre de personnes dans une foule ou dans une vidéo est un problème intéressant.
Même si actuellement le capteur le plus intéressant semble Kinect, il sera intéressant de comparer divers capteurs par rapport à différentes applications.
Lors de la seconde année, nous aborderons les problèmes de suivi de personnes lorsque ces dernières se croissent par exemple.
En d’autres termes, nous chercherons à répondre aux deux questions suivantes :
(i) Quels systèmes d’acquisition délivreront des informations 3D utiles à la vidéo protection ?
(ii) Quels traitements des données vidéo 3D apporteront un plus significatif en vidéosurveillance par rapport à l’état de l’art?
Un objectif sera aussi de comprendre en quoi de meilleurs capteurs, une meilleure compréhension de la scène peut aussi aider à améliorer la protection de la vie privée des personnes.
Ce travail sera en partie réalisé dans le cadre d’un nouveau projet NoE Européen VideoSence (début prévu en Mai 2011).
Doctorant.e: Fradi Hajer