Projet de recherche doctoral numero :3693

Description

Date depot: 1 janvier 1900
Titre: Codage vidéo perceptuel pour un système de vidéoconférence bas débit
Directeur de thèse: Marco CAGNAZZO (LTCI (EDMH))
Directrice de thèse: Beatrice PESQUET-POPESCU (LTCI (EDMH))
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Non defini

Resumé: L'objectif du programme de recherche est de contribuer au développement de la première solution de visioconférence sur la télévision, utilisant une définition HD et une image taille réelle du visage humain, diffusant sur le réseau domestique internet haut débit en France. Egalement la solution recherchée doit permettre simultanément au moins deux sources vidéo en diffusion : une caméra intégrée à la télévision et une caméra manuelle sans fil, que l'utilisateur peut emmener, déplacer, pointer sur des objets (plus tard d’autres caméras pourront être placées dans certaines pièces de la maison ou à l'extérieur afin que tout membre de la famille y ait accès à distance). On comprend que le débit alloué à la caméra principale doit être partagé avec la caméra manuelle lorsque celle-ci est activée. Il s'agit de gérer automatiquement 2 flux indépendants sur une contrainte constante de débit. Des logiciels tels que Skype proposent aujourd'hui des visioconférences haut-débit entre plusieurs utilisateurs. Skype recommande une connexion Internet haut débit de 1,1 Mbps minimum (en débit continu) pour effectuer des appels vidéo HD 720p sur PC ou télévision. Skype ne permet pas de gérer une caméra mobile additionnelle. Skype n’est pas une solution qui privilégie le confort visuel et les émotions transmises dans sa stratégie de compression et diffusion, de plus son utilisation nécessite une bonne maitrise de la micro-informatique. (Installation, configuration, identification par user/login). En considérant que le débit moyen montant « haut débit » chez Orange est de 560 kbps, il apparaît qu'établir une visioconférence en très haut débit (au moins 1,1 Mbps) est problématique. Ce dernier point nous amène à privilégier en priorité les expressions et les émotions retransmises et ressenties (notamment celle du visage) afin de pallier la faible bande passante. Résultats attendus Une solution de visioconférence permettant de : - Garantir un confort visuel capable de faire passer un niveau d’émotion ressentie proche d’une expérience réelle. - Diffuser une vidéo haute définition (HD) dans une taille d’image proche de celle du visage humain sur le réseau internet domestique (à moins de 500kb/s). - Gérer de manière dynamique et intelligente l’utilisation simultanée de la caméra principale et d’une caméra mobile tout en gardant un haut niveau de confort visuel et un débit global inférieur à 500kb/s. Les points d'innovation La solution recherchée veut se différencier en utilisant pleinement les capacités visuelles qu'apporte un téléviseur HD, en proposant un confort visuel important : fluidité, vidéo en temps réel, téléprésence (taille du visage à échelle réelle), qualité de résolution (HD 720p, pour le visage au moins), perception des émotions transmises, taux de compression respectant un critère quantitatif. Pour remplir ses objectifs, c'est-à-dire un confort visuel confronté à des hautes contraintes de débit ainsi que l'intégration d'un module de sécurité, le candidat va mener les points de recherche suivants : 1. quantifier le confort visuel d'une vidéo pour des scènes connues de type visioconférences (visage, expression, émotion) pour fixer de manière quantitative les contraintes que doit respecter notre solution de visioconférence (les stratégies d’encodage, les arbitrages de traitement d’image et d’optimisation de la bande passante (notamment avec la caméra mobile)), Pour ce point, il va mener des études concernant : - Les contraintes de débit global pour une solution de visioconférence sur IP - Les contraintes de débit et de qualité sur la zone d’intérêt du visage - Les solutions de transmission avec qualité différenciée d’une zone d’intérêt dans un flux vidéo respectant la syntaxe H.264/AVC - L’état de l’art concernant les mesures de qualité d’une vidéo transmise sur un réseau à pertes 2. concevoir et intégrer des traitements d'image permettant d'assurer un haut niveau de confort visuel et d'émotion transmise et ressentie, Pour ce point, le candidat va mener des études concernant les solutions d’optimisation de la qualité d’une zone d’intérêt dans un encodeur H.264/AVC. Ces solutions passant par une optimisation de l’algorithme d’allocation de débit, les efforts seront concentrés sur la mise en place des solutions efficaces d’allocation de débit. 3. établir un mode de compression capable de diffuser une vidéo en mode HD sur le réseau domestique français de l’internet haut-débit (<500 kb/s), Pour ce point, nous proposons de mener des études concernant l’optimisation de la qualité au décodeur d’un flux bas débit. Une méthode d’interpolation, voire de super-résolution à partir du flux vidéo, sera étudiée. Des algorithmes d’optimisation dans ce contexte sont actuellement à l’étude à TPT. 4. gérer de manière dynamique l’encodage et la diffusion de deux sources vidéo. Les travaux nécessaires sur ce point concernent l’allocation de débit entre deux flux vidéo. Un algorithme d’optimisatio

Doctorant.e: Meddeb Marwa