Description
Date depot: 1 octobre 2020
Titre: Edition d’images avec des réseaux de neurones profonds
Directeur de thèse:
Matthieu CORD (ISIR (EDITE))
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Intelligence artificielle
Resumé:
Des progrès remarquables ont été réalisés pour la vision numérique ces dernières années, essentiellement grâce aux réseaux de neurones profonds. En effet, si en 2011 le taux d’erreur pour la classification d’image du ImageNet Challenge était de 26%, on a aujourd’hui réussi à atteindre les 5% de taux d’erreur avec les réseaux profonds, ce qui est mieux que le taux d’erreur humain. Les autres domaines de la vision numérique, tant la segmentation que l’inpainting, la génération, etc ont également vu de grands progrès avec le deep learning. Dans le cadre de l’édition automatique de l’image, les acteurs industriels ont investi dans ces techniques d’intelligence artificielle afin d’alléger le temps nécessaire aux photographes pour obtenir une belle image, ce qui permet d’avoir des photos avant et après édition. Plusieurs centaines de shootings sont traités tous les jours, donnant des bases de données étiquetée de taille considérable de transformations d’images. Aujourd’hui, l’application principale de l’édition automatique dans la photographie professionnelle consiste en l’amélioration des tonalités et des contrastes, tandis que les tâches plus compliquées comme la suppression ou l’ajout d’objets reste manuelle en post-production. Nous voudrions améliorer cette partie d’édition compliquée d’image.
Dans cette thèse, notre principal objectif est de proposer de nouveaux schémas d’apprentissage de systèmes de vision dans le contexte de l’édition automatique d’image.
Doctorant.e: Grechka Asya