Description
Date depot: 3 octobre 2019
Titre: Réseaux de neurones profonds pour la reconnaissance d’instances visuelles d’objets dans un contexte adaptatif
Directeur de thèse:
Hichem SAHBI (LIP6)
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Non defini
Resumé:
L’intelligence artificielle (IA) a connu ces dernières années un grand succès dans plusieurs domaines d’applications comme la vision par ordinateur, le traitement automatique des langues, la reconnaissance de la parole et l’analyse sémantique des contenus. Cependant, la commercialisation de ces solutions nécessite de franchir un gap important qui consiste à adapter ces méthodes à des cas d’usages spécifiques et bien centrés sur les utilisateurs humains. Pour un usage industriel, il est difficile d’anticiper toutes les utilisations potentielles pour un système de reconnaissance visuelle. Les solutions d’intelligence artificielle existantes, basées sur des apprentissages, sont souvent sous-dimensionnées en terme de nombre d’objets possibles ; plus précisément, la reconnaissance d’instances visuelles d’objets nécessite une actualisation permanente et quasi-quotidienne des données et des modèles d’apprentissage ce qui est laborieux et onéreux (e.g., lors de la phrase d’enrôlement d’une nouvelle identité en reconnaissance faciale ou l’ajout d’un nouveau produit dans un magasin avec télé-paiement visuel, etc.). Une autre contrainte à considérer est de pouvoir corriger de façon active les erreurs de détections et de reconnaissances; il y a encore très peu de recherches dans cette direction même si la problématique est importante pour des cas d’usages centrés sur des utilisateurs humains. Enfin, le déploiement de façon industrielle des solutions d’apprentissage automatique (et notamment celles basées sur les modèles profonds) nécessite de traiter la question fondamentale liée à la taille et la rapidité d’exécution de ces modèles.
Doctorant.e: Zhan Haoming