Projet de recherche doctoral numero :6396

Description

Date depot: 3 octobre 2019
Titre: Conception de modèles d'apprentissage profond pour objets connectés
Directeur de thèse: Hichem SAHBI (LIP6)
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Non defini

Resumé: Les machines sont actuellement capables de comprendre et interpréter des scènes visuelles avec des performances, en termes de précision, proches à celles des humains. Par exemple, de nouvelles approches sont même sur le point de décrire parfaitement ce qui se passe devant une caméra en traduisant une activité en langage naturel. Ce grand progrès est dû principalement à l’émergence du domaine de l’apprentissage profond (Deep Learning DL) qui a permis de révolutionner les méthodes classiques de l’apprentissage par ordinateur (Machine Learning ML). L’apprentissage profond a permis récemment de faire ses preuves dans pas mal d’applications : sécurité, vision par ordinateur, traitement du langage etc. Par ailleurs, les travaux de modélisation s’appuient quasi tous sur des réseaux de neurones convolutifs avec des millions, voire des milliards de paramètres. Par exemple, Krizhevsky et al. ont obtenu des résultats intéressants dans le challenge ImageNet 2012 en utilisant un réseau contenant 60 millions de paramètres. Généralement, l’apprentissage de ces modèles nécessite des jours voire des semaines. L’utilisation des GPUs à très haute capacité de calcul joue un rôle crucial dans leur succès. Après la publication d’AlexNet, la tendance générale pour la conception des réseaux de neurones est de multiplier les couches intermédiaires afin d’avoir une meilleure performance. Cependant, cette technique a ses limites et est dans pas mal de cas inutile et non justifiée. En effet, les réseaux de neurones profonds sont très consommateurs en temps et en mémoire. Pour les produits type 'embarqué', les méthodes de vision artificielle doivent s’exécuter le plus rapidement possible avec des ressources de calcul limitées; pour des applications sous contraintes dans des produits – qui embarquent des algorithmes de réseaux profonds comme les objets connectés où le critère d’exécution en temps-réel est primordial – nous souhaitons ainsi obtenir le meilleur compromis qualité/temps de calcul. Ce compromis représente une fonction où le facteur d’accélération est inversement proportionnel aux performances de prédiction.





Doctorant.e: Dupont Robin