Projet de recherche doctoral numero :8179

Description

Date depot: 6 juillet 2021
Titre: Apprentissage par Renforcement Robuste
Directeur de thèse: Sylvain LAMPRIER (LERIA)
Encadrant : Hatem HAJRI (IRT System-X)
Domaine scientifique: Sciences pour l'ingénieur
Thématique CNRS : Intelligence artificielle

Resumé: L'apprentissage par renforcement (RL) est un ensemble de méthodes permettant l’apprentissage automatique de systèmes de décisions autonomes utilisant des réseaux de neurones à partir d’un environnement dans lequel un agent fait des observations, prend des décisions et reçoit des récompenses ou des pénalités. Le RL est utilisé dans plusieurs domaines industriels comme la conduite autonome, l’automatisation, la robotique, le traitement des langues etc. Les agents issus du RL peuvent être extrêmement performants dans les conditions dans lesquelles ils ont appris, mais une problématique importante aujourd’hui lié au RL est de réussir à obtenir des agents robustes et résistants à des perturbations dans les observations et dans l’environnement. Les techniques de défense et d’entrainement robuste bien que très récentes commencent à être adoptées en apprentissage par renforcement. En effet, les techniques d’entrainement adverse ont été appliquées, et il a été montré empiriquement que cela permet d’augmenter la robustesse des agents. Malgré ces premiers travaux, l’application de techniques de Défense certifiable et Lissage aléatoire sont loin d’être entièrement explorées en RL. L’objectif de la thèse proposée sera d’appliquer ces méthodes afin d’améliorer la robustesse des agents appris. On traitera le problème de la robustesse des techniques de RL dans deux cadres applicatifs bien différents, mais avec de nombreuses applications industrielles : 1) la navigation et le contrôle 2) le traitement et la génération de langue (NLP).

Résumé dans une autre langue: X



Doctorant.e: Schott Lucas