MyEDB

Description

Date depot: 7 février 2020
Titre: Apprentissage par renforcement en ligne dans les environnements non-stationnaires
Directeur de thèse: Sylvain LAMPRIER (LERIA)
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Intelligence artificielle

Resumé: Les applications de l’apprentissage par renforcement interviennent dans un monde large- ment non-stationnaire (e.g capteurs imparfaits, conditions météoroligiques changeantes, présence d’autres agents aux multiples comportements, etc.). Il est donc nécessaire d’apprendre des poli- tiques capables de s’adapter aux changements de dynamique de l’environnement. Cependant, les algorithmes classiques font l’hypothèse de stationnarité, et ne sont donc pas adaptés pour traiter ce type de problème. Les principales méthodes ont été développéees dans le cadre des bandits manchots et très peu de travaux ne permettent le traitement de problèmes à grande échelle (espace d’actions et d’états continus, en grande dimension). La thèse s’intéresse donc à l’étude de nouveaux modèles profonds capable de détecter les changements de dynamique de l’environnement et de s’y adapter rapidement.

Doctorant.e: Kamienny Pierre-Alexandre

Projet de recherche doctoral numero :6788

Description