Description
Date depot: 7 février 2020
Titre: Apprentissage par renforcement en ligne dans les environnements non-stationnaires
Directeur de thèse:
Sylvain LAMPRIER (LERIA)
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Intelligence artificielle
Resumé:
Les applications de l’apprentissage par renforcement interviennent dans un monde large-
ment non-stationnaire (e.g capteurs imparfaits, conditions météoroligiques changeantes, présence
d’autres agents aux multiples comportements, etc.). Il est donc nécessaire d’apprendre des poli-
tiques capables de s’adapter aux changements de dynamique de l’environnement. Cependant,
les algorithmes classiques font l’hypothèse de stationnarité, et ne sont donc pas adaptés pour
traiter ce type de problème. Les principales méthodes ont été développéees dans le cadre des
bandits manchots et très peu de travaux ne permettent le traitement de problèmes à grande
échelle (espace d’actions et d’états continus, en grande dimension). La thèse s’intéresse donc
à l’étude de nouveaux modèles profonds capable de détecter les changements de dynamique de
l’environnement et de s’y adapter rapidement.
Doctorant.e: Kamienny Pierre-Alexandre