Fiche de PIERROT Thomas

Informations professionnelles


Statut: Docteur ED
ED: EDITE
Unité de recherche: ISIR (EDITE)
Employeur: INSTASDEEP


Date de debut de thèse: 1 novembre 2018
Date soutenance de thèse: 30 septembre 2021
Directeur de thèse: Olivier SIGAUD (ISIR (EDITE))
Sujet de thèse: Advanced Gradient Descent Methods in Deep Reinforcement Learning


Soutenance de thèse

Données générales

Titre : Exploitation des biais inductifs dans l’apprentissage par renforcement profond.
Date : 30 septembre 2021
Heure: 16:00
Résumé : Au cours de la dernière décennie, les technologies d’apprentissage profond et, en particulier, les réseaux neuronaux convolutifs, ont permis des avancées significatives dans le domaine de la vision par ordinateur. Depuis lors, toute une révolution a eu lieu, conduisant à une percée dans de nombreux domaines tels que le repliement des protéines en biologie, la génération d’images ou le traitement du langage naturel. Cette tendance a également profité aux méthodes de prise de décision séquentielle. Cependant, malgré ces récents succès, l’utilisation de l’apprentissage par renforcement profond dans l’industrie reste rare par rapport aux autres techniques d’apprentissage profond. Dans cette thèse, nous étudions l'exploitation de bias inductifs pour tenter de remédier à certaines faiblesses des approches actuelle d’apprentissage par renforcement profond afin de rendre plus fréquente leur utilisation dans des applications concrètes.
Lieu : Pyramide - T55, 4 Place Jussieu 65, 75005 Paris

Rapporteurs/ Rapporteuses

Personne Qualité Etablissement
M. Filliat David Professeur des universités Unité d'Informatique et d'Ingénierie des Systèmes
M. Pietquin Olivier Professeur des universités Google

Composition du jury

Personne Qualité Etablissement
M. Filliat David Professeur des universités Unité d'Informatique et d'Ingénierie des Systèmes
M. Pietquin Olivier Professeur des universités Google
Mme. Hamrick Jessica Industrielle , Royaume-Uni
M. Konidaris George Professeur des universités Department of Computer Sc., Brown University, Providence RI (États-Unis)
M. Beguir Karim Industriel , Royaume-Uni
M. Sigaud Olivier Professeur des universités Institut des Systèmes Intelligents et de Robotique, Sorbonne Université
M. Perrin Nicolas Chargé de recherche Institut des Systèmes Intelligents et de Robotique, Sorbonne Université