Description
Date depot: 6 juillet 2021
Titre: Réseaux de neurones pré-entrainés pour l’analyse de séries temporelles dans le domaine de l’énergie
Directeur de thèse:
Vincent GUIGUE (ISIR (EDITE))
Encadrant :
Nicolas BASKIOTIS (ISIR (EDITE))
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Intelligence artificielle
Resumé: Dans cette thèse, nous étudierons la construction de modèles pré-entrainés de deep learning pour un apprentissage sur des bases de séries temporelles. Nous étudierons ensuite les conditions de transférabilité de ces modèles et les gains de ce transfert à d’autres tâches.
La première partie de ce travail sera consacrée à un ’état de l’art sur les architectures de réseaux de neurones pré-entrainés sur des séries temporelles univariées ou multivariées, et à l’appropriation des représentations des séries temporelles. En effet, il s’agira dans un premier temps de proposer des représentations de séries temporelles suffisamment « générales » pour convenir à la diversité des données temporelles EDF ,aussi bien sur la forme des données que sur leur granularité temporelle.
La deuxième partie de ce travail portera sur la construction des architectures de modèles pré-entrainés deep learning innovantes et optimales et leur entrainement sur les séries temporelles. Une approche automatique sera envisagée pour le choix des hyper-paramètres (learning rate, nombre d’epochs, nombre de couches, fonctions d’activation, etc.). De plus, en préparation au transfert, les questions de l’identification des modules réutilisables, la définition de conditions théoriques de transférabilité ainsi que des bornes pour la dégradation des performances seront étudiées. La question de la prise en compte de séries temporelles multivariées sera également étudiée, dans le but de capturer et réutiliser la corrélation entre les différentes dimensions des séries temporelles.
La troisième partie de ce travail consistera à transférer les réseaux/modèles construits et entrainés aux phases précédentes sur au minimum deux problématiques métiers EDF liées au traitement des séries temporelles. Ces deux problématiques seront choisies en lien avec les activités du département parmi les grandes familles de tâches pré-identifiées pour le traitement des séries temporelles à EDF à savoir la classification, la régression, la détection d’anomalie. Pour cela, les données de consommation électrique des habitations et des bâtiments ainsi que celles de capteurs dans les usines du Groupe EDF seraient exploitées pour les expérimentations. Les performances du transfert seront évaluées et comparées à l’état de l’art bibliographique mais aussi interne EDF afin de valoriser les apports de cette thèse.
Doctorant.e: Le Naour Etienne