Projet de recherche doctoral numero :3835

Description

Date depot: 1 janvier 1900
Titre: Classification et détection de figures chartistes par apprentissage statistique
Directeur de thèse: Thierry ARTIÈRES (LIS)
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Non defini

Resumé: Cette thèse porte sur l'analyse de cours financiers et plus particulièrement sur la reconnaissance de figures chartistes qui sont des motifs possédant un potentiel prédictif. Bien que leur définition obéisse à des règles théoriques précises, leur détection pose problème. L’écart entre la théorie et la pratique est importante ; les figures réelles ne respectent pas parfaitement les règles théoriques. La définition des figures semble subjective et dépendre de l’expert financier. Enfin il n’existe pas de corpus de données étiquetées. Nous avons étudié la classification et la détection de ces figures à l’aide de systèmes statistiques markoviens génératifs (HMMs) et discriminants (CRFs et Hidden CRFs) qui sont des technologies de référence pour le traitement de séquences. Nous avons proposé plusieurs stratégies pour apprendre de façon robuste ces systèmes avec peu de données étiquetées. La première est une hybridation des HMMs et des HCRFs reposant sur l’idée d’exploiter les capacités de modélisation des HMMs afin de limiter le sur-apprentissage des modèles discriminants (HCRFs). La seconde est une approche semi-supervisée qui emprunte au co-training l’idée de l’apprentissage conjoint de deux systèmes, l’un génératif, l’autre discriminant. Afin de concevoir des systèmes de détection performants et adaptés à chaque expert, nous avons conçu un système à deux niveaux dans lequel des motifs d'un cours sont pré-sélectionnés par des HMMs puis confirmés ou infirmés par une SVM opérant sur une description enrichie des motifs. Le modèle SVM est appris par une stratégie d’apprentissage actif pour personnaliser le système à un expert particulier.

Doctorant.e: Soullard Yann