Projet de recherche doctoral numero :2897

Description

Date depot: 1 janvier 1900
Titre: Détection d'evenements rares dans les données hautes fréquences et applications au trading algorithmique
Directeur de thèse: Eric MOULINES (CMAP)
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Non defini

Resumé: Les 30 dernières années ont vu deux bouleversements modifier le fonctionnement des marchés de capitaux : l’apparition des marchés électroniques, et celle des produits dérivés. Ces deux changements fondamentaux ont donné un véritable coup de fouet à la modélisation, au sens physique, statistique et mathématique, des marchés financiers. Cette modélisation est au cœur même de certaines activités, telles que l’arbitrage statistique et la gestion des produits dérivés exotiques. Il faut noter que la première tentative de modélisation du marché – traditionnellement attribuée à Gaston Bachelier dans sa Théorie de la spéculation – date de 1900, contemporaine en cela de la mathématisation par Einstein et Smoluchowsky du mouvement des particules de pollen dans un liquide, le fameux « mouvement brownien ». Depuis cette époque, des expériences multiples sur la masse de données disponibles ont contredit les hypothèses simplificatrices de cette modélisation. Plusieurs modèles alternatifs sont apparus, sans qu’aucun ne puisse, pour l’instant, prétendre à l’universalité, et la recherche dans cette direction abonde en problèmes ouverts présentant de l’intérêt sur un plan scientifique aussi bien que financier. Fruit de nombreux efforts scientifiques et empiriques, et encore largement incomplète, la modélisation sert à prédire – dans un sens probabiliste - les évolutions à court, moyen, voire long terme des mouvements d’un actif de marché : c’est l’instrument de base de ce que l’on appelle l’arbitrage statistique. Elle sert aussi - et c’est là une des spécificités du marché des dérivés - à prévoir l’ensemble des coûts futurs de réplication qui seront à la charge d’une institution financière lorsqu’une transaction optionnelle a été conclue. Les évolutions de la modélisation en Finance Quantitative suivent deux directions principales : mieux décrire le comportement des marchés sous-jacents dans le respect de la Physique des données adapter, au besoin fabriquer, les concepts mathématiques et les outils de simulation numérique nécessaires pour comprendre et mesurer l’impact des modèles sur les activités de marché. Dans le cadre général évoqué ci-dessus, et qui s’inscrit dans la discipline désignée depuis quelques années sous le nom d’Éconophysique, les données constituent un champ d’expérimentation naturel pour tester des vues théoriques sur le fonctionnement des marchés de capitaux. Un des défis à relever pour perfectionner les modèles mathématiques utilisés dans le cadre des stratégies de trading algorithmique est de savoir utiliser les données disponibles pour valider, modifier, rejeter aussi certaines hypothèses qui sous-tendent les modèles. Dans le cadre de sa thèse, le candidat retenu aura pour première mission de développer et valider des algorithmes de détection de sauts sur des données haute fréquence. Dans un deuxième temps, ces méthodes et algorithmes seront utilisés pour mettre en place des stratégies d’arbitrage statistique reposant sur la connaissance d’« événements rares ». Il est nécessaire de préciser tout d’abord ce que l’on entend par « sauts » dans des données hautes fréquence : par nature, ces données changeant de manière discrète aussi bien en temps (intervalle entre deux événements dans le carnet d’ordre) qu’en espace (taille du tick), il est nécessaire de spécifier l’objectif. Une première approche serait, utilisant par exemple les travaux de (Aït-Sahalia & Jacod, Estimating the degree of activity of jumps in high-frequency data, 2009), (Aït-Sahalia & Jacod, Testing for jumps in a discretely observed process, 2009), (Barndorf-Nielsen & Shephard, 2006) de supposer l’existence d’un processus à temps continu sous-jacent, qui serait échantillonné à des intervalles aléatoires et discrets. Cette méthode présente l’avantage d’une modélisation mathématique déjà bien établie, mais nous semble aller à l’encontre d’intuitions élémentaires sur le fonctionnement des marchés : de fait, il est bien connu maintenant que le processus de changement de prix est décrit, au premier ordre, par le processus d’arrivée des ordres au marché et, au second ordre, par le profil du carnet d’ordre, voir par exemple (Smith, Farmer, Gillemot, & Krishnamurthy, 2003), (Chakraborti, Muni-Toke, Patriarca, & Abergel, 2009). En particulier, l’existence de sauts est intimement liée à la présence de « trous » (gap) dans le carnet, ainsi qu’à l’arrivée massive d’ordres au marché quasiment synchrones. Nous choisirons donc plutôt d’étudier et de modéliser certaines grandeurs fondamentales du profil du carnet d’ordre afin de caractériser les propriétés statistiques des trade through et autres événements rares. Le candidat s’attachera dans un premier temps à étudier de manière systématique les propriétés statistiques ayant trait à la détection des événements rares. Dans un deuxième temps, il candidat s’intéressera à des stratégies d’arbitrage statistique portant sur l’identification des processus de sauts. Il s’attaquera à

Doctorant.e: Zheng Ban