Projet de recherche doctoral numero :2780

Description

Date depot: 1 janvier 1900
Titre: Prédiction de l'occurrence d'une baisse de prix pour le conseil à l'achat d'un billet en ligne
Directeur de thèse: Francois ROUEFF (LTCI (EDMH))
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Non defini

Resumé: Le projet de thèse émane d'une problématique appliquée, provenant du monde du voyage et plus particulièrement de l’achat de voyages sur Internet, que nous proposons d'aborder au moyen de méthodes mathématiques et algorithmiques issues de la théorie de l'apprentissage statistique et de la modélisation stochastique des séries temporelles. Contexte. Les compagnies aériennes au premier chef, suivies par l'ensemble des professionnels du tourisme (compagnies ferroviaires, hôteliers, etc.) ont généralisé les politiques de ‘yield management’ afin d'optimiser le prix d'une prestation en fonction de leur niveau d'inventaire et de la date de réservation. Il en résulte une opacité totale dans le processus de formation des prix, qui, pour un même billet et aux mêmes dates, peuvent varier très fortement (i) d'un fournisseur à un autre, et (ii) d'un moment à l'autre. Le consommateur est maintenu dans l'ignorance et l'incertitude, parfois encouragé à réserver le plus longtemps à l'avance, parfois exhorté à réserver sur un coup de tête à la dernière minute pour bénéficier d'offres présentées comme dégriffées. Données et résultats attendus. La société « Liligo.com » dispose d'une base historique de prix de voyages proposés sur les sites de référence d'e-commerce de tourisme. Cette base de données peut servir à élaborer des modèles d'évolution de ces prix, afin d'anticiper leur tendance (à la hausse ou à la baisse). De plus, par ses activités de moteur de recherche et de comparateur de prix, Liligo.com collecte en temps réel et conserve les prix des voyages, offrant l’opportunité de fournir un service d'aide à la décision d'achat pour ses clients, fondé sur le modèle prédictif. Dans le cadre de l'application décrite, les méthodes de prédiction existantes reposent essentiellement sur des approches de type « data-mining », n’exploitant pas la temporalité des séries de prix et n’utilisant qu’un résumé simpliste des données (moyennes temporelles brutes). Par contraste, nous proposons dans ce projet de mettre en oeuvre des méthodes de type machine- learning en tenant compte de la nature/complexité des données d’entrée dans le contexte présent. Les méthodes d'apprentissage statistique dites ‘supervisées’ sont désormais très utilisées dans des domaines tels que la reconnaissance de formes, la catégorisation de textes ou encore la vision assistée par ordinateur : à partir de l'observation passée, elles permettent de construire des règles de décision à vocation prédictive. Les méthodes classiques d’apprentissage pour la prédiction (régression/classification) ont généralement été élaborées dans des contextes où les données d’entrée sont indépendantes et identiquement distribuées. Or, elles prennent ici la forme d’un historique de série temporelle et présentent donc une structure de dépendance essentielle (forte auto-corrélation) . L’approche envisagée repose sur une modélisation statistique préalable de la dynamique des séries temporelles de prix, fondée sur la théorie des processus ponctuels. Les prix observés évoluant « par sauts », la notion de processus ponctuel, largement utilisée pour la modélisation des « files d’attente » en recherche opérationnelle est adaptée à la représentation des données d’entrée (prédicteurs). La combinaison d’une représentation temporelle des données d’entrée (variables prédictives) et de procédures d’apprentissage soulève des problèmes à la fois théoriques et pratiques (algorithmiques, informatiques) que le candidat devra aborder durant la thèse.

Doctorant.e: Wohlfarth Till