Description
Date depot: 1 janvier 1900
Titre: Prédiction de l'occurrence d'une baisse de prix pour le conseil à l'achat d'un billet en ligne
Directeur de thèse:
Francois ROUEFF (LTCI (EDMH))
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Non defini
Resumé:
Le projet de thèse émane d'une problématique appliquée, provenant du monde
du voyage et plus particulièrement de l’achat de voyages sur Internet, que nous
proposons d'aborder au moyen de méthodes mathématiques et algorithmiques
issues de la théorie de l'apprentissage statistique et de la modélisation
stochastique des séries temporelles.
Contexte. Les compagnies aériennes au premier chef, suivies par l'ensemble des
professionnels du tourisme (compagnies ferroviaires, hôteliers, etc.) ont
généralisé les politiques de ‘yield management’ afin d'optimiser le prix d'une
prestation en fonction de leur niveau d'inventaire et de la date de réservation. Il
en résulte une opacité totale dans le processus de formation des prix, qui, pour
un même billet et aux mêmes dates, peuvent varier très fortement (i) d'un
fournisseur à un autre, et (ii) d'un moment à l'autre. Le consommateur est
maintenu dans l'ignorance et l'incertitude, parfois encouragé à réserver le plus
longtemps à l'avance, parfois exhorté à réserver sur un coup de tête à la
dernière minute pour bénéficier d'offres présentées comme dégriffées.
Données et résultats attendus. La société « Liligo.com » dispose d'une base
historique de prix de voyages proposés sur les sites de référence d'e-commerce
de tourisme. Cette base de données peut servir à élaborer des modèles
d'évolution de ces prix, afin d'anticiper leur tendance (à la hausse ou à la
baisse). De plus, par ses activités de moteur de recherche et de comparateur de
prix, Liligo.com collecte en temps réel et conserve les prix des voyages, offrant
l’opportunité de fournir un service d'aide à la décision d'achat pour ses clients,
fondé sur le modèle prédictif.
Dans le cadre de l'application décrite, les méthodes de prédiction existantes
reposent essentiellement sur des approches de type « data-mining »,
n’exploitant pas la temporalité des séries de prix et n’utilisant qu’un résumé
simpliste des données (moyennes temporelles brutes). Par contraste, nous
proposons dans ce projet de mettre en oeuvre des méthodes de type machine-
learning en tenant compte de la nature/complexité des données d’entrée dans le
contexte présent.
Les méthodes d'apprentissage statistique dites ‘supervisées’ sont désormais très
utilisées dans des domaines tels que la reconnaissance de formes, la
catégorisation de textes ou encore la vision assistée par ordinateur : à partir de
l'observation passée, elles permettent de construire des règles de décision à
vocation prédictive. Les méthodes classiques d’apprentissage pour la
prédiction (régression/classification) ont généralement été élaborées dans des
contextes où les données d’entrée sont indépendantes et identiquement
distribuées. Or, elles prennent ici la forme d’un historique de série temporelle et
présentent donc une structure de dépendance essentielle (forte auto-corrélation)
. L’approche envisagée repose sur une modélisation statistique préalable de la
dynamique des séries temporelles de prix, fondée sur la théorie des processus
ponctuels. Les prix observés évoluant « par sauts », la notion de processus
ponctuel, largement utilisée pour la modélisation des « files d’attente » en
recherche opérationnelle est adaptée à la représentation des données
d’entrée (prédicteurs). La combinaison d’une représentation temporelle des
données d’entrée (variables prédictives) et de procédures d’apprentissage
soulève des problèmes à la fois théoriques et pratiques (algorithmiques,
informatiques) que le candidat devra aborder durant la thèse.
Doctorant.e: Wohlfarth Till