Description
Date depot: 23 novembre 2023
Titre: DÉTECTION D’ANOMALIES CONTEXTUELLES EN UTILISANT DES TECHNIQUES D’INTELLIGENCE ARTIFICIELLE
Directrice de thèse:
Florence ROSSANT (LISITE)
Encadrante :
Yousra CHABCHOUB (LISITE)
Directeur de thèse:
Maurras Ulbricht TOGBE (LISITE)
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Données et connaissances
Resumé: La détection d’anomalies est un sujet d’actualité à la frontière de deux grands domaines de recherche en rapide évolution
à savoir la cybersécurité et l’intelligence artificielle. Plusieurs méthodes de Deep Learning ont été récemment appliquées
à la détection d’anomalie dans de nombreux domaines comme la santé, la détection de fraude, le transport... Ces
approches permettent de détecter des anomalies de plus en plus complexes et avec d’excellents résultats, dépassant les
méthodes traditionnelles. Malgré les grands progrès réalisés dans le domaine de la détection d’anomalies, des défis
restent à relever notamment la prise en compte du contexte dans des systèmes complexes et l’explication des résultats
obtenus.
La détection d’anomalies contextuelles est basée sur l’identification des comportements anormaux ou inhabituels dans
un jeu de données en prenant en compte le contexte. Les anomalies s’écartent de manière significative du comportement
attendu ou normal dans un contexte donné. Le contexte fait référence à différents facteurs, notamment les informations
temporelles (l’heure de la journée, le jour de la semaine), les informations spatiales (la localisation, la proximité
de certains objets, les caractéristiques de l’équipement source des données), le comportement de l’utilisateur (ses
habitudes, les préférences), les conditions environnementales ou toute autre information pertinente qui permet de
mieux comprendre le système dans son ensemble. En incorporant le contexte, l’algorithme de détection d’anomalies
peut mieux différencier les anomalies réelles des variations attendues, appelées aussi concept drift, réduisant ainsi les
faux positifs et améliorant la précision de la détection d’anomalies. Cette approche est particulièrement utile dans les
systèmes complexes où les anomalies dépendent du contexte. Par exemple, dans [Hayes and Capretz, 2015], les auteurs
présentent un framework de détection d’anomalies dans des données de capteurs à grande échelle, en tenant compte des
informations contextuelles. Ils introduisent un processus d’extraction de caractéristiques contextuelles qui exploite des
informations liées aux données des capteurs. La détection d’anomalies contextuelles est utilisée dans plusieurs autres
domaines d’application, tels que la surveillance du trafic vidéo à l’aide de véhicules aériens sans pilote (UAV) [Bozcan
and Kayacan, 2021].
Le contexte peut également être utilisé pour évaluer le niveau de gravité de l’anomalie ou fournir une meilleure
explication et interprétation (Explainability) [Pang and Aggarwal, 2021]. En effet, l’interprétation est une étape cruciale
de la détection des anomalies, car elle aide les analystes à comprendre les raisons derrière les anomalies détectées.
L’Explainability est étroitement liée au concept de Root Cause Analysis abordé dans certaines études comme [Lu et al.,
2017, Wang et al., 2019] et qui a pour but de fournir une explication précise de la cause de l’anomalie. L’Explanable
Anomalies Detection (XAD) est aussi issue de l’Explanable Artificial Intelligence (XAI) [Sejr and Schneider-Kamp,
2021] qui a été récemment appliquée dans plusieurs domaines comme l’internet des objets [Kok et al., 2022], la santé
[Hussain et al., 2022] ou la Cybersécurité [Kuppa and Le-Khac, 2021, Zhang et al., 2022]. C’est donc une problématique
émergente qui vise à réduire le fossé entre les avancées dans le domaine de la détection d’anomalies et les utilisateurs
finaux.
L’Explainability et la détection d’anomalies contextuelles associées aux techniques de Deep Learning sont des sujets de
recherche intéressants qui ne sont pas suffisamment abordés dans la littérature. Très peu d’études se sont récemment
penchées sur ces questions [Carmona et al., 2022, Huong et al., 2022, Schockaert, 2020]. L’objectif de cette thèse
est de réaliser d’abord un état de l’art sur les approches existantes de détection d’anomalies contextuelles basées sur
le Deep Learning, puis de concevoir et développer de nouvelles approches améliorant l’efficacité de la détection en
exploitant les informations contextuelles. Une analyse plus poussée doit être effectuée pour fournir plus de précision et
d’explication de l’anomalie. Les résultats doivent être validés sur des jeux de données publics (séries temporelles ou
données de Logs).
Doctorant.e: Gumbs Gauderic