Projet de recherche doctoral numero :8622

Description

Date depot: 23 novembre 2023
Titre: DÉTECTION D’ANOMALIES CONTEXTUELLES EN UTILISANT DES TECHNIQUES D’INTELLIGENCE ARTIFICIELLE
Directrice de thèse: Florence ROSSANT (LISITE)
Encadrante : Yousra CHABCHOUB (LISITE)
Directeur de thèse: Maurras Ulbricht TOGBE (LISITE)
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Données et connaissances

Resumé: La détection d’anomalies est un sujet d’actualité à la frontière de deux grands domaines de recherche en rapide évolution à savoir la cybersécurité et l’intelligence artificielle. Plusieurs méthodes de Deep Learning ont été récemment appliquées à la détection d’anomalie dans de nombreux domaines comme la santé, la détection de fraude, le transport... Ces approches permettent de détecter des anomalies de plus en plus complexes et avec d’excellents résultats, dépassant les méthodes traditionnelles. Malgré les grands progrès réalisés dans le domaine de la détection d’anomalies, des défis restent à relever notamment la prise en compte du contexte dans des systèmes complexes et l’explication des résultats obtenus. La détection d’anomalies contextuelles est basée sur l’identification des comportements anormaux ou inhabituels dans un jeu de données en prenant en compte le contexte. Les anomalies s’écartent de manière significative du comportement attendu ou normal dans un contexte donné. Le contexte fait référence à différents facteurs, notamment les informations temporelles (l’heure de la journée, le jour de la semaine), les informations spatiales (la localisation, la proximité de certains objets, les caractéristiques de l’équipement source des données), le comportement de l’utilisateur (ses habitudes, les préférences), les conditions environnementales ou toute autre information pertinente qui permet de mieux comprendre le système dans son ensemble. En incorporant le contexte, l’algorithme de détection d’anomalies peut mieux différencier les anomalies réelles des variations attendues, appelées aussi concept drift, réduisant ainsi les faux positifs et améliorant la précision de la détection d’anomalies. Cette approche est particulièrement utile dans les systèmes complexes où les anomalies dépendent du contexte. Par exemple, dans [Hayes and Capretz, 2015], les auteurs présentent un framework de détection d’anomalies dans des données de capteurs à grande échelle, en tenant compte des informations contextuelles. Ils introduisent un processus d’extraction de caractéristiques contextuelles qui exploite des informations liées aux données des capteurs. La détection d’anomalies contextuelles est utilisée dans plusieurs autres domaines d’application, tels que la surveillance du trafic vidéo à l’aide de véhicules aériens sans pilote (UAV) [Bozcan and Kayacan, 2021]. Le contexte peut également être utilisé pour évaluer le niveau de gravité de l’anomalie ou fournir une meilleure explication et interprétation (Explainability) [Pang and Aggarwal, 2021]. En effet, l’interprétation est une étape cruciale de la détection des anomalies, car elle aide les analystes à comprendre les raisons derrière les anomalies détectées. L’Explainability est étroitement liée au concept de Root Cause Analysis abordé dans certaines études comme [Lu et al., 2017, Wang et al., 2019] et qui a pour but de fournir une explication précise de la cause de l’anomalie. L’Explanable Anomalies Detection (XAD) est aussi issue de l’Explanable Artificial Intelligence (XAI) [Sejr and Schneider-Kamp, 2021] qui a été récemment appliquée dans plusieurs domaines comme l’internet des objets [Kok et al., 2022], la santé [Hussain et al., 2022] ou la Cybersécurité [Kuppa and Le-Khac, 2021, Zhang et al., 2022]. C’est donc une problématique émergente qui vise à réduire le fossé entre les avancées dans le domaine de la détection d’anomalies et les utilisateurs finaux. L’Explainability et la détection d’anomalies contextuelles associées aux techniques de Deep Learning sont des sujets de recherche intéressants qui ne sont pas suffisamment abordés dans la littérature. Très peu d’études se sont récemment penchées sur ces questions [Carmona et al., 2022, Huong et al., 2022, Schockaert, 2020]. L’objectif de cette thèse est de réaliser d’abord un état de l’art sur les approches existantes de détection d’anomalies contextuelles basées sur le Deep Learning, puis de concevoir et développer de nouvelles approches améliorant l’efficacité de la détection en exploitant les informations contextuelles. Une analyse plus poussée doit être effectuée pour fournir plus de précision et d’explication de l’anomalie. Les résultats doivent être validés sur des jeux de données publics (séries temporelles ou données de Logs).

Doctorant.e: Gumbs Gauderic