Projet de recherche doctoral numero :3273

Description

Date depot: 1 janvier 1900
Titre: La fouille de données dans les réseaux sociaux, appliquée au domaine de la fraude à la carte bancaire sur Internet
Directeur de thèse: Patrick GALLINARI (ISIR (EDITE))
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Non defini

Resumé: La thèse vise à développer des méthodes automatiques ou semi-automatiques sur des données relationnelles. Ce type de données possède des caractéristiques particulières qui nécessitent de développer des méthodes capables de prendre en compte des données liées par différents types de relations (la relation la plus simple étant le temps) et non pas des données indépendantes et identiquement distribuées, qui est le cas classique en statistique. L’analyse de données relationnelle se fera sous l’angle de la fouille de réseaux sociaux, domaine très récent de l’apprentissage statistique qui reste encore en grande partie à développer. On traitera les problèmes de la prise en compte de données sociales dans le processus classique de data mining par la création et l’agrégation de données sociales avec d’autres indicateurs. Par ailleurs, des algorithmes spécifiques seront développés ou adaptés pour la découverte de relations, la découverte de liens entre acteurs et entre transactions, et également pour réaliser de l’inférence collective dans les graphes sociaux ainsi identifiés. On s’appuiera notamment sur deux grandes familles de méthodes : Les algorithmes d’inférence collective qui exploitent des extensions des techniques de relaxation, de classification itérative et sur les techniques de modularisation et d’analyse spectrale de graphes. Un des objectifs de la thèse est d’étendre ces méthodes dans différentes directions : le passage à l’échelle, l’optimisation de fonctions de scores adaptées au problème de détection, la prise en compte d’informations multiples sur les liens et les nœuds du réseau. Les résultats de la thèse seront appliqués pour étudier la fraude sur Internet, par l’analyse et le suivi des transactions, en vue de modéliser les interactions entre les différents réseaux d’acteurs (acheteurs, commerçants et opérateurs – fournisseurs d’accès).

Doctorant.e: Poussevin Mickael