Projet de recherche doctoral numero :2653

Description

Date depot: 1 janvier 1900
Titre: ADS2 : Vers une Supervision Adaptative des Systèmes Distribués
Directrice de thèse: Amal EL FALLAH SEGHROUCHNI (LIP6)
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Non defini

Resumé: A l'instar des être vivants, les systèmes informatiques sont sujets à de nombreuses perturbations. Sans mécanisme de protection, celles-ci peuvent entrainer de graves dysfonctionnements. Pour palier à ce problème, de nombreux modèles portant sur la redondance et/ou le recouvrement (diagnostic et réparation) dans les systèmes informatiques sont étudiés par la communauté scientifique. Dans le cadre de ma thèse, nous nous intéressons plus particulièrement au cas des {{systèmes distribués asynchrones}} avec {{pannes franches}} et {{communications non fiables}} (comportements byzantins non considérés). Mon travail de recherche vise à concevoir un système de supervision qui permettre de Détecter, Isoler, Diagnostiquer et Réparer automatiquement un sous-ensemble des différentes fautes survenant au sein d'un tel système dans le but d'obtenir un système (supervisé + superviseur) autoguérissant. Dans ce contexte, nous proposons un {{système de supervision adaptatif}} reposant sur une architecture multi-agent. Chaque agent supervise la région du système où il est déployé. Chaque agent est autonome et doté de capacité de diagnostic et de réparation. Nous définisons un processus décisionnel qui permet à chaque agent de prendre une décision à tout moment en fonction de l'état du système. Cette décision repose sur un compromis entre le fait d'échanger des informations avec les autres agents du système (couteux en temps mais améliorant la fiabilité du diagnostic) et le fait de décider unilatéralement de l'action à entreprendre. Ainsi, à haut niveau, le comportement du superviseur passe automatiquement d'un fonctionnement quasi-centralisé (quand les coûts de communications sont faibles) à un fonctionnement distribué (lorsque les coûts de communications varient au cours du temps). Nous avons identifié 3 points clés pour l’obtention d’une telle architecture de supervision : (1) le modèle décisionnel des agents, (2) le mécanisme d’inférence pour l’établissement d’un diagnostic, et (3) le mécanisme qui permet de maintenir une vision cohérente de l’état du système par les agents. Nos travaux abordent ces différents points.

Doctorant.e: Herpson Cedric