Projet de recherche doctoral numero :3002

Description

Date depot: 1 janvier 1900
Titre: Infrastructure logicielle distribuée et coopérative pour le test et la reconfiguration d'architectures massivement parallèles multiprocesseur sur puce et tolérantes aux pannes franches
Directeur de thèse: Alain GREINER (LIP6)
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Non defini

Resumé: Les MP2SoCs sont des circuits intégrés à très haute densité d’intégration, qui contiennent des centaines voire des milliers de ressources de calcul répliquées (processeur, mémoires locales, etc). Un des problèmes majeurs est que des pannes franches, lors de la fabrication ou lors de leur fonctionnementIl est difficile d’ajouter du matériel dédié au test sans modifier l’architecture et donc les performance du système. La problématique principale du test pour ce type de puce est d’amener les vecteurs de test au composants intégrés et d’extraire les résultats de ces tests. La solution générale est de disposer d’une infrastructure intégrée à la puce et permettant ces opérations. Cette infrastructure peut être dédiée ou bien être celle utilisée par les composants du SoC. Le projet ADAM est un projet ANR visant les architectures du type MP2SoC. L’objectif est de réaliser une plateforme s’adaptant seule à des conditions dégradées, tel qu’une panne dans un composant ou une température trop élevée. Trois phases peuvent être extraites de l’exécution d’une instance de ADAM. Une phase de monitoring, durant laquelle le logiciel fonctionnel s’exécute. Lorsqu’un problème est détecté, le système entre dans la phase de diagnostic, pendant laquelle le logiciel fonctionnel est arrêté, le matériel est réinitialisé et le système complet est testé en vue d’extraire une liste des composants fonctionnels et défectueux. Enfin, lorsque le diagnostique est établi, une phase de redéploiement du logiciel se basant sur les informations obtenues lors de la phase précédente. Dans cette thèse à pour but la réalisation d’une infrastructure logicielle, qui s’exécute au boot d’une plateforme matérielle multi-processeurs à mémoire partagée, organisé en tuiles sur un réseau sur puce, et qui permet de diagnostiquer les pannes franches ainsi que de permettre la reconfiguration de composants de cette plateforme. L’ajout de matériel dédié à cette tâche doit être négligeable comparé aux méthodes existantes dans la littérature.

Doctorant.e: Refauvelet Dimitri