Projet de recherche doctoral numero :3132

Description

Date depot: 1 janvier 1900
Titre: Combinatoire des mutations génétiques
Directrice de thèse: Alessandra CARBONE (LCQB)
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Non defini

Resumé: L'évolution a imposé des contraintes d'auto-cohérence entre séquence, structure et fonction d'une protéine. Cette idée a été adressée explicitement dans le contexte de familles de protéines et étudiée par différentes méthodes d’analyse de signaux de conservation (Lichtarge et al. Journal of Molecular Biology 1996 ; Engelen et al. PloS Computational Biology, 2009) et de co-évolution (Ranganathan et al. Science 1999) d’acides-aminés dans les séquences protéiques. Ces analyses permettent d’extraire des invariants fonctionnels (cad des résidus conservés ou co-évolués) qui possèdent des propriétés structurelles et fonctionnelles importantes, peuvant guider la mutagenèse et le drug design. Aussi, l'existence de réseaux d'acides aminés co-évolués dans les familles de protéines a été récemment prouvée par des méthodes statistiques (Ranganhatan et al. Nature Struct. Biol. 2003) et combinatoires (Baussand & Carbone, PLoS Computational Biology, 2009 ; Dib & Carbone 2011, soumis). Dans cette thèse nous souhaitons démontrer que ces réseaux constituent un signal permettant de prédire des résidus importants (hot-spots) pour comprendre les maladies génétiques. Dans une analyse exploratoire récente, nous avons étudié de près la protéine P53, connue pour sa participation active au développement des cancers. Plusieurs études cliniques ont mis en évidence un nombre de mutations clés (hot-spots) qui semblent être caractéristiques de son inactivation pendant les cancers de certains tissus [Paalman 2000, Caustres 2002, Soussi 2003]. En parallèle, des études structurales ont aussi mis en évidence le rôle de résidus spécifiques dans la stabilité structurale de la protéine [Joerger 2006, Joerger 2009]. Notre analyse de coévolution de la P53 identifie un ensemble de 35 résidus co-évoluants qui contient la plupart des résidus identifiés dans des tissus cancéreux spécifiques (colon, sein, foie, cerveau, ovaires, etc.) et la plupart de hot-spots connus. Cette thèse propose de développer des nouvelles méthodes combinatoires basées sur l’analyse de coévolution d’acides-aminés pour la prédiction de mutations (SNPs), multiples ou non, à effet délétère. Ces méthodes doivent être capable de s’appliquer à des familles de protéines représentées par très peu de séquences et de distinguer des clusters de résidus co-évoluants qui soient responsables de l’inactivation. Les approches statistiques ne peuvent pas être appliquées à cette question et l’approche combinatoire jusqu’ici étudiée au laboratoire doit être raffinée et développée ultérieurement pour répondre à ces nouvelles applications en génétique. Un outil d'analyse (et web server) sera implementé. Les prédictions seront testées sur les données des Genome Wide Association Studies (GWAS) réalisées par le Welcome Trust Control Case Consortium et par d'autres groupes.

Doctorant.e: Champeimont Raphael