Projet de recherche doctoral numero :3907

Description

Date depot: 1 janvier 1900
Titre: Combinaison d'analyse de coévolution et de dynamique moléculaire pour l'étude de réseaux de communication entre acides aminés impliqués dans les maladies génétiques
Directrice de thèse: Alessandra CARBONE (LCQB)
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Non defini

Resumé: Les protéines assurent leur fonction biologique en adaptant leur forme et leurs mouvements en réponse à des stimuli spécifiques. Des modifications génétiques (mutations) ponctuelles peuvent détériorer cette capacité d'adaptation et ainsi provoquer diverses pathologies. Ces perturbations surviennent au niveau d'un site protéique donné et induisent généralement des effets sur d'autres sites distants de la protéine, affectant ainsi sa fonction et sa stabilité. Par conséquent, l’identification de voies de propagation du signal à travers les structures tridimensionnelles des protéines constitue un élément essentiel pour comprendre les mécanismes moléculaires à l'origine des maladies humaines. Ce projet a pour but de contribuer au développement d’approches computationnelles pour la description et la visualisation systématique des réseaux de communication à travers les structures protéiques. Nous avons précédemment implémenté une méthode d’analyse en réseau modulaire (MOdular NETwork Analysis) pour l’étude d'une mutation oncogène du récepteur tyrosine kinase KIT [Laine et al 2012]. MONETA se base sur les corrélations dynamiques inter-résidus pour définir des groupes (clusters) et des chaînes (chemins) de résidus à travers lesquels l'information est transmise. Les corrélations sont obtenues à partir d’un ensemble de conformations, générées par des calculs de simulations de dynamique moléculaire. A partir de ces résultats, trois axes seront développés : (1) adapter l'outil MONETA pour son application à grande échelle, (2) inférer une représentation de la protéine sous forme de graphe de communication, (3) intégrer des informations sur la conservation et/ou la coévolution des résidus. L'axe (1) comportera une phase d'implémentation et d'intégration des différents modules de MONETA et une phase de calibrage des paramètres. L'axe (2) consistera à optimiser la définition des clusters et chemins obtenus avec MONETA pour inférer un graphe représentant de manière simplifiée l’objet biologique. L'axe (3) concernera l'exploration de la relation entre dynamique structurale et évolution de séquence. Des méthodes développées au laboratoire seront utilisées pour détecter des résidus très conservés et/ou coévolués [Engelen et al. 2009, Baussand&Carbone 2009, Dib&Carbone 2012]. On développera un algorithme efficace qui à partir de l’information de coévolution et d’une analyse gros-grain en réseaux élastiques fournira une définition grossière de fragments fonctionnels de la protéine. Les régions de la protéine caractérisées par la présence de ces fragments seront explorées par des techniques de simulation de dynamique moléculaire (tout atomes en solvant explicite, par des techniques d’échantillonnage locale). La connaissance au préalable de ces fragments permettra donc de réduire le cout important des calculs de simulation et d’éviter une exploration complète de l’espace conformationnel. L’information provenant des séquences qui concerne la coévolution de certains résidues de la protéine sera re-utilisée après l’analyse des corrélations dynamiques pour permettre de tester la robustesse des clusters et chemins identifiés à partir des propriétés dynamiques, et d'évaluer leur importance biologique. L'approche ainsi développée sera validée sur des protéines impliquées dans des maladies génétiques telles que les dyskinésies ciliaires, certaines maladies de la croissance et les maladies auto-inflammatoires. Les prédictions des mutations et de leurs effets seront confrontées aux données expérimentales. La thèse sera développée dans le cadre d’une collaboration interdisciplinaire avec le groupe du Professeur Serge Amselem, Laboratoire de physiopathologie des maladies génétiques d'expression pédiatrique - UMRS 933 INSERM-UPMC à l’Hôpital d'Enfants Armand-Trousseau, Paris. La thèse concerne deux aspects importants de la recherche biologique et clinique développée au laboratoire à Trousseau (Pantel et al. 2006, Kott et al. 2012, Duquesnoy et al. 2009): (1) identifier des mutations impliquées dans des maladies génétiques et (2) caractériser le rôle délétère de ces mutations sur la fonction des protéines concernées. Ces deux directions de recherche demandent une modélisation de la structure de la protéine si elle n’est pas présente dans les bases de données PDB, et une étude de la dynamique moléculaire de la structure pour essayer de comprendre le rôle du résidu muté. Les outils développés dans la thèse, basés sur la conservation des acides aminés, leur co-évolution et la dynamique moléculaire permettront d'identifier des réseaux de communication (possiblement fonctionnels) dans les structures protéiques et ainsi de : 1/ mieux comprendre les mécanismes délétères des mutations au niveau moléculaire (altération de la structure, la dynamique interne, localisation dans des fragments conservés ou co-évolués) 2/ mettre en évidence des relations entre différentes mutations (appartenance à un même réseau de c

Doctorant.e: Karami Yasaman