Description
Date depot: 1 janvier 1900
Titre: Contraintes de sélection négative sur l'évolution des réseaux biologiques
Directeur de thèse:
Hervé ISAMBERT (PC_Curie)
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Non defini
Resumé:
Les avancées importantes dans le domaine du séquençage haut-débit permettent aujourd'hui de produire un nombre croissant de données issues des génomes. Les algorithmes de génomique comparative, ainsi que des méthodes statistiques spécifiques, ont permis d'identifier des gènes soumis à une forte sélection positive. La sélection de tels gènes conférant un avantage sélectif pour l'espèce se conçoit intuitivement bien. A l'inverse, la conservation de gènes particulièrement sensibles aux mutations délétères, c'est-à-dire susceptibles d'induire des maladies génétiques complexes chez les individus, soulève de nombreuses interrogations. Les mécanismes ayant favorisé le maintien de ces gènes par sélection négative, malgré le danger potentiel que leurs mutations représentent, restent encore à élucider et pourraient ouvrir la voie à de nouvelles approches thérapeutiques.
Dans ce projet de thèse, à l'interface entre l'informatique, l'analyse statistique et la modélisation en biologie, nous nous proposons d'analyser quantitativement les conséquences des mutations délétères sur l'évolution des gènes dupliqués, plus particulièrement, les gènes 'ohnologues' issus d'une duplication complète de génome comme les deux qui se sont produites à l'origine de la spéciation des vertébrés, il y a 500Ma environ. En effet, les résultats préliminaires récemment obtenus par l'équipe en collaboration avec le groupe de Jacques Camonis à l'Institut Curie (ref.1), suggèrent que les voies de signalisation impliquées dans de nombreux cancers ont été très largement façonnées par ces deux duplications de génome entier et conservent de nombreux gènes ohnologues particulièrement susceptibles aux mutations délétères. En provoquant l'élimination des individus qui les portent, ces mutations délétères favorisent en effet indirectement la conservation des ohnologues correspondants (non-mutés) au sein de la nouvelle espèce ayant doublé son génome.
Les méthodes statistiques existantes ont été principalement conçues pour identifier les signatures de la sélection positive sur les séquences protéiques et ne sont pas adaptées à l'étude des gènes sous forte sélection négative. Nous allons donc développer et implémenter une nouvelle approche statistique permettant de quantifier spécifiquement l'importance de la sélection négative sur les gènes dupliqués issus d'évènements de duplication complète du génome, par rapport à d'autres gènes paralogues (dans la même espèce) et orthologues (de différentes espèces). Nous nous appuierons sur des approches de génomique comparative, entre les génomes d'eucaryotes supérieurs nouvellement séquencés, dans le contexte des modèles de systèmes complexes pour la biologie des systèmes évolutifs (ref.2-6).
Pour ce projet, nous développerons des outils bioinformatiques et biostatistiques adaptés permettant:
-* de collecter de grandes quantités de données relatives aux gènes d'intérêt dans le génome humain et à leurs orthologues chez d'autres vertébrés et invertébrés (via des banques de données en ligne telles que Ensembl).
-* de procéder à l'alignement d'un grand nombre de séquences codantes (via des algorithmes de génomique comparative tels que BLAST ou ClustalW).
-* d'identifier les gènes sous sélection négative (via de nouvelles approches statistiques à développer, voir Enjeux ci dessous). Nous nous intéresserons plus particulièrement aux gènes ohnologues issus des deux duplications de génome qui ont eu lieu il y a environ 500 MA et ont conduit à la diversification des vertébrés. Nous comparerons chaque paire d'ohnologues, à des paires de gènes impliquant des orthologues et/ou des paralogues correspondants.
-* de modéliser l'évolution des interactions des gènes d'intérêt avec leur partenaires connus en terme d'évolution de graphes. De tels modèles d'évolution de graphes d'intéraction sous processus de duplication-divergence ont été développé récemment par l'équipe (ref. 2-6) et il s'agira ici de différentier les effets de sélection positive et négative sur les propriétés émergentes de ces graphes.
-* d'analyser l'interdépendance et la hiérarchie d'une multitude de propriétés structurales et fonctionnelles des gènes ohnologues d'intérêt. On distinguera notamment dans notre étude différentes sous-familles de gènes: ohnologues auto-inhibiteurs, ohnologues sujets aux cancers, ohnologues sujets à des maladies génétiques autre que les cancers, non-ohnologues auto-inhibiteurs etc.. Ces études statistiques croisées permettront la mise en évidence de corrélations entre ohnologues, sélection négative et maladies génétiques. (voir Enjeux ci-dessous). En effet, au-delà de l'analyse de ces corrélations, ce projet est également motivé par la mise en évidence de l'influence directe que peuvent avoir les gènes ohnologues sur le développement de maladies complexes.
Doctorant.e: Affeldt Severine