Description
Date depot: 1 janvier 1900
Titre: Développement de méthodes statistiques et informatiques nécessaires à l'analyse de données génomiques
Directeur de thèse:
Gilbert SAPORTA (CEDRIC)
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Non defini
Resumé:
1) Contexte et objectif de la thèse
2) Description de l’échantillon à l’étude et des données de la base de données d’exploitation, ainsi que des données génétiques issues de biopuces
3) Méthodologie d’exploitation
- Réitérer les analyses gènes candidats par SNIP
- Analyses par méthodes bioinformatiques standards :
Contrôle de qualité et stratification,
Analyse par régression
Analyse des extrêmes
Haplotypage
Recherche des interactions
- Nouvelles approches statistiques : mise en œuvre de méthodes de classification supervisées en utilisant ou développant des méthodes efficaces pour le cas où le nombre de variables est très supérieur au nombre d’observations. Ces méthodes pourront être notamment des méthodes de réduction de dimension (composantes principales, PLS, analyse discriminante en version « sparse »), des méthodes à noyau de type SVM, et kernel- logistic PLS. Une question ouverte est la détection d’interactions dans ce cas de combinatoire explosive.
Doctorant.e: Bernard Anne