Description
Date depot: 8 septembre 2023
Titre: compression de données génomiques à large échelle
Directeur de thèse:
Rayan CHIKHI (G5- institut Pasteur)
Encadrant :
Antoine LIMASSET (CRISTAL)
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Sciences de l’information et sciences du vivant
Resumé: Ce projet de doctorat est focalisé sur la mise au point d'algorithmes innovants pour l'analyse des données issues du séquençage d'ADN de différentes populations. Ces outils ont des applications variées, allant de l'examen d'échantillons humains et animaux à l'étude d'échantillons environnementaux. Une avancée sera la création d'une méthode pour compresser les séquences post-processées d'ADN, appelées "unitigs", dans le cadre d'études portant sur de vastes populations. Ces travaux sont largement appuyés sur des données réelles, notamment celles du projet "1000 génomes" ou de la base de données SRA.
Doctorant.e: Rouzé Timothé