Description
Date depot: 6 février 2024
Titre: Approches d’apprentissage statistique pour la modélisation des écosystèmes marins basé sur l’ADN environnemental
Directeur de thèse:
Edi PRIFTI (UMMISCO)
Encadrant :
Eugeni BELDA (UMMISCO)
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Intelligence artificielle
Resumé: Les méthodes traditionnelles de suivi de la biodiversité marine, basées sur des observations visuelles et une identification morphologique, sont coûteuses en temps et en ressources, rendant le suivi exhaustif des environnements marins difficile. Le metabarcoding de l'ADN environnemental (ADNe) offre une alternative efficace pour évaluer la biodiversité marine en échantillonnant et séquençant les fragments d'ADN laissés par les organismes aquatiques dans leur milieu. Cette méthode, capable de détecter un plus large éventail d'espèces sans observation directe, devient progressivement un nouveau standard pour le suivi de la biodiversité. Cependant, l'application de l'ADNe est confrontée à deux défis majeurs: la complexité des pipelines bio-informatiques nécessaires au traitement des données et l'incomplétude des bases de référence pour l'assignation taxonomique. Ce projet de thèse, inscrit dans le cadre du projet AIME (Artificial Intelligence for Marine Ecosystems) financé par l'Agence Française du Développement (AFD), vise à développer de nouvelles méthodes analytiques issues de la bio-informatique et du machine learning pour relever ces défis. Le candidat se concentrera sur l'amélioration des inférences écologiques à partir des données d'ADNe et le développement d'outils de classification plus précis et efficaces. Ces outils aideront à définir de nouveaux indicateurs de biodiversité pour les écosystèmes marins, guidant les stratégies de conservation. Plus spécifiquement, le projet adaptera des approches issues du diagnostic de santé humaine et de la recherche sur le microbiome intestinal au metabarcoding, incluant metagenome2vec pour la classification directe des échantillons d'ADNe, predomics pour la modélisation prédictive des signatures d'ADNe, et ScaleNet pour la construction de grands réseaux d'espèces co-occurrentes. Ces signatures serviront d'outils pour développer et évaluer des stratégies de gestion, telles que les aires marines protégées, utilisant un large éventail de données d'ADNe ciblant les assemblages de poissons tropicaux et tempérés dans divers environnements, incluant la Nouvelle-Calédonie et la Californie du Sud.
Résumé dans une autre langue: The traditional methods for monitoring marine biodiversity, relying on visual observations and morphological identification, are time-consuming and expensive, making comprehensive surveillance of marine environments challenging. DNA metabarcoding of environmental DNA (eDNA) presents an efficient alternative for assessing marine biodiversity by sampling and sequencing DNA fragments left by aquatic organisms in their environment. This approach, capable of detecting a wider range of species without direct observation, is increasingly becoming a new standard for biodiversity monitoring. However, the application of eDNA faces two significant challenges: the complexity of bioinformatic pipelines needed for data processing and the incompleteness of reference databases for taxonomic assignment. This thesis project, within the AIME (Artificial Intelligence for Marine Ecosystems) project funded by the Agence Française du Développement (AFD), aims to develop new analytical methods from bioinformatics and machine learning to address these challenges. The candidate will focus on improving ecological inferences from eDNA data and developing more accurate and efficient classification tools. These tools will help define new biodiversity indicators for marine ecosystems, guiding conservation strategies. Specifically, the project will adapt approaches from human health diagnostics and intestinal microbiome research to metabarcoding, including metagenome2vec for direct eDNA sample classification, predomics for predictive modeling of eDNA signatures, and ScaleNet for constructing large co-occurring species networks. These signatures will serve as tools for developing and evaluating management strategies, such as marine protected areas, using a diverse array of eDNA data targeting both tropical and temperate fish assemblies from various environments, including New Caledonia and Southern California.
Doctorant.e: Kana Djifack Eberrhard Estephe