Description
Date depot: 1 janvier 1900
Titre: Fusion et Optimisation de modèles pour la séparation de sources audio
Directeur de thèse:
Gael RICHARD (LTCI (IP PARIS))
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Non defini
Resumé:
La séparation de source audio dans le cas sous-déterminé (moins de sources que de capteurs) est un problème complexe. Des approches récentes permettent d'obtenir une qualité acceptable dans des cas précis. Il est cependant nécessaire de paramétrer assez finement les algorithmes pour obtenir un résultat convainquant, notamment en sélectionnant manuellement les modèles appropriés ainsi qu'en les paramétrant. Le but de cette thèse est d'étudier les manières de sélectionner automatiquement plusieurs modèles afin de contourner ce besoin de sélection manuelle. La recherche effectuée se situera sur deux terrains. D'une part, un procédé d'optimisation pour la sélection de modèles de sources sera proposé. A l'aide d'une fonction de coût mise au point de façon appropriée, il permettra de choisir les modèles qui permettent d'expliquer le mélange au mieux. D'autre part, une approche par fusion sera employée. Il s'agira ici d'employer plusieurs modèles de sources par source sonore afin d'obtenir une estimée plus précise, par analogie avec les processus de fusion de modèles en apprentissage statistique. Ces travaux auront un impact dans le domaine de l'indexation pour lequel il est très important d'avoir une représentation pertinente du signal, ainsi que dans d'autres domaines mettant en jeu des mélanges de signaux.
Doctorant.e: Jaureguiberry Xabier