Projet de recherche doctoral numero :3507

Description

Date depot: 1 janvier 1900
Titre: Modèles probabilistes de représentations temps-fréquences - Application au traitement des signaux de musique.
Directeur de thèse: Bertrand DAVID (LTCI (EDMH))
Directeur de thèse: Roland BADEAU (LTCI (EDMH))
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Non defini

Resumé: {{{Principaux objectifs}}} Cette thèse a pour objectif de définir un modèle généraliste de signaux audiofréquences, en particulier de signaux de musique polyphonique, qui en fournisse une représentation à la fois {sémantique} (qui permette d'extraire des informations sur le signal analysé) et {générative} (qui permette de ré-synthétiser un son de haute qualité). L'intérêt d'une telle représentation est de fournir un outil unifié pour aborder des applications aussi variées que l'indexation automatique, la transcription de musique, les transformations sonores, le codage audio, la séparation et la localisation de sources ou encore la restauration d'enregistrements. {{{Etat de l'art}}} Les méthodes de décomposition de représentations temps-fréquence inspirées de la NMF ({nonnegative matrix factorization}) ont connu un grand succès ces dernières années dans le domaine du traitement des signaux audiofréquences. La méthodologie de plus en plus fréquemment adoptée consiste à formuler cette décomposition comme un problème d'estimation d'un modèle probabiliste de représentation temps-fréquence. Cette approche permet en effet d'incorporer des connaissances sur les composantes à extraire et d'utiliser des méthodes d'apprentissage automatique connues. A Télécom ParisTech, plusieurs applications ont été abordées avec ce type d'outils, dans le cadre de thèses soutenues ou en cours, que nous avons personnellement encadrées : -* la transcription automatique de musique [Bertin 2010,Fuentes 2011], -* la séparation de sources sonores [Durrieu 2011,Liutkus 2012], -* la modélisation d'instruments de musique par synthèse spectrale [Hennequin 2011 ,Rigaud 2011]. Plusieurs laboratoires français et étrangers sont très actifs dans ce domaine, parmi lesquels l'INRIA en France [Duong 2010], de grandes universités étrangères (l'université de Tokyo au Japon [Le Roux, 2009] et l'Université de l'Illinois aux USA [Mysore 2010]) et des industriels ({NTT Communication Science Laboratories} au Japon [Le Roux, 2009] et {Adobe Systems Advanced Technology Labs} aux USA [Mysore 2010]).

Doctorant.e: Magron Paul