Description
Date depot: 1 janvier 1900
Titre: Méthodes parcimonieuses pour la déréverbération des signaux audio
Directeur de thèse:
Gael RICHARD (LTCI (IP PARIS))
Directeur de thèse:
Yves GRENIER (LTCI (EDMH))
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Non defini
Resumé:
Les signaux audio, qu'il s'agisse de parole ou de musique subissent lors de la prise de sons différentes dégradations : modifications de timbre ou d'intelligibilité dues à l'effet de salle, présence de bruits, auxquelles s'ajoute, dans le cas de la téléphonie mains-libres, la présence d'échos en provenance d'un haut-parleur.
L'amélioration de la qualité des signaux captés est indispensable dans de nombreuses applications, qu'elles soient liés à la téléphonie ou à la reconnaissance automatique de la parole. Les diverses dégradations n'ont pas reçu un même intérêt. La suppression de bruit a donné lieu à de nombreuses propositions d'algorithmes et peut être considérée comme une technique mature qui a trouvé de nombreuses applications industrielles. On peut également considérer que l'annulation des échos acoustiques est un problème résolu, du moins dans le cas monophonique. Le problème reste encore ouvert dans les cas des prises de sons stéréophoniques même si plusieurs solutions efficaces ont déjà été proposées. Par contre le problème de la restauration d'un signal réverbéré reste peu étudié. La déréverbération est une conséquence de l'emploi de techniques de formation de voie avec des réseaux de microphones. De ce fait les principales techniques qui ont été proposées l'ont été à partir de réseaux de microphones. Il existe encore peu de travaux effectués sur la déréverbération lorsqu'on utilise un seul microphone ou même deux microphones.
L'objectif de cette thèse est de mettre au point des techniques de déréverbération qui puissent fonctionner à partir d'un seul microphone. Dans la mesure où le seul signal qui soit enregistré est la convolution d'un signal de source inconnu et de la réponse impulsionnelle du canal acoustique qui est elle aussi inconnue, nous nous trouvons dans une problématique de déconvolution aveugle. Pour résoudre un problème de ce type, il est nécessaire d'introduire une information sur le signal ou sur la réponse. Par exemple, en communications numériques, le signal émis fait partie d'un alphabet réduit (dans le cas le plus rudimentaire, le signal est une succession de +1 et -1), et des algorithmes adaptatifs de déconvolution aveugle ont été présentés depuis une vingtaine d'années pour ce cas.
Dans le cas des signaux audio (parole ou musique), ceux-ci n'appartiennent pas à une classe qu'on peut décrire à partir d'un petit nombre de signaux. Par contre une part importante de chaque signal est représenté par des signaux harmoniques, caractérisés par une fréquence fondamentale (le pitch de la parole, la note jouée en musique) et par des harmoniques ou partiels. De ce fait, à un instant donné, seul un petit nombre de fréquences est activé. Dans le plan temps-fréquence, le signal sera considéré comme parcimonieux : il n'occupera qu'une petite fraction du plan temps-fréquence. La réverbération de ce signal a pour effet d'étaler le signal dans le plan temps-fréquence et de réduire sa parcimonie. L'objectif que nous nous donnons dans cette thèse est d'exploiter cette constatation pour tenter de supprimer la réverbération du signal en cherchant un filtre ou un ensemble de filtres qui augmentera la parcimonie du signal.
Doctorant.e: Lopez Zuleta Nicolas