Projet de recherche doctoral numero :3804

Description

Date depot: 1 janvier 1900
Titre: Mesure et correction de netteté des sons
Directeur de thèse: Gael MAHE (LIPADE)
Directeur de thèse: Mihai MITREA (LTCI (EDMH))
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Non defini

Resumé: Objectif : Définir de nouvelles mesures objectives non-intrusives de netteté des sons et des algorithmes non-supervisés de débruitage, déréverbération et d'optimisation de l'intelligibilité, fondés sur ces mesures. Etat de l'art : La netteté d'un son est une grandeur subjective, bien définie pour la parole - notre capacité à reconnaître des phonèmes - mais moins pour la musique, dont l'information est plus complexe et moins facilement verbalisable sans culture musicale. Dans le cas de la parole, la netteté peut être mesurée formellement par des tests subjectifs impliquant plusieurs sujets, tels que ceux normalisés par l'Union Internationale des Télécommunications (UIT). Ces mesures sont cependant coûteuses à mettre en œuvre. Dans certaines applications, des indices objectifs permettent d’estimer plus simplement la netteté du son à partir des paramètres physiques du son ou du système de transmission en jeu. Par exemple, en acoustique des salles, la corrélation du Speech Transmission Index (STI) avec la netteté perçue, dans diverses conditions de bruit et de réverbération, est établie depuis les années 80. Divers critères de netteté ont été proposés depuis, mais tous sont fondés sur une comparaison avec la source originale, ce qui suppose de disposer de celle-ci, ou sur les caractéristiques du système de transmission (acoustique, électronique ou numérique). Outre l'éventuelle non-disponibilité de la source ou des caractéristiques du système, cette approche pose le problème de la définition de la netteté, implicitement conçue comme une dégradation par rapport à un original pur, et non comme une qualité intrinsèque d'un son. Le même problème se retrouve dans les techniques de correction du son (débruitage, égalisation, déréverbération), fondées elles aussi sur une comparaison avec la source originale ou sur les caractéristiques du système. Dans le cas fréquent où ces informations ne sont pas disponibles, elles doivent être estimées, au prix d'hypothèses délicates (par exemple la stationnarité du bruit de fond ou du système acoustique, souvent non-vérifiée). Nos travaux récents ont étudié la possibilité d'adapter aux sons des indicateurs nouveaux issus du traitement d'image, la cohérence globale de phase (GPC) [Blanchet2008] et le sharpness index (SI) [Blanchet2012], qui caractérisent la capacité des phases de la transformée de Fourier d’une image à collaborer pour produire des contours nets et des régions très régulières. Ces indicateurs, qui ont l'avantage de ne pas reposer sur une comparaison avec une référence, présentent, sous certaines conditions, des comportements similaires à ceux du STI en fonction des niveaux de bruit et de réverbération. [1] G. Blanchet, L. Moisan, B. Rougé, 'Measuring the global phase coherence of an image', pro- ceedings of the International Conference on Image Processing, pp. 1176-1179, 2008. [2] G. Blanchet, L. Moisan, 'An explicit sharpness index related to Global Phase Coherence', Proc. ICASSP 2012, pp. 1065-1068, 2012. Axes de travail : a) Spécifier la notion de netteté pour différentes classes de sons Il s'agira d'une étude bibliographique dans le domaine de la psycho-acoustique, visant à cerner, au-delà du sens commun, cette notion de netteté pour la parole (en la distinguant de l'intelligibilité) et pour la musique. Cette étude doit également couvrir les protocoles de mesure subjective de la netteté, qui portent implicitement une certaine définition de celle-ci. b) Dresser un état de l'art des mesures objectives de netteté du son c) Poursuivre l'étude des indices SI et GPC, hérités du traitement d’images, comme mesures objectives de netteté du son Nos résultats préliminaires ont validé l'idée d'utiliser le SI et la GPC comme indicateurs de netteté du son. Il est cependant nécessaire de préciser les limites de ces nouveaux indicateurs, notamment en comparant leur comportement à ceux des indicateurs objectifs existants, pour différents sons et différentes conditions de transmission du son. Si cette étude confirme l'intérêt du SI et de la GPC, ceux-ci pourront être validés par des tests subjectifs formels. d) Définir de nouvelles mesures de netteté intrinsèque pour le son L'idée de la GPC peut être généralisée comme la sensibilité d'une mesure de régularité du signal à une certaine distorsion, dans un espace de représentation donné. Il s'agit donc d'identifier, pour le son, l'espace de représentation, la mesure de régularité et la distorsion optimaux, pour définir de nouveaux indices fondés sur ce concept. Ces nouveaux indices devront être adaptés à la fois aux caractéristiques des signaux sonores et à celles de l'audition humaine (intégration d'une approche psycho-acoustique). En particulier, l'espace de représentation pourra s'inspirer de la représentation interne du système auditif. Les indices seront validés par des tests subjectifs formels permettant d'établir leur corrélation avec la netteté per

Doctorant.e: Rios Muller Rafael