Projet de recherche doctoral numero :2913

Description

Date depot: 1 janvier 1900
Titre: Amelioration de la qualite de vocale sur terminaux mobiles par optimisation de la chaine de traitement de signal
Directeur de thèse: Nicholas EVANS (Eurecom)
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Non defini

Resumé: La qualité vocale sur terminaux téléphoniques ne répond à des critères de qualité suffisants qu’au prix de l’implantation d’un certain nombre d’algorithmes de traitement digital du signal. Les terminaux, notamment mobiles, ont vu leur taille réduite ces dernières décennies. Cette réduction de taille a entrainé une réduction proportionnelle de la taille du haut-parleur et dans une moindre mesure des microphones, réduisant par la même la qualité de la communication. Un certain nombre de traitements digitaux (égalisation, compression du signal) sont généralement intégrés au sein de la chaine de transmission. Ils ont pour but de compenser les défauts des transducteurs mais également d’améliorer l’intelligibilité et la clarté de la voix. Par ailleurs, les terminaux de petite taille, ou bien l’utilisation de fonctionnalités mains-libres génèrent sur le signal microphonique une perturbation appelée écho. Un couplage acoustique non-négligeable entre les transducteurs du terminal a pour conséquence la retransmission du signal haut-parleur vers le microphone. Etant donné le retard des réseaux de communication modernes, tel le GSM, il en résulte que le locuteur distant connait l’expérience désagréable d’entendre sa propre voix retardée si aucun traitement de l’écho n’est intégré sur le terminal. Aussi, la plupart des terminaux modernes possède une fonctionnalité d’annulation d’écho implantée dans le domaine digital. Les terminaux mobiles sont à même de se retrouver en environnement bruité (café, gare, voiture…). Afin d’améliorer l’intelligibilité et de diminuer la fatigue liée au bruit lors d’une télécommunication, des solutions de réduction de bruit sont également intégrées sur les terminaux. Ces exemples montrent que la qualité d’une communication n’est possible que grâce à un nombre relativement important de traitement du signal. Les algorithmes sous-jacents à ces traitements ont été historiquement développés de manière indépendante les uns des autres, les recherches s’étant attachées à trouver une solution optimale à chaque problème. Il en résulte que les solutions actuellement disponibles sont une juxtaposition de processus. Prenant l’axiome que la suite de traitements optimaux n’implique pas forcément un résultat global optimal, il se pourrait que les solutions actuelles ne permettent pas d’atteindre la meilleure qualité possible. De plus, la juxtaposition entraine des efforts importants pour l’étude de l’interaction des modules entre eux. A titre d’exemple, une réduction de bruit aura pour but de réduire l’énergie du bruit alors qu’un algorithme d’amélioration d’intelligibilité entrainera une augmentation d’énergie. En ne considérant que ces deux processus, leur juxtaposition peut entrainer un effet nul et donc aucune amélioration finale de la qualité. Solution étudiée pendant la thèse Le projet de recherche tend à appréhender la qualité audio dans une approche globale en considérant l’ensemble de la chaine de traitement et non pas les problèmes individuellement. L’approche se baserait sur une vision plus centralisée des problèmes ou bien sur une interaction plus étroite entre les différents algorithmiques impliqués. Le traitement de la parole se base sur des critères de minimisation d’erreur ou de maximisation d’énergie. Pour reprendre les algorithmes cités auparavant, les algorithmes d’annulation d’écho se base sur un critère de minimisation d’erreur entre la réponse impulsionnelle entre haut-parleur et microphone et l’estimée de cette même réponse impulsionnelle. Ils sont généralement couplés à un post-filtrage basé sur la minimisation de l’énergie du signal d’écho et/ou la minimisation de l’erreur entre signal utile (i.e. sans écho) et signal en sortie de filtrage. Les techniques de réduction de bruit se basent quant à elle principalement sur la minimisation de l’erreur entre signal non-bruité et signal en sortie du filtre de débruitage. Enfin l’amélioration de la qualité de la parole et des transducteurs est principalement fondée sur une approche empirique de minimisation de distorsion ou bien de maximisation d’énergie. Un constat évident réside dans le caractère hétéroclite des critères d’optimisation utilisés. S’ajoute une interaction très limitée entre les différents modules de telle sorte qu’en pratique aucun garde-fou algorithmique ne permet vraiment de contrôler automatiquement l’ensemble de la chaine audio. Ce dernier point implique une phase non négligeable d’adaptation des algorithmes les uns aux autres, passant par l’adaptation empirique de paramètres clés. L’étude des critères d’optimisation et de leur interaction constitue la première étape envisagée lors de la thèse. Cette étape permettra de déterminer à quel point les critères se trouvent potentiellement antagonistes. L’étude des critères pourra permettre une interaction locale des algorithmiques. Pour prendre un exemple, il est envisageable que les algorithmiques ayant pour but la réduction d’écho et de bruit

Doctorant.e: Yemdji Tchassi Christelle