Projet de recherche doctoral numero :3572

Description

Date depot: 1 janvier 1900
Titre: Tatouage audio pour le renforcement des systèmes de communications bas débits
Directrice de thèse: Madeleine BONNET (LIPADE)
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Non defini

Resumé: L’étude menée dans le cadre de cette thèse exploite les possibilités offertes par le tatouage audio pour le renforcement de la qualité des systèmes de communications audio. En effet, jusqu’à présent et dans le but de protection des documents, les recherches dans ce domaine se sont principalement tournées vers les objectifs de maximisation du débit de tatouage et de robustesse de celui-ci aux attaques, sans prendre en compte le contenu et l’exploitation du message caché dans le son. Dans ce contexte, deux approches sont à envisager : 1) d’une part considérer le tatouage comme mémoire porteuse d’informations sur le signal originel. Ceci permet de véhiculer des informations permettant la restauration du signal après réception. Les applications visées sont le débruitage et la restauration des trames perdues. 2) d’autre part concevoir un tatouage témoin de la ’’vie’’ du son, qui subit les mêmes altérations que lui. La comparaison entre le tatouage originel et sa version altérée permettrait d’estimer les transformations du signal et, partant, de les inverser. L’application d’annulation d’écho acoustique pourrait bénéficier de cette approche. Ainsi, le sujet de thèse s’inscrit dans le cadre de l’étude et la conception et la conception d’un système de tatouage pour l’amélioration du signal hôte. Cette approche a été initiée par Mme Imen Mezghenni dans sa thèse et ceci dans le contexte de l’annulation adaptative d’écho acoustique par tatouage. Les travaux de thèse de Mme Imen Samaali Gharbi visent une deuxième application de l’outil tatouage audio, pour l’amélioration des nouvelles générations de codeurs audio à bas débit, et ceci en exploitant l’information véhiculé part le tatouage. Le faible débit de tatouage implique de rechercher la représentation la plus compacte des informations les plus pertinentes en égard à l’application considérée. Dans le contexte du codage à bas débits, les codecs actuels, en particulier le MP3 et le AAC, introduisent un phénomène dit « pré-écho » pouvant dégrader la qualité perceptive des signaux codés/décodés à des débits réduits. Le pré-écho est un léger bruit introduit par le codeur avant une attaque (signaux percussifs comme les castagnettes) et peut non seulement être audible mais aussi changer les caractéristiques statistiques du signal, par exemple la stationnarité et la distribution. La distorsion de la qualité de compression s’accentue dans le cadre du codage multiple. En effet, le pré-écho s’accumule pour chaque cycle de codage/décodage. Dans ce cadre, un système de réduction de pré-écho a été proposé. La solution consiste à corriger l’enveloppe temporelle du signal après réception en se basant sur la connaissance à priori de l’enveloppe temporelle du signal original. Cette dernière est modélisée par la technique FDLP « Frequency Domain Linear Prediction » permettant de bien suivre l’évolution temporelle du signal tout en réduisant le nombre de paramètres qui la décrivent. Un appel à un détecteur d’attaque est nécessaire. L’évaluation des performances du système proposé a été faite par la mise en œuvre d’un ensemble de critères normalisés dédiés à la mesure perceptuelle de la qualité audio et intégrant l’ensemble des caractéristiques du système auditif. Une étude sur les codeurs perceptifs type AAC+ a souligné les failles de ces codecs dans la reconstruction du spectre hautes-fréquences, liées notamment à l'éventuelle imprévisibilité de la structure fine de celui-ci, ainsi qu'à l'imparfaite adéquation des indicateurs de rapport tonale à bruit. Ce problème se traduit par une rupture d’harmonicité, qui touche essentiellement les signaux fortement harmoniques (exemple : violon) et qui est perçu comme une dissonance. Un système de remise en forme spectrale et de réduction de dissonance est à envisager.

Doctorant.e: Samaali Imen