Projet de recherche doctoral numero :3291

Description

Date depot: 1 janvier 1900
Titre: Détection de mots-clés à base d'empreintes audio
Directrice de thèse: Marie-José CARATY (LIPADE)
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Non defini

Resumé: La détection de mots-clés dans la parole continue consiste à reconnaître et à localiser toutes les occurrences des mots d’une liste de mots-clés dans un continuum de parole donné. Les applications concernent par exemple le filtrage de contenus, la recherche d’information ou le résumé automatique. L’algorithme de comparaison dynamique permet un alignement acoustique non linéaire entre une référence et un signal test afin de prendre en compte la variabilité du rythme d’élocution. D’autres méthodes basées sur des systèmes de reconnaissance de la parole continue markoviens utilisent l’hypothèse de reconnaissance pour cette détection. L’évaluation de ces méthodes consiste à calculer les taux de reconnaissance et le nombre de fausses alarmes par heure et par mot-clé. Dans l’objectif de la recherche d’information dans les documents audio, il peut être nécessaire d’augmenter la liste de mots-clés sans avoir à apprendre la référence acoustique des nouveaux mots. Cette nouvelle recherche pose des problèmes de complexité car il s’agit d’appliquer la détection de mots-clés à l’ensemble des documents d’une thématique donnée. On propose dans cette thèse de construire un système de détection de mots-clés flexible et adapté à la recherche d’information. Il s’agit en particulier d’étudier de nouvelles représentations du signal de parole issues des recherches en identification audio par références. Ces recherches ont obtenu de bons résultats dans le domaine de l’indexation en musique. Cette référence est idéalement un code d’identification unique du segment audio. Elle doit être la plus compacte possible pour limiter le volume de stockage et permettre une recherche rapide. Ainsi, dans le cadre de la détection de mots-clés dans un flux audio, notre travail consiste à adapter l’identification audio par références à la parole ainsi que concevoir et développer des techniques d’appariement.

Doctorant.e: Camus Matthieu