Projet de recherche doctoral numero :2840

Description

Date depot: 1 janvier 1900
Titre: Indexation audio avec des méthodes d'apprentissage à partie d'exemples
Directeur de thèse: Gérard CHOLLET (LTCI (EDMH))
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Non defini

Resumé: Peu de travaux ont porté jusqu'à ce jour sur des techniques d'indexation qui apprennent automatiquement à associer des données et des étiquettes. C'est une originalité de l'approche ALISP (Automatic Language Independent Speech Processing) développée initialement pour le codage de la parole à très bas débit, et exploitée avec succès pour d’autres tâches, telles que la reconnaissance du locuteur ou de la langue de façon à minimiser au maximum la tâche d’annotation par des opérateurs humains. Dans le cadre de cette thèse, nous proposons donc d’utiliser la méthodologie ALISP (méthodologie exploitant des techniques d’apprentissage à partir d’exemples) pour les fins d’indexation audio. Cette approche est possible car YACAST peut mettre à disposition 10 années d’émissions radios avec des métadonnées. Il nous est possible avec de telles données d’apprendre automatiquement l’association d’une suite de segments aux classes préétablies. Parmi les avantages de cette approche que nous proposons, on peut citer une portabilité vers des applications multilingues plus aisée que les approches qui sont basées sur des transcriptions textuelles. Les travaux seront développés en suivant deux directions : - L’utilisation des outils ALISP pour les besoins d’indexation et de pige musicale de YACAST, indépendamment de la plate-forme matérielle. Cette étape nous permettra de mettre en adéquation notre savoir faire avec les besoins de YACAST. Ainsi cette vision plus globale des applications bien définie nous permettra de faire les bons choix pour l’implémentation sur le dispositif embarqué. Nous pourrons ainsi évaluer les risques engendrés et choisir une gamme d’applications minimale qui pourra être implémentée sur le dispositif embarqué. - Adaptation des algorithmes nécessaires pour la gamme d’application choisie pour le portage sur le dispositif embarqué développé dans le projet SurfOnHertz.

Doctorant.e: Khemiri Houssemeddine