Informations professionnelles
Statut: Docteur ED
ED: EDITE
Unité de recherche: STMS
Employeur: IRCAM Date de debut de thèse: 1 octobre 2019 Date soutenance de thèse: 27 février 2023 Directeur de thèse: Axel ROEBEL (STMS) Directeur de thèse: Nicolas OBIN (STMS) Sujet de thèse: Modélisation neuronale de la prosodie pour la transformation de l’expressivité de la voix
Employeur: IRCAM Date de debut de thèse: 1 octobre 2019 Date soutenance de thèse: 27 février 2023 Directeur de thèse: Axel ROEBEL (STMS) Directeur de thèse: Nicolas OBIN (STMS) Sujet de thèse: Modélisation neuronale de la prosodie pour la transformation de l’expressivité de la voix
Soutenance de thèse
Données générales
Titre : NEURAL CONVERSION OF SOCIAL ATTITUDES IN SPEECH SIGNALS
Date : 27 février 2023
Heure: 14:00
Résumé : La voix permet la transmission de messages linguistiques ainsi que d'autres informations, telles que les attitudes du locuteur, qui enrichissent considérablement le sens communiqué. Les attitudes sociales de la parole - ici définies en premier lieu comme des dispositions de prise de parole d’un locuteur à l’égard de son interlocuteur - constituent l’objet de cette recherche qui vise au développement d’algorithmes neuronaux dédiés à leurs conversion. L’ étape initiale fut la collecte d’un jeu de données dédié à ces attitudes vocales. Une première étude a permis d’identifier leurs stratégies de production; une seconde, de révéler certains biais impliqués dans leur perception. Forts de ces connaissances sur nos données, nous avons élaboré un algorithme basé sur l’architecture transformer pour la conversion many-to-many des attitudes. Des mesures objectives et subjectives ont permis de valider les performances de ce modèle.
Lieu : Ircam
Rapporteurs/ Rapporteuses
Personne | Qualité | Etablissement |
---|---|---|
M. Hueber Thomas | Chargé de recherche (HDR) | GRENOBLE IMAGES PAROLE SIGNAL AUTOMATIQUE UMR 5216 |
M. Lolive Damien | Professeur des universités | Institut de Recherche en Informatique et Systèmes Aléatoires, Univ. Rennes |
Composition du jury
Personne | Qualité | Etablissement |
---|---|---|
Mme. Pelachaud Catherine | Directrice de recherche (HDR) | Institut des Systèmes Intelligents et de Robotique, Sorbonne Université |
M. Obin Nicolas | Maître de Conférences (HDR) | Sciences et technologies de la musique et du son, Sorbonne Université |
M. Roebel Axel | Directeur de recherche (HDR) | Sciences et technologies de la musique et du son, Sorbonne Université, IRCAM |
Mme. Sisman Berrak | Maîtresse de Conférences | University of Texas at Dallas (États-Unis) |
M. Busso Carlos | Professeur des universités | University of Texas at Dallas (États-Unis) |
M. Lorenzo trueba Jaime | Industriel | Amazone (RU), Secteur Privé (RU) (Royaume-Uni) |
M. Hueber Thomas | Chargé de recherche (HDR) | GRENOBLE IMAGES PAROLE SIGNAL AUTOMATIQUE UMR 5216 |
M. Lolive Damien | Professeur des universités | Institut de Recherche en Informatique et Systèmes Aléatoires, Univ. Rennes |