Fiche de BOUS Frederik

Informations professionnelles

Statut: Docteur ED
Unité de recherche: STMS
Employeur: IRCAM

Date de debut de thèse: 1 octobre 2019
Date soutenance de thèse: 21 septembre 2023
Directeur de thèse: Axel ROEBEL (STMS)
Sujet de thèse: Parametric Speech Synthesis with Deep Neural Networks

Soutenance de thèse

Données générales

Titre : A neural voice transformation framework for modification of pitch and intensity
Date : 21 septembre 2023
Heure: 15:00
Résumé : At the core of these transformations is the bottleneck auto-encoder which disentangles some voice parameter from the remaining information, that is, it creates two information streams that are uncorrelated. The bottleneck auto-encoder, again forms an analysis-synthesis loop, this time between the mel-spectrogram and its latent code. Using the latent code from the analysis operation the synthesiser can perform the transformation by combining the original latent code with a modified parameter curve. In this thesis we study two specific voice parameters as possible control inputs to the auto-encoder: The fundamental frequency and the voice level. The fundamental frequency is used in an extensive study about the general mechanics of the bottleneck auto-encoder. To transform the voice level, we provide a method to obtain the voice level from recordings that were not annotated with voice level.
Lieu : IRCAM Salle Stravinsky

Rapporteurs/ Rapporteuses

Personne Qualité Etablissement
M. Dutoit Thierry Professeur des universités Université de Mons (Belgique)
M. Stylianou Yannis Professeur des universités University of Crete (Grèce)

Composition du jury

Personne Qualité Etablissement
M. D'alessandro Christophe Directeur de recherche (HDR) Institut Jean le Rond d'Alembert
M. Bonada Jordi Chargé de recherche Université Pompeu Fabra (UPF) (Espagne)
Mme. Henrich Nathalie Directrice de recherche (HDR) GRENOBLE IMAGES PAROLE SIGNAL AUTOMATIQUE UMR 5216, Univ. Grenoble Alpes
M. Roebel Axel Directeur de recherche (HDR) Sciences et technologies de la musique et du son, Sorbonne Université, IRCAM
M. Dutoit Thierry Professeur des universités Université de Mons (Belgique)
M. Stylianou Yannis Professeur des universités University of Crete (Grèce)