Description
Date depot: 18 octobre 2022
Titre: Selective attribute suppression for privacy preservation in speech
Directeur de thèse:
Nicholas EVANS (Eurecom)
Encadrant :
Massimiliano TODISCO (Eurecom)
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Non defini
Resumé: A wealth of personal, private information, far beyond the spoken content, can be derived from speech signals, e.g. the speaker identity, gender, health and emotion. When using smart speech technology, users grant unconditional access to all such information, even that which is not strictly necessary to accomplish the task to which a user gives consent. This additional information, though personal and private, can be used by adversaries for nefarious purposes. This project will strength the traditional approach to bring privacy to smart speech technology, involving anonymisation, to consider the selective suppression of privacy-sensitive attributes in speech signals. In building upon privacy-driven adversarial representation learning, multi-task learning and voice conversion-based anonymisation, the solution is formed from an array of competing, controllable or configurable adversaries from which privacy-sensitive attributes can be explicitly disentangled and suppressed before the resynthesis of a protected speech utterance.
Résumé dans une autre langue: Une multitude d'informations personnelles et privées, bien au-delà du contenu parlé, peuvent être dérivées des signaux vocaux, par ex. l'identité, le sexe, la santé et l'émotion du locuteur. Lors de l'utilisation de la technologie vocale intelligente, les utilisateurs accordent un accès inconditionnel à toutes ces informations, même celles qui ne sont pas strictement nécessaires pour accomplir la tâche à laquelle un utilisateur donne son consentement. Ces informations supplémentaires, bien que personnelles et privées, peuvent être utilisées par des acteurs malveillantes. Ce projet renforcera l'approche traditionnelle visant à apporter la confidentialité à la technologie vocale intelligente, impliquant l'anonymisation, pour envisager la suppression sélective des attributs sensibles à la confidentialité dans les signaux vocaux. En s'appuyant sur l'apprentissage de la représentation adverse axée sur la confidentialité, l'apprentissage multitâche et l'anonymisation basée sur la conversion vocale, la solution est formée d'un nombre d'adversaires concurrents, contrôlables ou configurables à partir desquels les attributs sensibles à la confidentialité peuvent être explicitement démêlés et supprimés avant la synthèse de la parole protégé.
Doctorant.e: Panariello Michele