Projet de recherche doctoral numero :8544

Description

Date depot: 15 juin 2023
Titre: Vers la traduction neuronale augmentée par des exemples - pour une meilleure exploitation des mémoires de traduction
Directeur de thèse: François YVON (ISIR (EDITE))
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Traitement automatique des langues et de la parole

Resumé: Les méthodes de traduction neuronale s'appuient sur l'apprentissage et l'exploitation de très gros modèles probabilistes paramétriques, nourris par des corpus parallèles collectés de manière opportuniste, et rassemblant des textes souvent très divers. Une approche alternative de la traduction à base de corpus s'appuie sur des méthodes non-paramétriques et exploite de petits corpus très spécialisés et bien adaptés à une tâche donnée. Si les méthodes neuronales constituent aujourd'hui l'état de l'art, des travaux récents ouvrent la voie pour développer des méthodes hybrides, exploitant des mémoires de traduction, et qui permettraient en particulier d'apporter des réponses opérationnelles aux problème d'explicabilité des modèles probabilistes. L'objectif de cette thèse est d'étudier et d'évaluer ces modèles hybrides pour traduire des textes en domaine de spécialité.

Résumé dans une autre langue: Neural translation methods are based on the learning and exploitation of very large parametric probabilistic models, fed by parallel corpora that are often collected in an opportunistic matter, and which gather very diverse texts. An alternative approach to corpus-based machine translation relies on non-parametric methods and exploits small, highly specialised corpora that are well adapted for a given task. While neural methods currently constitute the state of the art, recent work is paving the way for the development of hybrid methods, exploiting translation memories, and which would in particular provide operational answers to the problem of explicability of probabilistic models. The objective of this thesis is to study and evaluate these hybrid models for translating texts in specialised domains.



Doctorant.e: Bouthors Maxime