Projet de recherche doctoral numero :8561

Description

Date depot: 19 juillet 2023
Titre: Traduire automatiquement des documents complets: application aux documents scientifiques
Directeur de thèse: François YVON (ISIR (EDITE))
Encadrante : Rachel BAWDEN (Inria-Paris (ED-130))
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Traitement automatique des langues et de la parole

Resumé: L'objectif de ce projet de thèse est d'étudier les architectures de traduction automatique neuronale capables de prendre en charge des documents dans leur intégralité, et d'exploiter y compris leur structure et organisation interne pour améliorer les traductions, par exemple pour les rendre plus cohérentes. Ce travail pose à la fois des problèmes computationnels relatifs à la gestion de longs textes, mais également des problèmes d'apprentissages difficiles relatifs à l'utilisation effective de signaux d'apprentissage très ténus. Les questions relatives au transfert effectif de l'organisation du discours, de la cohésion textuel et de l'argumentation feront l'objet d'une attention particulière, tout comme celles relatives au transfert des éléments structurels et non-lexicaux. Le domaine d'application visé est la traduction d'écrits académiques, qui posent de surcroît des problèmes terminologiques qu'il faudra également prendre en considération.

Résumé dans une autre langue: The aim of this thesis project is to study neural machine translation architectures capable of handling documents in their entirety, and exploiting their internal structure and organisation to improve translations, for example to make them more coherent. This project poses both computational problems relative to the management of long texts, but also difficult learning problems relative to the effective use of very tenuous learning signals. Issues pertaining to the effective transfer of discourse organisation, textual cohesion and argumentation will receive particular attention, as will those relative to the transfer of structural and non-lexical elements. The targeted field of application is the translation of academic writings, which also poses terminological problems that will need to be taken into account.



Doctorant.e: Peng Ziqian