Description
Date depot: 1 janvier 1900
Titre: Reconnaissance de textes manuscrits grand vocabulaire par adaptation de modèles de langage
Directrice de thèse:
Laurence LIKFORMAN-SULEM (LTCI (EDMH))
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Non defini
Resumé:
La reconnaissance de la parole et de l’écriture sont des domaines de recherche très actifs depuis une vingtaine d'années. Les systèmes de lecture des enveloppes postales, des chèques et des formulaires en découlent directement. Les recherches dans le domaine du traitement de la parole ont fait émerger les modèles de Markov cachés (HMMs) [Rabiner 89]. Les modèles HMMs pour la reconnaissance de l'écriture manuscrite sont très proches de ceux développés pour la parole. Le passage du domaine de la parole au domaine de l'écrit nécessite cependant de prendre en compte les spécificités des deux domaines (signal mono-dimensionnel pour la parole, bi-dimensionnel pour l’écriture). L’application d’une fenêtre d’analyse glissant le long de l’image du mot ou de la ligne de texte à reconnaître permet d’obtenir une séquence de signal mono-dimensionnelle.
L’avantage des systèmes HMMs à fenêtres glissante est de ne pas nécessiter de segmenter les séquences d’observations issues d’une image de ligne en mots et caractères mais de fournir cette segmentation de manière implicite lors de la reconnaissance. Plusieurs systèmes HMMs de ce type ont été développés pour l’écrit aussi bien pour l’écriture latine [El Yacoubi et al. 99 ; Vinciarelli et Luettin 00] que pour l’écriture arabe [Bazzi et al. 99 ; El Hajj et al. 09] [Bianne et al. 2010]. Ces systèmes HMMs ont montré leur très bonnes performances lors des dernières compétitions Arabic Handwritten word competition et Handwriting recognition competition organisées dans le cadre des conférences ICDAR 05, 07 et 09 [Märgner et al. 05; Märgner et al. 07; Grosicki et El Abed 09].
Les enjeux pour la reconnaissance de l’écriture sont importants car les systèmes de reconnaissance ont pour objectif de travailler dans des conditions de plus en plus extrêmes: vocabulaire élargi du fait de l’origine tout venant des documents, grande variabilité de l’écriture due à des bases de grande taille incluant de nombreux scripteurs, documents dégradés due à leur ancienneté ou provenant de télécopies. Pour atteindre ces objectifs il est nécessaire de travailler au niveau de la modélisation HMM des caractères et des mots, ainsi qu’au niveau des modèles de langage qui permettent de diriger et de corriger la reconnaissance. Modéliser le langage consiste à disposer d’un dictionnaire et d’un modèle statistique (bi ou tri-grams) et/ou syntaxique des mots qui se suivent dans une phrase. La sélection d’un dictionnaire approprié est déterminante car si l’utilisation d’un grand dictionnaire permet de bien couvrir le vocabulaire susceptible d’être utilisé, les performances du système peuvent décroître du fait du nombre plus important de mots possibles.
Doctorant.e: Oprean Cristina