Description
Date depot: 1 janvier 1900
Titre: Reconnaissance de documents multilingues par Reseaux Bayesiens Dynamiques et Reseaux de Neurones Recurrents
Directrice de thèse:
Laurence LIKFORMAN-SULEM (LTCI (EDMH))
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Non defini
Resumé:
La variabilité de l’écriture manuscrite constitue actuellement le principal verrou de la reconnaissance de l’écriture. Un même scripteur tracera différemment les caractères suivant sa position par rapport au support d’écriture, les caractères en contexte, le stylo. Les tracés manuscrits sont aussi souvent dégradés car incomplets : coupures dans les traits, boucles non fermées.
Les modèles Markoviens de type HMMs (Modèles de Markov cachés) sont jusqu’à très récemment l’état de l’art des systèmes de reconnaissance de l’écriture par leur capacité à absorber le bruit et les distorsions non linéaires. Cependant les modèles HMMs font l’hypothèse d’indépendance des observations par rapport aux états cachés. Or les observations issues des tracés ne sont pas indépendantes entre elles dans un voisinage qui dépasse celui du
caractère.Des modèles innovants apparaissent qui tiennent compte du contexte des observations. Celles ci sont basées sur des architectures nouvelles comme les réseaux Bayésiens dynamiques et les réseaux de neurones récurrents. Dans cette thèse, le doctorant proposera un modèle mixte reseaux bayésiens Dynamiques/HMM pour la reconnaissance de mots. La segmentation implicite proposée par le modèle HMM permettra d’obtenir les observations bidirectionnelles propres à un caractère. Le doctorant proposera également une paramétrisation et une modélisation basée sur les réseaux de neurones récurrents. Ces deux approches seront comparées de manière
théorique et évaluées sur des bases publiques de documents francophones et multilingues (Université de Maryland, TechnoVision Rimes)
Doctorant.e: Morillot Olivier