Projet de recherche doctoral numero :2924

Description

Date depot: 1 janvier 1900
Titre: Modèles et applications pour la syndica- tion de données sur le web
Directeur de thèse: Bernd AMANN (LIP6)
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Non defini

Resumé: Contexte: Depuis quelques années on peut observer l'apparition d'une nouvelle génération d'applications web (souvent caractérisées par le terme Web 2.0 ) qui sont fondées sur la convergence des diverses technologies (moteurs de recherche, services web, AJAX, XML, RDF...) pour faciliter le partage d'informations sur le web. Parmi ces applications, les formats RSS et ATOM ont permis un changement radical dans la manière que l'information est partagée et diusée sur le web. L'objectif principal de ces formats est d'appliquer le principe de syndication (dans le sens partage ouvert et ciblée) de ressources web pour réduire le délai entre la publication d'une information et son apparition sur les écrans des personnes intéressées. Par exemple, au lieu de vérier régulièrement les modications d'une page web pour avoir les dernières nouvelles, les lecteurs d'un journal électronique peuvent ainsi créer des espaces personnalisées en s'abonnant à des ux RSS (ou ATOM) qui propagent automatiquement et d'une manière ciblée les nouvelles informations vers leur écran. Comparées à des sources de données traditionnelles (bases de données, documents), les ux RSS représentent plusieurs caractéristiques particulières :  au niveau applicatif/sémantique : l'information diusée par un ux peut varier de données précises (l'évolution des températures dans une ville) vers des informations incomplètes, fragmentées et redondantes (échange de messages sur un forum).  au niveau logique : un ux correspond à une séquence de fragments d'information qui peuvent contenir des références vers d'autres ressources web et qui sont étiquetés et ordonnés par des informations temporelles (par exemple la date d'insertion dans le ux).  au niveau physique : un ux RSS est représenté par un document RDF/XML dont les modications doivent être diusées vers les abonnées. Objectif général: Nous proposons d'étudier la syndication web comme un problème particulier de gestion de ux/données XML distribuées. L'objectif principal est de construire une plate-forme de syndication qui sera fondée sur 1. un modèle XML-RSS pour la représentation et l'interrogation uniforme de ux RSS et d'autres sources de données XML (bases de données, services web, métadonnées RDF), 2. un langage de syndication pour la dénition déclarative d'applications de syndication et 3. des solutions nouvelles pour la gestion de ux XML-RSS distribués. Approche: La première étape de la thèse consistera dans la dénition d'un modèle XMLRSS et d'un langage de requête qui combine la sémantique de RSS, XML et RDF pour la représentation et l'interrogation uniforme (1) de données XML (arbres ordonnés et étiquet és), (2) de métadonnées RDF (graphes étiquetés) et (3) des ux de données avec des propriétés et relations temporelles. Ce modèle s'appuiera sur ses standards XQuery (pour XML) et SPARQL (pour RDF) et sur des travaux existants autour des algèbres XML [ZPR02, JLS+01, FFM+00] et RDF [FHVB02]. La deuxième étape consistera dans le développement de la plate-forme pour la création d'application de syndication. Cette plate-forme intégrera un moteur de requêtes XML-RSS et un langage déclaratif et de haut niveau pour la dénition d'applications de syndication. L'approche choisie consiste à étendre les travaux existants sur les vues XML [VCC+06, PPV05] et les vues actives [AAC+99]. Références bibliographiques AAC+99 S. Abiteboul, B. Amann, S. Cluet, A. Eyal, L. Mignet, and T. Milo. Active views for electronic commerce. VLDB 1999. FFM+00 P. Fankhauser, M. Fernández, A. Malhotra, M. Rys, J. Siméon P. Wadler, The XML Query Algebra, W3C Working Draft 04 December 2000 FHVB02 F. Frasincar, G. Houben, R. Vdovjak, P. Barna, RAL: an Algebra for Querying RDF, WISE'02 JLS+01 H. V. Jagadish, Laks V. S. Lakshmanan, Divesh Srivastava, et al., TAX: A Tree Algebra for XML, DBLP'01 KAC+02 Gregory Karvounarakis, Soa Alexaki, Vassilis Christophides, Dimitris Plexousakis, Michel Scholl: RQL: a declarative query language for RDF. WWW 2002: 592-603 PPV05 M. Petropoulos , Y. Papakonstantinou , V. Vassalos, Graphical query interfaces for semistructured data: the QURSED system, ACM Transactions on Internet Technology (TOIT), v.5 n.2, p.390-438, May 2005 VCC+06 D. Vodislav, S. Cluet, G. Corona et I. Sebei. Views for simplifying access to heterogeneous XML data. In CoopIS, pp. 72-90, Springer, 2006. ZPR02 X. Zhang, B. Pielech, E.A. Rundensteiner, Honey, I shrunk the XQuery!: an XML algebra optimization approach, WIDM2002

Doctorant.e: Creus Tomas Jordi