Description
Date depot: 1 janvier 1900
Titre: Modèles et applications pour la syndica- tion de données sur le web
Directeur de thèse:
Bernd AMANN (LIP6)
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Non defini
Resumé:
Contexte: Depuis quelques années on peut observer l'apparition d'une nouvelle génération
d'applications web (souvent caractérisées par le terme Web 2.0 ) qui sont fondées sur la
convergence des diverses technologies (moteurs de recherche, services web, AJAX, XML,
RDF...) pour faciliter le partage d'informations sur le web. Parmi ces applications, les
formats RSS et ATOM ont permis un changement radical dans la manière que l'information
est partagée et diusée sur le web. L'objectif principal de ces formats est d'appliquer le
principe de syndication (dans le sens partage ouvert et ciblée) de ressources web pour
réduire le délai entre la publication d'une information et son apparition sur les écrans des
personnes intéressées. Par exemple, au lieu de vérier régulièrement les modications d'une
page web pour avoir les dernières nouvelles, les lecteurs d'un journal électronique peuvent
ainsi créer des espaces personnalisées en s'abonnant à des ux RSS (ou ATOM) qui propagent
automatiquement et d'une manière ciblée les nouvelles informations vers leur écran.
Comparées à des sources de données traditionnelles (bases de données, documents), les
ux RSS représentent plusieurs caractéristiques particulières :
au niveau applicatif/sémantique : l'information diusée par un ux peut varier de
données précises (l'évolution des températures dans une ville) vers des informations
incomplètes, fragmentées et redondantes (échange de messages sur un forum).
au niveau logique : un ux correspond à une séquence de fragments d'information qui
peuvent contenir des références vers d'autres ressources web et qui sont étiquetés et
ordonnés par des informations temporelles (par exemple la date d'insertion dans le
ux).
au niveau physique : un ux RSS est représenté par un document RDF/XML dont les
modications doivent être diusées vers les abonnées.
Objectif général: Nous proposons d'étudier la syndication web comme un problème particulier
de gestion de ux/données XML distribuées. L'objectif principal est de construire
une plate-forme de syndication qui sera fondée sur
1. un modèle XML-RSS pour la représentation et l'interrogation uniforme de ux RSS et
d'autres sources de données XML (bases de données, services web, métadonnées RDF),
2. un langage de syndication pour la dénition déclarative d'applications de syndication
et
3. des solutions nouvelles pour la gestion de ux XML-RSS distribués.
Approche: La première étape de la thèse consistera dans la dénition d'un modèle XMLRSS
et d'un langage de requête qui combine la sémantique de RSS, XML et RDF pour
la représentation et l'interrogation uniforme (1) de données XML (arbres ordonnés et étiquet
és), (2) de métadonnées RDF (graphes étiquetés) et (3) des ux de données avec des
propriétés et relations temporelles. Ce modèle s'appuiera sur ses standards XQuery (pour
XML) et SPARQL (pour RDF) et sur des travaux existants autour des algèbres XML [ZPR02,
JLS+01, FFM+00] et RDF [FHVB02].
La deuxième étape consistera dans le développement de la plate-forme pour la création
d'application de syndication. Cette plate-forme intégrera un moteur de requêtes XML-RSS
et un langage déclaratif et de haut niveau pour la dénition d'applications de syndication.
L'approche choisie consiste à étendre les travaux existants sur les vues XML [VCC+06,
PPV05] et les vues actives [AAC+99].
Références bibliographiques
AAC+99 S. Abiteboul, B. Amann, S. Cluet, A. Eyal, L. Mignet, and T. Milo. Active views
for electronic commerce. VLDB 1999.
FFM+00 P. Fankhauser, M. Fernández, A. Malhotra, M. Rys, J. Siméon P. Wadler, The
XML Query Algebra, W3C Working Draft 04 December 2000
FHVB02 F. Frasincar, G. Houben, R. Vdovjak, P. Barna, RAL: an Algebra for Querying
RDF, WISE'02
JLS+01 H. V. Jagadish, Laks V. S. Lakshmanan, Divesh Srivastava, et al., TAX: A Tree
Algebra for XML, DBLP'01
KAC+02 Gregory Karvounarakis, Soa Alexaki, Vassilis Christophides, Dimitris Plexousakis,
Michel Scholl: RQL: a declarative query language for RDF. WWW 2002:
592-603
PPV05 M. Petropoulos , Y. Papakonstantinou , V. Vassalos, Graphical query interfaces for
semistructured data: the QURSED system, ACM Transactions on Internet Technology
(TOIT), v.5 n.2, p.390-438, May 2005
VCC+06 D. Vodislav, S. Cluet, G. Corona et I. Sebei. Views for simplifying access to
heterogeneous XML data. In CoopIS, pp. 72-90, Springer, 2006.
ZPR02 X. Zhang, B. Pielech, E.A. Rundensteiner, Honey, I shrunk the XQuery!: an XML
algebra optimization approach, WIDM2002
Doctorant.e: Creus Tomas Jordi