Description
Date depot: 1 janvier 1900
Titre: Préservation de la confidentialité des données dans un cloud .
Directrice de thèse:
Salima BENBERNOU (LIPADE)
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Non defini
Resumé:
L'informatique 'dans les nuages' est un concept apparu très récemment, mais dont les racines
remontent à quelques années, notamment à la technologie des grilles de calcul (Grid
Computing), utilisée pour le calcul scienti_que. Le Cloud Computing fait référence à l'utilisation
de la mémoire et des capacités de calcul des ordinateurs et des serveurs répartis dans le monde
entier, et liés par un réseau, tel Internet. Les utilisateurs du nuage pourraient ainsi disposer d'une
puissance informatique considérable et modulable. Le Cloud Computing est en phase de devenir
un business. L'ensemble de puissance de calcul et de mémoire, conçu comme un outil proposé
comme un service à des clients par une entreprise est annoncé comme l'ultime étape de
l'industrialisation des centres de données. A l'image de la puissance électrique il y a un siècle, la
puissance de calcul et de stockage de l'information serait proposée à la consommation par des
compagnies spécialisées. De ce fait, les entreprises n'auraient plus besoin de serveurs propres,
mais confieraient cette ressource à une entreprise qui leur garantirait une puissance de calcul et
de stockage à la demande PaaS et IaaS (Platform as a Service et Infrastructure as a Service). Une
couche logicielle de gestion des ressources et d'outils de programmation serait aussi proposée par
les propriétaires de Cloud Computing et ce de manière à rendre utilisable par le plus grand
nombre ces ressources informatiques SaaS (Software as a Service). C'est dans cette optique que
les logiciels en ligne tel que les applications collaboratives peuvent être perçues comme la partie
logicielle émergée de cette nouvelle manière de concevoir l'informatique. De même, les systèmes
d'exploitation pourraient être proposés à distance. Sur ce point, les technologies de virtualisation,
très en vogue à l'heure actuelle, pourraient s'intégrer à plein dans le concept de Cloud
Computing.
Le cloud computing est un modèle permettant la disponibilité, l’accès à la demande au réseau
d’un pool de partage de ressources configurables (i.e., réseaux, serveurs, stockage, applications,
services, ..) qui peut être rapidement approvisionné et publié avec un minimum d’effort gestion
ou d’interaction de services. Il existe de nombreux déploiement de modèles de cloud, tels que les
clouds publics, clouds privés, clouds de communautés et hybrides. En outre, deux concepts
majeurs ont émergés ; Cloud d’utilités et clouds de données. Les deux concepts ne sont pas
mutuellement exclusifs, ils peuvent coopérer pour fournir des économies à grande échelle,
d’élasticité, sécurité, et analyse dans un monde scalable. Le cloud d’utilités se focalise dans
l’offre d’infrastructure, plate-forme, software comme des services que beaucoup d’utilisateurs
consomment. Au contraire, l’objectif du cloud de données est de faire des agrégations de
données massives. Dans cette thèse nous nous intéressons au cloud de données. Le cloud de
données commence par assumer le besoin de l’entreprise de rapidement stocker et gérer un grand
volume chaotique de données propagées dans une entreprise, perturbées par des séquences de
temps. Ainsi, le Cloud computing offre une grande variété de technologie supportant la
transformation de la gestion et l’analyse de données.
Les questions de la confidentialité des données et de la qualité de service au regard du coût de la
prestation est l'objet de beaucoup d'attentions de la part des décideurs pour choisir, ou non,
d'externaliser l'intégralité de leurs données et ressources informatiques. C'est dans cette optique
que sont orientés les travaux au LIPADE.
Le champ des investigations s'oriente maintenant vers des techniques pour la préservation de la
vie privée des utilisateurs et/ou des clients lors de l'externalisation de leurs bases de données
dans un cloud et lors de l’analyse de ses données. Le but de la thèse est de la proposition de
méthodes pour la préservation de la confidentialité des données lors de l’externalisation des
bases de données et leur analyses dans un cloud.
L’objectif de la thèse est de proposer des solutions théoriques et opérationnelles relatives aux
problèmes de préservation de la vie privée dans le cadre de l’analyse de données externalisées
sur un cloud.
Traditionnellement, les bases de données relationnelles sont de solutions pour le stockage de
données structurées dans des applications conventionnelles d’entreprises. Cependant, de
nouvelles classes de problèmes ont émergées quand on est en possession d’un grand volume de
données plus grand que 10 terabytes. Faire de l’analyse de données sur un data cloud est un
problème ardu que nous souhaitons prendre en compte dans le cadre de cette thèse.
D’autre part, les données que nous souhaitons analyser risquent de comporter de données
sensibles. Il faudra prendre compte la préservation de la confidentialité des données quand on
est ne présence de plus de terabytes de données.
Les travaux sur la privacy sont inexistants. Cep
Doctorant.e: Khaled Toufik