Projet de recherche doctoral numero :2878

Description

Date depot: 1 janvier 1900
Titre: Préservation de la confidentialité des données dans un cloud .
Directrice de thèse: Salima BENBERNOU (LIPADE)
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Non defini

Resumé: L'informatique 'dans les nuages' est un concept apparu très récemment, mais dont les racines remontent à quelques années, notamment à la technologie des grilles de calcul (Grid Computing), utilisée pour le calcul scienti_que. Le Cloud Computing fait référence à l'utilisation de la mémoire et des capacités de calcul des ordinateurs et des serveurs répartis dans le monde entier, et liés par un réseau, tel Internet. Les utilisateurs du nuage pourraient ainsi disposer d'une puissance informatique considérable et modulable. Le Cloud Computing est en phase de devenir un business. L'ensemble de puissance de calcul et de mémoire, conçu comme un outil proposé comme un service à des clients par une entreprise est annoncé comme l'ultime étape de l'industrialisation des centres de données. A l'image de la puissance électrique il y a un siècle, la puissance de calcul et de stockage de l'information serait proposée à la consommation par des compagnies spécialisées. De ce fait, les entreprises n'auraient plus besoin de serveurs propres, mais confieraient cette ressource à une entreprise qui leur garantirait une puissance de calcul et de stockage à la demande PaaS et IaaS (Platform as a Service et Infrastructure as a Service). Une couche logicielle de gestion des ressources et d'outils de programmation serait aussi proposée par les propriétaires de Cloud Computing et ce de manière à rendre utilisable par le plus grand nombre ces ressources informatiques SaaS (Software as a Service). C'est dans cette optique que les logiciels en ligne tel que les applications collaboratives peuvent être perçues comme la partie logicielle émergée de cette nouvelle manière de concevoir l'informatique. De même, les systèmes d'exploitation pourraient être proposés à distance. Sur ce point, les technologies de virtualisation, très en vogue à l'heure actuelle, pourraient s'intégrer à plein dans le concept de Cloud Computing. Le cloud computing est un modèle permettant la disponibilité, l’accès à la demande au réseau d’un pool de partage de ressources configurables (i.e., réseaux, serveurs, stockage, applications, services, ..) qui peut être rapidement approvisionné et publié avec un minimum d’effort gestion ou d’interaction de services. Il existe de nombreux déploiement de modèles de cloud, tels que les clouds publics, clouds privés, clouds de communautés et hybrides. En outre, deux concepts majeurs ont émergés ; Cloud d’utilités et clouds de données. Les deux concepts ne sont pas mutuellement exclusifs, ils peuvent coopérer pour fournir des économies à grande échelle, d’élasticité, sécurité, et analyse dans un monde scalable. Le cloud d’utilités se focalise dans l’offre d’infrastructure, plate-forme, software comme des services que beaucoup d’utilisateurs consomment. Au contraire, l’objectif du cloud de données est de faire des agrégations de données massives. Dans cette thèse nous nous intéressons au cloud de données. Le cloud de données commence par assumer le besoin de l’entreprise de rapidement stocker et gérer un grand volume chaotique de données propagées dans une entreprise, perturbées par des séquences de temps. Ainsi, le Cloud computing offre une grande variété de technologie supportant la transformation de la gestion et l’analyse de données. Les questions de la confidentialité des données et de la qualité de service au regard du coût de la prestation est l'objet de beaucoup d'attentions de la part des décideurs pour choisir, ou non, d'externaliser l'intégralité de leurs données et ressources informatiques. C'est dans cette optique que sont orientés les travaux au LIPADE. Le champ des investigations s'oriente maintenant vers des techniques pour la préservation de la vie privée des utilisateurs et/ou des clients lors de l'externalisation de leurs bases de données dans un cloud et lors de l’analyse de ses données. Le but de la thèse est de la proposition de méthodes pour la préservation de la confidentialité des données lors de l’externalisation des bases de données et leur analyses dans un cloud. L’objectif de la thèse est de proposer des solutions théoriques et opérationnelles relatives aux problèmes de préservation de la vie privée dans le cadre de l’analyse de données externalisées sur un cloud. Traditionnellement, les bases de données relationnelles sont de solutions pour le stockage de données structurées dans des applications conventionnelles d’entreprises. Cependant, de nouvelles classes de problèmes ont émergées quand on est en possession d’un grand volume de données plus grand que 10 terabytes. Faire de l’analyse de données sur un data cloud est un problème ardu que nous souhaitons prendre en compte dans le cadre de cette thèse. D’autre part, les données que nous souhaitons analyser risquent de comporter de données sensibles. Il faudra prendre compte la préservation de la confidentialité des données quand on est ne présence de plus de terabytes de données. Les travaux sur la privacy sont inexistants. Cep

Doctorant.e: Khaled Toufik