Description
Date depot: 24 novembre 2023
Titre: hardware software codesign for data intensive applications
Directeur de thèse:
Maurizio FILIPPONE (Eurecom)
Encadrant :
Raja APPUSWAMY (Eurecom)
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Non defini
Resumé: Modern server hardware is increasingly heterogeneous with a diverse mix of XPU architectures deployed across CPU, GPU, and FPGAs. However, till date, database developers have had to rely on either proprietary, architecture-specific solutions (like CUDA), or low-level, cross-architecture solutions that complicate development (like OpenCL). The lack of portable parallelism caused by the absence of a common high-level programming framework is one of the main reasons preventing a wider adoption of XPUs by data management systems.
In this thesis, we take the first steps towards solving this problem using oneAPI--a cross-industry effort for developing an open, standards-based unified programming model that extends standard C++ to provide portable parallelism across diverse processor architectures. We will use oneAPI to develop accelerated data management engines for a few key data-intensive domains (relational data warehouses and computational genomics). In doing so, we will develop novel cross-architecture algorithms, investigate performance-portable implementation techniques, and perform rigorous evaluation using a variety of processing hardware.
Résumé dans une autre langue: Le matériel serveur moderne est de plus en plus hétérogène avec un mélange diversifié d'architectures XPU déployées sur CPU, GPU et FPGA. Cependant, jusqu'à présent, les développeurs de bases de données devaient s'appuyer soit sur des solutions propriétaires spécifiques à l'architecture (comme CUDA), soit sur des solutions multi-architectures de bas niveau qui compliquent le développement (comme OpenCL). Le manque de parallélisme portable causé par l’absence d’un cadre de programmation commun de haut niveau est l’une des principales raisons empêchant une adoption plus large des XPU par les systèmes de gestion de données.
Dans cette thèse, nous faisons les premiers pas vers la résolution de ce problème en utilisant oneAPI, un effort intersectoriel visant à développer un modèle de programmation unifié ouvert et basé sur des normes qui étend le C++ standard pour fournir un parallélisme portable sur diverses architectures de processeur. Nous utiliserons oneAPI pour développer des moteurs de gestion de données accélérées pour quelques domaines clés gourmands en données (entrepôts de données relationnels et génomique computationnelle). Ce faisant, nous développerons de nouveaux algorithmes multi-architectures, étudierons des techniques de mise en œuvre portables en termes de performances et effectuerons une évaluation rigoureuse à l’aide d’une variété de matériel de traitement.
Doctorant.e: Kabadzhov Ivan