SAM - Stockage et Accès aux Mégadonnées


Cette UE aborde les architectures de SGBD répartis et des systèmes newSQL Les thèmes suivants sont en particulier abordés : stockage et indexation de données réparties, exécution et optimisation de requêtes réparties, réplication de données et cohérence des répliques, transactions réparties et protocoles de validation, principes des bases de données parallèles, jointures parallèles, étude pratique des systèmes Dynamo DB, BigTable, Hbase, Calvin et Oracle NOSQL KVStore.

Le planning prévu est le suivant :

  • Cours 1 index non plaçant, composés, couvrants. Arbre B+
  • TP1-2 index et persistence, index bitmap. TD: index composés
  • Cours 2 : Hachage extensible et linéaire
  • TP1-2 index et persistence, TD hachage
  • Cours 3 : a) Index ART. b) LSM Tree Store
  • TP3 LSM Tree Store, TD3: Exercice index ART avec compression de chemins. Exercice sur les BKD tree
  • Cours 4 : implémentation et coût de opérateurs de jointure, tri externe
  • TP4-5 plan d’exécution de requêtes, TD: jointure 2 entre relations
  • Cours 5 : optimisation de requêtes, sélectivité des opérateurs de sélection et jointure
  • TP4-5 plan d’exécution de requêtes, TD sur l’optim de requêtes, pseudo code des plans d’exécution
  • Cours 6 : conception de BD réparties par fragmentation
  • TP6 : ordre des jointures. TD : coût d’un plan d’exécution
  • ER1
  • Cours 7 : requêtes réparties
  • TP7 : traitement de requêtes réparties. TD: requêtes réparties.
  • Cours 8 : réplication et système Dynamo DB
  • TP8-9 : Requêtes multi sites opendata, TD requêtes réparties avec JDBC
  • Cours 9 : Transaction NewSQL et système Calvin
  • TP8-9 : Requêtes multi sites opendata, TD transactions dans Calvin
  • Cours 10: Vector Databases
  • TP10 : séance de 4h pour le TP requêtes ANN + révisions
  • ER2

Informations

  • Période: M1 S2
  • Langue: français
  • Crédits: 6 ECTS