Ce cours aborde les problèmes et les solutions liés au “big data” avec comme objectif d’aborder tous les aspects permettant le développement d’un pipeline de données efficace allant de la préparation et la représentation des données jusqu’à leur analyse. Le cours aborde les thèmes suivants:
- Manipulation efficace des données structurées et semi-structurées
- Mise en oeuvre de data Lakehouse et gestion de la qualité de données
- Stockage efficace des données massives
- Traitement parallèle et distribué de requêtes SQL
- Traitement des flux de données et requêtes continues
- Analyse de graphes à large échelle
Informations
- Période: M2 S1
- Langue: français
- Crédits: 6 ECTS