Authorship: Youssef Jmal, Sofyan Guillermet-Laouad


title: Lab 2

Liens GitHub

Résumé (2–3 lignes)

Ce lab met en œuvre un pipeline ETL complet depuis une base PostgreSQL opérationnelle vers un schéma en étoile analytique en Parquet. Les transformations sont réalisées avec Spark, en justifiant les choix de jointure et de partitionnement à l’aide des plans d’exécution et des métriques Spark UI.