Formation/Cours

Logo UCL monochrome

Big Data

Etablissement : ECOLE DU NUMERIQUE

Langue : Français

Période : S4

Connaissance de base en algèbre linéaire, en programmation.

Dans la continuité de Big-Data 1, cette formation poursuivra la découverte de l’écosystème Big-Data, métiers, concepts méthodologiques et techniques. Ce semestre sera plus concentré sur l’utilisation de la technologie Spark et de son intégration par divers TD/TP et projet.

  • Introduction et rappels

• Revue des concepts du big data (“5V”, map&reduce)
• Revue de l’historique des technologies (BDD, Hadoop –> Spark)
• Rappel sur le fonctionnement de Spark (RDD, DAG Lazyness)
TD : Installation locale de spark

  • Spark “Advanced”

• Fonctionnement de Spark (Spark UI, pyspark)
• Machine Learning avec Spark (MLlib, scikit-learn)
• Deep Learning avec Spark (Tensorflow, pytorch)
TD : Machine Learning avec Spark (ETL, modèle, interprétation)
TD : Utilisation d’un framework de Deep Learning avec Spark.
TD : Utilisation avancée de Databricks.

  • MLOPS

• Machine Learning Design Document
• Initiation au MLOPS

  • Perspectives

• Ecosystème actuel & opensource
• LLM, ollama