Formation/Cours

Logo UCL monochrome

Apprentissage par renforcement

Etablissement : ECOLE DU NUMERIQUE

Langue : Français

Période : S4

Introduction à l’Intelligence artificielle et aux méthodes d’apprentissage automatique

Programmation en Python : implémentation d’algorithmes, implémentation d’indicateurs d’évaluation et visualisation (courbes de convergence …) et de comparaison entre différents algorithmes.

Ce cours fournie les bases théoriques pour comprendre l’apprentissage par renforcement avec des exemples applicatifs.

Ce cours fournit les bases théoriques pour comprendre l’apprentissage par renforcement avec des exemples applicatifs.

Ce cours permet aux étudiants de travailler des compétences transdisciplinaires sur la modélisation de l’évolution d’un environnement, préciser des critères d’évaluation, rédaction d’un rapport de travail …

  • Introduction, terminologies et motivation sur des solutions d’apprentissage par renforcement
  • Les agents décisionnels et la prise de décision s: les Processus Décisionnels de Markov (MDP), la fonction de valeurs, la programmation dynamique, l’équation de Bellman
  • Concepts autour des méthodes d’apprentissage par renforcement et leurs politiques : model base, model free, on policy, off policy, compromis exploitation exploration, solutions optimales et sous-optimales
  • L’algorithme de Q learning
  • L’algorithme de Monte-Carlo
  • Le fléau de la dimension : taille de problème, nombre de visites vs taille tableaux de valeurs, panorama de solutions existantes pour diminuer la complexité (apprentissage guidé par des heuristiques, bénéficier d’une structure sous-jacente …)
  • Panorama de cadres applicatifs et leurs spécificités
  • Conclusion sur les avantages et inconvénients des solutions d’apprentissage par renforcement