Apprentissage par renforcement
Etablissement : ECOLE DU NUMERIQUE
Langue : Français
Formation(s) dans laquelle/lesquelles le cours apparait :
- MASTER DATA ET IA [ECTS : 3,00]
Période : S4
Introduction à l’Intelligence artificielle et l’apprentissage automatique
Ce cours fournie les bases théoriques pour comprendre l’apprentissage par renforcement avec des exemples applicatifs.
- Introduction, terminologies et motivation sur des solutions d’apprentissage par renforcement
- Les agents décisionnels et la prise de décisions : les Processus Décisionnels de Markov, la fonction de valeurs, la programmation dynamique, l’équation de Bellman
- Concepts autour des méthodes d’apprentissage par renforcement et leurs politiques : model base, model free, on policy, off policy, compromis exploitation exploration, solutions optimales et sous-optimales
- L’algorithme de Q Learning
- L’algorithme de Monte-Carlo
- Le Fleau de la dimension : taille de problème, nombre de visites vs taille tableaux de valeurs, panorama de solutions existantes pour diminuer la complexité (apprentissage guidé par des heuristiques, bénéficier d’une structure sous-jacente …)
- Conclusion sur les avantages et inconvénients des solutions d’apprentissage par renforcement
- Panorama de cadres applicatifs et leurs spécificités avec un focus sur un cadre applicatif robotique via The Construct : une plateforme robotique basé sur la simulation de plusieurs types de robots (turtle, bras, bb8, …). Des licences de 4 mois serons offerts aux étudiants pour pratiquer la mise en place et l’évaluation de différents algorithmes d’apprentissage par renforcement sur des robots via le simulateur.