Retour

Renforcement Learning

ECTS : 2

Volume horaire : 21

Description du contenu de l'enseignement :

 1/ Introduction au reinforcement learning
2/ Formalisme théorique :  « Markov decision processes » (MDP), function valeur ( équation de  Belman et Hamilton- Jacobi – Bellman) etc.
3/ Stratégies usuelles, sur l’exemple de “multi-armed bandit”
4/ Stratégies en deep learning: Q-learning et DQN
5/ Stratégies en deep learning: SARSA et variantes
6/ Stratégies en deep learning: Actor-Critic et variantes
7/ Implémentations Python variées
8/ Perspectives. 

Compétence à acquérir :

introduction au deep reinforcement learning, avec une vision machine learning empirique: principaux algorithmes, implementations pratiques (gym) 

Bibliographie, lectures recommandées :

https://turinici.com

Université Paris Dauphine - PSL - Place du Maréchal de Lattre de Tassigny - 75775 PARIS Cedex 16 - 21/11/2024