Statistique

Reinforcement Learning#

ou apprentissage par renforcement

(année prochaine)

Lectures

Lectures sur des applications

Universal Planning Networks : utilisation de l’apprentissage par renforcement pour caler la progression du bras d’un robot vers la saisie d’une pièce lorsque le chemin est obstrué.

Exemples

pg-pong.py
Reinforcement_Toys, notebooks pour découvrir l’apprentissage par renforcement

Modules

Ray RLlib (ray - rllib)
keras-rl
gym

Environnements

OpenAI Gym, l’outil propose une formalisation qui permet de tester les algorithmes d’apprentissage par renforcements pour ses propres expériences ou pour des contextes ou jeu prédéfinies. Cela peut aboutir à ce type d’expérience : OpenAI Gym for NES games + DQN with Keras to learn Mario Bros. from raw pixels.