Reinforcement Learning#
ou apprentissage par renforcement
(année prochaine)
Lectures
Deep Reinforcement Learning through Policy Optmization (vu dans Highlights of NIPS 2016: Adversarial learning, Meta-learning, and more)
RLPy: A Value-Function-Based Reinforcement Learning Framework for Education and Research
Reinforcement Learning Part I Reinforcement Learning Part II
Renewal Monte Carlo: Renewal theory based reinforcement learning
Lectures sur des applications
Universal Planning Networks : utilisation de l’apprentissage par renforcement pour caler la progression du bras d’un robot vers la saisie d’une pièce lorsque le chemin est obstrué.
Exemples
Reinforcement_Toys, notebooks pour découvrir l’apprentissage par renforcement
Modules
Environnements
OpenAI Gym, l’outil propose une formalisation qui permet de tester les algorithmes d’apprentissage par renforcements pour ses propres expériences ou pour des contextes ou jeu prédéfinies. Cela peut aboutir à ce type d’expérience : OpenAI Gym for NES games + DQN with Keras to learn Mario Bros. from raw pixels.