apprentissage_par_renforcement
Ceci est une ancienne révision du document !
Table des matières
Apprentissage Par Renforcement
Apprentissage par renforcement
- Apprentissage par renforcement @ fr.wikipedia.org. En intelligence artificielle, plus précisément en apprentissage automatique, l'apprentissage par renforcement consiste, pour un agent autonome (robot, etc.), à apprendre à partir d'expériences, de façon à optimiser une récompense quantitative au cours du temps, positive ou négative. En répétant les expériences, le robot progresse.
Directeur Semour Skinner
Le directeur de l'école des enfants Simpson s'appelle Seymour Skinner, inspiré de Burrhus Frederic Skinner, inventeur de la Boîte de Skinner
Ressources
Frameworks possibles
- Dopamine, RLLib, Keras-RL, Coach, TRFL, Tensorforce, Coach and more @ winderresearch.com/
- OpenAI Gym
- Google Dopamine
- RLLib
- Keras-RL
- TRFL
- Tensorforce
- Facebook Horizon
- Nervana Systems Coach
- MAgent
- SLM-Lab
- DeeR
- Garage
- Surreal
- RLgraph
- Simple RL
Gym de OpenAI
OpenAI
fr.wikipedia.org OpenAI est une entreprise à « but lucratif plafonné » en intelligence artificielle, basée à San Francisco. En 2019, OpenAI a reçu a 1 000 000 000 $ de Microsoft. OpenAi utilise le super Calculateur de Micro$ pour ses apprentissages.
Avant mars 2019, elle était reconnue association à but non lucratif. L'objectif de cette société est de promouvoir et développer une intelligence artificielle à visage humain qui bénéficiera à toute l'humanité. Mais surtout, à se faire des $.
Gym
Horizon de Facebook serait devenu ReAgent
Dopamine de Google
Keras, le framework créé par un ingénieur français
Q-learning
- Le Q-learning est une technique d'apprentissage par renforcement. La lettre 'Q' désigne la fonction qui mesure la qualité d'une action exécutée dans un état donné du système.
apprentissage_par_renforcement.1609173376.txt.gz · Dernière modification : 2020/12/28 16:36 de serge