Apprentissage Par Renforcement

Intelligence Artificielle English Version

Les Pages Intelligence Artificielle en détails

Apprentissage par renforcement

Apprentissage par renforcement @ fr.wikipedia.org. En intelligence artificielle, plus précisément en apprentissage automatique, l'apprentissage par renforcement consiste, pour un agent autonome (robot, etc.), à apprendre à partir d'expériences, de façon à optimiser une récompense quantitative au cours du temps, positive ou négative. En répétant les expériences, le robot progresse.

Directeur Semour Skinner

Le directeur de l'école des enfants Simpson s'appelle Seymour Skinner, inspiré de Burrhus Frederic Skinner, inventeur de la Boîte de Skinner

Ressources

Q-learning

Ressources

Le Q-learning est une technique d'apprentissage par renforcement. La lettre 'Q' désigne la fonction qui mesure la qualité d'une action exécutée dans un état donné du système.
Dopamine, RLLib, Keras-RL, Coach, TRFL, Tensorforce, Coach and more @ winderresearch.com/
Apprentissage par renforcement @ larevueia.fr Article général.
The Best Tools for Reinforcement Learning in Python You Actually Want to Try Posted November 17, 2020, parle de:
- KerasRL
- Tensorforce
- Pyqlearning
- RL_Coach
- TFAgents
- MAME RL
- MushroomRL

Frameworks possibles

Gym de OpenAI

openai.com

fr.wikipedia.org OpenAI est une entreprise à « but lucratif plafonné » en intelligence artificielle, basée à San Francisco. En 2019, OpenAI a reçu a 1 000 000 000 $ de Microsoft. OpenAi utilise le super Calculateur de Micro$ pour ses apprentissages.
Avant mars 2019, elle était reconnue association à but non lucratif. L'objectif de cette société est de promouvoir et développer une intelligence artificielle à visage humain qui bénéficiera à toute l'humanité. Mais surtout, à se faire des $.

Dopamine de Google

Tensorforce

Tensorforce: a TensorFlow library for applied reinforcement learning @ github.com/tensorforce

sudo pip3 install tensorforce
Successfully installed matplotlib-3.3.3 msgpack-1.0.2 msgpack-numpy-0.4.7.1 tensorboard-2.4.0 tensorflow-2.3.1 tensorflow-estimator-2.3.0 tensorforce-0.6.2 tqdm-4.55.0

Stable Baselines

Basé sur openai/baselines

https://github.com/hill-a/stable-baselines

ia, sb