Outils pour utilisateurs

Outils du site


apprentissage_par_renforcement

Ceci est une ancienne révision du document !


Apprentissage Par Renforcement

Apprentissage par renforcement

  • Apprentissage par renforcement @ fr.wikipedia.org. En intelligence artificielle, plus précisément en apprentissage automatique, l'apprentissage par renforcement consiste, pour un agent autonome (robot, etc.), à apprendre à partir d'expériences, de façon à optimiser une récompense quantitative au cours du temps, positive ou négative. En répétant les expériences, le robot progresse.

Directeur Semour Skinner

Le directeur de l'école des enfants Simpson s'appelle Seymour Skinner, inspiré de Burrhus Frederic Skinner, inventeur de la Boîte de Skinner

Ressources

Q-learning

Ressources

Frameworks possibles

Gym de OpenAI

fr.wikipedia.org OpenAI est une entreprise à « but lucratif plafonné » en intelligence artificielle, basée à San Francisco. En 2019, OpenAI a reçu a 1 000 000 000 $ de Microsoft. OpenAi utilise le super Calculateur de Micro$ pour ses apprentissages.
Avant mars 2019, elle était reconnue association à but non lucratif. L'objectif de cette société était de promouvoir et développer une intelligence artificielle à visage humain qui bénéficierait à toute l'humanité. L'objectif actuel est de se faire des $.

Tensorforce

sudo pip3 install tensorforce
Successfully installed matplotlib-3.3.3 msgpack-1.0.2 msgpack-numpy-0.4.7.1 tensorboard-2.4.0 tensorflow-2.3.1 tensorflow-estimator-2.3.0 tensorforce-0.6.2 tqdm-4.55.0

Stable Baselines

git clone -b tf2 https://github.com/openai/baselines.git
      Successfully uninstalled gym-0.13.1
ERROR: pip's dependency resolver does not currently take into account all the packages that are installed.      
tensorforce 0.6.2 requires gym>=0.17.2, but you have gym 0.13.1 which is incompatible.

Le jeu du pendule dans Blender

Avec 2 modes:

  • Manuel avec les gauche/droite du clavier
  • Automatique, avec un RL
,
apprentissage_par_renforcement.1609353185.txt.gz · Dernière modification : 2020/12/30 18:33 de serge