apprentissage_par_renforcement
Différences
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentesRévision précédenteProchaine révision | Révision précédente | ||
apprentissage_par_renforcement [2022/02/04 08:24] – [Principe vulgarisé de l'Apprentissage par Renforcement] serge | apprentissage_par_renforcement [2022/02/10 07:52] (Version actuelle) – [Apprentissage Par Renforcement] serge | ||
---|---|---|---|
Ligne 201: | Ligne 201: | ||
L' | L' | ||
- | La récompense augmente plus vite à partir de la suppression de la récompense RV. Il faudrait faire un enregistrement du model quand la récompense est élevée.\\ | ||
- | Avec du son ce serait encore plus génial ! | ||
=====Quelques explications===== | =====Quelques explications===== | ||
====Relations scripts vs Blender==== | ====Relations scripts vs Blender==== | ||
Ligne 273: | Ligne 271: | ||
Bullet est le moteur physique de Blender | Bullet est le moteur physique de Blender | ||
- | ==== Création de votre propre environnement ==== | ||
- | * [[https:// | ||
- | L' | ||
====Un cartpole réel documenté mais sans RL==== | ====Un cartpole réel documenté mais sans RL==== |
apprentissage_par_renforcement.1643963083.txt.gz · Dernière modification : 2022/02/04 08:24 de serge