apprentissage_par_renforcement
Différences
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentesRévision précédenteProchaine révision | Révision précédente | ||
apprentissage_par_renforcement [2021/12/08 13:57] – [Le Hello World de l'Apprentissage Par Renforcement] Benjamin Labomedia | apprentissage_par_renforcement [2022/02/10 07:52] (Version actuelle) – [Apprentissage Par Renforcement] serge | ||
---|---|---|---|
Ligne 44: | Ligne 44: | ||
* [[https:// | * [[https:// | ||
- | ====Principe vulgarisé==== | + | ====Principe vulgarisé |
- | ===Boucle | + | |
* [[https:// | * [[https:// | ||
Ligne 53: | Ligne 52: | ||
{{ : | {{ : | ||
- | ===Apprentissage par renforcement=== | + | ====Principe vulgarisé de l'Apprentissage par Renforcement==== |
+ | **RL = Reinforcement Learning = Apprentissage par Renforcement** | ||
{{ : | {{ : | ||
L'IA (Intelligence Artificielle) dont nous parlons ici n'est pas intelligente, | L'IA (Intelligence Artificielle) dont nous parlons ici n'est pas intelligente, | ||
Ligne 201: | Ligne 201: | ||
L' | L' | ||
- | La récompense augmente plus vite à partir de la suppression de la récompense RV. Il faudrait faire un enregistrement du model quand la récompense est élevée.\\ | ||
- | Avec du son ce serait encore plus génial ! | ||
=====Quelques explications===== | =====Quelques explications===== | ||
====Relations scripts vs Blender==== | ====Relations scripts vs Blender==== | ||
Ligne 273: | Ligne 271: | ||
Bullet est le moteur physique de Blender | Bullet est le moteur physique de Blender | ||
- | ==== Création de votre propre environnement ==== | ||
- | * [[https:// | ||
- | L' | ||
====Un cartpole réel documenté mais sans RL==== | ====Un cartpole réel documenté mais sans RL==== |
apprentissage_par_renforcement.1638971829.txt.gz · Dernière modification : 2021/12/08 13:57 de Benjamin Labomedia