apprentissage_par_renforcement
Différences
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentesRévision précédenteProchaine révision | Révision précédenteProchaine révisionLes deux révisions suivantes | ||
apprentissage_par_renforcement [2021/01/09 16:22] – [Frameworks possibles] serge | apprentissage_par_renforcement [2021/01/09 17:39] – [Baselines vs Stable-baselines vs Stable-baselines3] serge | ||
---|---|---|---|
Ligne 76: | Ligne 76: | ||
* MushroomRL | * MushroomRL | ||
| | ||
- | ====Frameworks possibles==== | + | =====Frameworks possibles===== |
- | ===Gym de OpenAI=== | + | ====Gym de OpenAI==== |
+ | ===OpenAI=== | ||
* **[[https:// | * **[[https:// | ||
[[https:// | [[https:// | ||
- | | + | ===Gym=== |
- | * https:// | + | Gym is a toolkit for developing and comparing reinforcement learning algorithms. |
- | * http:// | + | |
+ | * [[https:// | ||
+ | * [[http:// | ||
+ | |||
+ | |||
====Baselines vs Stable-baselines vs Stable-baselines3==== | ====Baselines vs Stable-baselines vs Stable-baselines3==== | ||
- | **" | + | OpenAI Baselines is a set of high-quality implementations of reinforcement learning algorithms. |
===Baselines=== | ===Baselines=== | ||
- | [[https:// | + | [[https:// |
===Stable-baselines=== | ===Stable-baselines=== | ||
Ligne 126: | Ligne 132: | ||
* **[[https:// | * **[[https:// | ||
- | * | + | |
=====Le jeu du pendule dans Blender===== | =====Le jeu du pendule dans Blender===== | ||
apprentissage_par_renforcement.txt · Dernière modification : 2022/02/10 07:52 de serge