apprentissage_par_renforcement
Différences
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentesRévision précédenteProchaine révision | Révision précédenteProchaine révisionLes deux révisions suivantes | ||
apprentissage_par_renforcement [2021/01/09 17:36] – [Baselines vs Stable-baselines vs Stable-baselines3] serge | apprentissage_par_renforcement [2021/01/21 17:08] – [Constraint Rigid Body Joint] serge | ||
---|---|---|---|
Ligne 92: | Ligne 92: | ||
====Baselines vs Stable-baselines vs Stable-baselines3==== | ====Baselines vs Stable-baselines vs Stable-baselines3==== | ||
- | **" | + | OpenAI Baselines is a set of high-quality implementations of reinforcement learning algorithms. |
===Baselines=== | ===Baselines=== | ||
Ligne 106: | Ligne 106: | ||
<code bash> | <code bash> | ||
- | cd / | ||
- | git clone -b tf2 https:// | ||
- | cd baselines | ||
- | sudo pip3 install -e . | ||
- | sudo pip3 uninstall gym | ||
- | sudo pip3 install -e . | ||
- | sudo pip3 install stable-baselines3 | ||
git clone https:// | git clone https:// | ||
pip install -e .[docs, | pip install -e .[docs, | ||
Ligne 132: | Ligne 125: | ||
* **[[https:// | * **[[https:// | ||
- | * | + | |
=====Le jeu du pendule dans Blender===== | =====Le jeu du pendule dans Blender===== | ||
Ligne 159: | Ligne 152: | ||
Cette 2ème solution permet de bien faire tourner le pendule, par contre le stabiliser verticalement est corriace. | Cette 2ème solution permet de bien faire tourner le pendule, par contre le stabiliser verticalement est corriace. | ||
+ | |||
+ | Le Empty a été remplacer par un Cube en Dynamic avec une masse de 1 et le pendule une masse de 0.1 | ||
+ | |||
+ | ==== Source sur Github ==== | ||
+ | |||
+ | * **[[https:// | ||
=====Gym CartPole Ressources===== | =====Gym CartPole Ressources===== | ||
apprentissage_par_renforcement.txt · Dernière modification : 2022/02/10 07:52 de serge