intelligence_du_pendule_de_furuta
Différences
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentesRévision précédenteProchaine révision | Révision précédente | ||
intelligence_du_pendule_de_furuta [2022/05/24 18:25] – [Principes] serge | intelligence_du_pendule_de_furuta [2022/10/07 10:11] (Version actuelle) – [Version avec ESP32] serge | ||
---|---|---|---|
Ligne 13: | Ligne 13: | ||
Une Intelligence Artificielle n'est jamais intelligente.\\ | Une Intelligence Artificielle n'est jamais intelligente.\\ | ||
**C' | **C' | ||
- | |||
=====Ressources===== | =====Ressources===== | ||
Ligne 19: | Ligne 18: | ||
* **[[https:// | * **[[https:// | ||
* **[[https:// | * **[[https:// | ||
- | + | * **[[https:// | |
+ | * **[[https:// | ||
=====Principes===== | =====Principes===== | ||
L' | L' | ||
Ligne 25: | Ligne 26: | ||
* Le pendule envoie 4 items: (position, vitesse) du chariot, (position, vitesse) du pendule. | * Le pendule envoie 4 items: (position, vitesse) du chariot, (position, vitesse) du pendule. | ||
* Le serveur répond par une impulsion sur le moteur dans un sens ou dans l' | * Le serveur répond par une impulsion sur le moteur dans un sens ou dans l' | ||
- | + | Un cycle se termine | |
- | ====Reset pour un nouveau | + | |
- | * Le serveur demande un reset au pendule | + | |
- | * Le pendule se place dans une position angulaire entre -180 et 180 degrés, avec une petite vitesse angulaire | + | |
- | * Le chariot est proche | + | |
- | * Le client envoie ses '/ | + | |
- | * Un nouveau cycle commence | + | |
=====Installation de l' | =====Installation de l' | ||
- | Nous utilisons Gym de OpenAI et Stable-Baselines3. | + | Nous utilisons Gym de OpenAI et Stable-Baselines3.\\ |
- | + | Le code de Stable-baselines est le code de Baselines nettoyé, amélioré, documenté. Stable-baselines3 est la dernière version, il utilise Torch. [[https:// | |
- | ===Stable-baselines3=== | + | Les modules python à installer: stable-baselines3 et pyglet. Pyglet ne sert qu'a tester l' |
- | Le code de Stable-baselines est le code de Baselines nettoyé, amélioré, documenté. | + | |
- | Stable-baselines3 est la dernière version, il utilise | + | |
- | * **[[https:// | + | |
- | + | ||
- | ===Installation: | + | |
- | | + | |
- | Les modules python à installer: stable-baselines3[extra] | + | |
<code bash> | <code bash> | ||
Ligne 64: | Ligne 51: | ||
</ | </ | ||
- | ====Notre environement==== | + | =====Petit Pendule de Furuta===== |
- | Ressources: **[[https://stable-baselines3.readthedocs.io/en/master/guide/custom_env.html|Création | + | ====Version tout en python==== |
+ | Au bout de très longs apprentissages, | ||
+ | Le codeur du balancier de 4 000 points crée 16 000 callbacks. En estimant la vitesse de rotation du balancier à 1 tour par seconde, la fréquence d' | ||
+ | Le moteur a un codeur de 1 000 points: le même calcul ajoute 4 000 Hz.\\ | ||
+ | |||
+ | Les gpio d'une Pi ne peuvent pas tourner à plus de 20 000 Hz: [[https://atman-iot.com/ | ||
+ | |||
+ | Les vitesses de rotation sont plus rapides que 1 tour/ | ||
+ | |||
+ | Le codeur de 4 000 points a été remplacé par un codeur de 1 000 points, qui est grandement suffisant: les frottements ne permettent pas d' | ||
+ | |||
+ | ===Training avec " | ||
+ | La méthode training_best de train_test.py est étrange: la doc n'est pas claire, ça ne finit jamais, il y a un message d' | ||
+ | <code python> | ||
+ | eval_callback = EvalCallback(self.env, | ||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | </code> | ||
+ | |||
+ | |||
+ | =====Suivi de l' | ||
+ | ====Installation, | ||
+ | tensorboard est dans les requirements.\\ | ||
+ | Dans le dossier du projet, qui contient le venv=mon_env, | ||
+ | ./mon_env/bin/tensorboard --logdir=logs | ||
+ | |||
+ | Dans un navigateur: | ||
+ | http:// | ||
+ | |||
+ | |||
+ | |||
+ | ====Exemples==== | ||
+ | {{: | ||
+ | {{: | ||
+ | {{: | ||
+ | {{: | ||
+ | ====Moyenne des récompenses==== | ||
+ | {{: | ||
+ | avec rollout/ | ||
- | Notre environnement: | ||
- | {{tag> | + | {{tag> bestiaire_ia |
intelligence_du_pendule_de_furuta.txt · Dernière modification : 2022/10/07 10:11 de serge