Outils pour utilisateurs

Outils du site


intelligence_du_pendule_de_furuta

Ceci est une ancienne révision du document !


Intelligence du Pendule de Furuta

C'est quoi une Intelligence Artificielle

Une Intelligence Artificielle n'est jamais intelligente. C'est un programme informatique qui comprend à un moment donné un Apprentissage Automatique.

Ressources

Principes

  • Un PC serveur avec l'IA, avec un GUI ou des BP et un petit écran.
  • Un PC client sur le pendule.
  • Ils communiquent en OSC par un wifi adhoc/hotspot

L'apprentissage se compose de cycles, un cycle comprend des steps.
Un step est:

  • Le pendule envoie 4 items: (position, vitesse) du chariot, (position, vitesse) du pendule.
  • Le serveur répond par une impulsion sur le moteur dans un sens ou dans l'autre. Cette impulsion sera proportionnelle (coefficient à trouver empiriquement !) à la valeur entre -1 et 1.

Le nombre de steps est limité pour se maintenir dans un état proche de l'état final souhaité, ce qui va faire converger l'apprentissage. Un cycle comprend souvent 2000 step Maxi. Un cycle est stoppé aussi si le chariot est trop loin du zéro, si le pendule tourne trop vite … Un apprentissage comprend un nombre total de steps entre 100 000 et 1 000 000. ====Reset pour un nouveau cycle==== * Le serveur demande un reset au pendule * Le pendule se place dans une position angulaire entre -180 et 180 degrés, avec une petite vitesse angulaire * Le chariot est proche de zéro avec une petite vitesse linéaire * Le client envoie ses '/reset' = positions/vitesses * Un nouveau cycle commence ====Calcul de la vitesse et de la position==== * Le pendule envoie à une fréquence élevée ====Matériels==== ===Choix du PC pour l'IA=== Le fichier de poids fait ~46 ko. Un Raspi 4 doit suffire. ===Choix du PC pour le pendule=== Un Raspi 3 et du Arduino ? =====Installation===== Nous utilisons Gym de OpenAI et Stable-Baselines3. ===Stable-baselines3=== Le code de Stable-baselines est le code de Baselines nettoyé, amélioré, documenté. Documentation de stable-baselines @ stable-baselines.readthedocs.io Stable-baselines3 est la dernière version, il utilise tensorflow2 et Torch
* Documentation de stable-baselines3 @ stable-baselines3.readthedocs.io Installation: https://stable-baselines3.readthedocs.io/en/master/guide/install.html
Les modules python à installer: stable-baselines3[extra] et pyglet. Pyglet ne sert qu'a tester l'installation. L'installation de stable-baselines3 installe gym et installe tout ce qui est dans requirements.txt <code bash> # Installation et Mise à jour du module pip sudo apt install python3-pip python3 -m pip install –upgrade pip # Installation de venv sudo apt install python3-venv </code> Télécharger les sources de furuta
Dans votre dossier “projets”, par exemple /home/machin/projets <code bash> git clone https://github.com/sergeLabo/furuta # Allez dans le dossier des sources cd /home/machin/projets/furuta python3 -m venv mon_env source mon_env/bin/activate python3 -m pip install -r requirements.txt </code> =====Création d'un Environment particulier dans Gym de OpenAI===== ====Ressources==== Using Custom Environments Nous réalisons l'apprentissage dans le monde réel, nous n'avons pas besoin de render

intelligence_du_pendule_de_furuta.1644143435.txt.gz · Dernière modification : 2022/02/06 10:30 de serge