Outils pour utilisateurs

Outils du site


apprentissage_par_renforcement_d_un_pendule_de_furuta

Ceci est une ancienne révision du document !


Apprentissage par renforcement d'un pendule de Furuta

Affichage de l'efficacité d'un apprentissage par renforcement

Ressources

Suivi de l'efficacité de l'apprentissage avec tensorboard

Moyenne des récompenses

Permet d'apprécier l'efficacité de l'apprentissage avec rollout/ep_rew_nean

Tableau d'Optimisation des Paramètres

Parameter Optimization

Numéro 06 07 08 09 10 11 14 15
Learning Rate en 10-4 10 50 20 20 7 12 3
Ent Coef en 10-3 1 1 1 2 1 1 0
Vf Coef 0.55 0.55 0.55 0.55 0.51 0.55 0.5
Note d'efficacité 6/10 0/10 3/10 1/10 2/10 5/10
apprentissage_par_renforcement_d_un_pendule_de_furuta.1651569315.txt.gz · Dernière modification : 2022/05/03 09:15 de serge