apprentissage_par_renforcement_d_un_pendule_de_furuta
Ceci est une ancienne révision du document !
Table des matières
Apprentissage par renforcement d'un pendule de Furuta
Affichage de l'efficacité d'un apprentissage par renforcement
Ressources
Suivi de l'efficacité de l'apprentissage avec tensorboard
Moyenne des récompenses
Tableau d'Optimisation des Paramètres
Parameter Optimization
Numéro | 06 | 07 | 08 | 09 | 10 | 11 | 14 | 15 |
---|---|---|---|---|---|---|---|---|
Learning Rate en 10-4 | 10 | 50 | 20 | 20 | 7 | 12 | 3 | |
Ent Coef en 10-3 | 1 | 1 | 1 | 2 | 1 | 1 | 0 | |
Vf Coef | 0.55 | 0.55 | 0.55 | 0.55 | 0.51 | 0.55 | 0.5 | |
Note d'efficacité | 6/10 | 0/10 | 3/10 | 1/10 | 2/10 | 5/10 |
apprentissage_par_renforcement_d_un_pendule_de_furuta.1651568997.txt.gz · Dernière modification : 2022/05/03 09:09 de serge