apprentissage_par_renforcement_d_un_pendule_de_furuta

Ceci est une ancienne révision du document !

Table des matières

Ressources
Suivi de l'efficacité de l'apprentissage avec tensorboard
- Moyenne des récompenses
Tableau d'Optimisation des Paramètres

Apprentissage par renforcement d'un pendule de Furuta

Intelligence Artificielle English Version

Toutes les pages sur le Bestiaire Intelligence Artificielle

Affichage de l'efficacité d'un apprentissage par renforcement

Ressources

Reinforcement Learning in Python with Stable Baselines 3 : How to save and load models

Suivi de l'efficacité de l'apprentissage avec tensorboard

Moyenne des récompenses

Permet d'apprécier l'efficacité de l'apprentissage avec rollout/ep_rew_nean

Tableau d'Optimisation des Paramètres

Parameter Optimization

Numéro	06	07	08	09	10	11	14	15
Learning Rate en 10-4	10	50	20	20	7	12	3
Ent Coef en 10-3	1	1	1	2	1	1	0
Vf Coef	0.55	0.55	0.55	0.55	0.51	0.55	0.5
Note d'efficacité	6/10	0/10	3/10	1/10	2/10	5/10

apprentissage automatique, bestiaire ia, ia, python, sb, pytorch, tensorboard

apprentissage_par_renforcement_d_un_pendule_de_furuta.1651568997.txt.gz · Dernière modification : 2022/05/03 09:09 de serge