apprentissage_par_renforcement
Différences
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentesRévision précédente | Prochaine révisionLes deux révisions suivantes | ||
apprentissage_par_renforcement [2021/02/13 12:42] – [Relèvement du pendule appelé Swing-up] serge | apprentissage_par_renforcement [2021/02/13 12:43] – [Relèvement du pendule appelé Swing-up] serge | ||
---|---|---|---|
Ligne 195: | Ligne 195: | ||
L' | L' | ||
- | {{ : | + | {{ : |
La récompense augmente plus vite à partir de la suppression de la récompense RV. Il faudrait faire un enregistrement du model quand la récompense est élevée.\\ | La récompense augmente plus vite à partir de la suppression de la récompense RV. Il faudrait faire un enregistrement du model quand la récompense est élevée.\\ | ||
Avec du son ce serait encore plus génial ! | Avec du son ce serait encore plus génial ! |
apprentissage_par_renforcement.txt · Dernière modification : 2022/02/10 07:52 de serge