Outils pour utilisateurs

Outils du site


apprentissage_par_renforcement

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
apprentissage_par_renforcement [2021/06/01 13:21]
serge [Résultat du 1er essai]
apprentissage_par_renforcement [2021/09/07 18:18] (Version actuelle)
Benjamin Labomedia [Le Hello World de l'Apprentissage Par Renforcement]
Ligne 23: Ligne 23:
 </WRAP> </WRAP>
 </WRAP> </WRAP>
-https://www.youtube.com/watch?v=2koXcs0IhOc+  * https://www.youtube.com/watch?v=2koXcs0IhOc 
 +  * Double Inverted Furuta Pendulum https://www.youtube.com/watch?v=lwJ2jzVexaI
 =====Apprentissage par renforcement===== =====Apprentissage par renforcement=====
   * **[[https://fr.wikipedia.org/wiki/Apprentissage_par_renforcement|Apprentissage par renforcement @ fr.wikipedia.org]]**. En intelligence artificielle, plus précisément en apprentissage automatique, l'apprentissage par renforcement consiste, pour un agent autonome (robot, etc.), à apprendre à partir d'expériences, de façon à optimiser une récompense quantitative au cours du temps, positive ou négative. En répétant les expériences, le robot progresse.   * **[[https://fr.wikipedia.org/wiki/Apprentissage_par_renforcement|Apprentissage par renforcement @ fr.wikipedia.org]]**. En intelligence artificielle, plus précisément en apprentissage automatique, l'apprentissage par renforcement consiste, pour un agent autonome (robot, etc.), à apprendre à partir d'expériences, de façon à optimiser une récompense quantitative au cours du temps, positive ou négative. En répétant les expériences, le robot progresse.
apprentissage_par_renforcement.txt · Dernière modification: 2021/09/07 18:18 de Benjamin Labomedia