Différences

Ci-dessous, les différences entre deux révisions de la page.

--- darknet_letters [2019/10/20 12:00] – serge
+++ darknet_letters [2020/12/27 15:11] (Version actuelle) – serge
@@ Ligne 1: / Ligne 1: @@
 ====== Darknet Letters ======
 <WRAP center round box 60% centeralign>
-**{{tagpage>bge|Blender Game Engine}}** ....  **{{tagpage>ia|Intelligence Artificielle}}**
+**{{tagpage>ia|Intelligence Artificielle}}**     **[[http://translate.google.com/translate?hl=&sl=auto&tl=en&u=https%3A%2F%2Fressources.labomedia.org%2Fdarknet_letters|English Version]]**
 </WRAP>
-<WRAP center round box 80% centeralign>
+<WRAP center round box 60% centeralign>
-{{::2019_08:shot_22.png?400|}} {{:2019_08:shot_17.png?400|}}
+**[[les_pages_intelligence_artificielle_en_details|Les Pages Intelligence Artificielle en détails]]**
-Le fond noir ne convient pas, il faut une video !
 </WRAP>
 <WRAP center round box 60% centeralign>
-**De l'Intelligence Artificielle pour reconnaître des lettres dans différentes polices,  convertir les lettres d'un texte en musique midi.**
+**{{tagpage>bge|Blender Game Engine}}**
 </WRAP>
+<WRAP center round box 60% centeralign>
+{{media_02:shot_22.png?400|}} {{media_02:shot_17.png?400|}}\\
+Le fond noir ne convient pas, il faut une video !
+</WRAP>
+<WRAP center round box 60%>
+  * **De l'Intelligence Artificielle pour reconnaître des lettres dans différentes polices**
+  * **Créer des images correspondant à une musique midi**
+  * **Lecture des images par l'Intelligence Artificielle et rejouer le midi**
+</WRAP>
+{{ vimeo>377284950?medium }}
+\\ \\
+**[[darknet_letters_essais|Darknet Letters Tous les essais]]**
+**[[https://github.com/sergeLabo/darknet-letters|darknet-letters sur Github]]**\\ \\
 ===== YOLO Darknet V3 =====
+====Conclusion finale====
+  * Le nombre de paramètres à optimiser est important. Pour pouvoir faire beaucoup de simulation, les calculs doivent être rapide, il est nécessaire d'avoir des cartes graphiques puissantes, et chères !
+  * Pour faire mieux, une GTX 1060 ne suffit pas. Il en faudrait au minimum 2, et mieux encore RTX 2080 Ti 11GB à 1100€
+  * Cela permettrait de tester les modèles plus lourds et d'agrandir les images. Passer de 416x416 à 832x832 !
 ==== Conclusion des différents apprentissages ====
 <WRAP group>
 <WRAP half column>
-  * **380 objets**
+  * **Suppression des majuscules pour diminuer le nombre d'ojects de 380 à 190**
+  * **Le modèle yolov3.cfg est trop lourd, le yolov3-tiny_3l.cfg suffit**
   * **Images de 416x416**
-  * **5.5 jours d'apprentissage**
+  * **1 à 2 jours d'apprentissage**
-  * **Ne pas mettre de fond noir**
+  * **Fond video pour l'apprentissage, noir pour la détection**
-  * **Les zones de définitions des objets dans les images doivent être un peu large**
+  * **Pas de flou dans les images **
-  * **Mettre un peu de flou dans les images **
 </WRAP>
 <WRAP half column>
@@ Ligne 38: / Ligne 56: @@
 **Créer et testé sur Debian Buster 10**
-{{:2019_08:letters_1.png?300|}}
+{{media_02:letters_1.png?300|Le jeu}}
-{{:2019_08:letters_2.png?300|}}
+{{media_03:shot_12.png?300|Avec un fond video}}
-{{:2019_08:letters_3.png?300|}}
+{{media_02:letters_3.png?300|Avec un fond noir: la reconnaissance est très mauvaise}}
 ====Conversion d'un fichier *.midi en *.json====
@@ Ligne 97: / Ligne 115: @@
 <code txt>
- - Retour au logo
+- Lancement de letters
- - Lancement de letters
      SPACE pour changer de musique
  - Fabrication des shot pour l'IA
-- Conversion en json
+ - Conversion d'une musique en image
- - Conversion d'une musique en image
  H - Help
  R - Reset
@@ Ligne 108: / Ligne 124: @@
 </code>
-En 2: Les fichiers du dossier /json seront jouées.
+En 1: Les fichiers du dossier /json_60 seront jouées.
-En 3: Pour l'apprentissage, le fichier json/get_shot.json sera utilisé. Il a été construit avec darknet-letters/letters/midi/json_for_get_shot.py
+En 2: Pour l'apprentissage, le fichier json/get_shot.json sera utilisé. Il a été construit avec darknet-letters/letters/midi/json_for_get_shot.py
-En 4: Les fichiers midi sont traduits en json pour être facilement utilisé en python.
+En 3: Crée un jeu d'images pour ensuite tester l'IA avec play_letters.py
-En 5: Crée un jeu d'images pour ensuite tester l'IA avec show_letters.py
 ===== Création du set d'images pour l'apprentissage =====
@@ Ligne 132: / Ligne 146: @@
 Avec le script **./letters/control/control.py**
-{{ ::shot_14.jpg?400 |}}
+{{ media_03:shot_14.jpg?400 |}}
 ===== Yolo V3 Darknet=====
@@ Ligne 138: / Ligne 152: @@
   * **https://github.com/AlexeyAB/darknet**
-  * [[https://scholar.google.fr/scholar?q=yolo+artificial+intelligence&hl=fr&as_sdt=0&as_vis=1&oi=scholart|Recherche]] sur ressources universitaires avec Google scolar.
+  * [[https://scholar.google.fr/scholar?q=yolo+artificial+intelligence&hl=fr&as_sdt=0&as_vis=1&oi=scholart|Recherche]] sur ressources universitaires avec Google scholar.
 ==== Installation de CUDA ====
@@ Ligne 245: / Ligne 259: @@
  **La taille maxi des images possible est 416x416 avec 6 Go de Ram GPU**
-====Apprentissage avec yolov3.cfg====
+=====Apprentissage avec yolov3.cfg=====
 Dans le dossier /darknet:
   ./darknet detector train data/obj.data data/yolov3.cfg darknet53.conv.74 -map
 Les chemins "data/..." doivent être cohérent avec obj.data, le dossier "backup" doit exister.
-====Essais====
+=====Apprentissage avec yolov3-tiny_3l.cfg=====
-===Modifications suite à apprentissage finissant sur une erreur===
+**3 layers**
-  * Test avec yolov3-tiny.cfg
+  ./darknet partial data_09/yolov3-tiny_3l_09.cfg yolov3-tiny.weights data_09/yolov3-tiny.conv.15 15
-  * Test avec yolov3_5l.cfg
+  ./darknet detector train data_09/obj.data data_09/yolov3-tiny_3l_09.cfg data_09/yolov3-tiny.conv.15 -map
-  * Test avec yolov3-tiny_3l.cfg
-  * Grosse erreur perso: dans shot_xxx.txt de l'image shot_xxx.png: non de l'objet au lieu du numéro de l'objet !
+ Le fichier yolov3-tiny_3l_xx_best.weights fait 38.1 Mo
-  * fond noir
+=====Apprentissage avec yolov3-tiny.cfg=====
-  * fond noir remplacé par un nuage gris
+**2 layers**
-  * nuage gris remplacé par une video de ciel !
+  ./darknet partial data_12/yolov3-tiny_12.cfg yolov3-tiny.weights data_12/yolov3-tiny.conv.15 15
-  * Message dans le terminal: "Processus arrêté." Achat de DDR3 1600 mHz 16 Go pour remplacer les 4 Go existants.
+  ./darknet detector train data_12/obj.data data_12/yolov3-tiny_12.cfg data_12/yolov3-tiny.conv.15 -map
-  * Diminution des superpositions avec size de 0.6 à 0.9
-  * Images avec minuscules seules et images avec majuscules seules pour diminuer le nombre de lettres dans l'image et donc les superpositions.
+ Le fichier yolov3-tiny_12_best.weights fait 38 Mo. Malheureusement, ça plante !
-  * Reprise des 400 images des lettres pour les cadrer serrées (20 heures de boulot) !
+=====Tous les essais=====
-  * Ne pas déclarer des objets qui ne sont jamais dans les images !
+  * **[[darknet_letters_essais|Tous les essais sur cette page]]**
-  * SWAP de 64 Go au lieu de 8 Go
-===Essai 02===
+===== Reconversion d'images en musique =====
-  * fond video
+====Test sur le jeu d'image de json_to_image====
-  * flou de 3 à 7
+Et le script play_letters.py du dossier play_letters. Il faut copier les fichiers:
-  * letters_scale = 1.09
+  * darknet.py
-  * 30 000 images
+  * libdarknet.so
-  * 90 000 itérations
+des sources compilées de darknet dans le dossier play_letters.
-  * Shadeless pas de variation de couleurs et éclairage
-Résultat:
-{{ ::chart_30000.png?300 |}}
-Pas mal mais trop de lettres ne sont pas reconnues, et certaines avec 2 reconnaissances. La musique résultante est reconnaissable.
-===Essai 03===
+Créer les images de json_to_image avec l'option 5 du jeu letters.
+Les fichiers midi qui seront convertis en images sont ceux de /letters/midi/music/non_git/pour_ia
+Définir le FPS dans letters.ini dans la section [json_to_image]
+Il n'y a que 10 canaux midi au maximum possibles.
+====Quel fond d'image utiliser ?=====
 <WRAP group>
-<WRAP half column>
+<WRAP quarter column>
-  * fond noir
+  * Nuages
-  * pas de flou
+{{media_12:s_j_to_i_593.jpg?200|}}
-  * taille 416
-  * 50 000 images
-  * vérification du nombre de lettres: objectif 2000 par lettres, réel 1948
-  * changement du json utilisé par créer les shot: minuscules et majuscules séparées et pas de séparation des polices avec des canaux vides.
 </WRAP>
-<WRAP half column>
-  * yolo_v3.cfg
+<WRAP quarter column>
-  * letters_scale = 1.01
+  * Plasma
-  * plage_x = 4.5
+{{media_12:s_j_to_i_537.jpg?200|}}
-  * plage_y = 4.5
-  * size_min = 0.6
-  * size_max = 0.9
-  * variation de couleurs et éclairage avec un Sun
-  * début 25/09/2019 à 10h, fin 01/10/2019 à 6h55
-  * 50 000 itérations
 </WRAP>
+<WRAP quarter column>
+  * nuage RGB clair
+{{media_04:boney_m.png?200|}}
 </WRAP>
-{{ :chart_03.png?300 |}}
-Efficacité 99% mais reconnaît très mal les lettres, et la détection de leur position très très large par rapport au réel. La musique résultante n'est pas reconnaissable.
-===Essai 04===
+<WRAP quarter column>
-  * Idem Essai 03 mais fond video
+  * Très foncé en RGB
-  * Relance de 50 000 itérations supplémentaires.
+{{media_12:s_j_to_i_122.png?200|}}
-<WRAP group>
-<WRAP half column>
-{{ ::chart_04_50000.png?300 |}}
 </WRAP>
-<WRAP half column>
- {{ ::chart_04_92500.png?300 |}}
-</WRAP>
-</WRAP>
-Reconnaissance médiocre ! La musique résultante n'est pas reconnaissable.\\
-===Essai 05===
-<WRAP group>
-<WRAP half column>
-Modification par rapport à 4 et 3
-  * fond video
-  * flou: 3 à 7
-  * taille 416
-  * 50 000 images
-  * yolo_v3_05.cfg
-</WRAP>
-<WRAP half column>
-  * letters_scale = 1.08
-  * plage_x = 4.5
-  * plage_y = 4.5
-  * size_min = 0.6
-  * size_max = 0.9
-  * variation de couleurs et éclairage avec un Sun
-</WRAP>
 </WRAP>
-{{ ::chart_05_50000.png?300 |}}
+=====Bug: Libération de la RAM GPU à la fin d'une détection=====
-Très mauvais résultat !
-===Essai 06 avec Tiny du Sémaphore===
+[[darknet_letters_unload_gpu_ram_in_python_script|Voir la page Darknet Letters unload GPU RAM in python script]]
-Le fichier tiny.cfg est paramétré pour 80 objets, et la doc dit qu'il est bien optimisé: [[https://pjreddie.com/darknet/tiny-darknet/|Je cite pjreddie.com]] It's only 28 MB but more importantly, it's only 8x10<sup>10</sup> floating point operations. The original Alexnet is 2.3*10<sup>12</sup>. Darknet is 2.9 times faster and it's small and it's 4% more accurate.
+=====Durée d'un calcul et consommation électrique avec yolov3.cfg=====
-Même image que Essai 05, mais avec [[https://github.com/sergeLabo/darknet-letters/blob/master/letters/darknet/data_06/yolov3-tiny_06.cfg|yolov3-tiny_06.cfg]] du [[yolo_darknet_avec_un_vrai_semaphore|Sémaphore]], adapté pour 380 objets et images de 416x416.
-=====Durée d'un calcul et consommation électrique=====
   * 50000 itérations de 50 000 images de 416x416 = 6 jours * 24 * 0.2 kW =  kwh à 0.17 € le kWh soit 5 €
+**6 mois de calcul = 150 €**
 =====Quels matériels pour un apprentissage rapide ?=====
-  * **Quel serait le coût sur un Pentaflops  ?**
-  * **Et si La Labomedia achète un Pentaflops ?**
   * **[[https://timdettmers.com/2019/04/03/which-gpu-for-deep-learning/|timdettmers.com]]** Which GPU(s) to Get for Deep Learning
   * **[[https://www.quora.com/What-is-currently-the-best-GPU-for-deep-learning|www.quora.com]]** avec un graphique qui teste alexnet (yolo ?) conseille [[https://www.amazon.fr/MSI-GTX-1080-Graphique-GeForce/dp/B06XT3TVKP/ref=sr_1_4?keywords=gtx+1080+ti&qid=1569416932&s=gateway&sr=8-4|une GTX 1080 Ti]] à 750€ (en fin de série) ou [[https://www.ldlc.com/fiche/PB00263052.html|une RTX 2080 Ti 11GB]] à 1100€.
@@ Ligne 355: / Ligne 332: @@
   * **[[https://blog.slavv.com/picking-a-gpu-for-deep-learning-3d4795c273b9|slavv.com/]]** Picking a GPU for Deep Learning
   * **[[https://hackernoon.com/how-to-create-your-own-deep-learning-rig-a-complete-hardware-guide-7cdc71e174aa|hackernoon.com]]** How to create your own deep learning rig: A complete hardware guide
+  * https://www.tooploox.com/blog/deep-learning-with-gpu sur alexnet
 ===Remise spéciale Education===
   * **[[https://www.nvidia.com/fr-fr/titan/titan-rtx/|NVIDIA TITAN RTX]]** 20% de remise sur 2720€ soit €2,159.20
-=====Benchmark=====
-  * https://github.com/ryujaehun/pytorch-gpu-benchmark
-====Bilan====
-**Je suis un chercheur compétitif, près de mes sous, pauvre, fou d'apprentissage automatique et comme Salvador Dali du chocolat Lanvin: GTX 1060 (6GB) en fin de série à 200 € + 35 € de RAM** dans un ordinateur d'emprunt !
-===== Test =====
+===Pour une startup fortunée===
+  * **[[https://www.microway.com/preconfiguredsystems/whisperstation-deep-learning/| WhisperStation™- Deep Learning Ultra-Quiet Computing for Deep Learning Researchers]]** System Price: $11,265 to $40,047
+  * **[[https://www.microway.com/preconfiguredsystems/nvidia-dgx-station-deep-learning-workstation/|NVIDIA DGX Station for Deep Learning System]]** Price: $51,861 (academic pricing, includes 1 year support) to $73,830 (commercial, includes 1 year support)
+  * **[[https://www.microway.com/preconfiguredsystems/gpu-accelerated-workstation-cst-studio-suite/|Microway’s GPU-Accelerated Workstation for CST STUDIO SUITE®]]** System Price: $15,000 to $45,000
+===Juin 2020===
-====Test sur le jeu d'image de json_to_image====
+  * **[[https://lambdalabs.com/blog/choosing-a-gpu-for-deep-learning/|Choosing the Best GPU for Deep Learning in 2020]]**
-Et le script play_letters.py du dossier play_letters. Il faut copier les fichiers:
-  * darknet.py
-  * libdarknet.so
-des sources compilées de darknet dans le dossier play_letters.
-Créer les images de json_to_image avec l'option 5 du jeu letters. Les fichiers midi qui seront convertis en images sont ceux de /letters/midi/music/non_git/pour_ia
+    * RTX 2060 (6 GB): if you want to explore deep learning in your spare time. 360€
-Définir le FPS dans letters.ini dans la section [json_to_image]
+    * RTX 2070 or 2080 (8 GB): if you are serious about deep learning, but your GPU budget is $600-800. Eight GB of VRAM can fit the majority of models.
+    * RTX 2080 Ti (11 GB): if you are serious about deep learning and your GPU budget is ~$1,200. The RTX 2080 Ti is ~40% faster than the RTX 2080.
+    * Titan RTX and Quadro RTX 6000 (24 GB): if you are working on SOTA models extensively, but don't have budget for the future-proofing available with the RTX 8000. 4000€
+    * Quadro RTX 8000 (48 GB): you are investing in the future and might even be lucky enough to research SOTA deep learning in 2020. 5500€
-Il n'y a que 10 canaux midi au maximum possibles.
+=====Benchmark=====
+  * https://github.com/ryujaehun/pytorch-gpu-benchmark
+====Bilan====
+**Je suis un chercheur compétitif, près de mes sous, pauvre, fou d'apprentissage automatique et comme Salvador Dali du chocolat Lanvin: GTX 1060 (6GB) en fin de série à 200 € + 35 € de RAM** dans un ordinateur d'emprunt !
 =====Morale du jour=====
@@ Ligne 385: / Ligne 364: @@
 **Mais, en ce qui concerne l'Univers, je n'en ai pas encore acquis la certitude absolue."**
-{{tag> ia sb bge}}
+{{tag> ia sb bge yolo_darknet}}