6 mois de calcul ont coûté entre 100€ et 200€. La carte graphique avait coûté 200€. Les 16 Go de RAM 35€.
Le fichier de poids est: yolov3-tiny_3l_22_8000.weights
La vidéo en haut de page est réalisée avec cette configuration.
Le fichier yolov3-tiny_3l_22_8000.weights est considéré comme le meilleur des meilleurs.
En intelligence artificielle, on parle de surapprentissage (le terme anglais est overfitting) quand un modèle a trop appris les particularités de chacun des exemples fournis en exemple. Il présente alors un taux de succès très important sur les données d’entraînement (pouvant atteindre jusqu’à 100%), au détriment de ses performances générales réelles.
Pas mal mais trop de lettres ne sont pas reconnues, et certaines avec 2 reconnaissances. La musique résultante est reconnaissable. C'est le meilleurs résultat des essais 02 à 06
Reconnaissance médiocre ! La musique résultante n'est pas reconnaissable.
For training for both small and large objects use modified models:
Le fichier tiny.cfg est paramétré pour 80 objets, et la doc dit qu'il est bien optimisé: Je cite pjreddie.com It's only 28 MB but more importantly, it's only 8×1010 floating point operations. The original Alexnet is 2.3*1012. Darknet is 2.9 times faster and it's small and it's 4% more accurate.
Même image que Essai 05, mais avec yolov3-tiny_06.cfg du Sémaphore, adapté pour 380 objets et images de 416×416.
Le fichier yolov3-tiny_06_best.weights fait 40,1 Mo, l'apprentissage est 2 fois plus rapide que yolov3.cfg, soit 2.7 jours
La reconnaissance est très décevante, le FPS sur HD5000 est de 1.8 au lieu de 0.4, mais trop de lettres ne sont pas reconnues.
L'analyse des % de reconnaissance calculés à la fin de l'apprentissage, montre que ce sont les lettres avec la couleur gris clair qui sont les plus mal reconnues.
Efficacité
name font_0_i 85.00 name font_0_l 85.79 name font_2_j 87.91 name font_2_q 89.78 name font_2_o 90.16 name font_2_g 90.20 name font_0_n 90.22 name font_1_I 90.57 name font_1_J 91.31 name font_2_I 91.33 name font_0_e 91.56
Certaines lettres se ressemblent beaucoup et sont mal reconnues.
Suppression des majuscules: le volume sera défini à 127 pour toutes les notes, il ne reste plus que 190 objets ! 10 polices avec les lettres de b à t.
Les images sont à shot_size = 416 –> ????
Cette courbe est parfaite, et pourtant c'est tout faux !!!!!!!!!
idem essai 08 mais shot_size = 480 pour la config et les images:
20 000 itérations ne suffisent pas !