Table des matières
Bestiaire IA Fables de La Fontaine
Ressources
Les pages du wiki sur le TAL:
bestiaire ia, sb, tal | |
ia, python, sb, tal | |
ia, python, sb, tal | |
bestiaire ia, tal | |
apprentissage automatique, python, tal | |
ia, python, tal |
- TAL Traitement Automatique du Langage avec des Fables de La Fontaine Approche rapide du Traitement Automatique du Langage
- Générer du texte en python avec textgenrnn Page archivée, il faut utiliser aitextgen
- Why do we like word2vec Nous partons d'un Pre-trained model, puis nous entraînons un Fine-tuned model.
- Numériser Jean de La Fontaine : documentation de l'installation artistique associée à aitextgen.
Première expérience en Juillet 2020
aitextgen
Modèles possibles
belgpt2
belgpt2 Belgian GPT-2: A GPT-2 model pre-trained on a very large and heterogeneous French corpus (~60Gb).
4 Modèles de GPT2
Extrait de: The Journey of Open AI GPT models sur medium.com
The authors trained four language models with 117M (same as GPT-1), 345M, 762M and 1.5B (GPT-2) parameters.
GPT Neo
125M/350M GPT Neo model from EleutherAI
create your own GPT-2/GPT Neo model
+ tokenizer and train from scratch!
Installation de aitextgen
Dans un environnement virtuel, que j'appelle toujours mon_env, il n'est pas caché, il n'y a que moi qui appelle ça comme ça, c'est sans ambiguïté, c'est pédagogique.
Le tout télécharge des gros paquets: entre 1 et 2 Go, … patience …
# Installation et Mise à jour du module pip sudo apt install python3-pip python3 -m pip install --upgrade pip # Installation de venv sudo apt install python3-venv
Dans votre dossier “projets”, par exemple /home/machin/projets
git clone https://github.com/sergeLabo/La_Fontaine # Allez dans le dossier des sources cd ./La_Fontaine python3 -m venv mon_env source mon_env/bin/activate python3 -m pip install -r requirements.txt
Tester
Dans le dossier La_Fontaine:
./mon_env/bin/python3 example_generating.py
Toutes les fables de La Fontaine
Dans un fichier txt propre: fables.txt.zip