Archiver et rendre statique un site web

Ne pas utiliser httrack qui veux toujours aspirer tous les internets !

Par contre, cette commande aspire tout un site en bourrant le serveur de requêtes (attention à pas se faire bannir) :

wget --mirror --convert-links --html-extension -o log http://monsite.org

Cela aspirera le site en écrivant tout ce qu'il se passe dans un fichier log. En enlevant le paramètre

-o log

cela affichera tout devant vos yeux victorieux. Pour y aller + molo avec le nombre de requêtes par secondes, vous pouvez ajouer un paramètre

--wait=1

qui ne fera une requête que toutes les secondes. Du coup ça risque de durer un moment pour un gros site. Pour les autres paramètres :

--mirror : Equivalent à '-r -N -l inf --no-remove-listing', cela permet de faire un mirroir le + exact possible.
--convert-links : Cela converti les liens après que le téléchargement est terminé pour relier les assets au HTML (pour une vue locale. Ce qu'il nous faut quoi).
--html-extension : Ajoute une extension .html à tous les fichiers téléchargés. Votre Apache/Nginx/etc... vous remerciera.
  • archiver_et_rendre_statique_un_wiki.txt
  • Dernière modification: 2019/10/28 00:16
  • par Labomedia