Outils pour utilisateurs

Outils du site


archiver_et_rendre_statique_un_wiki

Ceci est une ancienne révision du document !


Archiver et rendre statique un site web

A creuser, l'utilisation de httrack pour éviter d'aspirer tous les internets lorsque l'on veut archiver un site! Voir aussi le projet Conifer de Rhizome.org pour archiver des sites web complexes (net-art, javascript, …)

Par contre, avec wget, ça aspire tout un site en bourrant le serveur de requêtes (attention à pas se faire bannir) :

wget --mirror --convert-links --html-extension -o log http://monsite.org

Cela aspirera le site en écrivant tout ce qu'il se passe dans un fichier log. En enlevant le paramètre

-o log

cela affichera tout devant vos yeux victorieux. Pour y aller + molo avec le nombre de requêtes par secondes, vous pouvez ajouer un paramètre

--wait=1

qui ne fera une requête que toutes les secondes. Du coup ça risque de durer un moment pour un gros site. Pour les autres paramètres :

--mirror : Equivalent à '-r -N -l inf --no-remove-listing', cela permet de faire un mirroir le + exact possible.
--convert-links : Cela converti les liens après que le téléchargement est terminé pour relier les assets au HTML (pour une vue locale. Ce qu'il nous faut quoi).
--html-extension : Ajoute une extension .html à tous les fichiers téléchargés. Votre Apache/Nginx/etc... vous remerciera.

Ressources

archiver_et_rendre_statique_un_wiki.1635549139.txt.gz · Dernière modification : 2021/10/29 23:12 de Benjamin Labomedia