Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
archiver_et_rendre_statique_un_wiki [2019/09/11 08:19]
serge [Ajouter un bandeau sur toutes les pages]
archiver_et_rendre_statique_un_wiki [2019/10/28 00:16] (Version actuelle)
Labomedia
Ligne 1: Ligne 1:
-====== Archiver et rendre statique un wiki ======+====== Archiver et rendre statique un site web ======
  
-=====Préparation===== 
-====Ajouter sur la page d’accueil un lien vers toutes les pages==== 
-Il y a 2 pages d'​accueil ! Sur la page https://​wiki.labomedia.org/​ 
-Ajouter: 
-  * Un lien vers les pages de l'​espace principal et des liens vers les espaces de nom spécifiques ! https://​wiki.labomedia.org/​index.php/​Toutes_les_pages.html 
-  * Un lien vers les pages en edit https://​wiki.labomedia.org/​index.php/​Toutes_les_pages_en_edit.html 
- 
-Cela assure que toutes les pages seront bien parcourues. 
- 
-=====Téléchargement===== 
 Ne pas utiliser httrack qui veux toujours aspirer tous les internets ! Ne pas utiliser httrack qui veux toujours aspirer tous les internets !
-====Ressources==== 
-  * https://​alvinalexander.com/​linux-unix/​how-to-make-offline-mirror-copy-website-with-wget 
  
-====Commande ​à valider et commenter par bj==== +Par contre, cette commande aspire tout un site en bourrant le serveur de requêtes (attention ​à pas se faire bannir) :
-  wget  -c --mirror --no-parent --convert-links https://​wiki.labomedia.org +
-Test +
-  wget -k -p -r --user-agent='​Mozilla/​5.0 (Windows NT 6.3; Win64; x64AppleWebKit/​537.36 (KHTML, like Gecko) Chrome/​37.0.2049.0 Safari/​537.36'​ -R '​*Special*'​ -R '​*Help*'​ -E https://​gendersec.tacticaltech.org/​wiki/​ +
-D'​après http://​meng6.net/​pages/​computing/​sysadmin/​backup_mediawiki/​ +
- -k: convert links to suit local viewing +
- -p: download page requisites/​dependencies +
- -r: download recursively +
- ​--user-agent:​ set "​fake"​ user agent for the purpose of emulating regular browsing as sometimes site checks user agent. Check user agent string at useragentstring.com. +
-Voir https://​gist.github.com/​bshishov/​db5436eb2dea0e38069525eb44ef1583+
  
-=====Ajouter un bandeau sur toutes les pages===== +  wget --mirror --convert-links --html-extension -o log http://​monsite.org 
-  ​* Des explications +   
-  * Avec un lien de recherche vers Google sur votre wiki+Cela aspirera le site en écrivant tout ce qu'il se passe dans un fichier log. En enlevant le paramètre <​code>​-o log</​code>​ cela affichera tout devant vos yeux victorieux. Pour y aller + molo avec le nombre ​de requêtes par secondes, vous pouvez ajouer un paramètre <​code>​--wait=1</​code>​ qui ne fera une requête que toutes les secondes. Du coup ça risque de durer un moment pour un gros site. Pour les autres paramètres :
  
-**Exemple sur mediawiki** +<​code>​ 
-  * https://wiki.labomedia.org/index.php/index.html +--mirror ​Equivalent à '-r -N -l inf --no-remove-listing',​ cela permet de faire un mirroir le + exact possible. 
-{{ :​a:​bandeau_accueil.png?800 |}}+</code> 
 +<​code>​ 
 +--convert-links : Cela converti les liens après que le téléchargement est terminé pour relier les assets au HTML (pour une vue localeCe qu'il nous faut quoi). 
 +</code> 
 +<​code>​ 
 +--html-extension : Ajoute une extension .html à tous les fichiers téléchargésVotre Apache/Nginx/etc... vous remerciera. 
 +</​code>​
  
-Facile en python, demander à Max comment il l'a fait en bash!+====Ressources====
  
-=====Archivage d'un site web===== +  * https://​alvinalexander.com/​linux-unix/how-to-make-offline-mirror-copy-website-with-wget 
-  wget -----http://sametmax.com +  * http://meng6.net/​pages/​computing/​sysadmin/​backup_mediawiki/​
- +
-{{tag>​sb}}+
  
  • archiver_et_rendre_statique_un_wiki.1568182757.txt.gz
  • Dernière modification: 2019/09/11 08:19
  • par serge