Outils pour utilisateurs

Outils du site


scraping_avec_beautifulsoup

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Prochaine révision
Révision précédente
scraping_avec_beautifulsoup [2019/11/29 14:01] – créée josephscraping_avec_beautifulsoup [2019/11/29 14:03] (Version actuelle) joseph
Ligne 1: Ligne 1:
 <markdown> <markdown>
-# Scraping avec Python + BeautifulSoup+# Scraping de ce wiki avec Python + BeautifulSoup
  
 Exemple : ce code de 9 lignes va récupérer toutes les pages de ce wiki associées au tag `securite`, parser leur page `https://ressources.labomedia.org/lapageenquestion?do=edit` (ça marche même si l'on est pas loggé, en lecture seule), repérer le `textarea`, et enregistrer le contenu dans un fichier `.txt` local : Exemple : ce code de 9 lignes va récupérer toutes les pages de ce wiki associées au tag `securite`, parser leur page `https://ressources.labomedia.org/lapageenquestion?do=edit` (ça marche même si l'on est pas loggé, en lecture seule), repérer le `textarea`, et enregistrer le contenu dans un fichier `.txt` local :
Ligne 15: Ligne 15:
             f.write(soup2.find('textarea', {"name": "wikitext"}).contents[0].replace('\r\n', '\n').lstrip('\n'))             f.write(soup2.find('textarea', {"name": "wikitext"}).contents[0].replace('\r\n', '\n').lstrip('\n'))
 ~~~ ~~~
 +
 +Résultat en quelques secondes:
 +
 +![](https://gget.it/tvmt/1.png)
 </markdown> </markdown>
 +
 +{{tag>scraping scrape python beautifulsoup joseph}}
scraping_avec_beautifulsoup.txt · Dernière modification : 2019/11/29 14:03 de joseph