Re: Stocker de manière automatique des pages wbe

Top Page

Reply to this message
Author: marc.terrier
Date:  
To: Frédéric
CC: guilde
Subject: Re: Stocker de manière automatique des pages wbe
Bonjour Frédéric,

Je pense que la première question à se poser, c'est de savoir quel usage tu souhaites faire des données, à terme, que tu auras récupérées. Si, par exemple, c'est pour en faire un historique, et suivre l'évolution sur une période longue, alors je te suggère d'éviter la sauvegarde sous forme d'images, qui ne sont compréhensibles que pour un humain, et difficilement exploitables de façon automatisée. Mais tu sembles sur la bonne voie : 'cron' pour lancer un script, qui récupère par 'wget' le contenu de la page, et 'awk' ou 'perl' (ou n'importe quel autre outil ou langage qui permet d'utiliser des expressions rationnelles) pour isoler les informations intéressantes au sein du code HTML (qui semble avoir été écrit avec les pieds, soit dit en passant). Tu mets le tout dans une base de données de ton choix, et après, tu en fais ce que tu veux : les infos susceptibles de t'intéresser me semblent être toutes sur la ligne 398, dans le cas présent. Le reste n'est que du bruit HTML.

Est-ce que ça t'aide un peu ?

--
Marc


----- Mail original -----
De: "Frédéric" <frederic.mantegazza@???>
À: guilde@???
Envoyé: Mardi 10 Janvier 2012 09:53:51
Objet: Stocker de manière automatique des pages wbe

Bonjour,

Je voudrais faire un suivi des prévisions météo de ce site :

    http://www.meteo-grenoble.com/previsions/imprime


en sauvegardant régulièrement cette page :

    http://www.meteo-grenoble.com/previsions


sous sa forme imprimable :

    http://www.meteo-grenoble.com/previsions/imprime


Comme feriez-vous ça (cron, wget...) ? Sous quelle forme la sauver ? Image ?
BDD ? Fichiers ?

Merci d'avance pour vos propositions.

--
Frédéric