Re: Parser du html en bash

Autor: nt.guilde
Data:
A: guilde
CC: guilde
Assumpte: Re: Parser du html en bash

> Mais dans mon cas, je ne veut pas réécrire Firefox en ligne de
> commande, je voudrait juste extraire une chaine d'un fichier. Une
> chaine qui commence par <div id="maCible"> et qui se fini au
> prochain </div> rencontré

Dans ce cas :

  sed 'H; $!d; g; s/\n/ /g
       s/.*<div id="maCible">/<div id="maCible">/; s|</div>.*|</div>|'

(rassembler le document en une seule ligne, éliminer tout ce qui précede
"<div id=...>", éliminer tout ce qui suit "</div>" ; pas testé).
Mais regarde les exemples dans cette page :
http://xmlstar.sourceforge.net/doc/xmlstarlet.txt. Peut-être que cela
marchera sur ton document. Je n'ai pas eu cette chance avec le site de
Arte, et ai eu recours à sed.
Pourras-tu nous dire quelle solution tu as retenue ?
-Nicolas

Aquest missatge és part del següent fil:
	l'arbre de fils complet ordenat per data
	Hugues Levasseur en
	Hugues Levasseur en