Re: Parser du html en bash

Top Page

Reply to this message
Author: Vincent Caron
Date:  
To: guilde
Subject: Re: Parser du html en bash
On 11/28/2013 12:23 PM, YP wrote:
> Mais entre nous, utiliser les regexp pour ça, vous risquez les foudres
> des grands théoriciens de l'informatique :>


D'un autre côté l'objet du mail aurait dû être "je voudrais en isoler
une div précise". On n'est pas obligé de parser pour ça, et une regex
peut donner une solution efficace et robuste. En plus si on part de
"bash", ça veut dire qu'en général on voit pas plus loin que les
coreutils (grep, sed, etc)... Sinon xmlstarlet + XPath est le marteau
qui vous transformera tous les HTML/XML en clou. A mon goût.