著者: Vincent Caron 日付: To: guilde 題目: Re: Parser du html en bash
On 11/28/2013 12:23 PM, YP wrote: > Mais entre nous, utiliser les regexp pour ça, vous risquez les foudres
> des grands théoriciens de l'informatique :>
D'un autre côté l'objet du mail aurait dû être "je voudrais en isoler
une div précise". On n'est pas obligé de parser pour ça, et une regex
peut donner une solution efficace et robuste. En plus si on part de
"bash", ça veut dire qu'en général on voit pas plus loin que les
coreutils (grep, sed, etc)... Sinon xmlstarlet + XPath est le marteau
qui vous transformera tous les HTML/XML en clou. A mon goût.