Re: Parser du html en bash

Top Page

Reply to this message
Author: Kristian Erik Hermansen
Date:  
To: Hugues Levasseur
CC: guilde
Subject: Re: Parser du html en bash
2013/11/28 Hugues Levasseur <hugues.levasseur@???>:
> Salut la guilde,
>
> J'ai besoin de découper du html en bash.
>
> En entrée un fichier html, et je voudrais en isoler une div précise
>
> <div id="maCible">Le truc qui m'interesse</div>
>
>
> Je me doute que la solution passe parcat fichier.html | grep -Po "xxx"
> mais après ... j'avoue mon ignorance des RegExp


Si vous voulez que les contenus au sein de la div ...

$ sudo apt-get install html2text
$ curl -s http://mydomain/mypage.html | html2text

Ou...

$ curl ... | egrep -o '<div.* </div>'
--
Kristian Erik Hermansen
https://www.linkedin.com/in/kristianhermansen
https://profiles.google.com/kristian.hermansen