2013/11/28 Hugues Levasseur <hugues.levasseur@???>:
> Salut la guilde,
>
> J'ai besoin de découper du html en bash.
>
> En entrée un fichier html, et je voudrais en isoler une div précise
>
> <div id="maCible">Le truc qui m'interesse</div>
>
>
> Je me doute que la solution passe parcat fichier.html | grep -Po "xxx"
> mais après ... j'avoue mon ignorance des RegExp
Si vous voulez que les contenus au sein de la div ...
$ sudo apt-get install html2text
$ curl -s
http://mydomain/mypage.html | html2text
Ou...
$ curl ... | egrep -o '<div.* </div>'
--
Kristian Erik Hermansen
https://www.linkedin.com/in/kristianhermansen
https://profiles.google.com/kristian.hermansen