Re: Récupération d'images avec wget

Page principale

Répondre à ce message
Auteur: Vincent Caron
Date:  
À: guilde@guilde.asso.fr
Sujet: Re: Récupération d'images avec wget
On Fri, 2011-08-05 at 12:56 +0200, Frédéric wrote:
> Re-,
>
> Je cherche à ne récupérer que les images d'un site. Est-ce faisable avec
> wget ? Je ne trouve pas d'option pour ; mais y'a peut-être une astuce ?


Hélas il n'y a pas d'option pour filtrer en se basant sur le
Content-Type MIME, mais à défaut avec les extensions ou en jouant sur un
motif on s'en sort, par ex:

$ wget -m -nH -np -A png,gif,jpg http://foobar.com/

L'option -A accepte aussi des motifs type 'glob' (*?[]) quant les
extensions ne conviennent pas. On veut à peu près toujours '-nH -np'.
Des fois on aime '-nd' (ne crée pas de répertoires). Et si on sait ce
qu'on fait, on a le droit d'utiliser '-e robots=off', voire aussi '-U
Mozilla/5.0' pour persuader le serveur qu'on n'est pas un bot.