Bonsoir,
Le 18/04/2012 16:15, Romain Touzé a écrit :
> Bonjour,
>
>> On voit que beaucoup (si ce n'est las plupart) des sites utilisent Google
>> Analytics. Ça leur apporte quoi ? Et à Google ? Comment ça fonctionne,
>> exactement ?
>>
>
> à l'utilisateur : un service gratuit pas trop mal foutu pour avoir les
> stats d'affluence sur son site. Contrairement à Xiti, pas besoin de
> mettre un logo de pub.
> à Google : comme d'habitude, avoir une connaissance fine des
> internautes et de leur usage du Net.
> Cela fonctionne avec quelques lignes de Javascript à intégrer qui
> fournissent les infos sur les personnes consultant le site.
Personnellement, j'utilise Privoxy http://www.privoxy.org/ (un proxy) ,
qui permet d'agir sur plusieurs aspects:
- filtrage de nom de domain ou d'adresses IP
- filtrage d'url (une url contenant un ../pub/... peut ainsi être bloqué)
- tout les filtrages se font à base d'expression régulières, pour un
effet maximum
- gestion de liste blanche
- suppression des http-referer
- changement des user-agent
- suppression de javascript pour l'affichage de popup
- blocage des cookies
- et bien d'autre encore
Les contenus bloqués sont remplacés, soit par des gif de 1.1 pixel,
soit par une page HTML qui indique le blocage par privoxy. Dans tout les
cas, la page web devient beaucoup moins bardée de pubs
Mais d'autres aspects sont encore plus intéressants :
- redirection à la volée : Je redirige certaines requêtes sur mon
serveur perso, afin que mon navigateur ne contact pas certains serveurs
web (filtrage). Mais qu'ils reçoivent quand même l'information dont il a
besoin (généralement du javascript):
# Redirect remote requests to the local version delivered by MON_SERVEUR
{ +redirect{s@^
http://@http://MON_SERVEUR/redirect/@} }
ajax.googleapis.com/ajax/libs/jquery/[0-9\.]*/jquery.min.js.*
www.google.com/jsapi
www.google-analytics.com/ga.js
- retrait de certains paramètres d'URL (méthode GET), lorsque ceux-ci ne
servent qu'à savoir d'où un lien a été cliqué. Exemple:
http://le.site.com/la_page.html?source=un.autre.site
devient :
http://le.site.com/la_page.html
# 2011/09/10: Remove useless parameters from some web sites:
{ +redirect{s@^([^?]*).*@$1@} }
http://le.site.com/
- empêche Google de savoir sur quel lien l'utilisateur clic, très pour
le google HTTPS :
# 2011/11/26: Prevent Google to monitor clicked html links
# Example:
www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=9&sqi=2&ved=0CG8QFjAI&url=http%3A%2F%2Fwww.codeguru.com%2Fforum%2Fshowthread.php%3Ft%3D363762&ei=ENmiTuinC5HLsgbQg42mAw&usg=AFQjCNG3VvEPEmLOjr9YMq2TqnJnCJGqkw
{ +redirect{s@&ei=.*@@} }
.google.*/url\?
{ +fast-redirects{check-decoded-url} }
.google.*/url\?
- et enfin, modification du contenu de pages web, afin de bloquer des
pub qui s'affichent xx secondes:
# 2011/09/10: Apply this filter to feedsportal.com ads
{ +filter{oaj-filter-02} }
.*.feedsportal.com
FILTER: oaj-filter-02 Filters for feedsportal.com ads
# 2011/09/10: Remove the ads page for feedsportal.com (feeds for
# some web sites, feedsportal.com
# To do this, we change the delay (ie: setTimeout) from xxxx ms to
# " 0" ms.
# Note that we have to use "$1 0" and not "$10", because regexp is
# looking for the 10th parameters...
s/(onload="setTimeout.*,)[0-9]+/$1 0/ig
s/(onload="setTimeout.*html[^,]*,)[0-9]+/$1 0/ig
Privoxy peut s'utiliser en temps que proxy sur le localhost, ou sur une
machiné dédiée. Dans ce cas, plusieurs machines peuvent êtres protégées
à partir d'une seule configuration.
Cordialement,
Olivier
--
~~~~~~~ _____/\_____ ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Phoenix / _ \/ _ \ Olivier Allard-Jacquin
/ / \ / \ \ Web: http://olivieraj.free.fr/
/___/ / \ \___\ Mail: olivieraj@???
~~~~ ///// ///\\\ \\\\\ ~~~~~~~~~~~~~~~~~~~~~~~ Linux Powered !!