bonjour a tous,
c'est bien compliqué de chercher des doublons dans un fichier. Existe-il une
syntaxe sed ou awk pour comparer deux lignes consécutives ? Avec un post
traitement par sort, l'analyse serait plus rapide et simple.
Stéphane
----- Original Message -----
From: "Edgar Bonet" <guilde@???>
To: "Liste Guilde" <guilde@???>
Sent: Friday, April 22, 2005 7:45 PM
Subject: Re: recherche cde pour trouver les lignes similitaires de 2
fichiers
> Le vendredi 22 avril, anne aublanc a écrit :
>> J'aimerai avoir l'inverse de la cde diff...
>> trouver les lignes similaires de 2 fichiers...
>
> Si les fichiers se ressemblent pas mal, tu peux essayer
>
> diff -U 999999 a b | grep '^ ' | sed 's/^ //'
>
> Si tu cherches juste les lignes communes, indépendamment de l'ordre :
>
> sort a | uniq > a.u
> sort b | uniq > b.u
> cat a.u b.u | sort | tee ab.s | uniq > ab.u
> diff ab.s ab.u | grep '^<' | sed 's/^< //'
>
> --
> Edgar Bonet Maison : 04 76 21 29 16 Bureau : 04 76 88 10 96
> 3 rue Jean Prévost Mobile : 06 77 19 79 39 Fax : 04 76 88 11 91
> 38000 Grenoble guilde@??? www.edgar-bonet.org
>