Re: recherche cde pour trouver les lignes similitaires de 2 …

Top Page

Reply to this message
Author: stephane driussi
Date:  
To: ML Guilde
Subject: Re: recherche cde pour trouver les lignes similitaires de 2 fichiers
bonjour a tous,

c'est bien compliqué de chercher des doublons dans un fichier. Existe-il une
syntaxe sed ou awk pour comparer deux lignes consécutives ? Avec un post
traitement par sort, l'analyse serait plus rapide et simple.

Stéphane

----- Original Message -----
From: "Edgar Bonet" <guilde@???>
To: "Liste Guilde" <guilde@???>
Sent: Friday, April 22, 2005 7:45 PM
Subject: Re: recherche cde pour trouver les lignes similitaires de 2
fichiers


> Le vendredi 22 avril, anne aublanc a écrit :
>> J'aimerai avoir l'inverse de la cde diff...
>> trouver les lignes similaires de 2 fichiers...
>
> Si les fichiers se ressemblent pas mal, tu peux essayer
>
>    diff -U 999999 a b | grep '^ ' | sed 's/^ //'

>
> Si tu cherches juste les lignes communes, indépendamment de l'ordre :
>
>    sort a | uniq > a.u
>    sort b | uniq > b.u
>    cat a.u b.u | sort | tee ab.s | uniq > ab.u
>    diff ab.s ab.u | grep '^<' | sed 's/^< //'

>
> -- 
> Edgar Bonet           Maison : 04 76 21 29 16    Bureau : 04 76 88 10 96
> 3 rue Jean Prévost    Mobile : 06 77 19 79 39    Fax    : 04 76 88 11 91
> 38000 Grenoble        guilde@???     www.edgar-bonet.org

>