Re: recherche cde pour trouver les lignes similitaires de 2 …

Top Page

Reply to this message
Author: Jean-Pierre Morin
Date:  
To: guilde
Subject: Re: recherche cde pour trouver les lignes similitaires de 2 fichiers
Le samedi 23 Avril 2005 13:40, stephane driussi a écrit :
> bonjour a tous,
>
> c'est bien compliqué de chercher des doublons dans un fichier. Existe-il
> une syntaxe sed ou awk pour comparer deux lignes consécutives ? Avec un
> post traitement par sort, l'analyse serait plus rapide et simple.
>
> Stéphane
>
> ----- Original Message -----
> From: "Edgar Bonet" <guilde@???>
> To: "Liste Guilde" <guilde@???>
> Sent: Friday, April 22, 2005 7:45 PM
> Subject: Re: recherche cde pour trouver les lignes similitaires de 2
> fichiers
>
> > Le vendredi 22 avril, anne aublanc a écrit :
> >> J'aimerai avoir l'inverse de la cde diff...
> >> trouver les lignes similaires de 2 fichiers...
> >
> > Si les fichiers se ressemblent pas mal, tu peux essayer
> >
> >    diff -U 999999 a b | grep '^ ' | sed 's/^ //'

> >
> > Si tu cherches juste les lignes communes, indépendamment de l'ordre :
> >
> >    sort a | uniq > a.u
> >    sort b | uniq > b.u
> >    cat a.u b.u | sort | tee ab.s | uniq > ab.u
> >    diff ab.s ab.u | grep '^<' | sed 's/^< //'

> >
> > --


Il y a la commande shell : comm
qui est une extension de diff..

JPM