Re: analyse lexicale

Page principale

Répondre à ce message
Auteur: Michel Karatchentzeff
Date:  
À: liste Guilde
Sujet: Re: analyse lexicale
On Sat, 16 Nov 2002, Buch Pascal wrote:

> bonsoir,
>
> je recherche un petit utilitaire qui, à partir d'un texte quelconque, dresse
> la liste des mots par ordre alphabétique et de fréquence... j'accepte même
> les trucs en ligne de commande ;-))
>

C'est un classique. Il y a diverses possibilités. Dans un fichier de
commandes par exemple:

cat $* |
tr -cs '[:lower:][:upper:]' '[\n*]' |
sort |
uniq -c |
sort -n

ou  ([    ] correspond à [^I])


 cat $* |
 sed 's/[      ][      ]*/\
 /g' |
  sed 's/  */\
 /g' |
  sort |
  uniq -c |
  sort -n


ou

> awk ' { for (i = 1; i <= NF; i++) num[$i]++}
> END {for (word in num) print word, num[word]}
> ' $*



--
Michel Karatchentzeff
mk@???                            karat@???
Fondation Louis de Broglie, 23, rue Marsoulan, 75012 Paris, FRANCE


Merci de ne pas ajouter, sauf nécessité, ce message à votre réponse.
J'en dispose déjà d'un double.