Le jeudi 07 janv. 2016 à 16:31:10 (+0100), ALD a écrit : > j'ai essayé avec diverses commandes comme diff ou rdfind mais les fichiers sont
> "presque" identiques, donc "un peu" différents (des fois juste une ligne de tag
> d'antivirus ou d'antispam de différence...) et ça suffit pour qu'ils soient
> considérés différents.
Théoriquement, chaque mail doit contenir un header du style :
Message-ID: <identifiant unique généré par le client>
Donc si tu te bases uniquement sur ce header, tu devrais virer tous les
doublons et garder tous les mails légitimes. Dans un dossier type
Maildir, j'utilise mutt qui vire assez bien les doublons (T pour
sélectionner, ~= pour dire les messages identiques, et ;d pour virer la
sélection), mais tu dois pouvoir trouver à faire avec awk ou assimilé.