Re: encodage d'un fichier

Page principale

Répondre à ce message
Auteur: Patrice Karatchentzeff
Date:  
CC: guilde
Sujet: Re: encodage d'un fichier
Le 19/06/06, Gedeon Legaut<gedeon.legaut@???> a écrit :
> bon(jour)soir,
> est-ce qu'il y a un moyen facile de connaitre l'encodage d'un fichier
> (sous emacs par ex, mais je prends ttes les idées) ?
> j'ai cherché si la commande "file" avait cela en option, mais non.
> merci


Pour faire simple, non.

C'est LE problème de l'informatique d'aujourd'hui : on paye casch 30
ans de vision à petite échelle de l'informatique (et, il faut bien le
dire, très américaine de la chose).

Pour faire plus compliqué : l'encodage d'un fichier est quelque chose
de complexe. Il existe de multiples méthodes et certaines se
recouvrent en partie. Il n'existe pas de moyen infaillible de détecter
le bon encodage.

La méthode la plus utilisée est euristique : on essaie de le
déterminer via le nombre d'occurence de certaines lettres par exemple.
Mais cette méthode donne parfois des résultats curieux : on montre
ainsi que le japonais est très proche de notre bon vieil encodage
latin (pendant longtemps, Emacs mettait du japonais sur les courriels
en latin-9).

Bref, si tu as une solution, ton nom sera certainement béni pendant
les 20 prochaines années :)

PK


-- 
      |\      _,,,---,,_       Patrice KARATCHENTZEFF
ZZZzz /,`.-'`'    -.  ;-;;,_   mailto:p.karatchentzeff@free.fr
     |,4-  ) )-,_. ,\ (  `'-'  http://p.karatchentzeff.free.fr
    '---''(_/--'  `-'\_)