Re: Un truc tordu

Top Page

Reply to this message
Author: guilde.nt
Date:  
To: Michel Karatchentzeff
CC: liste Guilde
Subject: Re: Un truc tordu
> En effet, ça marche bien. Dans mon cas, avec <U+FEFF> en début de fichier,
> il m'a fallu supprimer les 3 premiers octets
>     dd bs=1 skip=3 < in > out
> pour que cette séquence disparaisse.

>
> Il serait intéressant de savoir d'où cette séquence provient et ce qu'elle
> signifie.


Si c'est 3 caractères, il doit s'agir de 'ef bb bf' -- peux-tu vérifier ?
C'est le BOM (byte order mark) de UTF-8. Les autres BOMs sont : 'fe ff'
(UTF-16 big endian) et 'ff fe' (UTF-16 little endian). Utilisé par MicroSoft
pour préciser le type d'encodage et l'ordre des octets. On le trouvait aussi
au début des fichiers HTML, ce qui empêchait firefox d'afficher la page.
-Nicolas T.