Re: Un truc tordu

Top Page

Reply to this message
Author: Michel Karatchentzeff
Date:  
To: guilde.nt
CC: liste Guilde
Subject: Re: Un truc tordu
Le Wed, 28 Oct 2020, guilde.nt@??? a écrit :

>> En effet, ça marche bien. Dans mon cas, avec <U+FEFF> en début de fichier,
>> il m'a fallu supprimer les 3 premiers octets
>>     dd bs=1 skip=3 < in > out
>> pour que cette séquence disparaisse.

>>
>> Il serait intéressant de savoir d'où cette séquence provient et ce qu'elle
>> signifie.
>
> Si c'est 3 caractères, il doit s'agir de 'ef bb bf' -- peux-tu vérifier ?


Bravo ! hexedit me donne bien ces octets en début de fichier

00000000 EF BB BF 0D 0A 0D 0A 0D 0A 0D 0A 09 09 09 20 20

> C'est le BOM (byte order mark) de UTF-8. Les autres BOMs sont : 'fe ff'
> (UTF-16 big endian) et 'ff fe' (UTF-16 little endian). Utilisé par MicroSoft
> pour préciser le type d'encodage et l'ordre des octets. On le trouvait aussi
> au début des fichiers HTML, ce qui empêchait firefox d'afficher la page.


Les autres BOM dont tu parles sont-ils seulement utilisés par MicroSoft ?

Merci pour tes explications.

Michel

--
Michel Karatchentzeff
Michel.Karatchentzeff@???
Fondation Louis de Broglie, 23, rue Marsoulan, 75012 Paris, FRANCE
http://MichelKaratchentzeff.free.fr