Le Wed, 28 Oct 2020, guilde.nt@??? a écrit :
>> En effet, ça marche bien. Dans mon cas, avec <U+FEFF> en début de fichier,
>> il m'a fallu supprimer les 3 premiers octets
>> dd bs=1 skip=3 < in > out
>> pour que cette séquence disparaisse.
>>
>> Il serait intéressant de savoir d'où cette séquence provient et ce qu'elle
>> signifie.
>
> Si c'est 3 caractères, il doit s'agir de 'ef bb bf' -- peux-tu vérifier ?
Bravo ! hexedit me donne bien ces octets en début de fichier
00000000 EF BB BF 0D 0A 0D 0A 0D 0A 0D 0A 09 09 09 20 20
> C'est le BOM (byte order mark) de UTF-8. Les autres BOMs sont : 'fe ff'
> (UTF-16 big endian) et 'ff fe' (UTF-16 little endian). Utilisé par MicroSoft
> pour préciser le type d'encodage et l'ordre des octets. On le trouvait aussi
> au début des fichiers HTML, ce qui empêchait firefox d'afficher la page.
Les autres BOM dont tu parles sont-ils seulement utilisés par MicroSoft ?
Merci pour tes explications.
Michel
--
Michel Karatchentzeff
Michel.Karatchentzeff@???
Fondation Louis de Broglie, 23, rue Marsoulan, 75012 Paris, FRANCE
http://MichelKaratchentzeff.free.fr