Gédéon Légaut a écrit :
> je me demande si ce n'est pas beaucoup plus général que ça. Je veux
> dire par là que cela semble impliquer le terminal aussi.
C'est justement pour répondre à ce genre de question que je suggère hd :
$ echo é; echo é | hd
é
00000000 c3 a9 0a |...|
00000003
Là on voit que mon terminal affiche « é » quand il reçoit la séquence
(0xc3 0xa9). Il interprète donc correctement le UTF-8.
> D'un côté, 'é' est bien codé sur 2 octets avec pour code hexa "c3 a9",
> d'un autre, au lieu de reconnaître Début, hd renvoie D..but.
Oui, c'est normal. Dans la colonne de droite, hd affiche l'équivalent
ASCII pour les octets correspondant à des caractères ASCII imprimables
(0x20 à 0x7e). Il n'envoie jamais rien d'autre que de l'ASCII au
terminal. En particulier il n'affiche pas le UTF-8.
À+,
Edgar.