Re: encoding encoding ...

Top Page

Reply to this message
Author: Edgar Bonet
Date:  
To: guilde
Subject: Re: encoding encoding ...
Gédéon Légaut a écrit :
> je me demande si ce n'est pas beaucoup plus général que ça. Je veux
> dire par là que cela semble impliquer le terminal aussi.


C'est justement pour répondre à ce genre de question que je suggère hd :

    $ echo é; echo é | hd
    é
    00000000  c3 a9 0a                                          |...|
    00000003


Là on voit que mon terminal affiche « é » quand il reçoit la séquence
(0xc3 0xa9). Il interprète donc correctement le UTF-8.

> D'un côté, 'é' est bien codé sur 2 octets avec pour code hexa "c3 a9",
> d'un autre, au lieu de reconnaître Début, hd renvoie D..but.


Oui, c'est normal. Dans la colonne de droite, hd affiche l'équivalent
ASCII pour les octets correspondant à des caractères ASCII imprimables
(0x20 à 0x7e). Il n'envoie jamais rien d'autre que de l'ASCII au
terminal. En particulier il n'affiche pas le UTF-8.

À+,

Edgar.