UNICODE et UTF-8

L’encodage le plus utilisé pour les caractères UNICODE est UTF-8. C’est un encodage multi-octet :

  • Un octet pour les caractères ASCII
  • Plusieurs octets (de 2 à 4) pour les autres caractères

UTF-8 est l’encodage par défaut d’XML.

La plupart des logiciels sont maintenant « compatibles UTF-8 ».