Remarques relatives au codage des caractères


Jeux et codage de caractères


Nous différencions les jeux et les codages de caractères.

Traditionnellement, les jeux et les codages de caractères coïncidaient: un caractère était représenté directement par une séquence de bits. Cela s’applique notamment à:

Avec Unicode, les jeux et le codage de caractères sont séparés. Unicode définit en premier lieu les différents caractères des polices d’écriture respectives (jusqu’ici plus de 100 000) et leur attribue un dénommé code point, ou code caractère. Ce code caractère peut ensuite être converti de différentes manières dans une séquence de bits:

Références


ASCII

American National Standards Institute (ANSI) X3.4-1967 (ASCII-1967)

ISO/IEC 646:1991, Technologie de l’information — Jeu ISO de caractères codés à 7 éléments pour l'échange d'information
http://www.iso.org/iso/fr/iso_catalogue/catalogue_tc/catalogue_detail.htm?csnumber=4777
[payant]

ISO 8859

ISO/IEC 8859-1:1998, Technologie de l’information — Jeux de caractères graphiques codés sur un seul octet — Partie 1: Alphabet latin no. 1
http://www.iso.org/iso/fr/iso_catalogue/catalogue_tc/catalogue_detail.htm?csnumber=28245
[payant]
http://anubis.dkuug.dk/JTC1/SC2/WG3/docs/n411.pdf
[gratuit, version bêta anglophone de celle ci-dessus]

Unicode

Unicode 5.0.0
http://www.unicode.org/versions/Unicode5.0.0/
UTF-8
http://tools.ietf.org/html/rfc3629

Bibliographie


Spolsky, Joel: The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!)
http://www.joelonsoftware.com/articles/Unicode.html
Wikipédia, ISO 8859-1
http://fr.wikipedia.org/wiki/ISO_8859-1
Tero, Paul: All About Unicode, UTF8 & Character Sets
Smashing Magazine, 2012
http://coding.smashingmagazine.com/2012/06/06/all-about-unicode-utf8-character-sets/

Unicode

UTF-8
http://www.utf-8.com/
Wikipedia: Comparatif de l’UTF-8 avec d’autres codages de caractères UNICODE
http://en.wikipedia.org/wiki/UTF-8#Advantages_and_disadvantages
last update: georg.buechler - Wed, 12 Dec 2012 [15:18:24]
Copyright © by Koordinationsstelle für die dauerhafte Archivierung elektronischer Unterlagen
Copyright © by Centre de coordination pour l'archivage à long terme de documents électroniques