HTML


Catégorie

Texte, données hypertextes

Abréviations

HTML
.html et .htm
text/html et application/xhtml+xml
fmt/96, fmt/97, fmt/98, fmt/99, fmt/100, fmt/102, fmt/103

Titre

Hypertext Markup Language
Langage de balisage hypertexte

Versions

HTML 2.0 est la première version formellement spécifiée par le World Wide Web Consortium (W3C) en 1995. Les versions principales suivantes sont la 3.2 et la 4.0. En 2002 elles sont enrichies par XHTML et après une longue interruption dans le développement, elles sont remplacées fin 2014 par HTML5.

Description

HTML est un langage de balisage basé sur du texte destiné à structurer des documents numériques. HTML utilise des balises plus ou moins explicites pour la structuration sémantique, le formatage exact du balisage revenant au logiciel d’affichage (navigateur) et à la mise en page (CSS). En plus de structurer, le HTML permet d’inclure des liens, des métadonnées et des images. Le HTML est une forme simplifiée du langage de balisage SGML développé spécialement pour le web.

Evaluation


Ouverture du format: 4

La spécification HTML est administrée et développée par le World Wide Web Consortium (W3C).

Licence libre: 4

Il n’existe pas de patente connue pour le HTML.
Il y a cependant eu plusieurs tentatives de patenter le langage de balisage en tant que tel ainsi que le mécanisme hypertexte dans son ensemble, voir https://en.wikipedia.org/wiki/Eolas.

Diffusion: 4

Par sa diffusion sur le web, le format est l’un des plus répandus du monde informatique.

Fonctionnalités: 2

Le HTML couvre complètement les fonctionnalités des données hypertextes. La séparation de la sémantique et de la forme a en revanche perdu de son importance avec le temps, bien qu’une réglementation claire existe avec la séparation HTML/CSS. Beaucoup de pages internet mettent l’accent sur la présentation graphique dans la fenêtre du navigateur.

Implémentation: 4

Il existe plusieurs implémentations de navigateurs techniquement indépendantes les unes des autres pour HTML 2.0 jusqu’à 4.1.

Densité de mémorisation: 2

À cause de l’utilisation de balises redondantes, la densité de mémorisation n’est pas très élevée.

Vérifiabilité: 2

Dans les versions HTML plus récentes, on peut visualiser aussi bien la version que le codage des signes depuis l’en-tête du fichier (header) et les métadonnées. De ce point de vue, les versions plus anciennes sont peu fiables. Il existe divers validateurs HTML, mais en raison de la grande tolérance aux erreurs de la plupart des navigateurs, il existe également beaucoup de codes HTML invalides.

Bonnes pratiques: 1

HTML n’est en fait pas recommandé ni utilisé comme format d’archivage.

Perspectives: 1

HTML5 présente toutefois un potentiel en vue de développer un format adapté pour l’archivage.

Classes de formats: A

Il s’agit d’un des plus anciens formats du domaine de l’informatique


Conclusion

Du fait de la séparation de la structure des contenus et de la présentation formelle, le format répondrait en fait aux besoins de base de l’archivage numérique, puisqu’il rendrait l’archivage indépendant du développement du logiciel de visualisation. Malheureusement, le développement très rapide de la technologie des navigateurs a modifié entretemps le format et il s’avère que le contenu de beaucoup de pages internet n’est compréhensible que si la présentation graphique est correcte. Cela signifie que la rétrocompatibilité du navigateur garantit dans une large mesure le fait que nous puissions regarder les anciennes pages internet dans leur apparence initiale et en comprendre le contenu.
La nécessité d’archiver séparément les ressources externes qui vont avec chaque page HTML a un effet très négatif et a mené aux formats conteneurs pour pages HTML tels que MHTML, ARC et WARC.

Références

Hypertext Markup Language - 2.0, September 22, 1995
http://www.w3.org/MarkUp/html-spec/html-spec_toc.html
HTML 3.2 Reference Specification, W3C Recommendation 14-Jan-1997
http://www.w3.org/TR/REC-html32
HTML 4.01 Specification, W3C Recommendation 24 December 1999
http://www.w3.org/TR/html4/
XHTML™ 1.0 The Extensible HyperText Markup Language (Second Edition), A Reformulation of HTML 4 in XML 1.0, W3C Recommendation 26 January 2000, revised 1 August 2002
http://www.w3.org/TR/xhtml1/

Bibliographie

Ian S. Graham « The HTML SourceBook? » New York, 1995
Rainer Klute « Das World Wide Web » Bonn Addison-Wesley, 1996
Erik Wilde « World Wide Web, Technische Grundlagen » Berlin Heidelberg, 1999

Articles connexes

HTML5
MHTML

last update: claire.roethlisberger - Mon, 04 Jul 2016 [15:33:21]
Copyright © by Koordinationsstelle für die dauerhafte Archivierung elektronischer Unterlagen
Copyright © by Centre de coordination pour l'archivage à long terme de documents électroniques