MHTML


Catégorie

Texte, hypertexte

Abréviations

MHTML
.mht, .mhtml
multipart/related
x-fmt/429

Titre

MIME Encapsulation of Aggregate HTML Documents
(Il n’y a pas de désignation française courante)

Versions

Le format a été proposé par l’Internet Engineering Task Force dans le cadre de la RFC 2557.
Il présente une compatibilité binaire avec le codage des courriels MIME pour la transmission du HTML dans les messages électroniques.

Description

MHTML (MIME Encapsulation of Aggregate HTML Documents) est la tentative d’enregistrer localement dans un fichier une page web avec des ressources web incorporées distribuées. Comme expliqué dans l’introduction sur l'hypertexte, en règle générale un document HTML ne peut être présenté correctement que si le navigateur est en ligne et a accès à toutes les ressources incorporées. Avec le MHTML, toutes les ressources nécessaires à la présentation sont désormais enregistrées dans un fichier pour la navigation hors ligne. Cela signifie que lors de la conversion en MHTML, l’objet DOM actuel est sérialisé (sauvegardé) dans un fichier dans le navigateur. À cet effet, les contenus incorporés binaires passent par un encodage de type MIME, comme c’est le cas pour les messages électroniques.

Evaluation


Ouverture du format: 4

La spécification MHTML est publiée dans le RFC 2557 de l’Internet Engineering Task Force.

Licence libre: 4

Il n’existe pas de patente connue pour le MHTML.

Diffusion: 1

Le format en tant que tel n’a pas connu une grande diffusion pour le stockage de pages web individuelles. Une grande diffusion indirecte est assurée par l’utilisation pour l’envoi de messages électroniques codés en HTML dans Microsoft Outlook et autres programmes de messagerie.

Fonctionnalités: 3

MHTML permet de sauvegarder intégralement des pages internet individuelles avec toutes les ressources annexes (feuilles de style, images, etc.). Ça ne fonctionne de façon fiable que pour les pages web construites de manière simple. Il semble qu’il y ait des problèmes dès qu’on utilise JavaScript. MHTML ne peut pas représenter des sites internet entiers, c’est-à-dire avec des relations ou liens entre plusieurs pages.

Implémentation: 3

Seuls Microsoft Internet Explorer et Opera prennent en charge le format MHTML pour l’enregistrement de pages web individuelles.

Densité de mémorisation: 1

À cause de l’utilisation du codage Base64 pour contenus binaires d’une page web, la densité de mémorisation n’est pas très élevée.

Vérifiabilité: 2

Il n’y a pas d’outil de validation connu. Les navigateurs ouvrent le format MHTML avec une grande tolérance aux erreurs et essaient si nécessaire de recourir aux URL de l’original.

Bonnes pratiques: 1

MHTML ne peut pas être directement recommandé comme format d’archivage. Aucune utilisation dans ce sens n’est connue.

Perspectives: 2

MHTML présente un certain potentiel en vue de développer un format adapté pour l’archivage.

Classes de formats: D

Il s’agit d’un développement de la norme MIME dont le potentiel est pour l’instant encore flou, mais pas d’un nouveau développement fondamental.

Conclusion

En s’appuyant sur le protocole MAIL, on adopte une solution éprouvée. Pour les pages internet (simples), cela résout le problème des ressources distribuées. Un fichier MHTML représente exactement un objet DOM dans le navigateur, mais il faut procéder autrement pour archiver des sites web entiers, car les hyperliens partant du fichier MHTML se rapportent à des ressources web. Comme critiqué dans d’autres cas (ARC et WARC), aucune normalisation de format n’est effectuée lors d’un enregistrement en tant que fichier MHTML non plus. Une animation flash reste une animation flash incorporée et exige un module d’extension (plug in) flash dans le navigateur lors de sa restitution.

Références

Internet Engineering Task Force RFC 2557
http://tools.ietf.org/html/rfc2557
Base64 décrit un processus pour le codage de données binaires, il fait partie de la norme MIME (Multipurpose Internet Mail Extensions)
https://de.wikipedia.org/wiki/Base64
Multipurpose Internet Mail Extensions (MIME)
https://tools.ietf.org/html/rfc2048

Bibliographie

A Simplified Guide to MIME
http://www.hunnysoft.com/mime/mime-guide.html

Articles connexes

HTML
HTML5

last update: georg.buechler - Mon, 04 Jul 2016 [12:25:08]
Copyright © by Koordinationsstelle für die dauerhafte Archivierung elektronischer Unterlagen
Copyright © by Centre de coordination pour l'archivage à long terme de documents électroniques