Katalog archivischer Dateiformate Version 5.0, Juli 2016

MHTML


Kategorie

Text, Hypertext

Abkürzung

MHTML
.mht, .mhtml
multipart/related
x-fmt/429

Titel

MIME Encapsulation of Aggregate HTML Documents
(eine gängige deutsche Bezeichnung existiert nicht)

Versionen

Das Format wurde von der Internet Engineering Task Force als RFC 2557 vorgeschlagen.
Es ist binär kompatibel mit der MIME E-Mail-Kodierung zur Übermittlung von HTML in E-Mails.

Beschreibung

MHTML (MIME Encapsulation of Aggregate HTML Documents) ist der Versuch, eine Webseite mit eingebetteten verteilten Webressourcen in einer Datei lokal zu speichern. Wie in der Einleitung zu Hypertext dargelegt, kann ein HTML-Dokument in der Regel nur korrekt dargestellt werden, wenn der Browser online ist und Zugriff auf alle eingebetteten Ressourcen hat. Bei MHTML werden nun alle zur Darstellung notwendigen Ressourcen für das Offline-Browsen in einer Datei gespeichert. D.h. bei der Konvertierung zu MHTML wird das aktuelle DOM-Objekt im Browser in eine Datei serialisiert (gespeichert). Eingebettete binäre Inhalte werden zu diesem Zweck MIME-Type-encodiert, so wie das bei E-Mail der Fall ist.

Bewertung



Offenheit: 4

Die MHTML-Spezifikation ist im RFC 2557 der Internet Engineering Task Force offengelegt.

Lizenzfreiheit: 4

Soweit bekannt existieren keine Patente auf MHTML.

Verbreitung: 1

Das Format als solches hat zur Speicherung von einzelnen Webseiten keine grosse Verbreitung erlangt. Durch die Verwendung für das Versenden von HTML-kodierten E-Mails in Microsoft Outlook und anderen E-Mail-Programmen ist aber eine indirekte grosse Verbreitung gewährleistet.

Funktionalitaet: 3

MHTML erlaubt das integrale Speichern von einzelnen Webseiten mit allen zugehörigen Ressourcen (Stylesheets, Bilder etc.). Es funktioniert aber nur zuverlässig bei einfach aufgebauten Webseiten; sobald JavaScript verwendet wird, scheint es zu Problemen zu kommen. Ganze Internetauftritte, das heisst Beziehungen/Links zwischen mehreren Seiten, können nicht dargestellt werden.

Implementierung: 3

MHTML wird zur Speicherung von einzelnen Webseiten nur von Microsoft Internet Explorer und Opera unterstützt.

Speicherdichte: 1

Die Speicherdichte ist durch die Verwendung der Base64-Kodierung für binäre Inhalte einer Webseite nicht sehr hoch.

Verifizierbarkeit: 2

Es sind keine Tools zur Validierung bekannt; die Browser öffnen MHTML relativ fehlertolerant und versuchen, wenn nötig auf die Original-URL zurückzugreifen.

Best Practice: 1

MHTML kann nicht direkt als Archivformat empfohlen werden, es ist auch keine Verwendung in dieser Hinsicht bekannt.

Perspektive: 2

Ein gewisses Entwicklungspotential Richtung archivtaugliches Format besteht bei MHTML.

Formatklasse: D

Es handelt sich um eine Weiterentwicklung des MIME-Standards mit vorläufig noch unklarem Potential, nicht aber um eine grundlegende Neuentwicklung.


Fazit

Durch das Abstützen auf das MAIL-Protokoll wird eine bewährte Lösung übernommen. Das Problem der verteilten Ressourcen ist so für eine (einfache) Webseite gelöst. Eine MHTML-Datei bildet genau ein DOM-Objekt im Browser ab, aber die Archivierung von ganzen Websites muss anders angegangen werden, denn weiterführende Hyperlinks verweisen aus der MHTML-Datei wieder auf Webressourcen. Wie schon andernorts kritisiert (ARC und WARC) findet bei der Speicherung als MHTML-Datei auch keine Formatnormalisierung statt: Eine Flash-Animation bleibt eine eingebettete Flash-Animation und setzt bei der Wiedergabe ein Flash Plug-in im Browser voraus.

Referenz

Internet Engineering Task Force RFC 2557
http://tools.ietf.org/html/rfc2557
Base64 beschreibt ein Verfahren zur Kodierung von Binärdaten, es ist Bestandteil des MIME Standards (Multipurpose Internet Mail Extensions)
https://de.wikipedia.org/wiki/Base64
Multipurpose Internet Mail Extensions (MIME)
https://tools.ietf.org/html/rfc2048

Literatur

A Simplified Guide to MIME
http://www.hunnysoft.com/mime/mime-guide.html

Verbindungen

HTML
HTML5
last update: georg.buechler - Wed, 22 Jun 2016 [12:29:26]
Copyright © by Koordinationsstelle für die dauerhafte Archivierung elektronischer Unterlagen
Copyright © by Centre de coordination pour l'archivage à long terme de documents électroniques