Katalog archivischer Dateiformate Version 5.0, Juli 2016


Empfehlung der KOST


Der Katalog archivischer Dateiformate (KaD) kann von Archiven und verwandten Institutionen als Grundlage für die Formulierung eigener Formatempfehlungen benutzt werden. Aufgrund der im KaD detailliert erläuterten Analysen, Bewertungen und Schlussfolgerungen empfiehlt die KOST für die verschiedenen Formatkategorien die folgenden Dateiformate als gegenwärtig archivtauglichste Lösung:

Text sollen möglichst bereits im Amt in ein PDF-Format ( PDF/A-1, PDF/A-2 oder PDF ) umgewandelt und so archiviert werden.
Eine Konvertierung von PDF-Dateien in ein PDF/A-Format ist zu einem späteren Zeitpunkt meist problemlos möglich.

Es gibt nicht ein einziges ideales Archivformat für Bild. Es ist im Gegenteil unerlässlich, den konkreten Anwendungsfall und die archivische Bewertung in den Formatentscheid mit einzubeziehen:
  • PDF/A-2 erfüllt die archivischen Anforderungen an ein Bildformat in idealer Weise, ist jedoch in erster Linie geeignet für die Archivierung retrodigitalisierter Unterlagen in Seitenform wie Amtsdruckschriften und Karteikarten. Für diese Unterlagenkategorie ist auch eine massvolle Komprimierung empfehlenswert.
  • JPEG gilt gemeinhin sowie als Resultat der Analyse des KaD nicht als Archivformat. In der Praxis übernehmen viele Archive allerdings grosse Bildbestände im JPEG-Format. Eine Konvertierung in ein Archivformat macht hier nur in den wenigsten Fällen Sinn: JPEG ist weit verbreitet und stabil, der Informationsverlust durch die Komprimierung ist bereits geschehen und nicht rückgängig zu machen.
  • PNG kann in der Regel nicht als Zielformat für Migrationen gelten, wird jedoch bei der Archivierung von Webinhalten voraussichtlich in grossen Mengen übernommen werden.
  • DNG kann in Betracht gezogen werden bei der Archivierung von digitalen Fotos, falls der Zugriff auf die RAW-Daten möglich ist.
In einem allgemeinen Sinn kann immer noch TIFF als hauptsächliches Archivformat für Rasterbilder gelten. Die Verwendung von JPEG2000 mit seinen Vorteilen in der Speicherplatzökonomie ist alternativ ebenfalls möglich, erfordert vom Archiv jedoch ein bewusstes Bekenntnis zu diesem ausserhalb der Archivwelt immer noch wenig verbreiteten Format.

Für Audio ist das WAV-Format (genauer: WAVE PCM) als Archivformat anerkannt und unbestritten.

Für die Archivierung von Video sollte folgendes erwogen werden:
  • Die übernommen Video sollten wenn möglich die ursprünglich erzeugten und wenn nicht, so doch die mit möglichst wenig Konvertierungsschritten entstandenen Daten sein.
  • Die geringe Erfahrung im archivischen Bereich mit der Langzeitarchivierung von Video sollte uns davon abhalten, vorschnell Formatmigrationen in Erwägung zu ziehen. Eine Ausnahme ist der Fall, wo Video von ephemeren Datenträgern (Kassetten, Minidisks etc.) übernommen werden müssen.
  • Es ist abzuwägen, ob es der Umfang der zu archivierenden Video erlaubt, diese in unkomprimierter oder verlustfrei komprimierter Form zu speichern.
  • Der Entscheid für eine Komprimierung ist aus archivischer Sicht ein Bewertungsentscheid: In vielen Fällen muss mit Komprimierung auf bestimmte Aspekte (Qualität, zukünftige Benutzung etc.), ohne Komprimierung auf eine Überlieferung gänzlich verzichtet werden.
  • Es muss ein besonderes Augenmerk auf möglichst lange Migrationszyklen gelegt werden.
  • Deshalb ist für Video die Migrationsvermeidung höher zu gewichten als die Reduktion der Formatanzahl im Archiv, und es können mehr Formate als (mindestens provisorisch) archivtauglich akzeptiert werden als für andere Formatkategorien.
Daraus ergibt sich folgende Schlussfolgerung: Videoformate können nicht per se als archivtauglich oder nicht archivtauglich klassifiziert werden. Vielmehr ist je nach Entstehungszusammenhang, Archivauftrag und Bewertungsentscheid jeweils ein bestimmtes Format das in diesem Fall am besten geeignete.

Es existiert kein aus archivischer Sicht ideales Format für strukturierte Daten aus Tabellenkalkulation. Die Wahl eines provisorischen Archivformats muss sich an den zu bewahrenden Eigenschaften orientieren: Wenn die Funktionalität bewahrt werden soll, ist die Verwendung eines Originalformats wie XLS, ODF oder OOXML unabdingbar. Wenn in erster Linie die Tabellennatur bewahrt werden soll, können Datenbank-Archivierungsformate verwendet werden. Wenn nur der optische Aspekt wichtig ist, sollte PDF/A-1 oder -2 verwendet werden.

Datenbanken können nur unter Vorbehalt in ein archivisches Dateiformat überführt werden. Die Übernahme von Datenbanktabellen im CSV-Format ist bislang ein verbreitetes Vorgehen in den Archiven. Angesichts der Limiten von CSV, insbesondere der fehlenden Dokumentation und Metainformationen, kann dieses Format inzwischen nur noch als Notlösung gelten. Es wird empfohlen, ein umfassenderes, spezifisch für die Datenbank-Archivierung entwickeltes Format wie SIARD zu verwenden.

Die Webarchivierung bzw. die Archivierung von Hypertext stellt bezüglich Bewertung und Übernahme aber auch bei der Formatwahl besondere Anforderungen (siehe dazu die Studie zur Webarchivierung). Obwohl WARC das eingeführte Format der Webarchivierung ist, kann es als Langzeitformat nicht empfohlen werden: Die Vielzahl möglicher eingebetteter Formate und die Schwierigkeit, diese zu migrieren, sprechen dagegen. Für die Archivierung eines gesamten Webauftritts empfiehlt sich längerfristig eindeutig eine Umwandlung in PDF/A.

last update: georg.buechler - Tue, 05 Jul 2016 [12:57:36]
Copyright © by Koordinationsstelle für die dauerhafte Archivierung elektronischer Unterlagen
Copyright © by Centre de coordination pour l'archivage à long terme de documents électroniques