Katalog archivischer Dateiformate (
KaD, v2)
Verworfene Kriterien
Die folgenden Punkte wurden als mögliche Kriterien genannt, nach genauerer Analyse jedoch verworfen.
Metadatenunterstützung
Das Format soll Metadaten einschliessen können und muss die Extrahierung dieser Metadaten aus Dateien ermöglichen
Gewisse Dateiformate haben eigene Metadatenbereiche, die beim Erstellen der Datei befüllt werden. Diese Metadaten werden in der Regel automatisch erstellt und entsprechen darum nicht immer den wirklichen Gegebenheiten und Intentionen des Erstellers (z.B. Titel in einem
PDF-Dokument). Soweit sie nicht automatisch erstellt werden, werden sie tendenziell schlecht genutzt.
Das Kriterium, in Version 1.0 des KaD noch enthalten, wurde verworfen, weil deutlich wurde, dass formatinterne Metadaten für die digitale Archivierung keinen Vorteil bieten. Metadaten sind zwar von entscheidender Bedeutung für die digitale Archivierung. Aus den obigen Ueberlegungen ergibt sich, dass wo möglich auf Metadaten des Records-Management-Systems abgestellt werden sollte, in dem die Datei erzeugt worden ist. Diese externen Metadaten sind in aller Regel vollständiger und qualitativ wertvoller als die dateiinternen. Sie müssen dann zusammen mit der Dokumentdatei archiviert werden. Dafür existieren verschiedene Methoden, welche alle vom Dateiformat unabhängig sind.
Interoperabilität
Das Dateiformat ist von spezifischer Hardware und Betriebssystemen unabhängig.
Heute wird die Bindung eines Dateiformates an eine spezifische Hardware bzw. an ein spezielles Trägermedium (CD oder DVD) vor allem als Kopierschutz eingesetzt. Das widerspricht der Grundvorgabe, dass nur Formate ohne Kopierschutz und Verschlüsselung archiviert werden sollen.
Im Prinzip ist jedes wohl definierte Format auf jeder Hardware/Software-Plattform speicherbar. Ob auf dieser Plattform auch
Rendering Software für dieses Format zur Verfügung steht, ist damit nicht gesagt. Im Prinzip könnte aber, auf Grund der veröffentlichten Formatspezifikation, eine solche für die jeweilige Plattform entwickelt werden (z.B. WMF unter Linux).
Das Kriterium wurde verworfen, weil es für sämtliche untersuchten Formate zutrifft und mithin kein Unterscheidungsmerkmal ist. Interoperabilität ist eine so wesentliche Eigenschaft eines Archivformats, dass sie bereits in der Zusammenstellung des provisorischen Formatkatalogs berücksichtigt wurde.
Verifizierbarkeit
Es müssen Methoden und Werkzeuge existieren, die verifizieren können, dass eine Datei den Formatspezifikationen entspricht.
Hier geht es einerseits um die automatische Formaterkennung, anderseits um die Validierung der gesamten Datei.
Die Formaterkennung muss das Format bis auf die gewünschte Granularität erkennen können (also statt
PDF besser z.B.
PDF 1.4).
Die Formatvalidierung muss bestätigen, dass eine Datei den Spezifikationen des Formats entspricht. Dabei müssen auch als problematisch erachtete eingebettete Objekte erkannt werden können.
Das Kriterium wurde verworfen, weil es sich aus dem Kriterium Offenheit ableiten lässt.
Authentizität
Das Format muss die Authentizität der Dokumente gewährleisten.
Digitale Signatur als heute akzeptierte Möglichkeit, die Authentizität einer Datei zu beweisen, ist notwendig mit den Nachteilen der Verschlüsselung verbunden. Einfachere Möglichkeiten der Authentizitätssicherung können auch auf der Ebene der Dateiarchivierung implementiert werden.
Bei der Migration in das Format müssen Inhalt, Kontext, Struktur und Referenzen der Ausgangsdatei erhalten bleiben.
Das Kriterium wurde verworfen, weil die Authentizität der archivierten Dokumente nicht via Dateiformat, sondern über andere Mechanismen sichergestellt werden soll.
Fehlerkorrektur
Das Format soll Mechanismen der automatischen Fehlerkorrektur anbieten.
Gewisse Formate bieten Mechanismen der automatischen Fehlererkennung oder Fehlerkorrektur (z.B.
PNG).
Das Kriterium wurde verworfen, weil Fehlererkennung und Fehlerkorrektur heute in der Regel schon hinreichend von der Speichertechnologie und der Speichersoftware (Storage Management System) gewährleistet werden.