Katalog archivischer Dateiformate Version 5.0, Juli 2016

PDF/A-2 bei Bild



Preservation Planning


Gewisse Archivalien sind zwar dem Format nach Bilder, der Funktion nach jedoch vielmehr Texte. Dies gilt in erster Linie für Retrodigitalisate von seitenbasierten Vorlagen wie Amtsdruckschriften oder Karteikarten. Für solche Unterlagen empfiehlt sich die Wahl eines Archivformats, welches ihrer Funktion Rechnung trägt. Aus diesem Grund wird hier die Möglichkeit der Verwendung von PDF/A-2 als Archivformat für solche Unterlagen untersucht. Damit können zwei wesentliche Vorteile erreicht werden: Eine Abfolge von Seiten kann auf einfache und direkt verständliche Art abgebildet werden, und das Archivformat kann gleichzeitig als Zugangsformat dienen.

PDF/A-2 kann Bild in einer Vielzahl von Codierungen und Komprimierungen enthalten, welche ihrerseits auf ihre Archivtauglichkeit hin untersucht werden müssen. Für die erwähnten Arten von Unterlagen kann auch eine verlustbehaftete Komprimierung in Betracht gezogen werden, und zwar aus zwei Gründen:
  1. Auch ein hochaufgelöstes Retrodigitalisat ist nicht das Original, sondern weist gegenüber diesem einen Informationsverlust auf. (Für einen Vergleich der im Scan-Prozess entstehenden und der durch eine massvolle Komprimierung erzeugten Varianzen siehe der Bericht zum KOST-Kolloquium Datenkomprimierung bei Bild, Audio und Video, http://kost-ceco.ch/cms/index.php?compression_de.)
  2. Die wesentlichen signifikanten Eigenschaften von Druckschriften oder Karteikarten sind der Text und seine Anordnung; eine detaillierte fotografische Rekonstruktion wird in der Regel nicht angestrebt.

Die technischen Eigenschaften von PDF/A-2 sind im Kapitel zu den Text ausführlich beschrieben. Dort ist auch ein detaillierter Vergleich mit den Versionen 1 und 3 möglich. Für die Verwendung als Archivformat für Bild empfiehlt sich Version 2 insbesondere deshalb, weil sie die Verwendung der JPEG2000-Komprimierung erlaubt, welche ausdrücklich empfohlen wird.

Hier erfolgt einzig die Kurzbewertung von PDF/A-2 für die Verwendung als Format zur Archivierung von Bild.

Bewertung



Offenheit: 4

PDF/A-2 ist ein ISO-Standard.

Lizenzfreiheit: 4

Dieses Kriterium ist erfüllt für PDF/A-2; es ist jedoch darauf zu achten, dass keine lizenzierten Schriften, Kompressionsalgorithmen oder Verschlüsselungsalgorithmen verwendet werden.

Verbreitung: 3

PDF/A-2 hat in den letzten Jahren in den Archiven und der Geschäftswelt stark an Verbreitung gewonnen.

Funktionalitaet: 3

Grundsätzlich hängt die Funktionalität von PDF/A-2 als Archivformat für Bild vom eingebetteten Bildformat und dem allfällig verwendeten Kompressionsalgorithmus ab. PDF/A bildet insbesondere die Funktionalität seitenbasierter Originale wie Bücher, Amtsdruckschriften oder Karteikarten ideal ab. Als Kompressionsalgorithmus wird JPEG2000 empfohlen.

Implementierung: 3

Es existieren verschiedene Tools zur Erzeugung von PDF/A-2-Dokumenten (Adobe Acrobat Professional u.a.; siehe dazu die entsprechende KOST-Studie). Gelesen werden können die PDF/A-2-Dateien mit allen PDF-Readern (z.B. Adobe Reader).

Speicherdichte: 3

PDF/A-2 dient als Container für diverse Bildformate und Kompressionsalgorithmen. Für die Archivierung von retrodigitalisierten Unterlagen in Seitenform kann in der Regel eine verlustfreie oder verlustbehaftete Komprimierung in Kauf genommen werden. Entsprechend kann die Speicherdichte relativ hoch sein.

Verifizierbarkeit: 4

PDF/A-2-Dateien können von Formaterkennungssoftware erkannt werden. Es existieren mehrere Validatoren für das Format.

Best Practice: 3

Das Format wird in Archiven zunehmend eingesetzt und hat eine sehr hohe Akzeptanz als Archivformat. Im Bereich der Digitalen Fotographie hat es aber bis jetzt keine Bedeutung erlangt.

Perspektive: 3

Das Format wurde als Archivformat entwickelt und wird archivisch begleitet weiterentwickelt.

Formatklasse: C

Das Format ist neu.


Fazit

PDF/A-2 ist für die Archivierung von Bild geeignet. Speziell empfohlen wird es für die Archivierung retrodigitalisierter Unterlagen in Seitenform wie Amtsdruckschriften und Karteikarten. Innerhalb von PDF/A-2 sind verschiedene Bildformate und Komprimierungsalgorithmen möglich, welche die archivischen Eigenschaften massgeblich mitbestimmen und sorgfältig ausgewählt werden müssen. Empfohlen wird die Verwendung von PDF/A-2 mit der JPEG2000-Komprimierung.

Preservation Planning

Die in PDF/A erlaubte Komprimierungsart JBIG2 speichert gleichwertige Symbole nur einmal ab und verwendet diese mehrfach im ganzen Dokument. Dieses Verfahren nennt sich "Pattern matching and substitution" (PMS) und führt bei bestimmten Implementierungen und Einstellungen dazu, dass in Textdokumenten einzelne Zeichen durch andere ersetzt werden. Da der Fehler irreversibel ist und nicht festgestellt werden kann, ob das verlustbehaftete PMS-Verfahren eingesetzt wurde oder nicht, empfiehlt die KOST, beim Erstellen von PDF-Dateien vorerst auf die Kompressionsart JBIG2 zu verzichten. Für Details siehe http://kost-ceco.ch/cms/index.php?jbig2-compression_de.


last update: martin.kaiser - Tue, 05 Jul 2016 [16:17:44]
Copyright © by Koordinationsstelle für die dauerhafte Archivierung elektronischer Unterlagen
Copyright © by Centre de coordination pour l'archivage à long terme de documents électroniques