Katalog archivischer Dateiformate Version 5.0, Juli 2016

PDF/A-2



Preservation Planning


Kategorie

Textformate

Abkürzung

PDF/A, PDF/A-2, PDF/A-2a, PDF/A-2b, PDF/A-2u
.pdf
application/pdf
fmt/476, fmt/477, fmt/478

Titel

Portable Document Format (Archival)

Version

PDF/A-2 (entspricht ISO-32000-1 respektive PDF-Version 1.7) mit PDF/A-2a, PDF/A-2b und PDF/A-2u (2011)
Zusätzlich sind PDF/A-1 und PDF/A-3 publiziert. Da keine PDF/A-Version eine andere ablöst, sind alle Versionen gleichermassen gültig.

Beschreibung

PDF/A-2 ist ein Portable Document Format, das für die Archivierung geschaffen wurde. Das Format wurde im Standard "ISO-19005-2 - Document management – Electronic document file format for long-term preservation" genormt. Dieser Standard entspricht der PDF-Version ISO 32000-1. Im Standard wird nur aufgelistet, welche Funktionen der einzelnen PDF-Versionen obligatorisch, empfohlen, eingeschränkt oder verboten sind.
Man unterscheidet zwischen
PDF/A-2a: vollständige Übereinstimmung mit dem Standard PDF/A;
PDF/A-2b: Mindestanforderungen von PDF/A erfüllt (Barrierefreiheit gemäss Abschnitt 508 des US Rehabilitation Act nicht erfüllt);
PDF/A-2u: wie PDF/A-2b, nur dass der gesamte Text in Unicode abgebildet wird, so dass er indexiert und dargestellt werden kann.


Bewertung



Offenheit: 4

PDF/A-2 beruht auf der Version ISO-32000-1 der PDF-Spezifikation, die ihrerseits auf der von der Firma Adobe Systems entwickelten Version 1.7 beruht. PDF/A-2 ist als ISO-Standard 19005-2 publiziert und somit offengelegt.

Lizenzfreiheit: 4

Das Kriterium Lizenzfreiheit ist erfüllt; insbesondere weil u.a. nicht alle Kompressionsalgorithmen verwendet werden dürfen.

Verbreitung: 3

PDF/A-2 entspricht der PDF-Version ISO-32000-1 (mit gewissen Vorbehalten). Der Einsatz dieser Version ist nach wie vor zunehmend. PDF/A-2 selber ist noch wenig verbreitet und bekannt. Die Verbreitung wird jedoch zunehmen.

Funktionalitaet: 3

Textextraktion und natürliche Leseordnung bleiben bei PDF/A-2 erhalten. Im Gegensatz zur PDF-Version ISO-32000-1 sind Ton-/Videoproduktion und JavaScript-Objekte nicht erlaubt. Strukturierte Objekte (Texte, Vektorgraphiken, Rasterbilder) bleiben erhalten, sofern sie eingebettet werden.
Im Gegensatz zu PDF/A-1 sind Transparenz, JPEG2000-Komprimierung, Layer und PDF-Portfolio respektive eingebettete PDF/A-1 oder PDF/A-2 Dateien erlaubt.
WYSIWYG ist mit kleineren Einschränkungen gewährleistet. Für PDF/A-2a wird die visuelle Langzeitreproduktion (Lesbarkeit und Verständlichkeit) garantiert, bei PDF/A-2b fehlt das sogenannte Tagged PDF, welches der korrekten Darstellung auf unterschiedlichen Ausgabegeräten (PDA, Geräte gemäss Abschnitt 508 US Rehabilitation Act) dient. PDF/A-2u entspricht PDF/A-2b, nur dass der gesamte Text in Unicode abgebildet wird.

Implementierung: 3

Es existieren verschiedene Tools zur Erzeugung von PDF/A-Dokumenten (Adobe Acrobat Professional u.a.) Gelesen werden können die PDF/A-Dateien mit allen PDF-Readern (z.B. Adobe Reader). Jedoch existieren nur sehr wenige Reader, welche die Struktur eines PDF-Portfolios wiedergeben können. In der Praxis hat sich gezeigt, dass PDF/A-Dokumente von einem anderen als dem erzeugenden Tool aufgrund der Komplexität gelegentlich nicht als valid anerkannt werden.

Speicherdichte: 3

PDF/A-2 ist in der Regel kompakt. Im Gegensatz zu PDF/A-1 ist die JPEG2000 Komprimierung erlaubt, und entsprechend kann die Speicherdichte auch höher sein. Die Einbettung der Schriftarten verursacht jedoch gegenüber PDF einen zusätzlichen Speicherbedarf.

Verifizierbarkeit: 4

PDF/A-2-Dateien können mittels Bytesequenz erkannt werden. Es existiert eine Vielzahl von Validatoren.

Best Practice: 3

PDF/A-2 wird zwar noch wenig verwendet, aber von einigen Archiven als Archivformat akzeptiert.
PDF/A-2 eignet sich besonders gut für die dauerhafte Archivierung, kann aber nicht ohne Informationsverlust ausgedruckt werden.

Perspektive: 3

Der Standard PDF/A-2b kann sich höchstwahrscheinlich für die Langzeitarchivierung neben PDF/A-1b durchsetzen.
Neuentwicklungen finden in neuen Versionen statt, welche jedoch diese Version nicht ausser Kraft setzen.

Formatklasse: C

PDF/A-2 ist im Hinblick auf die Archivierung spezifiziert worden und widerspricht nicht den Anforderungen an die dauerhafte Archivierung.


Fazit

PDF/A-2 ist als Format für die Langzeitarchivierung geeignet.
Archive sollten darauf hinwirken, dass Dokumente in der Verwaltung im Standard PDF/A-1 oder PDF/A-2 gespeichert werden. Sollten Dokumente als PDF/A-2-Portfolio gespeichert werden, muss darauf geachtet werden, dass keine inhaltlich wichtige Struktur verwendet wird. Die Best Practice im Bereich PDF/A-1 zeigt deutlich, dass insbesondere der Konformitätslevel b gegenüber a bevorzugt wird. Unklar ist, ob der Konformitätslevel u gegenüber b bevorzugt wird.

Preservation Planning

Die in PDF/A erlaubte Komprimierungsart JBIG2 speichert gleichwertige Symbole nur einmal ab und verwendet diese mehrfach im ganzen Dokument. Dieses Verfahren nennt sich "Pattern matching and substitution" (PMS) und führt bei bestimmten Implementierungen und Einstellungen dazu, dass in Textdokumenten einzelne Zeichen durch andere ersetzt werden. Da der Fehler irreversibel ist und nicht festgestellt werden kann, ob das verlustbehaftete PMS-Verfahren eingesetzt wurde oder nicht, empfiehlt die KOST, beim Erstellen von PDF-Dateien vorerst auf die Kompressionsart JBIG2 zu verzichten. Für Details siehe http://kost-ceco.ch/cms/index.php?jbig2-compression_de.

Referenz

ISO 19005-2:2011
Document management — Electronic document file format for long-term preservation — Part 2: Use of ISO 32000-1 (PDF/A-2)
http://www.iso.org/iso/home/store/catalogue_tc/catalogue_detail.htm?csnumber=50655
[kostenpflichtig]

ISO 32000-1:2008
Document management — Portable document format — Part 1: PDF 1.7
http://www.iso.org/iso/catalogue_detail.htm?csnumber=51502
[kostenpflichtig]

Literatur

KOST
PDF/A-2 und PDF/A-3: Was ist neu?
KOST-Studie, 2013
http://kost-ceco.ch/cms/index.php?pdf-a-2_3_study_de
PDF Tools AG (ed)
Diverse Informationen zu PDF/A
http://www.pdf-tools.com/pdf/pdfa-langzeitarchivierung-iso-19005-pdf.aspx
Callas Software GmbH (ed)
PDF/A kompakt
http://www.callassoftware.com/callas/doku.php/de:pdfakompakt:start

Verbindungen

PDF, PDF/A-1, PDF/A-3

last update: martin.kaiser - Tue, 05 Jul 2016 [16:15:08]
Copyright © by Koordinationsstelle für die dauerhafte Archivierung elektronischer Unterlagen
Copyright © by Centre de coordination pour l'archivage à long terme de documents électroniques