Katalog archivischer Dateiformate Version 5.0, Juli 2016

PDF/A-3



Preservation Planning


Kategorie

Textformate

Abkürzung

PDF/A, PDF/A-3, PDF/A-3a, PDF/A-3b, PDF/A-3u
.pdf
application/pdf
fmt/479, fmt/480, fmt/481

Titel

Portable Document Format (Archival)

Version

PDF/A-3 (entspricht ISO-32000-1 respektive PDF-Version 1.7) mit PDF/A-3a, PDF/A-3b und PDF/A-3u (2012)
Zusätzlich sind PDF/A-1 und PDF/A-2 publiziert. Da keine PDF/A-Version eine andere ablöst, sind alle Versionen gleichermassen gültig.

Beschreibung

PDF/A-3 ist ein Portable Document Format, das für die Archivierung geschaffen wurde. Das Format wurde im Standard "ISO-19005-3 - Document management – Electronic document file format for long-term preservation" genormt. Dieser Standard entspricht der PDF-Version ISO 32000-1. Im Standard wird nur aufgelistet, welche Funktionen der einzelnen PDF-Versionen obligatorisch, empfohlen, eingeschränkt oder verboten sind.
Man unterscheidet zwischen
PDF/A-3a: vollständige Übereinstimmung mit dem Standard PDF/A;
PDF/A-3b: Mindestanforderungen von PDF/A erfüllt (Barrierefreiheit gemäss Abschnitt 508 des US Rehabilitation Act nicht erfüllt);
PDF/A-3u: wie PDF/A-3b, nur dass der gesamte Text in Unicode abgebildet wird, so dass er indexiert und dargestellt werden kann.

Bewertung



Offenheit: 4

PDF/A-3 beruht auf der Version ISO-32000-1 der PDF-Spezifikation, die ihrerseits auf der von der Firma Adobe Systems entwickelten Version 1.7 beruht. PDF/A-3 ist als ISO-Standard 19005-3 publiziert und somit offengelegt.

Lizenzfreiheit: 2

Das Kriterium Lizenzfreiheit ist nur für die PDF/A-3-Datei erfüllt; insbesondere weil u.a. nicht alle Kompressionsalgorithmen verwendet werden dürfen. Die eingebetteten Dateien können jedoch Lizenzen enthalten.

Verbreitung: 1

PDF/A-3 entspricht der PDF-Version ISO-32000-1 (mit gewissen Vorbehalten). Der Einsatz dieser Version ist nach wie vor zunehmend. PDF/A-3 selber ist noch wenig verbreitet und bekannt.

Funktionalitaet: 3

Die Funktionalität ist mit einer Ausnahme identisch mit jener von PDF/A-2.
Im Gegensatz zu PDF/A-2 sind alle eingebetteten Dateien erlaubt.

Implementierung: 3

Es existieren verschiedene Tools zur Erzeugung von PDF/A-Dokumenten (Adobe Acrobat Professional u.a.) Gelesen werden können die PDF/A-Dateien mit allen PDF-Readern (z.B. Adobe Reader). Jedoch existieren nur sehr wenige Reader, welche die Struktur eines PDF-Portfolios wiedergeben können. In der Praxis hat sich gezeigt, dass PDF/A-Dokumente von einem anderen als dem erzeugenden Tool aufgrund der Komplexität gelegentlich nicht als valid anerkannt werden.

Speicherdichte: 2

PDF/A-3 ist in der Regel kompakt. Im Gegensatz zu PDF/A-2 verursachen die eingebetteten Dateien jeglicher Art jedoch einen höheren Speicherbedarf.

Verifizierbarkeit: 2

PDF/A-3-Dateien können mittels Bytesequenz erkannt werden. Es existiert eine Vielzahl von Validatoren. Die eingebetteten Dateien können jedoch nicht erkannt und validiert werden.

Best Practice: 1

PDF/A-3 wird noch sehr wenig verwendet und von vielen Archiven als Archivformat nicht akzeptiert.
PDF/A-3 eignet sich nicht für die dauerhafte Archivierung respektive öffentliche Archive. Es kann aber für andere Archive wie z.B. Firmenarchive mit beschränkter Archivierungsdauer interessant sein.

Perspektive: 1

Der Standard PDF/A-3 wird sich höchstwahrscheinlich für die Langzeitarchivierung nicht durchsetzen.
Neuentwicklungen finden in neuen Versionen statt, welche jedoch diese Version nicht ausser Kraft setzen.

Formatklasse: D

PDF/A-3 ist im Hinblick auf die Archivierung spezifiziert worden, widerspricht aber den Anforderungen an die dauerhafte Archivierung.


Fazit

PDF/A-3 ist als Format für die Langzeitarchivierung nicht geeignet.
Archive sollten darauf hin wirken, dass Dokumente in der Verwaltung im Standard PDF/A-1 oder PDF/A-2 gespeichert werden. Sollten Dokumente als PDF/A-2-Portfolio gespeichert werden, muss darauf geachtet werden, dass keine inhaltlich wichtige Struktur verwendet wird. Die Best Practice im Bereich PDF/A-1 zeigt deutlich, dass insbesondere der Konformitätslevel b gegenüber a bevorzugt wird. Unklar ist ob der Konformitätslevel u gegenüber b bevorzugt wird.

Preservation Planning

Die in PDF/A erlaubte Komprimierungsart JBIG2 speichert gleichwertige Symbole nur einmal ab und verwendet diese mehrfach im ganzen Dokument. Dieses Verfahren nennt sich "Pattern matching and substitution" (PMS) und führt bei bestimmten Implementierungen und Einstellungen dazu, dass in Textdokumenten einzelne Zeichen durch andere ersetzt werden. Da der Fehler irreversibel ist und nicht festgestellt werden kann, ob das verlustbehaftete PMS-Verfahren eingesetzt wurde oder nicht, empfiehlt die KOST, beim Erstellen von PDF-Dateien vorerst auf die Kompressionsart JBIG2 zu verzichten. Für Details siehe https://kost-ceco.ch/cms/index.php?jbig2-compression_de.

Referenzen

ISO 19005-3:2012
Document management — Electronic document file format for long-term preservation — Part 3: Use of ISO 32000-1 with support for embedded files (PDF/A-3)
http://www.iso.org/iso/home/store/catalogue_tc/catalogue_detail.htm?csnumber=57229
[kostenpflichtig]

ISO 32000-1:2008
Document management — Portable document format — Part 1: PDF 1.7
http://www.iso.org/iso/catalogue_detail.htm?csnumber=51502
[kostenpflichtig]

Literatur

KOST
PDF/A-2 und PDF/A-3: Was ist neu?
KOST-Studie, 2013
https://kost-ceco.ch/cms/index.php?pdf-a-2_3_study_de
PDF Tools AG (ed)
Diverse Informationen zu PDF/A
http://www.pdf-tools.com/pdf/pdfa-langzeitarchivierung-iso-19005-pdf.aspx
Callas Software GmbH (ed)
PDF/A kompakt
http://www.callassoftware.com/callas/doku.php/de:pdfakompakt:start

Verbindungen

PDF, PDF/A-1, PDF/A-2

last update: martin.kaiser - Tue, 05 Jul 2016 [16:16:07]
Copyright © by Koordinationsstelle für die dauerhafte Archivierung elektronischer Unterlagen
Copyright © by Centre de coordination pour l'archivage à long terme de documents électroniques