Katalog archivischer Dateiformate Version 5.0, Juli 2016

PDF/A-1



Preservation Planning


Kategorie

Textformate

Abkürzungen

PDF/A
.pdf
application/pdf
fmt/95; fmt/354

Titel

Portable Document Format (Archival)

Version

PDF/A-1 (entspricht PDF-Version 1.4) mit PDF/A 1a und PDF/A 1b (2005)
Zusätzlich sind PDF/A-2 und PDF/A-3 publiziert. Da keine PDF/A-Version eine andere ablöst, sind alle Versionen gleichermassen gültig.

Beschreibung

PDF/A-1 ist ein Portable Document Format, das für die Archivierung geschaffen wurde. Das Format wurde im Standard "ISO-19005-1 - Document management – Electronic document file format for long-term preservation" genormt. Dieser Standard entspricht der PDF-Version 1.4. Im Standard wird nur aufgelistet, welche Funktionen der einzelnen PDF-Versionen obligatorisch, empfohlen, eingeschränkt oder verboten sind.
Man unterscheidet zwischen
PDF/A 1a: vollständige Übereinstimmung mit dem Standard PDF/A
PDF/A 1b: Mindestanforderungen von PDF/A erfüllt (Barrierefreiheit gemäss Abschnitt 508 des US Rehabilitation Act nicht erfüllt)

Bewertung



Offenheit: 4

PDF/A-1 beruht auf der Version 1.4 der PDF-Spezifikation, die von der Firma Adobe Systems entwickelt und zur Verfügung gestellt wird. PDF/A-1 ist als ISO-Standard 19005-1 publiziert und somit offengelegt.

Lizenzfreiheit: 3

Das Kriterium Lizenzfreiheit ist erfüllt; insbesondere, weil u.a. nicht alle Kompressionsalgorithmen verwendet werden dürfen.

Verbreitung: 4

PDF/A-1 entspricht der PDF-Version 1.4 (mit gewissen Vorbehalten). Der Einsatz dieser Version ist logischerweise abnehmend. PDF/A-1 selber ist jedoch verbreitet und bekannt. Die Verbreitung wird nach wie vor zunehmen, insbesondere dadurch, dass die Version 1 gültig bleibt und nicht migriert werden muss. In Office 2010 von Microsoft z.B. lassen sich Dokumente direkt im PDF/A-1-Format speichern.

Funktionalitaet: 3

Textextraktion und natürliche Leseordnung bleiben bei PDF/A-1 erhalten. Im Gegensatz zu PDF 1.4 sind Transparenz, Ton-/Videoproduktion und JavaScript-Objekte nicht erlaubt.
Strukturierte Objekte (Texte, Vektorgraphiken, Rasterbilder) bleiben erhalten, sofern sie eingebettet werden.
WYSIWYG ist mit kleineren Einschränkungen gewährleistet. Für PDF/A-1a wird die visuelle Langzeitreproduktion (Lesbarkeit und Verständlichkeit) garantiert, bei PDF/A-1b fehlt das sogenannte Tagged PDF, welches der korrekten Darstellung auf unterschiedlichen Ausgabegeräten (PDA, Geräte gemäss Abschnitt 508 US Rehabilitation Act) dient.

Implementierung: 4

Es existieren verschiedene Tools zur Erzeugung von PDF/A-Dokumenten (Adobe Acrobat Professional u.a.) Gelesen werden können die PDF/A-Dateien mit allen PDF-Readern (z.B. Adobe Reader). In der Praxis hat sich allerdings gezeigt, dass PDF/A-Dokumente von einem anderen als dem erzeugenden Tool aufgrund der Komplexität gelegentlich nicht als valid anerkannt werden.

Speicherdichte: 2

PDF/A-1 ist in der Regel relativ kompakt. Die Einbettung der Schriftarten verursacht jedoch gegenüber PDF einen zusätzlichen Speicherbedarf.

Verifizierbarkeit: 4

PDF/A-1-Dateien können mittels Bytesequenz erkannt werden. Es existiert eine Vielzahl von Validatoren.

Best Practice: 4

PDF/A-1b wird von vielen Archiven als Archivformat gefordert und auch bereits archiviert. PDF/A-1 eignet sich besonders gut für die dauerhafte Archivierung und kann zusätzlich ohne Informationsverlust ausgedruckt werden.

Perspektive: 4

Der Standard PDF/A-1b hat sich für die Langzeitarchivierung durchgesetzt. Neuentwicklungen finden in neuen Versionen statt, welche jedoch diese Version nicht ausser Kraft setzen.

Formatklasse: B

PDF/A ist im Hinblick auf die Archivierung spezifiziert worden und widerspricht nicht den Anforderungen an die dauerhafte Archivierung.


Fazit

PDF/A-1 ist als Format für die Langzeitarchivierung sehr geeignet.
Archive sollten darauf hin wirken, dass Dokumente in der Verwaltung im Standard PDF/A-1 gespeichert werden. Die Best Practice zeigt deutlich, dass inbesondere PDF/A-1b die bevorzugte Formatversion ist.

Preservation Planning

Die in PDF/A erlaubte Komprimierungsart JBIG2 speichert gleichwertige Symbole nur einmal ab und verwendet diese mehrfach im ganzen Dokument. Dieses Verfahren nennt sich "Pattern matching and substitution" (PMS) und führt bei bestimmten Implementierungen und Einstellungen dazu, dass in Textdokumenten einzelne Zeichen durch andere ersetzt werden. Da der Fehler irreversibel ist und nicht festgestellt werden kann, ob das verlustbehaftete PMS-Verfahren eingesetzt wurde oder nicht, empfiehlt die KOST, beim Erstellen von PDF-Dateien vorerst auf die Kompressionsart JBIG2 zu verzichten. Für Details siehe https://kost-ceco.ch/cms/index.php?jbig2-compression_de.

Referenzen

ISO 19005-1:2005
Document management — Electronic document file format for long-term preservation — Part 1: Use of PDF 1.4 (PDF/A-1)
http://www.iso.org/iso/iso_catalogue/catalogue_tc/catalogue_detail.htm?csnumber=38920
[kostenpflichtig]
PDF_Reference_1.4
PDF Reference (third edition) Adobe Portable Document Format Version 1.4
http://www.adobe.com/devnet/pdf/pdf_reference_archive.html
[kostenfrei]

Literatur

PDF Tools AG (ed)
Diverse Informationen zu PDF/A
http://www.pdf-tools.com/pdf/pdfa-langzeitarchivierung-iso-19005-pdf.aspx
Callas Software GmbH (ed)
PDF/A kompakt.
http://www.callassoftware.com/callas/doku.php/de:pdfakompakt:start

Verbindungen

PDF, PDF/A-2, PDF/A-3

last update: martin.kaiser - Tue, 05 Jul 2016 [16:03:34]
Copyright © by Koordinationsstelle für die dauerhafte Archivierung elektronischer Unterlagen
Copyright © by Centre de coordination pour l'archivage à long terme de documents électroniques