Katalog archivischer Dateiformate Version 5.0, Juli 2016

Text


Unter "Text" verstehen wir Daten zur Repräsentation von wenig strukturiertem Text, wie sie u.a. von Textverarbeitungssoftware oder Texteditoren erzeugt werden. Zur Archivierung von Textdaten wird herkömmlicherweise vorgeschlagen, die nativen Formate dieser Software in besser geeignete Archivformate zu konvertieren, z.B. PDF/A-1 oder PDF/A-2. Mit dem Wechsel zu offenen, XML-basierten Dateiformaten in Textverarbeitungssoftware stellt sich die Frage, ob diese sich auch als Archivformate eignen würden.

Zu beachten ist der grundsätzliche Unterschied zwischen seitenbasierten und nicht-seitenbasierten Formaten. Seitenbasierte Formate wie PDF und PDF/A sind für den Ausdruck optimiert, weswegen Seitenumbruch und Layout fixiert sind. Bei nicht-seitenbasierten Formaten wie allen Textverarbeitungsformaten steht der Text selber im Mittelpunkt; der Seitenumbruch wird erst beim Ausdruck (bzw. bei der Konvertierung in ein seitenbasiertes Format) fixiert. Ebenfalls zu den Textdaten zählen wir zwei Subtypen, die Präsentationsdaten (z.B. PowerPoint) und die Hyperlinkdaten (z.B. HTML). In der vorliegenden Version des KaD werden diese jedoch nicht speziell besprochen.

Abgeraten wird von der Umwandlung von Text- zu Bilddateien, z.B. TIFF. Dagegen spricht neben der Speicherplatzökonomie vor allem der Verlust der Möglichkeit des Textexports.

Untersuchte Formate


Empfehlung

Textdaten sollen möglichst bereits im Amt in ein PDF-Format ( PDF/A-1, PDF/A-2 oder PDF ) umgewandelt und so archiviert werden.
Eine Konvertierung von PDF-Dateien in ein PDF/A-Format ist zu einem späteren Zeitpunkt meist problemlos möglich.
last update: martin.kaiser - Tue, 31 May 2016 [14:27:03]
Copyright © by Koordinationsstelle für die dauerhafte Archivierung elektronischer Unterlagen
Copyright © by Centre de coordination pour l'archivage à long terme de documents électroniques