Katalog archivischer Dateiformate (
KaD, v2)
Textdaten
Unter Textdaten verstehen wir Daten zur Repräsentation von wenig strukturiertem Text, wie sie von Textverarbeitungssoftware oder Texteditoren erzeugt werden. Zur Archivierung von Textdaten wird herkömmlicherweise vorgeschlagen, die nativen Formate dieser Software in besser geeignete Archivformate zu konvertieren, z.B.
PDF und neuerdings
PDF/A. Mit dem Wechsel zu offenen, XML-basierten Dateiformaten in Textverarbeitungssoftware stellt sich die Frage, ob diese sich auch als Archivformate eignen würden.
Zu beachten ist der grundsätzliche Unterschied zwischen seitenbasierten und nicht-seitenbasierten Formaten. Seitenbasierte Formate wie
PDF und
PDF/A sind für den Ausdruck optimiert, weswegen Seitenumbruch und Layout fixiert sind. Bei nicht-seitenbasierten Formaten wie allen Textverarbeitungsformaten steht der Text selber im Mittelpunkt; der Seitenumbruch wird erst beim Ausdruck (bzw. bei der Konvertierung in ein seitenbasiertes Format) fixiert.
Abgeraten wird von der Umwandlung von Text- zu Bilddateien, z.B.
TIFF. Dagegen spricht neben der Speicherplatzökonomie vor allem der Verlust der Möglichkeit des Textexports.
Untersuchte Formate
(in der Reihenfolge ihrer Archivtauglichkeit)
Empfehlung
Textdaten sollen möglichst bereits im Amt in das
PDF/A-Format umgewandelt und so archiviert werden.