Katalog archivischer Dateiformate (KaD, v2)

Textdaten


Unter Textdaten verstehen wir Daten zur Repräsentation von wenig strukturiertem Text, wie sie von Textverarbeitungssoftware oder Texteditoren erzeugt werden. Zur Archivierung von Textdaten wird herkömmlicherweise vorgeschlagen, die nativen Formate dieser Software in besser geeignete Archivformate zu konvertieren, z.B. PDF und neuerdings PDF/A. Mit dem Wechsel zu offenen, XML-basierten Dateiformaten in Textverarbeitungssoftware stellt sich die Frage, ob diese sich auch als Archivformate eignen würden.

Zu beachten ist der grundsätzliche Unterschied zwischen seitenbasierten und nicht-seitenbasierten Formaten. Seitenbasierte Formate wie PDF und PDF/A sind für den Ausdruck optimiert, weswegen Seitenumbruch und Layout fixiert sind. Bei nicht-seitenbasierten Formaten wie allen Textverarbeitungsformaten steht der Text selber im Mittelpunkt; der Seitenumbruch wird erst beim Ausdruck (bzw. bei der Konvertierung in ein seitenbasiertes Format) fixiert.

Abgeraten wird von der Umwandlung von Text- zu Bilddateien, z.B. TIFF. Dagegen spricht neben der Speicherplatzökonomie vor allem der Verlust der Möglichkeit des Textexports.

Untersuchte Formate

(in der Reihenfolge ihrer Archivtauglichkeit)


Empfehlung

Textdaten sollen möglichst bereits im Amt in das PDF/A-Format umgewandelt und so archiviert werden.