Katalog archivischer Dateiformate (
KaD, v2)
TXT
Kategorie
Textformate
Abkürzung
TXT
.txt
text/plain
x-fmt/14; x-fmt/15; x-fmt/16; x-fmt/21; x-fmt/22; x-fmt/111; x-fmt/130; x-fmt/282; x-fmt/283
Titel
Nur-Text
Plain Text
Text only
Versionen
Keine; siehe aber die Informationen zur
Zeichencodierung.
Beschreibung
Das Textformat kann als stabilstes Format der Informatik gelten; die ASCII-Codierung ist bereits seit Jahrzehnten bekannt und im Einsatz; neuere Codierungen wie die ISO-8859-Familie sowie die verschiedenen UNICODE-Codierungen sind dazu abwärtskompatibel.
Bewertung
Die gebräuchlichen
Zeichencodierungen sind ISO- oder IETF-Standards und als solche offengelegt.
Es existieren keinerlei Lizenzen auf Textformat oder Codierungen.
Das Format ist eines der verbreitetsten der Informatik, wird jedoch in den Verwaltungen kaum verwendet.
In Nur-Text-Dateien sind Layout und Formatierungen kaum (d.h. nur sehr rudimentär) darstellbar. Deshalb ist eine Migration von Dateien aus Textverarbeitungsprogrammen in Nur-Text mit einem praktisch absoluten Verlust der Formatierung verbunden, was je nach deren Stellenwert inakzeptabel sein kann.
Es existiert eine Fülle von Texteditoren.
Die Speicherdichte ist hoch und kann bei Bedarf durch verlustfreie Kompression noch gesteigert werden.
Nur-Text wird verbreitet als Archivformat empfohlen und benutzt.
Ein Entwicklungspotential besteht bei Nur-Text praktisch nicht mehr.
Es handelt sich um eines der ältesten Formate der Informatik.
Fazit
Nur-Text erfüllt die meisten archivischen Anforderungen maximal (mit der wesentlichen Ausnahme der Layouterhaltung) und ist deshalb als Archivformat unbestritten. In den Verwaltungen werden Nur-Text-Dateien jedoch kaum verwendet. Ausnahmen sind XML-, HTML- und CSV-Dateien, bei denen es sich grundsätzlich auch um reine Textdateien handelt, die neben dem Text aber auch Struktur- und/oder Layoutinformationen beinhalten und jeweils einem bestimmten Anwendungszweck dienen (Webpages, Datenbankinhalte). Ferner exportieren gewisse ältere Informationssysteme ihre Daten am einfachsten in Nur-Text-Form.
Unterlagen, die dem Archiv im Nur-Text-Format angeboten werden, können bedenkenlos in diesem Format archiviert werden, sofern die Zeichencodierung bekannt ist. Die gängigen Zeichencodierungen sind durchwegs problemlos, müssen aber in den Metadaten dokumentiert werden. Wenn eine Wahlmöglichkeit besteht, sollte wegen der universellen Verständlichkeit und der Zukunftsfähigkeit UNICODE in der Codierung UTF-8 verwendet werden.
Referenz
Nur-Text ist kein formeller Standard. Es existieren jedoch formelle Standards für die
Zeichencodierung.
Formell definiert ist der MIME-Type text/plain:
Multipurpose Internet Mail Extensions (MIME) Part Two: Media Types, 1996
http://www.rfc-editor.org/rfc/rfc2046.txt
Literatur
Verbindungen
CSV