Katalog archivischer Dateiformate Version 5.0, Juli 2016

TXT


Kategorie

Textformate

Abkürzung

TXT
.txt, .ans, .asc
text/plain
x-fmt/14; x-fmt/15; x-fmt/16; x-fmt/21; x-fmt/22; x-fmt/111; x-fmt/130; x-fmt/282; x-fmt/283

Titel

Nur-Text
Plain Text
Text only

Versionen

Keine; siehe aber die Informationen zur Zeichencodierung.

Beschreibung

Das Textformat kann als stabilstes Format der Informatik gelten; die ASCII-Codierung ist bereits seit Jahrzehnten bekannt und im Einsatz; neuere Codierungen wie die ISO-8859-Familie sowie die verschiedenen UNICODE-Codierungen sind dazu abwärtskompatibel.

Bewertung



Offenheit: 4

Die gebräuchlichen Zeichencodierungen sind ISO- oder IETF-Standards und als solche offengelegt.

Lizenzfreiheit: 4

Es existieren keinerlei Lizenzen auf Textformat oder Codierungen.

Verbreitung: 2

Das Format ist eines der verbreitetsten der Informatik, wird jedoch in den Verwaltungen kaum verwendet.

Funktionalitaet: 2

In Nur-Text-Dateien sind Layout und Formatierungen kaum (d.h. nur sehr rudimentär) darstellbar. Deshalb ist eine Migration von Dateien aus Textverarbeitungsprogrammen in Nur-Text mit einem praktisch absoluten Verlust der Formatierung verbunden, was je nach deren Stellenwert inakzeptabel sein kann. Zudem enthalten die meisten Dateien aus Textverarbeitungsprogrammen vermehrt nicht nur Text, sondern auch Bilder, Grafiken, Tabellen und ähnliches, was bei der Konvertierung nicht übernommen werden kann.

Implementierung: 4

Es existiert eine Fülle von Texteditoren.

Speicherdichte: 4

Die Speicherdichte ist hoch und kann bei Bedarf durch verlustfreie Kompression noch gesteigert werden.

Verifizierbarkeit: 2

Die Erkennung ist teilweise nur durch die Extension möglich. Bei der Erkennung kann die Zeichencodierung nicht festgestellt werden. Es existieren zudem keine Validatoren.

Best Practice: 4

Nur-Text wird verbreitet als Archivformat empfohlen und benutzt.

Perspektive: 1

Ein Entwicklungspotential besteht bei Nur-Text praktisch nicht mehr.

Formatklasse: A

Es handelt sich um eines der ältesten Formate der Informatik.


Fazit

Nur-Text erfüllt die meisten archivischen Anforderungen maximal (mit der wesentlichen Ausnahme der Layouterhaltung) und ist deshalb als Archivformat unbestritten. In den Verwaltungen werden Nur-Text-Dateien jedoch kaum verwendet. Ausnahmen sind XML-, HTML- und CSV-Dateien, bei denen es sich grundsätzlich auch um reine Textdateien handelt, die neben dem Text aber auch Struktur- und/oder Layoutinformationen beinhalten und jeweils einem bestimmten Anwendungszweck dienen (Webpages, Datenbankinhalte). Ferner exportieren gewisse ältere Informationssysteme ihre Daten am einfachsten in Nur-Text-Form.
Unterlagen, die dem Archiv im Nur-Text-Format angeboten werden, können bedenkenlos in diesem Format archiviert werden, sofern die Zeichencodierung bekannt ist. Die gängigen Zeichencodierungen sind durchwegs problemlos, müssen aber in den Metadaten dokumentiert werden. Wenn eine Wahlmöglichkeit besteht, sollte wegen der universellen Verständlichkeit und der Zukunftsfähigkeit UNICODE in der Codierung UTF-8 verwendet werden.

Referenz

Nur-Text ist kein formeller Standard. Es existieren jedoch formelle Standards für die Zeichencodierung.
Formell definiert ist der MIME-Type text/plain:
Multipurpose Internet Mail Extensions (MIME) Part Two: Media Types, 1996
http://www.rfc-editor.org/rfc/rfc2046.txt

Literatur


Verbindungen

CSV

last update: georg.buechler - Mon, 26 Nov 2012 [14:39:06]
Copyright © by Koordinationsstelle für die dauerhafte Archivierung elektronischer Unterlagen
Copyright © by Centre de coordination pour l'archivage à long terme de documents électroniques