Katalog archivischer Dateiformate Version 5.0, Juli 2016

Die Formate im allgemeinen informatischen Kontext und in einer historischen Betrachtung


Von einer breiten Definition...

Ein Datenformat ist in der Informatik eine Vereinbarung, wie Daten durch binäre Zahlen repräsentiert werden. Unter Daten verstehen wir Informationen, die einen Text, eine Seite, ein Bild, einen Ton, eine ausführbare Datei etc. darstellen können. Die Art und Weise, wie Daten in einer Datei gespeichert sind, nennt man Dateiformat.

Eine solche Vereinbarung ermöglicht es, Daten zwischen verschiedenen Programmen auszutauschen, sowohl über eine direkte Verbindung als auch mittels einer Datei. Die verschiedenen Codierungsformate haben dabei die Aufgabe, die Information so zu präsentieren, dass sie lesbar gemacht werden kann als Text, Bild, Audio, Video oder Mischform.

... zu einer Kette ineinander greifender Elemente

Ein Format ist ein Element, das ein zweites voraussetzt (die Software), welches wiederum ein drittes (die Version) und ein viertes (das Betriebssystem) voraussetzt, um bei einem fünften (der Hardware) anzukommen. Diese Elemente bilden eine Kette, im Sinn sowohl einer Abfolge gleichwertiger Elemente als auch der Möglichkeit einer Fessel, falls eines der Elemente fehlt oder nicht mehr funktioniert. Anders ausgedrückt: Das Format kann die ganze Kette der Elemente bestimmen, die für seine Benutzung notwendig sind. Das Spektrum der Formattypen reicht von geschlossen bis vollständig offengelegt; gewisse sind durch Normen definiert, die meisten sind in der einen oder anderen Form standardisiert.

Die Banalisierung des digitalen Dokuments seit dem Auftauchen der Informatik bereitet diverse Probleme technischer, kultureller, ökonomischer oder juristischer Art. In wenigen Jahren sind wir von einer Logik der Speicherung zu einer Logik des Informationsflusses und vom Document Management zum Content Management übergegangen. In diesem Kontext ist das Thema der Formate fundamental, da es Auswirkungen hat auf die Kommunikation und den Bestand der Daten. Wegen seiner technischen Komplexität und seiner Existenz in einer Welt ohne Grenzen hat das digitale Dokument zur Erarbeitung unzähliger internationaler Normen und Standards geführt.
Zwei Daten umreissen den Kontext:

1962: Philippe Dreyfus erfindet in Frankreich das Wort informatique als Name für die Wissenschaft, die sich mit der Informationsverwaltung und den Computern befasst.

1964: Entstehung von ASCII (American Standard Code for Information Interchange), von der ISO 1966 normalisiert, um den Datenaustausch zwischen Computern zu erleichtern. (Gleichwohl behält IBM seine eigene Norm bei, den EBCDIC, Extended Binary Coded Decimal Interchange Code.)

Die ersten Formate sind Seitenbeschreibungsformate, die sich auf die physische Beschreibung des Dokuments beschränken, ohne sich für den Inhalt oder die logische Struktur zu interessieren.


Geschichte der archivischen Dateiformate: Ein Überblick


Interoperabilität

Unter dem Begriff "Interoperabilität" wird üblicherweise die Fähigkeit verschiedener informatischer Produkte und Dienste verstanden, Daten und Informationen auszutauschen und zu benutzen (d.h. zu kommunizieren), um zusammen in einer vernetzten Umgebung funktionieren zu können. Die Geschichte der Informatik wurde von Beginn an geprägt durch eine fortwährende Suche nach Interoperabilität, konkret nach der Möglichkeit, Software verschiedener Hersteller zusammenarbeiten zu lassen.

Die Interoperabilität ist damit seit jeher so etwas wie der Heilige Gral der Informatik. Sie kann durch verschiedene Hilfsmittel erreicht werden, zum Beispiel durch die Publikation von Formaten, APIs oder Protokollen. Dateiformate stellen die Interoperabilität auf dem Niveau des Dateiaustauschs sicher (z.B. die XML-Schemata, die Microsoft seit 2003 für die hauptsächlichen Anwendungen seiner Office-Suite publiziert, oder die ODF-Formate, die von OpenOffice.org publiziert wurden und später standardisiert wurden). APIs gewährleisten die Interoperabilität auf dem Niveau der Programmierung zwischen einer Anwendung und der darunter liegenden Plattform. Protokolle definieren die Kommunikation verschiedener Anwendungen in einem Netzwerk. Heute ist die Harmonisierung der Informatikindustrie zweifellos weiter fortgeschritten als in der Vergangenheit.

Literatur

Cornell University Library, Research Department
Moving Theory into Practice. Digital Imaging Tutorial
2003
http://www.library.cornell.edu/preservation/tutorial/contents.html

CHAUMIER, Jacques
Document et numérisation. Enjeux techniques, économiques, culturels et sociaux
Paris, Association des professionnels de l'information et de la documentation, 2006

last update: georg.buechler - Tue, 03 Nov 2009 [08:52:35]
Copyright © by Koordinationsstelle für die dauerhafte Archivierung elektronischer Unterlagen
Copyright © by Centre de coordination pour l'archivage à long terme de documents électroniques