Katalog archivischer Dateiformate (
KaD, v2)
Tabellenkalkulation
Tabellenkalkulationssoftware stellt numerische und alphanumerische Daten dar und erlaubt insbesondere deren Verarbeitung mittels Funktionen. Tabellenkalkulationsanwendungen existieren für verschiedene Plattformen, sowohl von kommerziellen Herstellern als auch aus Open-Source-Projekten. Sie arbeiten sämtlich mit je eigenen Formaten.
Zum aktuellen Zeitpunkt hat sich kein aus archivischer Sicht ideales Dateiformat für Tabellenkalkulationsdaten durchsetzen können. Die Überlegungen zu einem geeigneten Archivformat müssen davon ausgehen, dass bei der Archivierung von Spreadsheets (Tabellenkalkulations-Dokumenten) drei verschiedene Aspekte interessieren können:
- Die Funktionalität (der Aspekt der Kalkulation). Dieser kann nur erhalten werden, wenn Tabellenkalkulations-Originalformate archiviert werden, also XLS oder OOXML.
- Die Tabellennatur. Dieser kann Rechnung getragen werden, wenn das Spreadsheet wie eine Datenbank behandelt wird. Dazu wird auf die Datenbank-Archivierungsformate verwiesen. Insbesondere entspricht die Möglichkeit des Exports in XML dem Format SQLX.
- Die optische Erscheinung. Diese kann mit einer Konversion zu PDF/A erhalten werden.
Die Wahl eines Archivformats hängt also davon ab, welcher Aspekt von Spreadsheets als essentiell angesehen wird. Eine allgemeine Empfehlung abzugeben, fällt schwer.
Eine provisorische Lösung ist denkbar, die zwei allgemeine Grundsätze zur Formatwahl beherzigt, nämlich unnötige Migrationen zu vermeiden und sich möglichst viele Optionen offenzuhalten. Kommerzielle Anwendungen im Bereich Tabellenkalkulation sind in der Regel über einige Versionen abwärtskompatibel. Wenn eine Datei also in einem aktuellen Format vorliegt, kann mit guten Gründen davon ausgegangen werden, dass sie während der nächsten zehn Jahre von der jeweils aktuellen Programmversion noch problemlos gelesen werden kann; daher ist eine Migration unnötig. Liegt eine Datei in einer alten Formatversion vor, sollte eine Migration mit der entsprechenden Software in das jeweils aktuelle Format durchgeführt werden. (Gemäss Untersuchungen des Digital Preservation Testbed [p. 20] ist es dabei empfehlenswert, jeweils eine oder zwei Versionen zu überspringen.) Für Dateien in proprietären Formaten obsoleter Anwendungen ist die Migration in das Format einer aktuellen Anwendung unabdingbar.
Diese Ueberlegungen gelten insbesondere für das marktführende Format
XLS von Microsoft Excel. Obwohl dieses wesentliche archivische Anforderungen nicht erfüllt, ist es für ein Archiv sinnvoller, MS-Excel-Dateien in diesem proprietären Format zu belassen, als sie in ein idealeres, aber weder erprobtes noch verbreitetes Format zu migrieren. Die durch Abwärtskompatibilität erreichte Lesbarkeit von gegen 10 Jahren verschafft den Archiven einen Aufschub bei der Suche nach einem idealeren zukünftigen Archivformat.
Literatur
AHDS Preservation Handbook: Spreadsheets
Version 0.5, 2005
http://ahds.ac.uk/preservation/spreadsheets-preservation-handbook.pdf
Digital Preservation Testbed: From digital volatility to digital permanence. Preserving spreadsheets
2003
http://www.digitaleduurzaamheid.nl/bibliotheek/docs/volatility-permanence-spreadsh-en.pdf
Untersuchte Formate
(in der Reihenfolge ihrer Archivtauglichkeit)
Empfehlungen
- Wenn bei der Archivierung von Tabellenkalkulationsdaten die Bewahrung der Funktionalität als essentiell betrachtet wird, muss im Originalformat archiviert werden, also in der Regel in XLS oder OOXML. Dies kann auch allgemein als provisorische Lösung betrachtet werden, bis ein zukünftiges, besser geeignetes Archivformat vorliegt.
- Wenn der Tabellenaspekt als essentiell betrachtet wird, sind die Datenbank-Archivformate empfehlenswert.
- Wenn nur die optische Erscheinung, nicht aber die Funktionalität, als essentielle Eigenschaft gilt, können Spreadsheets in PDF/A konvertiert werden.