Katalog archivischer Dateiformate Version 5.0, Juli 2016

Datenkompression


Digitale Dateien (vor allem Bild-, Audio- und Videodateien, aber grundsätzlich alle Dateien) werden wegen ihrer Grösse häufig komprimiert, damit Speicherplatz und Kommunikationskapazitäten gespart werden können. Wir unterscheiden dabei zwischen verlustfreien und verlustbehafteten Kompressionsalgorithmen. Verlustfreie Kompression basiert auf der Reduktion von Redundanzen in den vorliegenden Daten. Bei der Dekompression werden diese wiederhergestellt und so der originale Zustand wieder erreicht. Verlustbehaftete Kompression basiert (ausschliesslich oder zusätzlich) auf der Reduktion von Irrelevanzen, d.h. von Informationen, die für den Benutzer entbehrlich sind, z.B. weil er sie ohnehin nicht wahrnehmen kann. Diese Informationen sind nach der Kompression jedoch verloren; das Original kann nicht mehr wiederhergestellt werden. Bei verlustbehafteter Kompression ergeben sich mehr oder weniger starke Kompressionsartefakte, d.h. charakteristische, wahrnehmbare Veränderungen im Resultat.

Für die digitale Archivierung gilt allgemein als Grundsatz, dass verlustbehaftete Kompressionsalgorithmen in der Regel zu vermeiden sind. Da der zukünftige Gebrauch der archivierten Unterlagen kaum abgeschätzt werden kann, sollen mit der Archivierung sämtlicher originaler Informationen möglichst alle Varianten offen gelassen werden. Insbesondere die temporale Kompression bei Video führt zu Problemen bei der eventuellen späteren Bearbeitung.

Gegen diesen Grundsatz sind in letzter Zeit drei gewichtige Einwände gemacht worden:
  1. Bei Digitalisierungen (von Bildern, Codices, Urkunden etc.) ist der Begriff "Verlust" genauer zu klären. Ein erster, unwiederbringlicher Datenverlust findet nämlich beim Digitalisierungsvorgang statt. Es kann gezeigt werden, dass Verfälschungen durch Komprimierung kleiner sein können als die durch den Digitalisierungsprozess erzeugte Varianz.
  2. Für Archivalien, die dem Format nach Bilder, der Funktion nach aber Texte sind, wie z.B. Retrodigitalisate von Amtsdruckschriften oder Karteikarten, ist die detaillierte fotografische Rekonstruktion keine signifikante Eigenschaft.
  3. In den letzten Jahren sind die Speicherplatzkosten für die digitale Archivierung präziser als zuvor bestimmt worden. Dabei hat sich gezeigt, dass der Speicherplatzbedarf unkomprimierter Archivalien, speziell im Bild-, Audio- und Videobereich, zu nicht mehr verantwortbaren Kosten führen kann.

Aus diesen und anderen Gründen sind Fälle denkbar, in denen Daten in komprimierten Formaten durchaus ins Archiv übernommen werden sollen. Auf jeden Fall zu vermeiden sind jedoch Kompressionen mit nicht offengelegten Kompressionsalgorithmen sowie die erneute Kompression bereits komprimierter Daten.

Literatur

Wikipedia: Datenkompression
http://de.wikipedia.org/wiki/Datenkompression

Dale, Robin
Lossy or Lossless? File Compression Strategies Discussion at ALA
in: RLG DigiNews 3,1; Februar 1999
http://worldcat.org/arcviewer/1/OCC/2007/08/08/0000070513/viewer/file1380.html#technical1

International Association of Sound and Audiovisual Archives IASA
"Die Bewahrung von Schallaufnahmen. Ethische Aspekte, Prinzipien, Strategien (IASA-TC 03)"
Version 2005, ab Kapitel 10
http://www.iasa-web.org/downloads/publications/TC03_German.pdf

KOST/Memoriav
Kolloquium Datenkomprimierung bei Bild, Audio, Video.
11.11.2009.
https://kost-ceco.ch/cms/index.php?compression_de
last update: georg.buechler - Wed, 21 Nov 2012 [09:31:49]
Copyright © by Koordinationsstelle für die dauerhafte Archivierung elektronischer Unterlagen
Copyright © by Centre de coordination pour l'archivage à long terme de documents électroniques