Benutzer-Werkzeuge

Webseiten-Werkzeuge


ueberstrukturierte_daten

Bewertung und Erschliessung von überstrukturierten Dateiablagen

Elektronische Ablieferung der Abteilung Landwirtschaft des Amts für Landwirtschaft und Umwelt am 25.05.2022. Fileshare-Laufwerk für die elektronische Datenablage mit Unterlagen aus dem Zeitraum 1999-2015.

Ausgangslage

Die Ablieferung des Fileshare-Laufwerks umfasste 30’829 Dateien in 5’048 Strukturordner (21.6 GB). Die Dateiablage wurde vor der Ablieferung ans Archiv nicht bewertet und bei der abliefernden Stelle war praktisch kein Wissen zu Dateiablage mehr vorhanden. Es handelte sich um eine unstrukturierte, ohne Organisationssystem, Richtlinien oder Regeln erstellte, ungenügend metadatierte, organisch gewachsene Dateiablage. Die Dateiablage beinhaltet zum Teil aber archivwürdige Unterlagen, deren Überlieferung auf Papier nicht gesichert ist.

Strukturierung der Dateiablage

Die Dateiablage war stark überstrukturiert. Das Verhältnis zwischen Dateien und Strukturordnern lag bei 1:6. Auf der ersten Ebene waren 25 Strukturordnern, auf der zweiten Ebene bereits 274 Strukturordner vorhanden. Die Ablage wies teilweise bis zu 13 Strukturebenen auf. Auf sämtlichen Strukturebenen waren neben den Strukturordnern zusätzlich Dokumente vorhanden.

Problemstellung

Eine Bewertung und Erschliessung sämtlicher Strukturordner und Strukturebenen war mit den vorhandenen personellen Ressourcen nicht möglich und Angesicht der fehlenden Ordnung und ungenügenden Metadatierung der Strukturordner und Dateien nicht zielführend.

Mögliche Vorgehensweisen

Für das Archiv standen drei Vorgehensweisen im Raum:

  • Keine Übernahme der Dateiablage
  • Unveränderte Übernahme der Dateiablage
  • Manuelle Bewertung und Erschliessung der Dateiablage

Die Dateiablage beinhaltete zum Teil archivwürdige Unterlagen und Teile davon mussten archiviert werden. Eine unveränderte Übernahme der Dateiablage hätte eine spätere Benutzung stark erschwert und zu sehr vielen technischen Problemen bei der Überführung ins digitale Langzeitarchiv geführt. Deshalb wurde eine eingeschränkte manuelle Bewertung und Erschliessung der Dateiablage beschlossen.

Bewertung

Um mit der Überstrukturierung der Dateiablage umgehen zu können, wurden für die Bewertung der Dateiablage nur die ersten vier Strukturebenen analysiert. Waren in den ersten vier Strukturebenen keine archivwürdigen Unterlagen vorhanden und lieferten die vorhandenen Metadaten keine Hinweise auf möglicherweise archivwürdige Unterlagen auf tiefergelegenen Strukturebenen, wurden ganze Strukturverzweigungen summarisch gelöscht. Das Risiko dabei eventuell archivwürdige Unterlagen zu löschen, wurde bewusst in Kauf genommen. Nach Abschluss der Bewertung waren noch 7'526 Dateien in 1'292 Strukturordnern (3.6 GB) vorhanden.

Erschliessung

Anschliessend an die Bewertung wurden auf den ersten zwei Ebenen der verbliebenen Dateiablage manuelle Eingriffe und Verbesserungen an der Metadatierung (Umbenennungen, Auflösen von Abkürzungen usw.) und der Strukturierung (Verschiebungen, Zusammenlegungen) vorgenommen. Metadaten und Strukturierung auf tiefergelegenen Strukturebenen blieben unverändert.

Dokumentation der vorgenommenen Eingriffe

Die bei der Bewertung und Erschliessung vorgenommenen Eingriffe wurden durch sogenannte „Filereports“ dokumentiert. Zu diesem Zweck wurde mit dem Tool Droid ein Report der abgelieferten und unbearbeiteten Dateiablage in Form einer csv-Datei erstellt. Nach Abschluss der Bewertung und Erschliessung wurde nach der gleichen Methode eine weitere csv-Datei erstellt. Die Vorher-Nachher „Filereports“ wurden der Dateiablage hinzugefügt und sind Teil des SIPs.

Verzeichnung im Archivinformationssystem

Nach dem Ingest ins digitale Langzeitarchiv wurden nur die ersten beiden manuell bearbeiteten Strukturebenen als Serie- und Dossierstufe ins AIS importiert. Unterhalb dieser Stufen vorhandenen Strukturebenen sind im AIS nicht abgebildet. Bei der Erschliessung wurde darauf geachtet, dass die im AIS abgebildeten Stufen die darin enthaltenen Unterlagen akkurat beschreiben.

Fazit

Mit der beschriebenen Vorgehensweise konnte die beschriebene Dateiablage mit vertretbarem Aufwand bearbeitet und ins digitale Langzeitarchiv überführt werden. Der Ansatz, die Bewertung und Erschliessung auf wenige Strukturebenen einer Ablage einzuschränken, hilft bei stark überstrukturierten und schlecht metadatierten Ablagen den personellen Aufwand für die Bewertung und Erschliessung zu begrenzen. Die dabei in Kauf genommenen Risiken, insbesondere der eventuelle Verlust archivwürdiger Unterlagen, müssen dagegen abgewogen werden.

Kontakt

Mario Seger, Staatsarchiv Obwalden, Tel. +41 666 61 55, E-Mail: mario.seger@ow.ch, www.staatsarchiv.ow.ch

/home/kostceco/public_html/kostwiki/data/pages/ueberstrukturierte_daten.txt · Zuletzt geändert: 2023/01/19 14:09 von johannes.hafner