<title>Ausgezeichnete Objekte</title>
Ein Blick in die digitale Transformationsstrategie des Deutschen Bergbau-Museums Bochum verdeutlicht die wissenschaftspolitische Dimension des Themas. Forschungsdaten sollen über offene Schnittstellen für Forschung und Transfer zugänglich und nutzbar gemacht werden. Dabei gilt es, ein besonderes Augenmerk auf die Computerlesbarkeit zu legen, damit die Daten beispielsweise im Internet gut auffindbar sind oder mit einschlägiger Software analysiert werden können. Ein weiterer wichtiger Aspekt ist die Interoperabilität, worunter die Gewährleistung der Austauschbarkeit der Daten zwischen verschiedenen Systemen und Institutionen zu verstehen ist. Einen Überblick darüber, was alles bei der Veröffentlichung von Forschungsdaten beachtet werden sollte, bieten die so genannten FAIR-Prinzipien.
Gemäß diesen Leitlinien forciert das montan.dok bereits seit Jahren die digitale Erschließung der Sammlungen und Archivbestände. Die so produzierten Daten werden zudem nicht nur über die Online-Datenbank des montan.dok, sondern auch in Fachrepositorien und Portalen, wie beispielsweise Archive in Nordrhein-Westfalen, museum-digital oder Deutsche Digitale Bibliothek (DDB) veröffentlicht. Was hier zunächst einmal womöglich recht einfach klingt, bedeutet in der Praxis jedoch für viele Gedächtnisinstitutionen eine große Herausforderung. Konnte früher bei der Erschließung und Dokumentation noch das Hauptaugenmerk auf die inhaltliche Qualität gelegt werden, muss im digitalen Zeitalter zusätzlich noch die Qualität der Daten und Datenstrukturen mit angemessener Expertise sichergestellt werden. Die Erfassung formaler und inhaltlicher Aspekte zu den Sammlungen und Objekten bedeutet – digital gedacht – letztlich die Erfassung strukturierter und computerlesbarer Metadaten.
Möchten Nutzende oder Mitarbeitende die umfangreichen Datenbestände des montan.dok durchsuchen, so hängt der Erfolg dieses Unterfangens maßgeblich von der Qualität der erzeugten Metadaten ab. Ob ein komplexes Informationsbedürfnis angemessen befriedigt wird, kann anhand zweier Kriterien beurteilt werden. Die „Trefferquote“ (engl. recall) zeigt an, mit welcher Wahrscheinlichkeit ein relevanter Datensatz gefunden wird, die „Genauigkeit“ (engl. precision) wiederum mit welcher Wahrscheinlichkeit ein gefundener Datensatz relevant ist. Damit beide Wahrscheinlichkeiten möglichst hohe Werte erreichen, ist es notwendig, bei der Metadatenerfassung weder zu verallgemeinernd noch zu spezifisch vorzugehen. Durch die Verwendung von Thesauri bzw. kontrollierten Vokabularen, in denen verwendete Begrifflichkeiten hierarchisch strukturiert und systematisch geordnet werden, können bei der Verschlagwortung beispielsweise beide Anforderungen unter einen Hut gebracht werden.
Grundvoraussetzung dafür, dass überhaupt komplexe Informationsbedürfnisse erfüllt werden können, ist die Sicherstellung der bereits mehrfach erwähnten Computerlesbarkeit der Daten. Vereinfacht ausgedrückt versteht man darunter, dass Software bzw. Webanwendungen kleinteilig und präzise auf Informationen sowie Zusammenhänge in den Datenbeständen zugreifen können. Folglich erfassen die meisten Museen ihre Objekte heutzutage in Datenbanksystemen, die auf Datenmodellen basieren, die (bestenfalls) sowohl die Anforderungen der musealen Dokumentation als auch der Computerlesbarkeit abdecken. Da hierbei unterschiedliche Systeme verwendet und Daten unterschiedlich strukturiert werden, stellt sich die Frage, wie Museen die in den FAIR-Prinzipien formulierte Anforderung der Interoperabilität gewährleisten können. Die entscheidende Rolle spielen hierbei internationale Metadatenstandards, die von elementarer Bedeutung für den Austausch zwischen den Museen, die Zusammenführung der Daten in Portalen wie der DDB und die anschließende Nutzung durch Forschende ist.
Während für das Bergbau-Archiv Bochum vor allem der Metadatenstandard „Encoded Archival Description“ (EAD) relevant ist, ist für Daten aus der Fotothek und den Musealen Sammlungen des montan.dok der Standard „Lightweight Information Describing Objects“ (LIDO) von großer Bedeutung. Beide basieren auf der Auszeichnungssprache „Extensible Markup Language“ (XML). XML gibt dabei die hierarchische Syntax des Datenformats vor, EAD und LIDO auf der anderen Seite die Semantik. Mithilfe so genannter XML-Tags werden – wie im Titel des vorliegenden Artikels zu sehen – einzelne Informationen markiert bzw. ausgezeichnet und zudem mehrere Informationen auf übergeordneter Ebene logisch zusammengefasst. Um derartige Austauschdateien automatisiert generieren und anschließend in die DDB importieren zu können, ist es notwendig, dass die hauseigenen Datenmodelle eine hohe Kompatibilität zu diesen Metadatenstandards aufweisen. Dies stellt durchaus eine schwierige Aufgabe für viele Institutionen dar. Datenbankbasierte Objektdokumentation auf Basis eigener Datenmodelle wird im montan.dok beispielsweise schon wesentlich länger ausgeübt, als die jeweiligen Metadatenstandards überhaupt existieren. Die nachträgliche Anpassung an diese ist daher mit einem nicht unerheblichen Aufwand verbunden.
Um zu verdeutlichen, wie eine solche mit LIDO-XML ausgezeichnete Austauschdatei aussieht, sei an dieser Stelle die Kohlekeramik „Tête de Mineur“ herangezogen, die auf einer Vorlage von Constantin Meunier basiert (montan.dok 030002783000). Betrachtet man nun Ausschnitte aus der Datei, so ist zu erkennen, dass Informationen wie der Titel oder der Objektname durch passende XML-Tags markiert sind („<titleSet>“ bzw. „<objectWorkType>“). Auffällig hierbei ist, dass der Objektname „Plakette“ nicht einfach nur als Zeichenkette aufgeführt wird, sondern darüber hinaus – markiert durch „<conceptID>“ – auch auf verschiedene Internetressourcen verwiesen wird. Bei diesen handelt es sich um Einträge in so genannten Normdateien, die den gewählten Begriff eindeutig identifizieren und zudem weitere Informationen – Synonyme, Verhältnisse zu anderen Begriffen etc. – zu diesem zusammenfassen.
Der Verweis auf derartige Normdateien ist ein weiterer wichtiger Baustein zur Gewährleistung der Interoperabilität. So ist im Prinzip sicherstellt, dass alle Gedächtnisinstitutionen dasselbe Vokabular bei der Metadatenerfassung verwenden. Eine der wichtigsten Normdateien ist die „Gemeinsame Normdatei“ (GND), die vor allem auch zahlreiche derartige Datensätze zu Personen und Institutionen zusammenführt. Diese Normdateien können wiederum dazu genutzt werden, die eigenen Daten automatisiert mit weiteren Informationen anzureichern. In einem weiteren Ausschnitt aus der Beispiel-Datei kann man erkennen, dass auf diese Art und Weise der Name „Constantin Meunier“ mit weiteren Angaben wie Lebensdaten oder Schreibweisen in verschiedenen Sprachen ergänzt werden konnte.
Auch wenn in diesem Artikel lediglich ein recht oberflächlicher Einblick in einige Facetten der digitalen Transformation am DBM gegeben werden kann, so fasst er doch gut zusammen, woran aktuell im Projekt „Digitale Infrastrukturen im Deutschen Bergbau-Museum Bochum und virtuelle Zugänglichkeit zum Bergbauerbe“ gearbeitet wird. Neben der voranschreitenden Überführung analoger in digitale Objekt- und Sammlungsdaten werden nachhaltige Prozesse entwickelt, um sowohl die Qualität der Daten als auch die Anreicherung mit Normdaten zu verbessern. Das Verfügbarmachen interoperabler Daten auf übergeordneten Portalen wie der DDB stellt im Ergebnis eine Inwertsetzung der Sammlungen und Bestände des montan.dok dar. Unter Zuhilfenahme entsprechender Methoden und Analysetools ermöglichen sie nämlich quantitative Forschungen im Kontext geisteswissenschaftlicher Fragestellungen.
01. Mai 2023 (Andreas Ketelaer, M. Sc.)
- Literatur
Montanhistorisches Dokumentationszentrum (montan.dok) beim Deutschen Bergbau-Museum Bochum (DBM) 030002783000
von Hagel, Frank: Vernetzt im Netz. Wohin mit den „eigenen“ Objektdaten?, in: Farrenkopf, Michael/Siemer, Stefan: Perspektiven des Bergbauerbes im Museum. Vernetzung, Digitalisierung, Forschung, Berlin/Boston 2020 (= Veröffentlichungen aus dem Deutschen Bergbau-Museum Bochum, Nr. 235; = Schriften des Montanhistorischen Dokumentationszentrums, Nr. 37), S. 213-220.
Jannidis, Fotis: Grundlagen der Datenmodellierung, in: Jannidis, Fotis/Kohle, Hubertus/Rehbein, Malte (Hrsg.): Digital Humanities. Eine Einführung, Stuttgart 2017, S. 99-108.
Kesper, Arno u.a.: Catalogue of Quality Problems in Data, Data Models and Data Transformations. Requirements specification for the quality management, quality analysis techniques, improvement measures as well as quality management processes of data sets for objects of the material culture. Unter: https://zenodo.org/record/3955500 (Eingesehen: 30.03.2023).
Klinke, Harald: Information Retrieval, in: Jannidis, Fotis/Kohle, Hubertus/Rehbein, Malte (Hrsg.): Digital Humanities. Eine Einführung, Stuttgart 2017, S. 213-222.
Knaus, Gudrun/Stein, Regine/Kailus, Angela: LIDO-Handbuch für die Erfassung und Publikation von Metadaten zu kulturellen Objekten, Bd. 1: Graphik, Heidelberg 2019.
Neuroth, Heike: Bibliothek, Archiv, Museum, in: Jannidis, Fotis/Kohle, Hubertus/Rehbein, Malte (Hrsg.): Digital Humanities. Eine Einführung, Stuttgart 2017, S. 268-278.
Vogeler, Georg/Sahle, Patrick: XML, in: Jannidis, Fotis/Kohle, Hubertus/Rehbein, Malte (Hrsg.): Digital Humanities. Eine Einführung, Stuttgart 2017, S. 128-146.
Werner, Claus: Von Abbauhammer bis Zylinderkappe. Sammlungsklassifikation und Objektnamenthesaurus zur Bergbautechnik am Deutschen Bergbau-Museum Bochum, in: Farrenkopf, Michael/Siemer, Stefan: Perspektiven des Bergbauerbes im Museum. Vernetzung, Digitalisierung, Forschung, Berlin/Boston 2020 (= Veröffentlichungen aus dem Deutschen Bergbau-Museum Bochum, Nr. 235; = Schriften des Montanhistorischen Dokumentationszentrums, Nr. 37), S. 69-81.
Online-Portale: montandok.de. Unter: https://www.montandok.de/objekt_start.fau?prj=montandok&dm=Montanhistorisches%20Dokumentationszentrum&ref=85911 und museum-digital. Unter: https://nat.museum-digital.de/object/1069039 sowie Deutsche Digitale Bibliothek. Unter: https://www.deutsche-digitale-bibliothek.de/item/AIROYFMCYJIE5XDRSM2TUJO4M4FFQA5R (Eingesehen: 30.03.2023).