Datenmodellierung

Warum ein Datenmodell?

Ein digitales Datenmodell hat gegenüber klassischen (analogen) Modellen den Vorteil, dass es große Datenmengen umfassen kann, die mithilfe des Computers prozessiert werden können. Neben der Ausführung automatisierter Operationen auf das Modell kann es computergestützt in unterschiedliche Formate transformiert und visualisiert werden.

Grundideen des MWW-Datenmodells

Das im Rahmen des Projektes MWW entwickelte Datenmodell basiert auf dem etablierten CIDOC-CRM-Standard und hat zum Ziel, Sammlungsforschung projektübergreifend und in einem Semantic Web-Format abzubilden. Das Modell ist so konzipiert, dass es verschiedene Schwerpunkte der Sammlungsforschung ins Auge fasst und diese in Bezug zueinander setzt.

Für denjenigen Forschungsansatz, der vor allem die Sammlung selbst zum Forschungsgegenstand hat, sind zunächst die Sammlungsobjekte von zentraler Bedeutung. Die systematische Erfassung ihrer konstitutiven Bestandteile, d.h. der einzelnen Sammlungsobjekte, ist die Voraussetzung etwa für den Nachweis konstituierender Prozesse einer Sammlung oder von Änderungen im Sammlungsbestand. Vor dem Hintergrund des (wechselnden) Bestandes und seiner Örtlichkeit können historische und soziale Aspekte und Entwicklungen von Sammlungen nachgezeichnet werden. Aus diesem Grund repräsentiert das MWW-Datenmodell Sammlungen zunächst als eine Ansammlung eigenständiger Sammlungsobjekte.

Für denjenigen Forschungsansatz, der Sammlungen hingegen vor allem als (kuratierte) Ansammlung historischer Forschungsquellen betrachtet, steht der durch das einzelne Sammlungsobjekt medial kommunizierte (wissenschaftliche) Informationsgehalt im Mittelpunkt des Interesses und weniger das Sammlungsobjekt in seiner materiellen Einzigartigkeit. So spielt es für den Forschenden im Zweifel keine Rolle, ob er das Sammlungsobjekt selbst oder aber dessen wissenschaftliche Quellenedition als Grundlage für seine Forschungen nutzt. Es macht für ihn auch keinen Unterschied, ob das Sammlungsobjekt seiner Wahl zwischenzeitlich zerstört worden ist, sofern ihm dessen intellektueller Informationsgehalt überliefert ist. Für einen Forschenden hingegen, der sich für die Sammlung selbst interessiert, ist das Ereignis der Zerstörung eines Sammlungsobjektes ein wichtiger Befund seiner Forschungsbemühungen. Das MWW-Datenmodell trägt demjenigen Forschungsansatz, der sich für Sammlungsobjekte vor allem als historische Forschungsquellen interessiert, insofern Rechnung, als dass auch Publikationen oder Quelleneditionen, die sich auf den wissenschaftlichen Informationsgehalt von Sammlungsobjekten beziehen, selbst als eigenständige Sammlungsobjekte zweiter Ordnung erfasst und als solche neben Sammlungsobjekte erster Ordnung gestellt werden können. 

Die Repräsentation von Sammlungsobjekten erster Ordnung einerseits und denjenigen Sammlungsobjekten zweiter Ordnung, die aus der wissenschaftlichen Beschäftigung mit ihnen resultieren, anderseits mithilfe des MWW-Datenmodells erweitert die klassische Idee einer Forschungssammlung. Im Sinne einer wissenstheoretischen Interpretation können Sammlungsobjekte als externalisierte Manifestationen von Wissen verstanden werden, das von Forschenden durch die Wahrnehmung der Sammlungsobjekte internalisiert, wissenschaftlich interpretiert und schließlich als weiterentwickeltes Wissen in Form von Publikationen oder Quelleneditionen (Sammlungsobjekte zweiter Ordnung) wieder externalisiert wird. Mit dem Ziel, eine Forschungssammlung als offenen Wissensraum zu realisieren, bildet das Modell daher nicht nur die eigentlichen Sammlungsobjekte, sondern auch materialisierte Ergebnisse der wissenschaftlichen Beschäftigung mit ihnen ab.

Über die Repräsentation der Forschungssammlung anhand von Sammlungsobjekten erster und zweiter Ordnung hinaus hat das Modell das Ziel, existierende Relationen beliebiger Art zwischen den Sammlungsobjekten abzubilden. Während sich Beziehungen, die sich innerhalb raum-zeitlicher Ereignisse materialisiert haben (etwa die Nutzung physischer Textzeugen bei der Erstellung einer philologischen Edition oder Goethes Einsatz eines Prismas bei seinen Farbexperimenten, deren Ergebnisse er in Schriften materialisiert hat), zwischen den physischen Sammlungsobjekten als solchen ausgedrückt werden können, können andere Beziehungen zwischen Sammlungsobjekten nur aus dem von ihnen medial vermittelten immateriellen Informationsgehalt durch den Forschenden erschlossen werden. Aus diesem Grund können die Sammlungsobjekte als Träger intellektueller Informationen modelliert werden, die wiederum auf andere Sammlungsobjekte verweisen können. So kann etwa der propositionale Gehalt eines Briefes von Goethe (erstes Sammlungsobjekt) auf ein Buch referenzieren, das Goethe studiert hat (zweites Sammlungsobjekt). Mithilfe der beschriebenen materiellen und immateriellen Repräsentation von Sammlungsobjekten können beliebige Relationen zwischen Objekten und deren Inhalten ausgedrückt werden, wodurch auch werkgenetische oder editorische Prozesse im Detail abgebildet werden können.

Analoge und digitale Sammlungsobjekte

Das MWW-Modell versucht der zunehmenden Digitalisierung von Wissensressourcen Rechnung zu tragen. Wissenschaftliche Publikationen und Editionen werden zunehmend in digitaler Form realisiert. Zudem liegen auch Nachlässe von Künstlern und Autoren häufig in digitaler Form vor (vgl. etwa den digitalen Nachlass von Friedrich Kittler, Projekt: "Born-digitals"). Jenseits der Frage, ob es sich um ein Sammlungsobjekt erster oder zweiter Ordnung handelt, erfasst das Modell daher sowohl Sammlungsobjekte, bei denen es sich um "analoge" physische Objekte handelt, als auch Sammlungsobjekte, die als elektronische Ressourcen vorliegen. Das Modell bietet für beide Arten von Sammlungsobjekten u.a. die Möglichkeit, ihren Ort sowie Produktionskontext abzubilden.  

Aussagen als Ergebnis wissenschaftlicher Interpretation

Sowohl Aussagen über den Bestand einer Forschungssammlung als auch über die gegenseitigen Beziehungen ihrer Sammlungsobjekte sind Ergebnisse wissenschaftlicher Forschung und haben als solche keinen endgültigen Charakter. Die Aussagen über die gegenseitigen Beziehungen und weiterer Kontexte von Sammlungsobjekten können mithilfe des Datenmodells als solche expliziert und dem verantwortlichen Forschenden zugewiesen werden. Auf diese Weise kann Sammlungsforschung als Ergebnis eines Forschungsprozesses transparent und nachvollziehbar gemacht werden. 

Generischer Charakter und Offenheit des Modells

Das Modell wurde im Rahmen des MWW-Projektes vor dem Hintergrund verschiedener Fallstudien entwickelt, wodurch eine generische Anwendbarkeit sichergestellt werden soll. Es nimmt grundsätzliche Aspekte von Sammlungsforschung im beschriebenen erweiterten Sinne in den Blick und bietet Vorschläge ihrer Repräsentation mithilfe von CIDOC-CRM-Entitäten und -Properties (s.u.). Unterschiedliche Forschungsprojekte haben mitunter sehr spezifische Aspekte bei der Modellierung von Sammlungen zu beachten. Da das Modell CIDOC-CRM basiert ist, können je nach Bedarf ausgehend von der hier vorgeschlagenen Modellierung Unterklassen gewählt oder selbst erstellt werden, welche die jeweils vorliegenden Sachverhalte im Detail abbilden. 

Basale Entitäten (E) mit Attributen (P)

Beschreibung MWW (CIDOC-CRM)
Forschungssammlung
ist Entität vom Typ Forschungssammlung
hat Anzahl Sammlungsobjekte Anzahl
E22 Human-Made Object
P2 has type  "mww/forschungssammlung"
P57 has number of parts [Numeral]
Analoges Sammlungsobjekt
ist Entität vom Typ Sammlungsobjekt
zeigt Ähnlichkeit mit Konzept
enthält Informationen
hat Ort in Archiv/Bibliothek Signatur
hat Halter Institution (Archiv/Bibliothek)
E22 Human-Made Object
P2 has type "mww/sammlungsobjekt"
P130 shows features of E28 Conceptual Object
P128 carries E73 Information Object
P54 has current permanent location E53 Place
P50 has current keeper E39 Actor
Digitales Sammlungsobjekt
ist Entität vom Typ Sammlungsobjekt
zeigt Ähnlichkeit mit Konzept
enthält Informationen
hat Webadresse Persistent Identifier / URL
hat Halter Institution (Archiv/Bibliothek)
befindet sich auf Datenträger/Server
E25 Human-Made Feature
P2 has type "mww/sammlungsobjekt"
P130 shows features of E28 Conceptual Object
P128 carries E73 Information Object
P54 has current permanent location E53 Place
P50 has current keeper E39 Actor
P56i is found on E22 Human-Made Object
Konzept (eines Sammlungsobjekts)
zeigt Ähnlichkeit mit Sammlungsobjekt
zeigt projektspezifische Ähnlichkeit [x] mit Sammlungsobjekt
E28 Conceptual Object
P130 shows features of E22/25 Human-Made Object/Feature
P130.[x] shows features of type [x] of E22/25 Human-Made Object/Feature
Informationen (eines Sammlungsobjekts)
beziehen sich auf Sammlungsobjekt
beziehen sich projektspezifisch [x] auf Sammlungsobjekt
handelt von Sammlungsobjekt
handelt projektspezifisch [x] von Sammlungsobjekt
E73 Information Object
P67 refers to E22/25 Human-Made Object/Feature
P67.[x] refers of type [x] to E22/25 Human-Made Object/Feature
P129 is about E22/25 Human-Made Object/Feature
P129.[x] is of type [x] about E22/25 Human-Made Object/Feature
Mögliche raum-zeitliche Ereignis-Kontexte eines Sammlungsobjektes
Explizite Aussage über ein Sammlungsobjekt
wurde gemacht von Wissenschaftler
bezieht sich auf Sammlungsobjekt Sammlungsobjekt
hat Attribut Attribut
hat als (Aussagen-)Objekt Sammlungsobjekt
E13 Attribute Assignment
P14 carried out by E39 Actor
P140 assigned attribute to  E22/25 Human-Made Object/Feature
P177 assigned property of type E55 Type
P141 assigned E22/25 Human-Made Object/Feature
Produktion eines Sammlungsobjektes
wurde produziert von  Autor/Editor/Wissenschaftler
hat produziert Sammlungsobjekt
hat Produktionsort Ort
hat Produktionsdatum Datum
hat anderes Sammlungsobjekt genutzt/ediert Sammlungsobjekt erster Ordnung
E12 Production
P14 carried out by E39 Actor
P108 has produced E22 Human-Made Object / E25 Human-Made Feature
P7 took place at E53 Place
P4 has time-span E52 Time-Span
P16 used specific object E22 Human-Made Object

Anwendungsbeispiel: Erstellen einer Forschungssammlung

Im folgenden Beispiel wird die Zuordnung eines Objektes (Human-Made Object: „Widmungsexemplar“) zu einer Forschungssammlung (Human-Made Object: „Forschungssammlung ‚Kurt Pinthus‘“) dargestellt. Die Zuordnung („part-of“) des Objektes zur Sammlung wird nicht direkt, sondern als „Aussage“ eines Forschenden expliziert (Attribute Assignment: „Forschungssammlung erstellen“).

Anwendungsbeispiel: Inhaltsbasierte Relation von Sammlungsobjekten

Im folgenden Beispiel wird eine inhaltsbasierte Relation zwischen zwei Sammlungsobjekten ausgedrückt. Das Sammlungsobjekt 1 (Human-Made Object: „Brief an Friedrich August Wolf“) trägt einen Text (Information Object: „Propositionaler Gehalt des Briefes“), der wiederum auf das Sammlungsobjekt 2 (Human-Made Object: „The History of the Royal Society […]“) verweist. Die Darstellung umfasst die Möglichkeit der direkten Modellierung und die Modellierung als explizierte Aussage eines Forschenden (Attribute Assignment).

Anwendungsbeispiel: Elektronisches Sammlungsobjekt als Edition eines analogen Sammlungsobjektes

Das folgende Beispiel bildet zwei Sammlungsobjekte ab, von denen das zweite (Human-Made Object: „Digitale Faksimile-Edition“) eine Faksimile-Edition des ersten (Human-Made Object: „Zettel/Konzept zu 'Faust I'“) ist. Während ersteres (linke Seite) ein analoges Sammlungsobjekt darstellt, ist das zweite eine elektronische Ressource. Zu beiden Sammlungsobjekte sind über ihre Produktionsereignisse der Autor bzw. Editor sowie Ort und Datum der Produktion erfasst. Die beiden Objekte stehen miteinander in Relation, weil das analoge Sammlungsobjekt Bestandteil der Produktion des elektronischen Sammlungsobjektes gewesen ist. Neben gegenseitiger Relation und dem Produktionskontext sind für die Sammlungsobjekte jeweils ihre Orte modelliert, wobei das analoge Objekt via Archiv-Signatur und das elektronische Objekt via URL verortet wird.