ENDE

Blog

angle-left

Handschriftliche Vielfalt im Griff der spitzen Klammern

Das Austarieren zwischen der vielfältigen Seitengestaltung mittelalterlicher Psalmen-Handschriften und der streng logischen und sauberen Klammerstruktur eines XML-Dokuments ist in meiner Arbeit eine wiederkehrende Herausforderung. Denn viele Fragen und Probleme stellen sich erst in dem Moment, in dem ich beginne, eine konkrete Handschrift für das Projekt „Mediengeschichte der Psalmen“ zu transkribieren.

Vielfältiges Erscheinungsbild

Wer sich bereits mit spätmittelalterlichen Handschriften beschäftigt hat, der weiß um ihr äußerst vielfältiges Erscheinungsbild: Sie unterscheiden sich stark voneinander in der Einrichtung (ein- oder zweispaltiges Seitenlayout), im Buchschmuck (Initialen, Rubrizierungen, Unterstreichungen), im Grad der Sorgfalt (Streichungen und Korrekturen), in den Schreibkonventionen (Hochpunkte, Virgeln, Häufigkeit von Abkürzungen) und nicht zuletzt in der Sprache (Schreibsprache, Wortwahl). Diese Eigenschaften der Handschriften werden beim Transkribieren mitkodiert. Dafür gibt es eine Grammatik, die XML (Extensible Markup Language – Erweiterbare Auszeichnungssprache), und ein Wörterbuch, den Standard der Text Encoding Initiative (TEI).

Der Aufbau eines XML-Dokuments erfolgt in einer Struktur, in der verschiedene Elemente ineinander verschachtelt sind. Diese können wiederum mit Inhalten – hier mit den Texten der Handschriften – gefüllt werden. Diese Verschachtelung kann beliebig tief fortgeführt werden. Die Funktion oder Bedeutung eines Elements wird durch sogenannte Tags definiert. Diese umschließen als Start- und End-Tag in spitzen Klammern den jeweiligen Inhalt, und bei eben dieser Umklammerung handelt es sich um das Kodieren oder Auszeichnen.

An Psalm 18,5 aus der Lutherbibel (Stuttgart, Deutsche Bibelgesellschaft 1999) führe ich vor, wie eine TEI-konforme Kodierung einer modernen Psalmenausgabe aussehen kann:

 

 

Würde dieser Psalm aus der Lutherbibel im Projekt „Mediengeschichte der Psalmen“ kodiert werden, sähe Vers 5 so aus:

 

Hier wird die angesprochene Verschachtelung sichtbar. <ab> dient als Wurzelelement, das wie ein Container alle folgenden Elemente enthält. Da in unserem Projekt die Struktur der Psalmen untersucht und verglichen werden soll, würden hier insbesondere die typographischen Strukturmerkmale mit sogenannten Attributen ausgezeichnet; also die hochgestellte Versnummer 5 (Attribut: rend="sup") und das im Fettdruck (Attribut: rend="bold") stehende Alinea-Zeichen. Die Tiefe der Verschachtelung hält sich in diesem Fall jedoch in überschaubaren Grenzen. 

 

Ein etwas anderes Bild ergibt die Auszeichnung von Psalm 18,5 aus der nachstehend abgebildeten Handschrift Wolfenbüttel, Herzog August Bibliothek, Cod. Guelf. 81.10 Aug. 2°.

 

 

Bei dieser Handschrift handelt es sich um einen zweisprachigen Psalter aus dem 15. Jahrhundert. Den Psalmen ist jeweils ein mittelniederdeutscher Kommentar vorangestellt. Jeder einzelne Psalmvers ist im Anschluss in Latein sowie in seiner mittelniederdeutschen Übersetzung oder Auslegung wiedergegeben. Zur Strukturierung des Werkes haben sich Schreiber und Rubrikator üblicher zeitgenössischer Mittel bedient: Große, rote Lombarden kennzeichnen den Beginn eines neuen Abschnittes (in diesem Fall des neuen Kommentars), rubrizierte Majuskeln (Großbuchstaben) gliedern den Fließtext (in diesem Fall die Psalmverse), und rote Unterstreichungen heben bestimmte Textteile (in diesem Fall die lateinischen Verse) hervor.

Der lateinische Beginn von Vers 18,5 ist in der Handschrift wie folgt gestaltet:

 

 

Die Auszeichnung von Psalm 18,5 aus dieser Handschrift sieht wiederum so aus:

 

 

Neben der Länge fällt besonders die umfangreichere und tiefere Verschachtelung auf. Dies ist der Struktur geschuldet, die von der Handschrift vorgegeben wird, hängt jedoch auch mit dem Aufbau eines XML-Dokuments zusammen: Die unterschiedlichen Kodierungselemente müssen konsequent verschachtelt werden. Gibt es hier Widersprüche oder Überschneidungen, ist das Dokument nicht wohlgeformt und kann nicht weiter verarbeitet werden.

Konsequent verschachtelt

Die Abkürzungen korrekt zu kodieren, ist eine besondere Herausforderung: Bereits das erste Wort besitzt vier Eigenschaften, die durch Klammern ausgedrückt werden müssen: die rubrizierte Initial-Majuskel, die Worttrennung am Zeilenende, die durchgehende rote Linierung sowie die Abkürzungen. Hat man jedoch das grundlegende Prinzip eines XML-Dokuments verstanden – eine innerhalb einer Eltern-Klammer geöffnete Kinder-Klammer muss auch innerhalb dieser Eltern-Klammer wieder geschlossen werden –, bekommt man auch diese ausführlicheren strukturellen Merkmale in den (Klammer-)Griff.

An dem hier angeführten Beispiel wird bereits deutlich, wie schwierig es sein kann, die mittelalterliche Schriftgestaltung in eine korrekte XML-Struktur zu übertragen. Noch komplizierter wird es, wenn weitere Zusätze berücksichtigt werden müssen, die nicht so einfach strukturiert werden können oder die mit einer bereits bestehenden Struktur in Konflikt geraten würden. So trifft man zum Beispiel in mittelalterlichen Handschriften häufig auf Randbemerkungen, die eine inhaltliche Ergänzung darstellen. Sie können über mehrere Zeilen gehen, oftmals von anderer Hand geschrieben sein und sich auf Textteile beziehen, die über einen Spalten- oder Seitenumbruch hinausgehen können.

Fundiertes Hilfsmittel

Hier stößt man durchaus an Grenzen der hierarchischen Schachtelung, doch finden sich in den TEI-Richtlinien auch Lösungsvorschläge für den Umgang mit solchen, einander übergreifenden Strukturen (http://www.tei-c.org/release/doc/tei-p5-doc/en/html/NH.html). In den Richtlinien wird an dieser Stelle zwar nicht explizit auf mittelalterliche Textphänomene und deren Kodierung Bezug genommen, doch ist es möglich, mit den bestehenden Elementen und Attributen die unterschiedlichen strukturellen Phänomene spätmittelalterlicher Handschriften auszuzeichnen. Dies setzt jedoch eine kontinuierliche Auseinandersetzung mit den unterschiedlichen Auszeichnungsmöglichkeiten und teilweise eine flexible Handhabung der Elemente und Attribute voraus.

Durch die Arbeit mit  verschiedenen spätmittelalterlichen Handschriften und ihrer Transkription und Kodierung liegen für das Projekt „Mediengeschichte der Psalmen“ inzwischen Richtlinien vor, wie und nach welchen Regeln ausgezeichnet wird. Durch diese Richtlinien, in denen Kodierungslösungen für zahlreiche Phänomene verzeichnet sind, sowie durch die Weiterentwicklung eines schnellen Auszeichnungssystems für die Transkriptionsarbeit wird zum Abschluss des Projektes ein fundiertes Hilfsmittel für Arbeiten mit einer ähnlichen Ausrichtung in der Texterfassung und -behandlung bereitstehen. Zahlreiche Kodierungsfragen, die im Verlauf des Projektes aufgekommen sind und sicher auch noch aufkommen werden, müssen so bei zukünftigen Forschungsvorhaben nicht mehr geklärt werden. Stattdessen können unsere Ergebnisse übernommen, angewendet und ausgebaut werden.

Hanne Grießmann, M. A. ist Wissenschaftliche Hilfskraft im Forschungsprojekt Text und Rahmen, Wolfenbütteler Teilprojekt „Mediengeschichte der Psalmen“, das von PD Dr. Ursula Kundert geleitet wird. Sie ist dort mit der Transkription und Kodierung mittelniederdeutscher, frühneuhochdeutscher und lateinischer Psalmen betraut.

Weitere Blogeintrag

MWW goes Shanghai

In Vicki Baums Roman Hotel Shanghai von 1939 führt die Autorin verschiedene Figuren...

MWW goes Washington

Anfang Oktober in Washington: Während sich in Deutschland bereits die Blätter färbten,...