Digitale Urkundenbestände. Aufbau und Nutzungsmöglichkeiten des Marburger Urkundenrepositoriums

Views
27
Open Peer Review
Kategorie
Data Paper
Version
1.0
Digitale Urkundenbestände. Aufbau und Nutzungsmöglichkeiten des Marburger Urkundenrepositoriums
Eike Martin Löhden Autor*inneninformationen
Diana Müller Autor*inneninformationen
Simon Horny Autor*inneninformationen

DOI: 10.17175/2025_004

Nachweis im OPAC der Herzog August Bibliothek: 1920441778

Erstveröffentlichung: 17.04.2025

Lizenz: CC BY-SA 4.0, sofern nicht anders angegeben. Creative Commons Deed

Letzte Überprüfung aller Verweise: 24.03.2025

GND-Verschlagwortung: Mediävistik | Repository (Informatik) | Sammlung | Urkundenlehre

Empfohlene Zitierweise: Eike Martin Löhden / Diana Müller / Simon Horny: Digitale Urkundenbestände. Aufbau und Nutzungsmöglichkeiten des Marburger Urkundenrepositoriums. In: Zeitschrift für digitale Geisteswissenschaften 10 (2025). 17.04.2025. HTML / XML / PDF. DOI: 10.17175/2025_004


  • Datenset: Marburger Urkundenrepositorium
  • Beteiligte: Lisa Dieckmann (Universität zu Köln – Resources), Luca Engel (Universität Marburg – Data curation), Mathias Gutenbrunner (Universität Marburg – Software), Jasmin Hauck (Universität Greifswald – Project administration), Simon Horny (Universität Marburg – Data curation), Robin Kuhn (Universität Marburg – Project administration), Eike Martin Löhden (Universität Marburg – Software), Alexander Maul (Hochschule Fulda – Conceptualization), Diana Müller (Universität Marburg – Project administration), Tobias Müllerleile (Universität Marburg – Supervision), Jürgen Nemitz (Universität Marburg – Resources), Lydia Riedl (Universität Marburg – Project administration), Georg Strack (Universität Marburg – Supervision), Achim Weisbrod (Universität Marburg – Resources), Jürgen Wolf (Universität Marburg – Supervision)
  • Version: 1.0
  • Erstveröffentlichung: 10.07.2024
  • Letzte Aktualisierung: 08.01.2025
  • Lizenz: CC-BY 4.0
  • URL: https://urkundenrepositorium.uni-marburg.de/
  • Zitiervorschlag: Lisa Dieckmann / Luca Engel / Mathias Gutenbrunner / Jasmin Hauck / Simon Horny / Robin Kuhn / Eike Martin Löhden / Alexander Maul / Diana Müller / Tobias Müllerleile / Jürgen Nemitz / Lydia Riedl / Georg Strack / Achim Weisbrod / Jürgen Wolf: Marburger Urkundenrepositorium. 10.07.2024. Letzte Aktualisierung: 08.01.2025. https://urkundenrepositorium.uni-marburg.de/
Zugehörige Publikationen:
  • Eike Martin Löhden: Das Marburger Urkundenrepositorium. Eine exemplarische Analyse der Urkunden. In: data_UMR. Eingereicht am 13.02.2025. DOI: 10.17192/fdr/242
  • Alexander Maul / Diana Müller / Eike Löhden: Das ›Marburger Urkundenrepositorium‹. Eine Plattform für digitale Urkundenbilder vereinigt das Lichtbildarchiv älterer Originalurkunden und das Corpus altdeutscher Originalurkunden. In: Maniculae 5 (2024), S. 34–42. DOI: 10.21248/maniculae.60

1. Zielstellung, Kontext und Datenquellen

[1]Eine mittelalterliche Urkunde – wie jede andere historische Quelle – steht nicht für sich allein. Sie muss immer im Geflecht der vielschichtigen Beziehungen gesehen werden, die ihren Kontext definieren. Zu welcher Zeit wurde sie wo ausgestellt? Welche Personen waren daran beteiligt und in welcher Rolle? Werden andere Objekte oder gar Urkunden im Text erwähnt?

[2]Die Darstellung und Analyse dieser Beziehungen war und ist eine Kernaufgabe der Diplomatik. Kommt man daher auf die Idee ein Urkundenportal wie das Marburger Urkundenrepositorium aufzubauen, welches die Bestände zweier Projekte wie das Lichtbildarchiv älterer Originalurkunden bis 1250 (LBA) und das Corpus der altdeutschen Originalurkunden bis 1300 (CAO) vereinigen soll, so muss das Ziel sein, nicht nur die Zugänglichkeit der Urkundendigitalisate zu verbessern, sondern genau die genannten Beziehungskontexte erforschbar zu machen.

[3]Bereits 2009 stellte Patrick Sahle einige Überlegung zum Aufbau eines modernen Urkundenportals zusammen, die bisher nichts an Aktualität verloren haben.‍[1] Wichtige Punkte sind bei ihm die Entwicklung eines Metadatenschemas, das den verschiedenen Beschreibungsebenen eines Urkundendigitalisates gerecht wird, die Orientierung an bestehenden Standards, die Verknüpfung mit Normdaten und die Bereitstellung von Interfaces um den automatisierten Datenaustausch zu ermöglichen.

[4]Den genannten Ansprüchen gerecht zu werden, ist eine Mammutaufgabe, die kaum zu bewältigen scheint. Bei der Entwicklung des Marburger Urkundenrepositoriums war klar, dass insbesondere die aufwendige Bereinigung und Aufbereitung der Metadaten sowie die Anreicherung mit Normdaten nicht so schnell und einfach machbar war, wie es erforderlich gewesen wäre, um das Portal den Standards entsprechend aufzubauen. Dennoch sollten auf technischer Ebene die Grundlagen dafür gelegt werden, die notwendigen Beziehungen und Kontexte abzubilden, um dann über das neue Portal die nachträgliche Aufarbeitung der Bestände zu ermöglichen. Dieses Vorhaben war daher auch ein wichtiger Gesichtspunkt für die Wahl einer geeigneten Software für das geplante Repositorium. Hier spielte nicht nur die Genese der beiden Projekte CAO und LBA eine große Rolle, sondern auch die Verknüpfung des Datenbestandes mit anderen Großprojekten wie Monasterium.net, prometheus‍[2] oder auch der Deutschen Digitalen Bibliothek.

[5]Für die bessere Kontextualisierung des Gesamtbestandes soll im Folgenden kurz auf die Geschichte der jeweiligen Teilbestände von LBA und CAO eingegangen werden. Im Anschluss werden wir genauer auf die zu Beginn des Projektes vorgefundenen Datenbestände eingehen und einige Schritte der (semi-)automatisierten Aufbereitung erläutern. Im darauffolgenden Abschnitt geben wir einen allgemeinen Überblick über den Gesamtbestand und stellen die technischen Spezifikationen und Konfiguration der gewählten Repositoriumssoftware DSpace dar. Der letzte Abschnitt widmet sich dann möglichen Nutzungsszenarien und wir diskutieren die Grenzen des Datenbestandes, bzw. der Auswertungsmöglichkeiten.

1.1 Das Lichtbildarchiv älterer Originalurkunden bis 1250

[6]Das Lichtbildarchiv älterer Originalurkunden bis 1250 (LBA) wurde 1928 durch Edmund Ernst Stengel in Marburg gegründet. Das Ziel der Sammlung war es, die in verschiedenen Archiven, Bibliotheken und anderen Einrichtungen verstreuten Urkunden mittels Fotografien an einem zentralen Ort leichter zugänglich zu machen. Alexander Maul beschreibt 2022 das Ziel als moderne Idee: »[...] für einen einfacheren Zugriff auf die Urkunden des Früh- und Hochmittelalters sollte eine zentrale Plattform geschaffen werden [...]«.‍[3]

[7]Ab Anfang der 90er Jahre begann man die Metadaten der Urkunden in eine Datenbank aufzunehmen, um die Sammlung leichter durchsuchbar zu machen. Sie bestand zu diesem Zeitpunkt bereits aus etwa 11.000 Karteikarten und den dazugehörigen Fotografien. Anfang 2006 wurde dann im Rahmen einer DFG Förderung begonnen, den Gesamtbestand zu digitalisieren und zusammen mit den bereits erfassten Metadaten zur Verfügung zu stellen. Die Sammlung umfasste zu diesem Zeitpunkt ca. 43.000 Digitalisate (es existierten meist mehrere Fotografien pro Urkunde: Vor- und Rückseite sowie Aufnahmen möglicher Siegel) von über 13.000 Urkunden.‍[4] Die Datenbank beruhte bis zum Start des Marburger Urkundenrepositoriums auf der Software kleio.

[8]Die Auswahl an Metadatenfeldern, mit denen die Urkunden verzeichnet wurden, ist auf Basis der damals zu Verfügung stehenden technischen und personellen Ressourcen getroffen worden. Man entschied sich bewusst gegen die Aufnahme von Volltexten, da man der Meinung war, dies sei nicht der Auftrag des LBA und würde daher auch in Bezug auf die Zielsetzung des LBA keinen Mehrwert für die Sammlung bringen.‍[5] Doch man versuchte bereits 1989 die systematische, computergestützte Untersuchung der Urkunden zu ermöglichen.‍[6] Als Beispiel kann die systematische Erfassung von Aussteller*innen, Empfänger*innen und Mitsiegler*innen von Urkunden dienen. Diese wurden, soweit möglich, in die Kategorien geistlich und weltlich unterteilt und anhand einer Ordnungszahl in verschiedene Ränge gegliedert (siehe Tabelle 1).

[9]Entsprechende Vereinheitlichungen gab es auch für weitere Metadatenfelder, wie ›Sortierdatum‹, ›Siegel‹, ›Überlieferung‹ oder ›Format‹. Jedes dieser Felder diente dazu, möglichst viele Informationen so aufzubereiten, dass sie sowohl möglichst nutzer*innenfreundlich darstellbar waren, als auch maschinell ausgewertet werden konnten. Die maschinelle Auswertung diente zwar hauptsächlich der Indizierung der Urkunden für die Suche, wurde aber auch in wenigen Fällen für quantitative Analysen genutzt, wie der Beitrag von Bischoff zeigt. Erforderlich war dafür zu diesem Zeitpunkt jedoch ein manueller Abzug des Gesamtbestandes, da die Datenbanksoftware keine entsprechenden Schnittstellen zur Verfügung stellte.

Typ Rang Beschreibung
G 1 Päpste
2 Legaten
3 Bischöfe und Domkapitel
4 Klöster, Stifts- und andere Kirchen, Spitäler, Orden und Ordensangehörige
5 Andere Geistliche
W 1 Kaiser oder Könige
2 Herzöge und Fürsten
3 Grafen
4 Städte, Bürger, Zünfte
5 Notare
6 andere Weltliche
Tab. 1: Übersichtstabelle zur Einteilung von Personen im LBA. [Tabelle übernommen von: Bischoff 1989, S. 32]

[10]Bereits seit 2008 stellte die Datenbank LBA online die Digitalisate der Urkundenbilder Nutzer*innen zur Verfügung. Allerdings wurde die Auflösung künstlich reduziert und die originalen TIFF-Dateien standen nur auf Anfrage und gegen ein Honorar zur Verfügung. Nach und nach veraltete jedoch das kleio-Datenbanksystem und eine Weiterentwicklung konnte in Marburg nicht sichergestellt werden. Zunächst mussten nur einige Funktionen wie persönliche Zugänge, Arbeitsmappen und Bestellformulare abgestellt werden, doch bald schon drohte ein komplettes Abschalten des Systems.‍[7]

1.2 Das Corpus der altdeutscher Originalurkunden bis zum Jahr 1300

[11]Der erste Band des Corpus der altdeutschen Originalurkunden bis zum Jahr 1300 (CAO) wurde bereits im Jahr 1932 durch Friedrich Wilhelm vorgelegt, in dem auf 4.000 Seiten über 2.500 Urkunden entsprechend der Originale abgeschrieben worden waren.‍[8] Ziel des Projektes war es, nicht nur alle erhaltenen deutschsprachigen Urkundenausfertigungen bis Ende 1299 zu erfassen, sondern diese ebenso über das Wörterbuch der Mittelhochdeutschen Urkundensprache lexikografisch zu erschließen. Dies ist mit 4.422 Urkunden und ca. 1.3 Millionen Belegwörtern auch nahezu vollständig gelungen. Neben Registern über aktuelle und frühere Lagerorte enthält jeder der fünf Bände Verzeichnisse über Aussteller*innen, Empfänger*innen und Ausstellungsorte.‍[9]

[12]Ein wichtiger Punkt des CAO war, dass die Texte nicht normalisiert wurden. Es sollte der Textträger in den Mittelpunkt der Edition gerückt werden und eine möglichst buchstabengetreue Transkription erstellt werden.‍[10] Diese Praxis setzte sich auch in Metadatenfeldern wie Aussteller*innen, Empfänger*innen o. a. fort, da diese direkt aus dem Text übernommen wurden. Dies stellt einen deutlichen Unterschied zu den Beständen des LBA dar und ist maßgeblich in der unterschiedlichen Zielsetzung der beiden Sammlungen begründet. Schon nach der Publikation des ersten Bandes des CAO wurde genau diese Abwesenheit von Normalisierung von Historiker*innen kritisiert, wenn man auch anerkannte, dass die traditionelle Vorgehensweise bei Editionen für ein mehrheitlich der Germanistik dienendes Corpus nicht ausreichte.‍[11]

[13]Seit 2010 bereitete man das Corpus am Trier Center for Digital Humanities digital auf und stellte es als digitales Textarchiv zur Verfügung.‍[12] Die Arbeitsmaterialien des CAO lagen schon mehrere Jahre im Institut für deutsche Philologie des Mittelalters der Philipps-Universität Marburg und wurden dort in Zusammenarbeit mit dem LBA für das Marburger Urkundenrepositorium digitalisiert: Es sind so 3376 digitale Urkundenabbildungen der Urkunden des CAO entstanden und in das Repositorium überführt worden.‍[13] Im Rahmen ihrer Analyse über sprachlandschaftliche Variationen im Mittelhochdeutschen anhand des CAO überführten Carsten Becker und Oliver Schallert den Urkundenbestand in eine eigene, relationale Datenbankstruktur und reicherten diese mit geografischen Daten an.‍[14] Diese Daten stellten auch für die Aufnahme der Stücke in das Marburger Urkundenrepositorium eine wichtige Quelle dar. In Folge sind fast 92 % der Urkunden des CAO mit eindeutigen Ausstellungsorten verknüpft (beim LBA sind es lediglich 9 %).

2. Beschreibung der Datenerhebung sowie Methoden zur Erhebung, Bereinigung und Aufbereitung

[14]Die Bestände von LBA und CAO waren auf einem sehr unterschiedlichen Stand und mussten daher auch jeweils eigenständig aufbereitet werden, um die Urkunden in ein gemeinsames Repositorium zu überführen. Die Bestände sind auch zum jetzigen Zeitpunkt noch nicht vereinheitlicht und haben unterschiedlich ausführliche Metadaten. Die Vereinheitlichung und Aufbereitung der Bestände sollen nach und nach über das neue Portal erfolgen.‍[15]

[15]Die Metadaten der alten kleio-Datenbank des LBA ließen sich lediglich als Textdokument exportieren und mussten in einem ersten Durchlauf um Rechtschreibfehler, Dopplungen und unnötige Leerzeichen bereinigt werden. Insbesondere die Bezeichner von Metadatenfeldern enthielten oft Rechtschreibfehler oder kamen doppelt vor (zum Beispiel »zugangsnummer« und »zugangsnummern«).‍[16] Die Fehler wurden durch Python-Scripte automatisiert bereinigt und einige Metadatenfelder – wie ›Siegel‹ – weiter aufgetrennt: Aus »1 /VON URSPR.:/1/WS« wurden die einzelnen Informationen extrahiert (ein Wachssiegel von ursprünglich einem erhalten) und in einzelne Metadatenfelder gespeichert. Dies ermöglicht spätere Filter nach beispielsweise Anzahl der verwendeten oder erhaltenen Siegel oder auch der Art des Siegels. ‍[17]

[16]Besonders behandelt wurden die Felder zu Ausstellungsort und Archiven. Diese werden im Urkundenrepositorium als eigene Entitäten gespeichert, um die Anreicherung mit Normdaten zu ermöglichen und Redundanzen in der Datenhaltung zu vermeiden (zum Entitätenmodell siehe Abschnitt 3.1). Ausstellungsorte und Archive konnten semi-automatisiert identifiziert werden und mit GND-Normdaten angereichert werden. Insgesamt konnten etwas weniger als 370 Archive und fast 1500 Orte erfasst werden (einige Bereinigungen von Dubletten sind noch nicht ganz abgeschlossen). Dasselbe Vorgehen ist auch für Personen (Aussteller*innen, Empfänger*innen und Mitsiegeler*innen) geplant, wurde jedoch aus Zeitgründen zurückgestellt. Bisher sind ca. 379 Personen im Repositorium erfasst, die zusammen etwa 37 % der Urkunden von LBA und CAO ausgestellt haben.‍[18]

[17]Die Metadaten, mit welchen die Urkunden des CAO im Marburger Urkundenrepositorium beschrieben werden, stammen aus zwei verschiedenen Quellen. Zum einen gibt es natürlich die bereits erwähnte Datenbank der Universität Trier, deren Daten maßgeblich in das Urkundenrepositorium eingeflossen sind und die Basis für den Bestand darstellen. Auch wenn das Urkundenrepositorium bisher keine Volltexte der Urkunden zur Verfügung stellt, so wurden dennoch die Kopfregesten aus der Trierer Datenbank übernommen, um eine bessere Auffindbarkeit der Stücke zu gewährleisten. Auch Informationen über Aussteller*innen, Empfänger*innen oder sonstige erwähnte Personen wurden in das Urkundenrepositorium übernommen. Eine Identifizierung von Personen und die Anreicherungen mit Normdaten ist jedoch hier deutlich schwieriger als das beim LBA der Fall ist, da es sich oft um weniger bekannte Personen handelt. Auch Archivinformationen ließen sich nicht automatisiert von den Signaturen trennen, weswegen dies nachgelagert und manuell erfolgt. Anders sieht es bei den Ausstellungsorten der Urkunden aus: Hier stellte die Datenbank nur wenig Informationen zur Verfügung, weswegen wir auf die erwähnten Daten von Carsten Becker und Oliver Schallert‍[19] zurückgegriffen haben. Die von ihnen aufgebaute Datenbank enthält detaillierte Geo-Referenzen für die Urkunden des CAO, auf deren Basis eine eindeutige Zuordnung der Stücke leicht möglich war. Daher sind über 90 % der Urkunden des CAO mit eindeutigen Ausstellungsorten verknüpft.

[18]Die automatisierte Aufbereitung und Zusammenstellung der Urkundendaten von CAO und LBA erfolgte mittels verschiedener Python-Skripte, wobei die Ergebnisse in Tabellen zwischengespeichert wurden. Für die abschließende Registrierung der Metadaten in DSpace wurde das Simple Archive Format (SAF) verwendet, wobei die Packages mittels der dafür entwickelten Python-Bibliothek dspyce erstellt wurden. dspyce ermöglicht die automatisierte Ingestierung, Bearbeitung und das Auslesen von Daten aus DSpace Repositorien mittels Python.‍[20] Die Digitalisate wurden in einem zweiten Schritt über die REST-Schnittstelle von DSpace zu den Urkunden hinzugefügt, wobei DSpace automatisiert IIIF-Manifeste für die Digitalisate bereitstellt, die dann über einen IIIF-Viewer angezeigt werden können.

3. Strukturelle Beschreibung der Datenpublikation und technische Spezifikationen

[19]Was kennzeichnet die Inhalte des neu entstanden Urkundenrepositoriums? Wie ist es aufgebaut? Zunächst werden wir die Verwendung und Konfiguration der Software DSpace in diesem Kontext diskutieren. Damit soll vor allem ein Einblick in die Planung und den Aufbau eines solchen Sammlungsrepositoriums gegeben werden.

3.1 Besonderheiten des DSpace-Repositoriums

[20]Um auf die technischen Besonderheiten des Repositoriums einzugehen, sollten hier kurz zwei Dinge vorangestellt werden: Warum haben wir uns für die Verwendung eines Repositoriums entschieden und was macht die Software DSpace aus?

[21]Zur Frage, was genau ein Repositorium überhaupt ist, gibt es bisher kaum feste Definitionen. Pascal Becker legt seiner Arbeit von 2014 folgende Definition zugrunde: »Ein Repositorium ist ein System zur sicheren Speicherung und Weitergabe digitaler Objekte und der die Objekte beschreibenden Metadaten«.‍[21] Daraus ergeben sich die folgenden Aufgaben für das Repositorium:

  1. Es speichert sicher digitale Objekte (in unserem Fall die mittelalterlichen Urkunden). Sicher bedeutet hier, dass dem Repositorium auch eine gewisse archivierende Rolle zukommt;
  2. es hält zu den digitalen Objekten (Urkunden) beschreibende Metadaten vor und
  3. es gibt Objekte und zugehörige Informationen an andere Plattformen, Personen oder Organisationen weiter.
Folgt man dieser Definition so fällt eine gewisse Ähnlichkeit zu den eingangs genannten Leitlinien für Urkundenportale von Patrick Sahle auf. Diese sind natürlich deutlich spezifischer, jedoch finden sich die Kernaufgaben eines Repositoriums (Speichern, Beschreiben, Weitergeben) alle bei Sahle wieder, was es für die Verwendung als Portal für mittelalterliche Urkunden zumindest grundsätzlich geeignet macht.

[22]Ein Grund für ein DSpace-Repositorium an der Philipps-Universität Marburg stellte auch die bereits vorhandene Erfahrung mit der Software dar: Mit bereits sieben verschiedenen DSpace-Repositorien,‍[22] die in Marburg betrieben werden, war bereits einiges an Erfahrung mit der Software vorhanden. Außerdem fügt sich das Urkundenrepositorium auf diese Weise in die vorhandene technische Umgebung ein. Das ist eine wichtige Voraussetzung für den dauerhaft zu gewährleistenden Betrieb eines Repositoriums.

[23]Ein DSpace-Repositorium setzt sich seit Version 7 aus Back- und Frontend zusammen. Das Backend ist in Java geschrieben und greift für die Datenspeicherung auf eine PostgreSQL-Datenbank zurück. Für die Indizierung wird ein Solr-Server verwendet. Das Frontend besteht aus einer Single Page Application, die auf Angular basiert.

[24]Die Verwendung eines DSpace-Repositoriums bietet uns seit Version 7 zusätzliche Möglichkeiten, um den eingangs genannten Anforderungen Sahles gerecht zu werden. Mit dieser Version wurde ein neues Konzept für die Vernetzung von Objekten innerhalb des Repositoriums ausgegeben: Die Verwendung von Entitäten. DSpace definiert Entitäten wie folgt: »In DSpace, an Entity is a special type of Item which often has Relationships to other Entities« (Lyrasis Wiki). Ein Item (also hier eine mittelalterliche Urkunde) steht also nicht für sich allein sondern kann zu anderen Objekten – wie Personen, Ausstellungsorten oder Archiven – in Verbindung gesetzt werden. Dies ermöglicht die Vermeidung von Redundanzen und die bessere Kontextualisierung der Urkunden.

Abb. 1: Entitätenmodell des Urkundenrepositoriums. [Grafik: Eike Löhden 2025]
Abb. 1: Entitätenmodell des Urkundenrepositoriums. [Grafik: Eike Löhden 2025]

[25]Für das Urkundenrepositorium haben wir uns auf die vier Entitätstypen Urkunde, Historische Person, Archiv und Ort (im Sinne einer geografischen Ortsbezeichnung) beschränkt. Abbildung 1 zeigt nahezu vollständig das zugrunde liegende Modell. Es fehlen lediglich ein paar weitere Beziehungen zwischen Historischer Person und Urkunde (wie ›ist Zeuge von‹, ›ist erwähnte Person‹), die hier aus Platzgründen weggelassen wurden. Die Verwendung sogenannter virtueller Metadaten zeigt den eigentlichen Vorteil der Verwendung eines Entitätenmodells: Statt wie gewohnt beispielsweise einen Ausstellungsort zu einer Urkunde anzugeben, wird ein bereits im Repositorium vorhandener geografischer Ort als Ausstellungsort verknüpft und das Metadatenfeld ›Ausstellungsort‹ automatisch mit dem Namen des Ortes befüllt. Es können auch weitere Informationen wie Koordinaten oder Normdaten mit an die Urkunde übergeben werden. Obwohl es für Nutzer*innen keinen Unterschied zwischen originären und virtuellen Metadaten gibt, wird vom System nur eine Referenz auf das entsprechende Metadatenfeld der verknüpften Entität eingetragen und die Daten werden nicht tatsächlich kopiert. Es können tatsächlich auch Referenzen aus mehreren Metadatenfeldern in einem zusammengeführt werden. Dieses Konzept ermöglicht es, Daten einer Entität zu ändern, ohne sämtliche verknüpfte Entitäten manuell anpassen zu müssen. Die Änderungen sind sofort bei allen Verknüpfungen sichtbar.

[26]Die Verwendung des Modells scheint vorteilhaft für ein solches Repositorium zu sein, wo liegen jedoch seine Grenzen und Nachteile? Zunächst muss festgelegt werden, was überhaupt als eigene Entitäten ausgezeichnet werden soll und was weiterhin ein klassisches Metadatenfeld bleibt. Diese Entscheidung ist nicht so trivial wie sie klingt, denn am Ende ist es oft eine Abwägung. Als Beispiel könnten hier Siegel und Literaturangaben dienen: In beiden Fällen haben wir Informationen, die bei vielen Urkunden identisch sein können (ein Werk zitiert mehrere Urkunden; viele Urkunden haben eine Goldbulle) und sich daher wiederholen. Das vielleicht wichtigste Kriterium für die Auszeichnung einer Entität ist die Frage, ob weitere allgemeine Informationen mit dem Metadatenfeld zusammenhängen, bzw. sich das Feld selbst aus verschiedenen Informationen zusammensetzt und dadurch eine Änderung die Gefahr von Anomalien‍[23] birgt. Dies ist bei Siegeln nicht der Fall: Natürlich kann es sein, dass einmal ein Rechtschreibfehler in der Bezeichnung der Art des Siegels vorliegt, aber weitere allgemeine Informationen sind in diesem Kontext nicht vorhanden, die eine zusätzliche Speicherung rechtfertigen würden. Informationen wie Anzahl, Beschaffenheit und Erhaltungszustand sind alle objektspezifisch und müssen ohnehin bei der Urkunde gespeichert werden.

[27]Bei verknüpfter Literatur sieht das schon anders aus: Das Feld setzt sich aus vielen einzelnen Informationen (Autor*in, Jahr, Titel, etc.) zusammen und diese Informationen sind nicht objektspezifisch (lediglich eine evtl. vorhandene Seitenzahl). Warum haben wir uns trotzdem bisher gegen eine Aufnahme der verknüpften Literatur als eigenen Entitätstyp entschieden? Das hat hauptsächlich zwei Gründe: Zum einen ist die verknüpfte Literatur keine Information über die Urkunde selbst und zum anderen ist das Auszeichnen von Entitäten immer mit zusätzlicher Arbeit verbunden, die im Kontext der Literatur nicht leistbar war. Schon bei den Historischen Personen ist noch viel Arbeit offen: Nur etwa die Hälfte der vorhandenen Urkunden haben verknüpfte Entitäten als Aussteller*in, bei anderen Metadatenfeldern (Empfänger*in, Mitsiegler*in etc.) gibt es fast gar keine verknüpften Entitäten. Dies muss nun sukzessive angepasst werden und kann nur in wenigen Fällen automatisiert passieren. Es lässt sich dennoch festhalten, dass das Einführen eines Entitätenmodells viele Möglichkeiten für die bessere Auszeichnung der Daten bietet, auch wenn es zunächst mit einem höheren Implementierungsaufwand verbunden ist.

[28]Ein weiteres wichtiges Merkmal von DSpace-Repositorien ist ihre OAI-PMH-Schnittstelle.‍[24] Bereits 2011 forderte Georg Vogeler in seinem Beitrag zum Verhältnis von Archiven und Diplomatik im Netz die Möglichkeit, Information wie Metadaten oder Digitalisate über eine OAI-PMH-Schnittstelle zur Verfügung zu stellen, um so den Datenaustausch und Kollaborationen zu vereinfachen.‍[25] DSpace ermöglicht mittels XSLT-Crosswalks die Transformation des internen Metadatenschemas in verschiedene Zielformate. Standardmäßig wird bereits Dublin Core und einige weitere Formate unterstützt. Das Urkundenrepositorium beinhaltet bereits eine erste Basistransformation zu LIDO und METS/MODS. Auch eine Transformation der Metadaten für CEI bzw. TEI ist in Entwicklung, um die Urkunden einfacher für übergeordnete Portale, wie Monasterium.net, zur Verfügung zu stellen. Über die OAI-PMH-Schnittstelle soll in Zukunft auch die Langzeitarchivierung der Daten sichergestellt werden. Im Kontext des Lavah-Projektes wird eine zentrale Lösung über den hebis-Verbund angestrebt.

3.2 Ein kurzer Überblick über das Marburger Urkundenrepositorium in Zahlen

[29]Bereits 1989 schrieb Frank Bischoff den erwähnten Beitrag über das LBA in dem er auch einige statistische Auswertungen vorstellte.‍[26] Eine Analyse in diesem Umfang würde den Rahmen dieses Beitrages sprengen, dennoch möchten wir versuchen, einen kurzen Überblick in Zahlen über die Urkunden des Marburger Urkundenrepositoriums zu geben.‍[27]

[30]75,15 % der Urkunden des Urkundenrepositoriums stammen aus Beständen des LBA, das CAO steuerte 4.622 Stücke bei. Zwar sind die Originale in Archiven über ganz Europa hinweg verteilt, jedoch sind die meisten in deutschen oder schweizer Archiven zu finden. Den mit Abstand größten Anteil beherbergt das Münchner Staatsarchiv mit über 2.000 Stücken, aber auch in Marburg werden mehr als 830 Urkunden aufbewahrt. Die 15 häufigsten Archive beinhalten bereits über 50 % der eindeutig zugewiesenen Urkunden. Es kommen jedoch vermutlich noch einige Urkunden hinzu, denn die eindeutige Zuweisung der Archive bei den Urkunden des CAO ist zwar weit fortgeschritten, jedoch noch nicht komplett abgeschlossen.

[31]Die geografischen Angaben zu den Ausstellungsorten der Urkunden des LBA sind, wie bereits erwähnt, nur wenig repräsentativ, da bisher nur ein kleiner Bestand diesbezüglich erschlossen wurde. Anders sieht es bei den Stücken des CAO aus. Hier lässt sich ein klarer Schwerpunkt im süddeutschen Raum erkennen. Ein großer Anteil der Urkunden scheint im Süden Baden-Württembergs und um Zürich und Basel entstanden zu sein. Auch in Österreich scheinen viele Urkunden ausgestellt worden zu sein. Aus Norddeutschland sind nur einige wenige Urkunden im CAO überliefert.‍[28] Über die beteiligten Personen im Urkundenrepositorium lassen sich bisher leider nur wenige generelle Aussagen tätigen, da insbesondere der Bestand des CAO diesbezüglich nur wenig erschlossen ist. Im Kontext des LBA lassen sich über ausstellende oder empfangende Personen lediglich Aussagen bezüglich des Status treffen, bzw. ob sie geistlichen oder weltlichen Gruppen angehörten (vgl. Tabelle 1). Wie bereits erwähnt wurden bereits 379 Personen als Entitäten ausgezeichnet und mit Normdaten angereichert, die Anzahl ist jedoch im Vergleich zu dem Gesamtbestand noch relativ gering. Ein großer Teil des LBA-Bestandes sind Herrscher- und Papsturkunden, wobei jedoch Empfänger*innen hauptsächlich weltliche wie Grafen oder Gräfinnen, Städte, Bürger*innen und Zünfte waren. Im geistlichen Kontext gingen die meisten Urkunden an Klöster, Stifts- und andere Kirchen, Spitäler, Orden sowie Ordensangehörige.

Abb. 2: Verteilung geistlicher Empfänger*innen. [Grafik: Eike Löhden 2025]
Abb. 2: Verteilung geistlicher Empfänger*innen. [Grafik: Eike Löhden 2025]
Abb. 3: Verteilung weltlicher Empfänger*innen. [Grafik: Eike Löhden 2025]
Abb. 3: Verteilung weltlicher Empfänger*innen. [Grafik: Eike Löhden 2025]

4. Nutzungshorizonte und Grenzen

[32]Nicht allein quantitative und computergestützte Auswertungen sind im Urkundenrepositorium einfacher geworden, sondern auch die klassische Diplomatik soll nun einfacher die Digitalisate der Urkunden einsehen können. Zum einen werden alle Bilder als TIFF-Dateien in höchster Auflösung unter Creative-Commons-Lizenz zur Verfügung gestellt und zum anderen ermöglicht die Einbindung eines IIIF-Viewers eine erste, genauere Untersuchung bereits im Browser. Dieser ermöglicht überdies den Export der Bilddateien in verschieden Größen im JPG-Format.

[33]Durch verschiedene Suchfiltermöglichkeiten und eine erweiterte Suche bereits auf der Startseite ist auch das Finden von Urkunden einfacher geworden. Insbesondere die Stücke des CAO können durch Ähnlichkeitssuchen trotz unterschiedlicher Schreibweisen schnell gefunden werden. Um die zitierten Links des LBA zu erhalten und einfachere Referenzierung der Stücke zu ermöglichen, stehen zusätzliche URIs zur Verfügung, die sich immer aus dem folgenden Schema zusammensetzen: https://urkundenrepositorium.uni-marburg.de/handle/[lba/cao]/[zugangsnummer/urkundennummer]. Ist also Urkunden- bzw. Zugangsnummer bereits bekannt, so kann direkt das entsprechende Stück referenziert werden. Wenn weitere Bereinigungsschritte abgeschlossen sind, ist auch die Vergabe von DOIs zur besseren Zitierbarkeit geplant.

[34]Möchte man jedoch große Teile des Bestandes oder sogar den Gesamtbestand auswerten, bietet es sich an, die Daten automatisiert auszulesen. Dafür stehen nun verschiedene Schnittstellen zur Verfügung. Zum einen gibt es natürlich die bereits erwähnte OAI-PMH-Schnittstelle, über die Metadaten und Digitalisate in verschiedenen Formaten zur Verfügung gestellt werden. In einigen Programmiersprachen stehen auch bereits entsprechende Bibliotheken zum Auslesen der Schnittstelle zur Verfügung.‍[29] Zum anderen stellt DSpace auch eine eigene REST-API zur Verfügung, über die sämtliche Daten im internen Metadatenschema ausgelesen werden können.‍[30] Um die Arbeit via REST-Schnittstelle zu unterstützen, haben wir die bereits erwähnte Python-Bibliothek dspyce entwickelt, mittels derer man auch parallelisiert Daten von DSpace-Repositorien auslesen kann.‍[31] In Tabelle 2 findet sich eine Übersicht der dabei möglichen Metadatenfelder und eine Beschreibung ihrer Inhalte.

[35]Was sind jedoch die Grenzen der verschiedenen Nutzungsszenarien? Viele Probleme und Grenzen in der Arbeit mit dem Marburger Urkundenrepositorium ergeben sich aus noch fehlenden Vereinheitlichungen und Datenbereinigungen. Wie bereits in Abschnitt 3.2 geschildert, haben nur sehr wenige Stücke des LBA angegebene Archivorte und Personen sind im Kontext des CAO kaum identifiziert. Repräsentative Aussagen über den Bestand sind daher oft schwierig. Hier ist noch einiges an Arbeit zu leisten. Schließlich sind die Archivsignaturen der Urkunden des LBA oft nicht mehr aktuell und teilweise auch unvollständig.

[36]Durch das deutlich einfachere computergestützte Auslesen und Verändern des Bestandes, könnten sich jedoch hier Möglichkeiten ergeben, im Rahmen von Forschungsprojekten Daten zu aktualisieren. Die einfachere Nutzer*innenverwaltung von DSpace kann die dazu erforderlichen Zugriffsrechte auf Teilbestände ermöglichen.

[37]Mit der Entwicklung des Marburger Urkundenrepositoriums ist die Arbeit an den Urkundendaten daher keinesfalls abgeschlossen, sondern ist im Gegenteil erst wieder möglich geworden. Datenbereinigungen und Aufarbeitungen sind notwendig, um den zu Beginn erwähnten Anforderungen an eine moderne Plattform für mittelalterliche Urkunden gerecht zu werden. Nur so können die beiden großen Bestände von LBA und CAO ihr Potential entfalten und eine verlässliche datengestützte Forschung überhaupt erst ermöglichen.

Anhang

Kategorie Metadatenfeld Beschreibung
administrativ dc.coverage.temporal Datierungszeitraum im ISO-Format
administrativ dc.date.accessioned Aufnahmezeitpunkt im Urkundenrepositorium im ISO-Format
administrativ dc.date.submitted Aufnahme der Urkunde in das LBA
administrativ dc.date.updated Letztes Änderungsdatum der Metadaten (bei LBA-Urkunden)
administrativ dspace.entity.type Entitätstyp
administrativ dspace.iiif.enabled Definiert Nutzung des IIIF-Viewers
administrativ local.personal-predicate JSON-Metadatenfeld mit Informationen über Rang, Typ und Name einer Person (bei Urkunden des LBA)
administrativ relation.istUrkundeAusgestelltAnOrt UUID verknüpfter Orte
administrativ relation.istUrkundeAusgestelltAnOrt.latestForDiscovery UUID verknüpfter Orte
administrativ relation.istUrkundeDesAusstellers UUID verknüpfter Aussteller*innen
administrativ relation.istUrkundeDesAusstellers.latestForDiscovery UUID verknüpfter Aussteller*innen
administrativ relation.istUrkundeDesEmpfaengers UUID verknüpfter Empfänger*innen
administrativ relation.istUrkundeDesEmpfaengers.latestForDiscovery UUID verknüpfter Empfänger*innen
administrativ relation.istUrkundeImBesitzVon UUID verknüpfter Archive
administrativ relation.istUrkundeImBesitzVon.latestForDiscovery UUID verknüpfter Archive
administrativ relation.istUrkundeImVorbesitzVon UUID verknüpfter ehemaliger Archive
administrativ relation.istUrkundeImVorbesitzVon.latestForDiscovery UUID verknüpfter ehemaliger Archive
beschreibend dc.contributor.author Aussteller*in einer Urkunde
beschreibend dc.date.created Ausstellungsdatum einer Urkunde im ISO-Format
beschreibend dc.description Bemerkungen
beschreibend dc.description.abstract Kopfregest bei den Urkunden des CAO
beschreibend dc.description.sponsorship Förderinformationen (Name der fördernden Institution sowie ein Link zu Logo)
beschreibend dc.format.extent Größeninformation zu einer Urkunde (Freitext)
beschreibend dc.format.mimetype Objekttyp (bei den Urkunden immer ›image‹)
beschreibend dc.publisher Sammlung der Urkunde (LBA / CAO)
beschreibend dc.rights Rechteinformationen (Text)
beschreibend dc.rights.uri Rechteinformationen (URI)
beschreibend dc.title Automatisch generierter Titel einer Urkunde
beschreibend dcterms.references Links zu anderen Verzeichnissen (z. B. Regesta Imperii (ri) o. a.); JSON-Feld {<system>: <link>}
beschreibend local.archiv Altes Feld für den Archivnamen (wird sukzessive durch local.archiv.name ersetzt)
beschreibend local.archiv.gnd GND-ID eines Archives
beschreibend local.archiv.name Name eines Archives
beschreibend local.archiv.place Ort eines Archives
beschreibend local.archiv.signatur Signatur einer Urkunde
beschreibend local.date.ausstellungsdatum Ausstellungsdatum einer Urkunde im Freitext
beschreibend local.date.datierung Datierung einer Urkunde (von-bis) im Freitext
beschreibend local.description.edition Link zu einer Edition
beschreibend local.format.basismaterial Negativnummern einer Urkunde des LBA
beschreibend local.format.height Höhe der Urkunde
beschreibend local.format.language Sprache einer Urkunde
beschreibend local.format.width Breite der Urkunde
beschreibend local.geo.coordinates Koordinaten eines Ortes
beschreibend local.geo.gnd GND-ID eines Ortes
beschreibend local.geo.place Name eines Ortes
beschreibend local.id.aussteller-gnd GND-ID eines Austellers
beschreibend local.id.empfaenger-gnd GND-ID eines Empfängers
beschreibend local.literatur Verweise auf Literatur zu einer Urkunde
beschreibend local.person.empfaenger Empfänger*in einer Urkunde
beschreibend local.person.mitsiegler Siegler*in einer Urkunde
beschreibend local.person.other Weitere mit einer Urkunde verknüpfte Personen
beschreibend local.person.zeuge Zeug*in einer Urkunde
beschreibend local.personal-predicate.rank Der Rang einer Person, siehe Tabelle 1.
beschreibend local.personal-predicate.type Der Typ einer Person (Weltlich / Geistlich), siehe Tabelle 1.
beschreibend local.seal Siegeltyp (GB, WS, BB)
beschreibend local.seal.erh Anzahl erhaltener Siegel
beschreibend local.seal.urspr Anzahl urprünglicher Sigel
beschreibend local.status.ueberlieferung Überlieferungsart einer Urkunde (O-Original, F-Fälschung, I-Insert, Kp-Kopie)
identifier dc.identifier Zugangsnummer (LBA), Urkundennummer (CAO)
identifier dc.identifier.other Interne Identifikationsnummer
identifier dc.identifier.uri Persistente URI zu der Objektseite
identifier local.archiv.id Interne ID eines Archives
Tab. 2: Übersichtstabelle über die im Urkundenrepositorium verwendeten Metadatenfelder.


Fußnoten


Bibliografische Angaben

  • Hendrik Baumbach / Andreas Meyer: Lichtbildarchiv älterer Originalurkunden. In: Christoph Otterbeck / Joachim Schachtner (Hg.): Schätze der Wissenschaft. Die Sammlungen, Museen und Archive der Philipps-Universität Marburg. Marburg 2014, S. 200–207. [Nachweis im GVK]
  • Carsten Becker / Oliver Schallert: Urkunden als Quelle (schreib-)sprachlandschaftlicher Variation: Bestandsaufnahmen und Perspektiven. State of the Art and Future Perspectives. In: Zeitschrift für Deutsches Altertum und Deutsche Literatur 151 (2022), H. 2, S. 143–178. DOI: 10.3813/zfda-2022-0005
  • Pascal-Nicolas Becker: Repositorien und das Semantic Web – Repositorieninhalte als Linked Data bereitstellen. Diplomarbeit, Freie Universität Berlin. 2014. DOI: 10.14279/DEPOSITONCE-5015
  • Frank Michael Bischoff: Die Datenbank des Marburger »Lichtbildarchivs älterer Originalurkunden bis 1250«. Systembeschreibung und Versuch einer vorläufigen statistischen Auswertung. In: Peter Rück (Hg.): Fotografische Sammlungen mittelalterlicher Urkunden in Europa: Geschichte, Umfang, Aufbau und Verzeichnungsmethoden der wichtigsten Urkundenfotosammlungen mit Beiträgen zur EDV-Erfassung von Urkunden und Fotodokumenten (= Historische Hilfswissenschaften, 1). Sigmaringen 1989, S. 25–70. [Nachweis im GVK]
  • Lisa Dieckmann: Bilder, Metadaten und unterschiedliche Quellen: Über Herausforderungen bei der Zusammenführung von heterogenen Objekten des kulturellen Erbes unter besonderer Berücksichtigung illuminierter Urkunden. In: Gabriele Bartz / Markus Gneiß (Hg.): Illuminierte Urkunden. Beiträge aus Diplomatik Kunstgeschichte und Digital Humanities / Illuminated Charters. Essays from Diplomatic Art History and Digital Humanities (= Beihefte zum Archiv für Diplomatik, Schriftgeschichte, Siegel- und Wappenkunde, 16). Köln 2019, S. 53–72. DOI: 10.7788/9783412512385.53
  • Heinz-Alexander Fütterer: oaipmh-scythe. In: GitHub. Version 0.13.0 vom 07.05.2024. https://github.com/afuetterer/oaipmh-scythe
  • Andreas Gniffke / Andrea Rapp: ›Corpus der altdeutschen Originalurkunden bis zum Jahr 1300‹. Ein Retrodigitalisierungsprojekt. In: Historisches Forum 7 (2005), H. 1, S. 391–403. DOI: 10.18452/17819
  • Diether Haacke: Das Corpus der altdeutschen Originalurkunden. In: Beiträge zur Geschichte der deutschen Sprache und Literatur 77 (1955), S. 375–392. DOI: 10.1515/bgsl.1955.1955.77.375/html
  • Alfons Kemper / André Eickler: Datenbanksysteme. Eine Einführung. 10. Auflage. Berlin 2015. [Nachweis im GVK]
  • Eike Martin Löhden: dspyce. In: GitHub. Version 0.0.6 vom 28.11.2024. https://github.com/dspace-unimr/dspyce
  • Eike Martin Löhden: Das Marburger Urkundenrepositorium. Eine exemplarische Analyse der Urkunden. In: data_UMR. Eingereicht am 13.02.2025. DOI: 10.17192/fdr/242
  • Alexander Maul: »Schwarze Kunst mit Licht gezeichnet« – Das Marburger Lichtbildarchiv in Geschichte, Gegenwart und Zukunft. In: Patrick Reinard / Leif Scheuermann (Hg.): Geschichtswissenschaften in Pandemiezeiten. Beiträge zur digitalen Wissensvermittlung und Public History (= Abhandlungen der Arbeitsgemeinschaft Geschichte und EDV (AAGE), 4). Gutenberg / Nahe 2022, S. 365–403. [Nachweis im GVK]
  • Alexander Maul / Diana Müller / Eike Löhden: Das ›Marburger Urkundenrepositorium‹. Eine Plattform für digitale Urkundenbilder vereinigt das Lichtbildarchiv älterer Originalurkunden und das Corpus altdeutscher Originalurkunden. In: Maniculae 5 (2024), S. 34–42. DOI: 10.21248/maniculae.60
  • Patrick Sahle: Vorüberlegungen zur Portalbildung in der Urkundenforschung. In: Georg Vogeler (Hg.): Digitale Diplomatik. Neue Technologien in der historischen Arbeit mit Urkunden (= Beihefte zum Archiv für Diplomatik, Schriftgeschichte, Siegel- und Wappenkunde, 12). Köln 2009, S. 325–341. [Nachweis im GVK]
  • Georg Vogeler: Das Verhältnis von Archiven und Diplomatik im Netz. Von der archivischen zur kollaborativen Erschließung. In: Joachim Kemper / Georg Vogeler (Hg.): Digitale Urkundenpräsentationen. Beiträge zum Workshop in München, 16. Juni 2010 (= Schriften des Instituts für Dokumentologie und Editorik, 6). Norderstedt 2011, S. 61–82. URN: urn:nbn:de:hbz:38-45583

Abbildungs- und Tabellenverzeichnis

  • Tab. 1: Übersichtstabelle zur Einteilung von Personen im LBA. [Tabelle übernommen von: Bischoff 1989, S. 32]
  • Abb. 1: Entitätenmodell des Urkundenrepositoriums. [Grafik: Eike Löhden 2025]
  • Abb. 2: Verteilung geistlicher Empfänger*innen. [Grafik: Eike Löhden 2025]
  • Abb. 3: Verteilung weltlicher Empfänger*innen. [Grafik: Eike Löhden 2025]
  • Tab. 2: Übersichtstabelle über die im Urkundenrepositorium verwendeten Metadatenfelder.