Abstract
Vorgestellt wird ein Annotationssystem für narratologische Phänomene wie Raum, Zeit, Fokalisierung, Redewiedergabe, Erzählerrede, Figurenbezug der Figuren- / Erzählerrede, Wertungen, Negation, uneigentliche Rede, Ambiguität. Annotationsrichtlinien werden entwickelt, damit verschiedene Personen beim gleichen Text zu homogenen Ergebnissen kommen (Inter-Annotator-Agreement). Dabei werden narratologische Modelle überprüft und präzisiert. Annotiert werden etwa 100 deutsche Kurzerzählungen. Das Korpus ermöglicht eine Nachnutzbarkeit in vielfältiger Weise. Es erlaubt systematische Zugriffe auf gleichartig annotierte Korpussegmente und damit quantifizierende Beiträge zur historischen Narratologie, zur Kulturwissenschaft und zur Gattungsgeschichte.
The article presents an annotation system for narratological phenomena such as space, time, focalisation, reported speech, narrator's speech, the relationship between the speech of a character/of the narrator and that of a certain character, evaluative remarks, negation, figurative speech, and ambiguity. Guidelines for annotation are being developed in order to enable different people to achieve consistent results when working with the same text (inter-annotator agreement). In doing so, narratological models will be systematically reassessed and refined. The aim of this project is therefore to annotate approximately 100 short German-language narratives. The corpus will be reusable for a variety of purposes. It permits systematic access to corpus segments annotated in the same way and supports quantifiable contributions in the fields of historical narratology, cultural studies and the history of literary genres.
- 1. Einleitung
- 2. Das Annotationssystem
- 2.1 Figur am Fokusort: <FigurFokusort>
- 2.2 Lokale Bewegungen: <BewegungLokal>
- 2.3 Abweichungen vom linearen Zeitverlauf <Zeit>
- 2.4 Fokalisierung <Fokalisiert>
- 2.5 Figurenrede und Gedankenrede: <Redewiedergabe>
- 2.6 Erzählerrede: <Erzählerrede>
- 2.7 Bezug von <Redewiedergabe> oder <Erzählerrede> auf Figur: <Figurenbezug>
- 2.8 Evaluative Äußerungen: <Wertung>
- 2.9 Negation des Aussagegehalts: <Negation>
- 2.10 Uneigentliche Rede: <UneigentlicheRede>
- 2.11 Allgemeine Attribute: @Regel, @Datum, @Bearbeiter, @comment und Metadaten
- 2.12 Ambiguität und unsichere Einstufungen: <certainty>, @cert, @cert_comment
- 3. Homogenität und Ambivalenzproblematik
- 4. Annotationsprobleme und exemplarische Auswertung
- 4.1 Abgrenzungsprobleme
- 4.2 Perspektivenabhängigkeit
- 5. Möglichkeiten der quantitativen Auswertung
- 5.1 Redewiedergabe
- 5.2 Fokalisierung
- 5.3 Figurenbezug
- 5.4 Negation innerhalb von Erzähler- / Figurenrede
- 5.5 Lexikalische Vielfalt: MTLD von Erzähler- / Figurenrede
- 6. Soziale Netzwerkanalyse
- 7. Ausblick: Akkurate Daten und vielfältige Analysen
- Bibliographische Angaben
- Abbildungslegenden und -nachweise
1. Einleitung
Quantitative Analyseverfahren[1] haben in der Regel vollständige Texte oder Abschnitte zum Gegenstand. Die Möglichkeiten für automatische Analysen enden jedoch dort, wo spezifische Textebenen in den Blick zu nehmen wären. Computer können zwar nach Wörtern wie »Treue« suchen. Nicht automatisch erfassbar jedoch ist, ob diese Wörter in Figurenrede oder Erzählerrede vorkommen, ob sie durch Negationswörter verneint werden und auf welche Figuren sie bezogen sind: etwa nur auf bestimmte oder beispielsweise nur auf weibliche Figuren? Wer spricht? Der Erzähler oder eine Figur? Über wen wird gesprochen? Wie wird gesprochen? Es ist ein erheblicher Unterschied, ob eine Figur öffentlich wahrnehmbar etwa über ihre Treue spricht oder die Figur lediglich darüber nachdenkt. Nur annotierte Texte können solche Informationen bereitstellen.
Ein groß dimensioniertes Roman-Projekt haben Jannidis, Lauer und Rapp vorgeschlagen – für Fragen, wie: »Wer hat, wann und wo zum ersten Mal die Form der erlebten Rede eingesetzt, wer die episodische Reihung zu psychologischer Figurenzeichnung verdichtet?«[2] Während bei einem solchen Projekt mit großem Korpus eine Beschränkung auf wenige Kategorien wie Figuren- und Erzählerrede ein Gebot der Ökonomie ist, gibt es bei einer Begrenzung auf kürzere Texte andere Optionen.
Die »hohe Präzision der strukturalistischen Narratologie«[3] scheint computerphilologische Zugriffe zu begünstigen. Dennoch sind digitale Studien im Feld der Narratologie bislang relativ selten:[4] Überwiegend stehen bei quantitativen Studien lexikalische Textmerkmale (etwa bei Burrows’ Delta) im Mittelpunkt wie auch bei Analysen zu Funktionswörtern, Hapax Legomena, Kollokationen und n-Grammen. Der Aufwand, eigens für eine spezifische Fragestellung und Methode ein Korpus manuell aufzubereiten, kann oft aus ökonomischen Gründen nicht geleistet werden. Studien, die auf narratologischen Unterscheidungen wie Figurenrede / Erzählerrede beruhen, haben jedoch bislang gerade bei älteren Sprachstufen eine manuelle Korpusaufbereitung zur Voraussetzung.
Ich beabsichtige, ein Korpus aus Kurzerzählungen vom mittelhochdeutschen Märe bis zur Novelle des 19. Jahrhunderts narratologisch zu annotieren[5] – jedoch nicht mit Blick auf eine einzelne Fragestellung und auf eine konkrete Analysemethode, vielmehr wird hier eine generische Konzeption verfolgt, bei der Nachnutzbarkeit im Zentrum steht: Die Annotation erfolgt im Sinne einer Grundlagenarbeit für multiple Fragestellungen und multiple Methoden, die vielfältige Anschlussforschungen ermöglichen. Das Korpus erlaubt die Bearbeitung von Fragestellungen, die derzeit noch nicht absehbar sind, zudem können die Korpusdaten auch neue Fragestellungen generieren. Damit werden etwa Untersuchungen zur Kontinuität von Märe und Novelle möglich, die nicht auf Definitionen beruhen, sondern auf Informationen, die aus den annotierten Texten selbst extrahiert werden können.
Während es bei automatisierten Zugriffen etwa im Rahmen von »Big-Data«-Studien bei statistischen Analyseverfahren bleibt, wird hier ein spezifisch literaturwissenschaftlicher Ansatz verfolgt, bei dem narratologische Kategorien[6] erstmals in dieser Breite in einem Korpus abgebildet werden. Die Analyse der Möglichkeiten und Probleme bei der Entwicklung eines generischen narratologischen Annotationssystems, das nicht auf bestimmte Fragestellungen und Methoden begrenzt ist, ist selbst Forschungsgegenstand. Die Entwicklung von Tagset und Regelwerk erlaubt einerseits eine ökonomische Erweiterung oder Fortsetzung des Projektes. Andererseits soll es möglich sein, das Annotationssystem auch für eine Anwendung bei anderen Gattungen und Literaturen weiterzuentwickeln, so dass im Kontext der Computational Narratology eine hohe Anschlussfähigkeit und Nachnutzbarkeit besteht. Die Aufnahme des Tagset in die TEI-Richtlinien wird angestrebt, sowie das Annotationssystem fertiggestellt ist; bis dahin können die Elemente in eine ODD-Datei integriert werden. Die Entwicklung von Tagset und Annotationsrichtlinien ist nicht nur eine wesentliche Voraussetzung für den Auszeichnungsvorgang; durch die Annotationsrichtlinien wird auch transparent, auf welchen Voraussetzungen die Korpusauszeichnung beruht.
In diesem Beitrag wird ein Annotationssystem vorgestellt und die Problematik einer narratologischen Annotation diskutiert. Neben der grundlegenden Ambiguitätsproblematik bei literarischen Texten werden auch konkrete Probleme bei der Auszeichnung einzelner Textpassagen vorgestellt; als Beispieltexte dienen dabei zwei mittelhochdeutsche Mären mit vergleichbarem Plot (Sperber und Häslein); erste Auswertungen können andeuten, welche Auswertungsoptionen auf dieser Basis möglich werden.
2. Das Annotationssystem
2.1 Figur am Fokusort: <FigurFokusort>
<FigurFokusort>[7] | Benennt die Figuren, die sich an dem Ort aufhalten, von dem erzählt wird |
Attribute |
@Bezeichnung: Name bzw. Bezeichnung der Figuren @Figurengruppe [fakultativ]: Gruppe, bspw. Gralsgesellschaft, Burgvolk @level [fakultativ falls »1«]: Grad der Verschachtelung, falls ein Bericht über ein Geschehen an einem anderen Ort in eine Figurenrede / Gedankenrede eingebettet ist[8] @non-fact (»true«) [fakultativ]: Falls eine Figur oder ein Erzähler auf Figuren an anderem Ort Bezug nimmt, die sich nicht faktisch dort befinden |
Beispiel | <FigurFokusort Bezeichnung="Rit Toc" Figurengruppe="">Nû lac ein juncvrouwelîn, edel, schoene unde fîn, […] </FigurFokusort> (Häslein 61f.) |
Hier wird die Präsenz von Figuren am Ort des Erzählfokus annotiert.[9] Voraussetzung ist eine konkrete Verortung der Figuren in Raum und Zeit.[10]
2.2 Lokale Bewegungen: <BewegungLokal>
<BewegungLokal> erlaubt etwa Auswertungen bezüglich Transgressionen und statischen bzw. dynamischen Figuren.
<BewegungLokal> | Lokale Bewegungen: Wechsel des Erzählortes; Fortbewegung, die einer Figur folgt |
Attribute |
@Typ ( Fokuswechsel | Fortbewegung ) @Bezeichnung [fakultativ]: Bei Fortbewegung von Figuren @level [fakultativ]: Falls auf die Bewegung innerhalb von Redewiedergabe referiert wird @non-fact [fakultativ]: Falls eine Figur auf Bewegungen von anderen Figuren Bezug nimmt, die faktisch nicht stattfinden |
Beispiel | <BewegungLokal Typ="Fortbewegung" Bezeichnung="Rit">alsus reit er alzehant […].</BewegungLokal> (Häslein 56) |
Annotiert werden horizontale oder vertikale Figurenbewegungen im Raum sowie der Wechsel des Erzählortes in der erzählten Welt. Relevant kann dieses Element etwa bei raumtheoretischen Fragestellungen (Transgression; statische vs. dynamische Figuren) werden.
2.3 Abweichungen vom linearen Zeitverlauf <Zeit>
<Zeit> | Abweichungen vom linearen Zeitverlauf |
Attribute |
@Typ ( Prolepse_Beginn | Prolepse_Ende | Analepse_Beginn | Analepse_Ende | Ellipse | Pause ) @level [fakultativ]: Bei Alternationen, die in Redewiedergabe eingebettet sind |
Beispiel | <Zeit Typ="Pause">Tribe ich die zît vergebene hin, […] </Zeit> (Häslein 1)[11] |
Hier werden Basismerkmale annotiert, die Genette prominent gemacht hat.[12] Aus Gründen der Ökonomie wird auf eine komplexe Modellierung wie bei Meister und Mani verzichtet.[13]
2.4 Fokalisierung <Fokalisiert>
<Fokalisiert> | Welche Figur ist intern oder extern fokalisiert |
Attribute |
@Typ: ( intern | extern | Paralipse | Paralepse ) @Bezeichnung |
Beispiel |
<Fokalisiert Bezeichnung="Toc" Typ="intern">und dô diu juncvrouwe zart der sumerzîte ginret wart, […] daz lie diu juncvrouwe âne haz.</Fokalisiert> (Häslein 160–166) |
Da selbst in narratologische Darstellungen mitunter metaphorische Begriffe wie »Mitsicht«[14] eingehen, muss das Phänomen genauer modelliert werden. Grundlage für die Entwicklung der Annotationsrichtlinien sind die auf Genette beruhenden Konzepte bei Hübner und Dimpel.[15] Hier im Beispiel wird eine interne Fokalisierung durch innere Figurenrede (ginret) konstituiert.[16]
2.5 Figurenrede und Gedankenrede: <Redewiedergabe>
<Redewiedergabe> | Figurenrede oder Gedankenrede |
Attribute |
@Typ: ( »Direkte Rede« | »Indirekte/erzählte Rede« | »Erlebte Rede« »Direkte Gedankenrede« | »Bewusstseinsdarstellung« | »Erlebte Gedankenrede«) @Bezeichnung: Name bzw. Bezeichnung der Figur @level [fakultativ]: Grad der Verschachtelung, wenn eine Redewiedergabe in eine andere Redewiedergabe eingebettet ist[17] @non-fact [fakultativ]: Nicht-faktische Wiedergaben[18] @narr [fakultativ]: Grenzbereich zwischen Sprache und Handlung[19] @border [fakultativ]: Grenzfälle von Rede (beten, zählen, singen etc.)[20] |
Kommentar | Bei Wechsel der Erzählebene (Binnenerzählungen) weiterhin <embedded>[21] |
Beispiel | <Redewiedergabe Typ="Bewusstseinsdarstellung" Bezeichnung="Rit">des vröute sich der ritter dô</Redewiedergabe> (Häslein 39)[22] |
Hier wird das Auszeichnungsmodell von Brunner mit einigen Vereinfachungen übernommen. Ob für die Projektziele die gleiche Auszeichnungstiefe mit Blick auf das Korpus notwendig und pragmatisch zielführend ist oder ob hier zusammenfassende Kategorien hinreichend sind, muss bei der Entwicklung der Annotationsrichtlinien laufend geprüft werden.[23]
2.6 Erzählerrede: <Erzählerrede>
<Erzählerrede> | Art der Erzählerrede (Modellierung Nünning) |
Attribute |
@Typ: (»Bericht Figurenaktivität« | »Sonstiger Bericht« | »Explanative Erzähleräußerung« | »Erzählerreflexion über erzählte Welt« | »Erzählerreflexion allgemein« | »Erzählerreflexion metanarrativ« ) @Bezeichnung: Name bzw. Bezeichnung der Erzählinstanz @non-fact [fakultativ]: Nicht-faktische Erzählerrede |
Beispiel | <Erzaehlerrede Typ="Bericht Figurenaktivität" Bezeichnung="Rit">alsus reit er alzehant / gegen eime dorfe hin,</Erzaehlerrede> (Häslein 56f.) |
Die narrative Erzählerrede jenseits von Redewiedergabe wird differenziert in ›Figurenaktivität‹ und ›Sonstiger Bericht‹. Die weitere Taxonomie folgt der Unterscheidung von Nünning;[24] zudem lässt sich hier auf die Annotationsrichtlinien von Gius / Jacke aufbauen.[25]
2.7 Bezug von <Redewiedergabe> oder
<Erzählerrede> auf Figur: <Figurenbezug>
<Figurenbezug> | Zuordnung des Inhalts einer <Redewiedergabe> oder <Erzählerrede> auf eine Figur. Beispiel: Auf welche Figur bezieht sich eine explanative oder evaluative Aussage? |
Attribute |
@Unmittelbar: Name / Bezeichnung der Figur bei unmittelbarem Bezug @Mittelbar: Name / Bezeichnung der Figur bei mittelbarem Bezug @Vorläufig_implizit: Name / Bezeichnung bei Bezug, der auf Kontiguität, Äquivalenz etc. beruht, der jedoch später explizit oder stark offensichtlich wird @Implizit: Name / Bezeichnung bei Bezug, der auf Kontiguität, Äquivalenz etc. beruht @non-fact [fakultativ]: Nicht-faktischer Bezug |
Beispiel | <Figurenbezug Unmittelbar="Mut Toc" Mittelbar="Rit">des wart ir gelwez hâr zerrouft; / darnâch ir liehten wangen / begunde diu muoter zwangen […]. </Figurenbezug> (Häslein 198–200)[26] |
Hier geht es nicht um Urheber oder Art einer Äußerung, sondern um den Gegenstand: Figuren oder Erzähler können über eine andere Figur sprechen oder zu einer Figur. Auch eine Figurenhandlung kann auf eine Figur bezogen sein. Notiert wird, auf welche Figur Bezug genommen wird. Wenn etwa alles Wollen und Streben des Protagonisten darauf ausgerichtet ist, die Liebe einer Dame zu erwerben, so ist ein solcher Text häufig aus der Perspektive des Protagonisten erzählt. Häufig hat die Dame selbst nur wenig Anteil an Erzähler- und Figurenrede, obwohl es stets um sie geht. Solche Daten sind bei kulturwissenschaftlichen Analysen interessant: Die Frage »Über wen wird gesprochen?« kann hier wichtiger werden als Genettes Frage »Wer spricht?«. Neben unmittelbaren Bezügen gibt es auch mittelbare: Figuren wenden sich mitunter direkt an andere Figuren (Brautvater), um indirekt das eigentliche Ziel (Gewinnung der Braut) zu erreichen.
2.8 Evaluative Äußerungen: <Wertung>
<Wertung> | Erzähler- oder Figurenrede mit evaluativer Äußerung zu einer Figur |
Attribute |
@Wertende: Bezeichnung des Erzählers oder der evaluierenden Figur @Gewertete: Bezeichnung @Typ (positiv explizit | positiv implizit | negativ explizit | negativ implizit) @level, @non-fact [fakultativ; s.o.]: |
Beispiel | dô wart dem ritter offenbâr / einer juncvrouwen lîp / gelobet vür ein êlich wîp, / <Wertung Wertende="Erzähler" Gewertete="Verlobte" Typ="positiv explizit">diu was schoene unde kluoc,</Wertung> (Häslein 322–325) |
Erfasst werden explizite und implizite Bewertungshandlungen nach Winko.[27]
2.9 Negation des Aussagegehalts: <Negation>
<Negation> | Negation des Aussagegehalts |
Attribute | @Typ ( »einfach« | »doppelt positiv« | »doppelt negativ« | »dreifach« ) |
Beispiel | <Negation Typ="doppelt negativ">ich engelebete nie sô lieben tac.</Negation> (Häslein 82) |
Der Wert »doppelt negativ« berücksichtigt, dass im Mittelhochdeutschen eine Negation mit zwei Negationswörtern realisiert werden kann. Es kann in quantitativen Studien von Interesse sein, ob ein Wort wie »Treue« in Negation steht.
2.10 Uneigentliche Rede: <UneigentlicheRede>
<UneigentlicheRede> | Abweichung vom literalen Sinn (metaphorische, ironische Rede etc.) |
Attribute | @Bezeichnung |
Beispiel | <UneigentlicheRede Bezeichnung="Erzähler">dô riet ime sîn herze stæte,</UneigentlicheRede> (Häslein 44) |
2.11 Allgemeine Attribute: @Regel, @Datum, @Bearbeiter, @comment und
Metadaten
@Datum und @Bearbeiter werden vom Projekteditor automatisch ergänzt. In @Regel wird die einschlägige Annotationsregel festgehalten. In @comment kann eine Annotationsentscheidung ggf. begründet werden. Weiterhin werden alle Figurenreferenzen wie Namen oder Pronomina annotiert.
2.12 Ambiguität und unsichere Einstufungen: <certainty>,
@cert, @cert_comment
Das TEI-P5-Attribut @cert ist als fakultatives Attribut bei allen hier vorgestellten Elementen vorgesehen – beispielsweise als Attribut zu <FigurFokusort>, wenn nicht erzählt wurde, wann welche Figur den Raum verlassen hat. Das TEI-Element <certainty> wird bei übergreifenden Problemlagen gesetzt, die nicht im @cert-Attribut bei den übrigen Elementen abgebildet werden können.
3. Homogenität und Ambivalenzproblematik
Ziel ist, dass verschiedene Versuchspersonen zu homogenen Ergebnissen kommen (›Inter-Annotator-Agreement‹). Damit die Annotation einheitlich erfolgen kann, müssen Annotationsrichtlinien erarbeitet werden – auch deshalb, weil narratologische Definitionen oft nur scheinbar eindeutig sind. Die Annotationsrichtlinien werden regelmäßig überarbeitet – mit Gewinn nicht nur für den Annotationsvorgang: Willard McCarty hat beschrieben, dass das Vornehmen von Korrekturen am Modell zentral zum Erkenntnisgewinn beiträgt.[28] Etablierte narratologische Konzepte werden daraufhin erprobt, inwieweit sie eine eindeutige Annotation ermöglichen oder ob auch die narratologische Modellbildung erweitert und konkretisiert werden muss. Der Zwang zur Formalisierung macht es nötig, narratologische Begriffe in kleinteilige Explikationen aufzuspalten.[29] Die Textauszeichnung ist ein eminent textnahes Verfahren – man ist dazu gezwungen, den Text noch eingehender zu betrachten als bei einem ›close reading‹. Damit sind sowohl konzeptions-, theorie- als auch textbezogene Erkenntnisse zu erwarten, die ursprünglich nicht Teil einer konkreten Fragestellung waren (Serendipitätseffekte).[30]
Dass Texte polyvalent und ambig sein können, ist eine zentrale Herausforderung für Annotationsprojekte:[31] Eine Annotation geht mit einer Disambiguierung einher: es werden eindeutige Festlegungen getroffen.[32] Solche Festlegungen können notwendigerweise nicht zugleich allen fachlichen Konventionen gerecht werden – man bedenke, wie unterschiedlich Bal und Genette ›Fokalisierung‹ definieren.[33] Allerdings gibt es auch sonst nur wenige Bereiche der Literaturwissenschaft, die weitgehend frei von subjektiven Vorannahmen sind. Oft beruht bereits die Kategorienbildung auf Vorannahmen – angefangen bei der Frage, was überhaupt ein Wort oder ein Satz ist.
Der Ambivalenzproblematik soll auch dadurch begegnet werden, dass Interpretationsentscheidungen weit möglichst in die Annotationsrichtlinien ausgelagert werden, so dass die einzelne Annotationsentscheidung konkordant zu den Richtlinien und einheitlich zum Korpus ausfallen kann. Die Annotationsregeln beruhen zwar auf begründeten narratologischen Konzepten, andererseits werden die Regeln jedoch insofern subjektiv bleiben, als auch alternative Modellierungen möglich sind. Die Anwendung der Regel soll allerdings vom Subjektivitätsfaktor so weit wie möglich freigehalten werden.[34] Soweit dies gelingt, kann eine Teilstrecke im Annotationsvorgang – die Anwendung der Annotationsregel auf ein Textsegment – als empirisch beschrieben werden.[35]
Während der Annotation kann auf bereits annotiertes Material zugegriffen werden, so dass eine Orientierung an einschlägigen Fällen möglich ist. So kann entweder eine valide Auszeichnung vorgenommen werden, die sich konsequent an der bisherigen Auszeichnungspolitik orientiert, oder es fällt auf, dass die früheren Fälle neu bearbeitet werden müssen. Durch die Dokumentation von Annotationsregel und das Bearbeitungsdatum im XML-Code ist bei einer Regelrevision ein rascher Zugriff auf diese Fälle möglich. Die annotierten Texte und die Annotationsrichtlinien (zur Nachnutzbarkeit und Übertragung auf andere Textsorten) werden im Textgrid-Repository sowie auf den Servern des Regionalen Rechenzentrums Erlangen (RRZE) publiziert (Langzeitarchivierung).
4. Annotationsprobleme und exemplarische Auswertung
Für eine Diskussion von Annotationsproblemen und für eine exemplarische Auswertung verwende ich zwei mittelhochdeutsche Mären: Sperber und Häslein.[36] In beiden Texten will ein unbedarftes Mädchen einem Ritter ein Tier abkaufen, einen Sperber bzw. einen Hasen. Der Ritter ist nur bereit, das Tier gegen die Minne des Mädchens zu tauschen, das Mädchen weiß jedoch nicht, was Minne ist, und geht auf den Handel ein. Es wird von seiner Oberin im Kloster bzw. seiner Mutter dafür getadelt und geschlagen und tauscht deshalb bei einem zweiten Treffen mit dem Ritter das Tier wieder zurück gegen die Minne, es kommt also nochmals zum Beilager. Während der Sperber – durchaus misogyn erzählt – mit dem Vergnügen des Ritters und der Resignation der Oberin endet, folgt im Häslein ein zweiter Teil, in dem der Ritter eine andere Dame heiraten will, die sich über das Mädchen lustig macht, weil das Mädchen seiner Mutter vom Beilager erzählt hat, während sie hundertfach bei ihrem Kaplan lag. Der Ritter schickt daraufhin seine Verlobte zurück zu ihrem Kaplan und heiratet das Mädchen. Die Wertungsstruktur im Häslein ist eine deutlich andere, weil hier die Sorge der Mutter, dass das entehrte Mädchen keine gute Partie machen könnte, breiten Raum gewinnt, so dass ein Gegengewicht zum Vergnügen des Ritters in den Text eingebracht ist.[37]
4.1 Abgrenzungsprobleme
In Sperber V. 232 formuliert die Oberin zum Minnekauf, »daz si [das Mädchen] des koufes ie gewuoc« (Abbildung 1). Das mittelhochdeutsche gewuoc lässt sich mit »berichten oder erwähnen« übersetzen, dann ginge es um gesprochene Rede des Mädchens. Man kann gewuoc (Inf. gewahen) jedoch auch als »gedenken«, »sich entschließen« verstehen, dann ginge es um einen inneren Vorgang (Bewusstseinsdarstellung). Es könnte also sowohl eine Schilderung »von außen« oder Bewusstseinsdarstellung vorliegen – oder beides zugleich. In den Annotationsrichtlinien lässt sich etwa festlegen, dass bei einer derartigen Ambiguität nicht Bewusstseinsdarstellung zu annotieren ist, sondern »Erzählerrede: Sonstiger Bericht« mit Attribut cert="50%" und cert_comment="ambig: gewuoc". Ggf. auch Bewusstseinsdarstellung«. Geprüft wird, ob ein weiteres Attribut für solche ambigen Fälle einzuführen wäre, da zahlreiche mhd. Verben zugleich auf äußere und innere Handlungen bzw. Vorgänge referieren können.
4.2 Perspektivenabhängigkeit
Auch bei uneigentlicher Rede gibt es Grenzfälle. Wenn der Ritter im Häslein ankündigt, dem Mädchen den Hasen für seine Minne zu geben, so steht die Minne in der Ritterrede metonymisch für das Beilager (vgl. Abbildung 2). Bei der Figurenrede des Mädchens geht es dagegen nicht um eine übertragene Bedeutung, das Mädchen nimmt das Phänomen wörtlich. Die Annotation beruht hier auf der rekonstruierten Figurenperspektive.
5. Möglichkeiten der quantitativen Auswertung
5.1 Redewiedergabe
Hier nun Beispiele einer vorläufigen Auswertung – Tagset und Annotationsrichtlinien werden noch überarbeitet. Im Häslein (Abbildung 4) haben Ritter und Mutter weit größere Anteile an der Figurenrede als im Sperber; umgekehrt bei der Tochter, die im Sperber (Abbildung 3) große Anteile hat, zumeist direkte Rede.[38]
Im Sperber gibt es nur halb so viel indirekte Rede wie im Häslein, der Text besteht zur Hälfte aus Dialogen (vgl. Abbildung 5 und Abbildung 6). Im Häslein geht es häufiger um innere Vorgänge.
5.2 Fokalisierung
Anders als die Oberin im Sperber ist die Mutter im Häslein zumindest zeitweilig fokalisiert, während die Hindernisfigur im Sperber offenbar von außen erzählt werden kann (vgl. Abbildung 7). Die längere direkte Gedankenrede der Mutter im Häslein ist zentral für die Peripetie der Wertungsstruktur. Während das Sperber-Mädchen Gefallen am Beilager findet, wird diese laszive Darstellung im Häslein reduziert; das Mädchen ist weniger fokal (vgl. Abbildung 8). Beim Rückkauf fehlen Informationen dazu, ob ihr das Beilager zusagt, vielmehr blickt sie dabei stets auf ihr »liebez heselîn« (V. 273).
5.3 Figurenbezug
Bei der Bezugnahme auf die Tochter bzw. das Mädchen fällt auf, dass im Sperber mehr unmittelbare als mittelbare Bezüge vorhanden sind; im Häslein ist es umgekehrt (vgl. Abbildung 9 und Abbildung 10). Mit unmittelbaren Bezüge werden oft einfache Referenzen realisiert, während bei mittelbaren Bezügen bspw. ein eigentliches Handlungsziel erfasst werden kann, obwohl es nur scheinbar und vordergründig um andere Dinge geht. Im Sperber steht das Beilager im Zentrum – eine eher schlichte Komposition – , das Häslein bietet ein komplexeres Handeln.[39] Nicht abgebildet sind die Bezüge auf das Mädchen im Sperber mit Attribut »vorläufig_implizit« am Textanfang.
5.4 Negation innerhalb von Erzähler- / Figurenrede
Ein Vorteil der Annotation von verschiedenen Ebenen liegt darin, dass man mehrere Filter gleichzeitig anwenden kann. Man kann abfragen, ob Erzähler oder ob Figuren häufiger Negationen verwenden: Beim Sperber-Erzähler finden sich nur geringe Differenzen, das Mädchen greift häufiger zur Negation als der Ritter – allerdings vorwiegend in der Szene, in der sie dagegen protestiert, dass der Ritter die Minne nur einmal zurückgeben wollte, obwohl er sie dreimal erhalten habe (Abbildung 11). Dagegen stehen beim Häslein-Erzähler nur wenige Negationen; anders bei den Figuren (Abbildung 12): Der Ritter etwa lehnt wortreich den zuerst angebotenen Kaufpreis fürs Häslein ab (Ringe und Schmuck).
5.5 Lexikalische Vielfalt: MTLD von Erzähler- / Figurenrede
Die lexikalische Vielfalt habe ich mittels MTLD (Measure of Textual Lexical Diversity) ermittelt; gegenüber der Type-Token-Ratio ist MTLD längenunabhängig.[40] Höhere Werte weisen auf eine variationsreichere Ausdrucksweise hin.
Es sollte geprüft werden, ob sich eine absteigende Reihenfolge ›Erzähler – adeliger Ritter – einfältige Tochter‹ ergibt. Beim Sperber hat der sonstige Erzählerbericht immerhin höhere Werte als die direkte Rede von Tochter und Ritter (Abbildung 13). Insgesamt bleiben die Sperber-Werte hinsichtlich der Fragestellung diffus; die Werte zur Oberin können kaum belastet werden: MTLD ist bei Samples ab 100 Wörtern anwendbar;[41] die rotgefärbte Rede der Oberin im Sperber kommt jedoch nur auf 68 Wörter.
Die Rangfolge der Figuren im Häslein entspricht der Rangfolge im Sperber (Abbildung 14): Entgegen der Hypothese hat der Ritter niedrigere Werte als die Tochter. Wird der Ritter, der zunächst nur seinen Vorteil verfolgt, sprachlich benachteiligt? Die Mutter – als textinterne Wertungsinstanz – spricht sogar variationsreicher als der Erzähler.
Einer der Gründe dafür, warum der Bericht von Figurenaktivitäten niedrige Werte aufweist, dürfte darin liegen, dass bislang dixit-Formeln (»er sprach«) bei Figurenaktivität annotiert wurden. Eventuell muss hierfür künftig ein eigenes Attribut vergeben werden.
6. Soziale Netzwerkanalyse
Bei der literarischen Netzwerkanalyse (SNA) wird visualisiert, welche Figuren miteinander interagieren. In der Pionierstudie von Peer Trilcke werden potentielle Figurenbeziehungen erfasst:[42] Wenn Figuren zeitgleich auf der Bühne sind, wird angenommen, dass eine Vernetzung vorliegt; dabei werden potentielle Figurenbeziehungen erfasst. Das Element <FigurFokusort> erlaubt es, solche Konstellationen zu visualisieren (Abbildung 15 und Abbildung 16).[43]
Bei <Figurenbezug> (Abbildung 17 und Abbildung 18) werden Figuren, auf die gleichzeitig Bezug genommen wird, erfasst. Hier geht es nicht nur um potentielle Vernetzung, sondern um Bezüge, die eine Figur oder der Erzähler realisiert.
Der SNA-Plot visualisiert, inwiefern die Figurenkonstellation im Häslein komplexer ist als im Sperber. Dadurch, dass beim Figurenbezug auch absente Figuren erfasst werden – etwa der Kaplan im Häslein –, gehen bei <FigurenBezug> mehr Informationen ein als bei <FigurFokusort>. Im Sperber ist die Relation zwischen Ritter und Oberin bei <FigurenBezug> stärker ausgeprägt als bei <FigurFokusort>, da der Rückkauf mit Rücksicht auf die vom Mädchen angenommenen Interessen der Oberin erfolgt.[44]
Im Sperber (vgl. Abbildung 19) sind die linke »Kloster«-Hälfe und rechte »Minnekauf«-Hälfte nur über Gott und Tochter verbunden. Bei den Beziehungen der Hauptfiguren variiert deutlich, welche Figur bei reziproken Bezügen wie stark auf die jeweils andere Figur Bezug nimmt. Die Tochter ist mit den übrigen Nonnen ausschließlich darüber verbunden, dass anfangs auch auf sie vorläufig implizit beim Beten etc. Bezuggenommen wird. Im Häslein (vgl. Abbildung 20) sind die Hochzeitsgäste und die Verlobte zentraler als die Mutter; andererseits ist die Beziehung Mutter – Tochter stärker. Viele Beziehungen sind nicht reziprok (rot; Kaplan, Gesinde, Gott); der Ritter nimmt häufiger auf die Verlobte Bezug als umgekehrt.
Ein Vorteil der annotierten Texte besteht darin, dass der Bezug von Figurenrede und Figurenaktivität (in Erzählerrede) auf andere Figuren abgebildet werden kann, so dass nunmehr tatsächlich realisierte sowie gewichtete und gerichtete Relationen in die Netzwerkanalyse eingehen.[45]
7. Ausblick: Akkurate Daten und vielfältige Analysen
Franco Moretti hat Netzwerkanalysen präsentiert, die nicht gewichtet und nicht gerichtet sind; er selbst kommentiert dieses Problem: »Das kann nicht richtig sein.«[46] Dennoch hat sich Moretti nicht davon abhalten lassen, aus seinen nicht-gewichteten und nicht-gerichteten SNA-Plots den Vorschlag abzuleiten, eingeführte Kategorien wie Hauptfigur versus Nebenfiguren oder ›runde‹ versus ›flache‹ Figur zu überdenken: »In Anbetracht der Verteilung spricht nichts für diese Dichotomien, sie macht eher eine radikale Neukonzeption der Figuren und ihrer Hierarchie erforderlich.«[47] Mit Blick auf die vorstehenden gewichteten und gerichteten SNA-Plots zu Häslein und Sperber ist demgegenüber festzuhalten, dass die Plots mit genauerer Datenbasis keinen Anlass dazu geben, eine Definition von Hauptfigur, die etwa die Partizipation der Figur an Ereignissen in der erzählten Welt als Kriterium verwendet,[48] grundlegend in Zweifel zu ziehen. Für die weitere Entwicklung der digitalen Literaturwissenschaften wird es weniger darauf ankommen, im Schatten des Big-Data-Hypes spektakuläre Ergebnisse als ›distant reading‹ zu vermarkten. Wichtig wäre dagegen ein Forschungsprogramm, das akkurate Daten zur Verfügung stellt, die weiterführende Analysen erst ermöglichen. Mein Annotationsprojekt versteht sich als ein Baustein innerhalb eines solchen Programms. Mittelfristig ist auf den Erfolg von automatischen Verfahren zu hoffen, die freilich erst einmal eine geeignete Modellierung und annotierte Trainingsdaten zur Voraussetzung haben.
Das Annotationssystem wird laufend weiterentwickelt, die hier vorgestellten Auswertungen beruhen auf vorläufigen Daten, die Texte wurden im Jahr 2016 annotiert. Das Korpus erlaubt Auswertungen in vielfältiger Weise, es kann mit einer Vielzahl an statistischen Methoden analysiert werden – etwa in Hinblick auf Heterogenität oder Homogenität. Man kann beispielsweise Figurenrede vom Typ ›Bewusstseinsdarstellung‹ von weiblichen Figuren mit einem Korpussegment vergleichen, das aus Erzählerrede besteht; die Figurenrede von Antagonisten lässt sich etwa mit Figurenrede von Protagonisten vergleichen. Eine Besonderheit ist, dass die Sample-Erstellung für spezifische Fragestellungen nicht nur eindimensionale Zugriffe auf Korpussegmente erlaubt, sondern auch systematische Zugriffe auf mehrere Ebenen gleichzeitig. Möglich wird eine Auswertung mit multiplen Fragestellungen. Beispielsweise lässt sich fragen: Wie steht es um die diachrone Entwicklung von Fokalisierung, um temporale Alternationen, wie verteilt sich der Redebezug auf verschiedene Figurentypen? Zahlreiche gender-bezogene Auswertungen werden möglich – mit einer Sample-Analyse mit Text, der jeweils auf weibliche oder männliche Figuren bezogen ist, oder mit Figurenrede, die von weiblichen oder männlichen Figuren stammt. Wie sind evaluative Äußerungen einerseits auf Erzählerrede und Figurenrede und andererseits auf welche Aktanten verteilt? Lassen sich epochenspezifische Verteilungen ausmachen? Wird es anhand der Auswertungsdaten möglich, Thesen zur Gattungsentwicklung kritisch zu diskutieren, die das Verhältnis vom Märe zur Novelle in einer teleologischen Perspektive beschreiben, und die das Märe als weniger komplex und weniger multiperspektivisch sehen?[49] Zwar wird man sich – wie überall im Bereich der digitalen Literaturanalyse – davor hüten müssen, vorschnell große Wahrheiten zu verkünden; ich hoffe aber, dass auf der Grundlage von hundert annotierten Kurzerzählungen bei aller Vorsicht zumindest Tendenzen beschrieben werden können.