Abstract
Da die mediävistische Textualitätsdebatte von einer deutlichen Zurückhaltung gegenüber der Instanz des Autors geprägt ist, stehen die Voraussetzungen für eine Akzeptanz des Einsatzes stilometrischer Methoden auf dem Gebiet der mittelhochdeutschen Literatur nicht günstig. Doch eröffnet gerade das Spannungsfeld von Tradition und Individualität, das für diese Texte von Bedeutung ist, der Stilometrie Anwendungsmöglichkeiten, die zu einer gegenseitigen Erhellung von Methode und Fachdisziplin führen können. Der Artikel zeigt anhand von Beispielanalysen, wie mittelhochdeutsche Texte sowohl durch individuelle als auch durch gattungsspezifische Stilfaktoren bestimmt sind und was bei der Quantifizierung dieser Kategorien zu beachten ist.
The debate on medieval textuality is shaped by an obvious reservation about the category of authorship. Therefore, the conditions for the acceptance of stylometric methods in the field of Middle High German literature might not seem too favorable. However, it is exactly this tension between tradition and individuality, which bears great significance for those texts, that offers opportunities for the application of stylometric methods, which can lead to a mutual elucidation of method and discipline. The paper provides examples of the ways in which Middle High German texts are influenced by individual as well as genre-specific style factors. Furthermore, it elaborates on the issues that must be addressed for a proper quantification of these categories.
1. Zur Problematik des Stilbegriffs in der Mediävistik
Im Rahmen der Digital Humanities stellt die Stilometrie, also die Anwendung quantitativer Methoden zur Erfassung und Klassifizierung stilistischer Merkmale von Texten, eine jener Unterdisziplinen dar, die zur Zeit eine gesteigerte Aufmerksamkeit der Forschung für sich beanspruchen kann. Das Potential und die Beliebtheit der Methode belegt nicht zuletzt eine große Zahl von Publikationen, die sich auch für den deutschsprachigen Raum nachweisen lässt.[1] Aufgrund ihrer Aktualität bietet sich die Stilometrie demnach als Untersuchungsfeld geradezu an, wollte man, wie dies im Folgenden geschehen soll, exemplarisch der Frage nachgehen, ob die Digital Humanities einen methodischen Brückenschlag zu den traditionellen Geisteswissenschaften ermöglichen können oder aber die Gefahr einer »feindlichen Übernahme« der Geisteswissenschaften durch die Computerphilologie besteht.[2] Was die Methode diesbezüglich vor allem interessant macht, ist der Umstand, dass sie in letzter Zeit offenkundig auch in der traditionellen Literaturwissenschaft verstärkt wahrgenommen wird. Dies scheint zumindest für die germanistische Mediävistik zuzutreffen, dem Fachgebiet, dem ich mich näher zuwenden will. Als symptomatisch für das Interesse kann hier etwa die Aufnahme eines einschlägigen Aufsatzes von Mike Kestemont in die traditionsreiche Zeitschrift für deutsches Altertum gewertet werden[3] oder der programmatische Artikel von Manuel Braun in der letztjährigen Ausgabe der Zeitschrift für Literaturwissenschaft und Linguistik, die unter dem Titel »Turn, Turn, Turn? Oder: Braucht die Germanistik eine germanistische Wende?« den gegenwärtigen Stand der Fachdisziplin reflektiert.[4]
Fast sieht es also so aus, als könnte sich nach der mittlerweile recht gut etablierten digitalen Editorik die nächste Teildisziplin der Digital Humanities anschicken, ihren Platz auf dem Feld der althergebrachten Germanistik zu erobern. Jedoch stehen die Voraussetzungen für eine Akzeptanz der Stilometrie wesentlich ungünstiger, als dies bei der Editionswissenschaft der Fall war. Denn rückblickend lässt sich feststellen, dass die Etablierung der digitalen Editorik nicht zuletzt deswegen gelingen konnte, weil sich die Methode in vorzüglicher Weise zur Beantwortung von Fragestellungen eignete, die bereits im Fokus der literaturwissenschaftlichen Diskussion standen: Die Möglichkeiten einer dynamischen, von Autorpositionen freigehaltenen Betrachtungsweise von Texten trafen sich mit den Anforderungen einer stark poststrukturalistisch beeinflussten Philologie, die Konzepte von Subjekt, Autorschaft und Textfestigkeit zunehmend in Frage stellte.[5] Selbst nach dem Abklingen der heftig geführten Debatte um die sogenannte New Philology und der partiellen Rücknahme allzu radikaler Extrempositionen ist nicht von der Hand zu weisen, dass die digitale Darstellung gerade für mittelalterliche Texte besondere Vorteile bietet, da diese nur handschriftlich und in den allermeisten Fällen nur in späteren Abschriften, nicht aber in einem vom Autor selbst angefertigten Original überliefert sind.[6] Auch wenn man aufgrund dieser Umstände die Bedeutung von Autorschaft nicht gleich völlig in Abrede stellen möchte, wie dies poststrukturalistische Extrempositionen tun, so bleibt doch der Befund, dass das Autororiginal in der Überlieferung nicht mehr direkt greifbar ist. Statt nun dessen ungeachtet gezwungenermaßen nur einen, möglicherweise sogar hypothetisch rekonstruierten ›Original‹-Text bieten zu müssen, wie dies früher bei den nur gedruckt vorliegenden Editionen der Fall war, lässt sich mittels einer digitalen Editionsdarstellung die gesamte handschriftliche Überlieferung mit einbeziehen. Dies ermöglicht den Blick auf eine dynamische Entwicklungsgeschichte des Textes im Verlauf seiner Tradierung, die nicht allein durch den Autor bestimmt wird, wodurch aber grundlegende theoretische Fragen wie jene, was die Integrität eines Textes oder die Rolle des Autors überhaupt ausmachen, nicht nur neu angegangen werden können, sondern sich regelrecht aufdrängen.
Demgegenüber müssen die primären Anwendungsgebiete der Stilometrie aus der Sicht der traditionellen Literaturwissenschaft zumindest auf den ersten Blick deutlich rückwärtsgewandt, wenn nicht gar altmodisch anmuten. Nur allzu leicht etwa könnten stilistische Untersuchungen zur Identifizierung von Autorschaft, die bislang einen der ergebnisträchtigsten Zweige der Stilometrie darstellen, Assoziationen an mittlerweile als überholt geltende Ansätze zur Klärung von ›Echtheitsfragen‹ und anderen wertästhetischen Problemstellungen hervorrufen.[7] Denn die Frage nach der Beschaffenheit von Autorstilen wurde in der traditionellen Philologie durchaus bereits gestellt, gerade nämlich bei der heute verpönten Rekonstruktion von Originaltexten, zu der sich die ältere Forschung aufgrund ihrer Ausrichtung auf feste Textgestalten genötigt sah. Da es den Vertretern der klassischen Textkritik vor allem darum ging, den einen, ›richtigen‹ Autortext aus der ihrer Ansicht nach entstellten handschriftlichen Überlieferung zu rekonstruieren, erfolgte die Einrichtung der Ausgabentexte nicht selten unter der Maßgabe, ob eine bestimmte Formulierung dem jeweiligen Autor stilistisch zuzutrauen sei oder nicht. Die Frage nach dem ›richtigen‹ Text traf sich dabei mit einem überhöhten Stilideal, das davon ausging, dass die besten Autoren sich auch durch einen besonders qualitätsvollen Stil auszeichnen sollten, und daher stilistisch Minderwertiges aus dem Text auszuscheiden sei. Auf dieser Grundlage wurden Entscheidungen getroffen, die mitunter höchst subjektiv waren, was diese Methode nicht zu Unrecht in Verruf gebracht hat.
Es zeigt sich also, dass die Wissenschaftsgeschichte der Mediävistik nicht die besten Anschlussvoraussetzungen für eine autorzentrierte Stilometrie bietet. Gerade eine Fixierung auf die Instanz ›Autor‹ könnte den erkenntnistheoretischen Mehrwert in Frage stellen, der sich durch die Anwendung der Computertechnologie mit ihrer Möglichkeit zur Öffnung und Perspektivierung von Texten ergeben hat. In dieser Hinsicht erscheint die Stilometrie auf den ersten Blick der erfolgreichen digitalen Editorik fast schon diametral entgegengesetzt.
Dieser Befund überrascht umso mehr, wenn man bedenkt, dass gerade der vielleicht wirkmächtigste Ansatz zur Rehabilitierung quantitativer textanalytischer Methoden in den Geisteswissenschaften, das von Franco Moretti in die Diskussion eingebrachte Konzept des Distant Reading, eigentlich mit dem Anspruch angetreten ist, die Fokussierung auf Höhenkammliteratur und Autorgenies zu unterlaufen: Durch die Anwendung quantitativer Methoden, so paraphrasiere ich Moretti, werde es nämlich möglich, ein realistischeres Bild der gesamten Schriftproduktion zu erhalten, das sich nicht auf wenige elitäre Spitzenprodukte beschränken muss, sondern, aufgrund der erhöhten Verarbeitungskapazitäten des Computers, die breite Masse der tatsächlich vorhandenen Texte erschließen kann.[8] Dieser reizvolle, provokante Ansporn ginge verloren, würde sich die Stilometrie allzu sehr auf die Aufdeckung von Autorschaftszugehörigkeiten beschränken.
Doch wird gerade an den Arbeiten von Moretti deutlich, dass sich die Stilometrie durchaus auch zur Klärung nicht-autorbezogener Fragestellungen verwenden lässt. So hat sich die stilometrische Forschung etwa schon bald – und nicht erst seit Moretti – an der Klassifizierung von Texten in Hinblick auf ihre Gattung versucht, und zwar allein schon aus methodischen Gründen.[9] Der Einbezug dieser Kategorie liegt deshalb nahe, weil sich gerade die Zugehörigkeit von Texten zu unterschiedlichen Gattungen als größter Störfaktor bei der Differenzierung von Individualstilen erwiesen hat. Ganz offenbar ist der Stil eines Textes nicht nur von der Persönlichkeit des Autors abhängig, sondern auch von überindividuellen Faktoren, wie sie etwa die Gattungen darstellen.
Gerade dieses Spannungsfeld zwischen Tradition und Individualität, welches sich in der Determiniertheit der Texte zwischen Autor- und Gattungsstil zeigt, eröffnet nun aber sehr wohl Anschlussmöglichkeiten an Fragestellungen, die wieder mehr ins Zentrum aktueller Diskussionen in den traditionellen Literaturwissenschaften führen. Denn Morettis Versuch einer Entdifferenzierung zwischen Spitzenprodukten und breiter Masse an Texten erscheint bei näherer Hinsicht der spezifisch mittelalterlichen Literaturauffassung vielleicht gar nicht völlig unangemessen. So wurde bei der Beschreibung mittelalterlicher Literatur immer wieder die Notwendigkeit betont, die einzelnen Texte nicht nach dem Maßstab einer genieästhetischen, auf Originalität abzielenden Literaturproduktion zu beurteilen, sondern den Eigenwert einer speziellen »Ästhetik der Identität«[10] anzuerkennen: Mittelalterliche Texte zielen, anders als wir dies vom modernen Literaturbetrieb seit der Goethezeit gewohnt sind, gar nicht darauf ab, völlig Neues oder Individuelles zu schaffen, sondern knüpfen bewusst an Traditionen an. Statt um das Neuerfinden einer Geschichte geht es vielmehr um das Wiedererzählen althergebrachter Stoffe.[11] So ist beispielsweise der Iwein von Hartmann von Aue, einer der wichtigsten Artusromane der mittelhochdeutschen Literatur, über große Passagen hinweg eine ziemlich genaue Übertragung seiner französischen Quelle, des Yvain von Chrétien de Troyes. Die Eingriffe Hartmanns in den Text sind zwar durchaus aussagekräftig, führen aber nicht zu einer völligen Lösung von seiner Vorlage. Dieser Mangel an Originalität wird dabei nicht als Manko empfunden, sondern im Gegenteil, gerade die Wiederaufnahme des Altbewährten, immer schon Gültigen, rechtfertigt erst das literarische Tun. Aufgrund dieser grundsätzlichen Ausrichtung mittelalterlicher Literatur kommt der Einordnung der Texte in Traditions- und damit Gattungszusammenhänge tendenziell eine größere Bedeutung zu als bei modernen Texten – und dementsprechend, so ließe sich zumindest vermuten, verringert sich die Relevanz des Individualstils eines einzelnen Autors. Dass die Instanz ›Autor‹ deswegen aber nicht gleich völlig verloren geht, hat die sich am Poststrukturalismus abarbeitende Autorschaftsdebatte in der Mediävistik ebenfalls deutlich gezeigt.[12] Auch das Bewusstsein für literarische ›Spitzenprodukte‹ fehlt im Mittelalter nicht, so wird etwa – um wieder bei Hartmann als Beispiel zu bleiben – dieser im bekannten ›Literaturkatalog‹ aus dem Tristan Gottfrieds von Straßburg neben anderen als herausragender Autor gepriesen und gerade für seinen besonders klaren Stil gelobt.[13]
2. Fallstudien
2.1 Voraussetzungen
Vor diesem Hintergrund könnte es nun gerade besonders interessant erscheinen, auch mittelalterliche Texte in Hinblick auf ihre stilometrische Auswertbarkeit zu überprüfen.
Dem stehen jedoch gewichtige praktische Gründe entgegen: Stilometrische Verfahren beruhen im Wesentlichen auf der computerunterstützten Auszählung von Worthäufigkeiten, auf deren Grundlage Texte mit ähnlichem Wortgebrauch nach statistischen Verfahren zusammensortiert werden. Zwar sind mittlerweile immer mehr mittel- und frühneuhochdeutsche Texte in elektronischer Form verfügbar, was die Grundlage für die Wortfrequenzerfassung bietet, die Vergleichbarkeit des Wortgebrauchs in diesen Texten ist jedoch mit erheblichen Schwierigkeiten behaftet. Denn im mittelalterlichen Deutsch gibt es keine festgelegte Orthographie, die Schreibung ein- und desselben Wortes kann variieren, einerseits regional, weil die Schreiber aus unterschiedlichen Dialektgebieten stammen, andererseits auch zeitbedingt, weil sich die Schreibsprache im Verlauf des Mittelalters erheblich verändert hat. Darüber hinausgehend können die Schreiber der Handschriften auch unabhängig von Dialekten und Zeitstufen unterschiedliche Schreibgewohnheiten aufweisen, was sogar soweit geht, dass ein und dasselbe Wort in derselben Handschrift unterschiedlich geschrieben auftritt. Zwar werden diese Differenzen in den meisten der heute verfügbaren Textausgaben durch den Herausgeber ausgeglichen und die Schreibung bis zu einem gewissen Grad vereinheitlicht, doch stellt gerade diese Normalisierung einen weiteren Störfaktor dar, denn auch für diese Vereinheitlichung gibt es keine bis in alle Details festgelegten Regeln, weshalb sie je nach Herausgeber unterschiedlich ausfallen kann. Schließlich ist noch ein weiterer Punkt zu nennen, der bei der Untersuchung vieler mittelhochdeutscher Texte ins Gewicht fällt: Die wichtigsten literarischen Werke sind in Versen abgefasst, also auch epische bzw. erzählende Texte, die zumeist in Reimpaarversen, manchmal sogar in Strophen gebunden sind. Die Besonderheiten der metrischen Struktur und der Reimbindung wirken sich ebenfalls auf den Wortgebrauch aus, und auch dies kann die Vergleichbarkeit der Texte erschweren.[14]
2.2 Höfische Epik
Trotz dieser Schwierigkeiten, mit denen eine stilometrische Analyse mittelalterlicher Texte konfrontiert ist, habe ich in einer ersten Annäherung zu eruieren versucht, welche Resultate sich mit den bereits vorhandenen Textkorpora erzielen lassen. Ziel der im Folgenden beschriebenen Fallstudien ist es also ausdrücklich nicht, endgültige Ergebnisse zu liefern, sondern zunächst heuristisch zu ermitteln, welche Probleme genauer in den Blick zu nehmen sind. Die Grundlage für meinen ersten Versuch bildete ein Korpus von einigen wichtigen epischen Texten der mittelhochdeutschen Literatur, das ich mithilfe des von Maciej Eder, Mike Kestemont und Jan Rybicki entwickelten Stylo-Packages[15] für das Statistikprogramm R[16] einer stilometrischen Analyse ausgesetzt habe. Konkret herangezogen habe ich die heute erhaltenen Werke der drei Klassiker der höfischen Epik, den Tristan Gottfrieds von Straßburg, den Parzival und den Willehalm Wolframs von Eschenbach sowie die epischen Werke Hartmanns von Aue, nämlich die beiden Artusromane Erec und Iwein sowie die Legendendichtungen Der arme Heinrich und Gregorius.[17] Um eine weitere zeitliche Streuung zu erreichen, wurden zudem noch der Eneas-Roman Heinrichs von Veldeke, der eine Art Vorläufer der höfischen Klassik darstellt, in die Analyse mit einbezogen sowie die Werke Konrads von Würzburg und Ulrichs von Etzenbach, die zeitlich etwas später anzusiedeln sind.
Eine Clusteranalyse dieser Texte, die auf der Grundlage der 200 häufigsten Wörter erstellt wurde,[18] bietet ein auf den ersten Blick erstaunlich eindeutiges Bild (Abbildung 1):
Die Werke der Autoren werden vom Computer ohne Ausnahme richtig sortiert, zum Teil scheinen sich sogar Texte derselben Gattung zusammenzuordnen, so bilden etwa die beiden Artusromane Erec und Iwein einen eigenen Unterzweig in der Hartmann-Gruppe.[19] Grundsätzlich scheint jedoch das Autorensignal das Gattungssignal zu überwiegen, so befinden sich etwa der Parzival und der Willehalm, die unterschiedlichen Gattungen angehören, auf ein und demselben Wolfram-Zweig. Diese Ergebnisse sind freilich mit äußerster Vorsicht zu behandeln: Denn natürlich spielen die bereits erwähnten Einflussfaktoren wie Schreiber, Schreibdialekt und Herausgeber bei dieser Sortierung eine Rolle, und ich werde im Folgenden noch näher auf ein Beispiel für eine solche Verzerrung eingehen. Allerdings wäre selbst unter Berücksichtigung dieser Faktoren nicht unbedingt eine solch klare Verteilung zu erwarten, da ja die Werke mancher der hier aufgeführten Autoren in ganz unterschiedlichen Handschriften überliefert sind und auch von unterschiedlichen Editoren herausgegeben wurden. So ist beispielsweise die Ausgabe von Hartmanns Iwein nach Handschriften des 13. Jahrhunderts erstellt, der nebengeordnete Erec jedoch nach einer Handschrift, die erst aus dem 16. Jahrhundert stammt. Diese Differenz in der handschriftlichen Basis spielt also offensichtlich keine genügend große Rolle, als dass sie eine Zusammenordnung der beiden Texte verhindern könnte.[20]
2.3 Wolfram und Hartmann
Die Ergebnisse erscheinen jedenfalls vielversprechend genug, um diesen Zusammenhängen genauer nachzugehen.In einem weiteren Versuch habe ich daher Wolframs Parzival und die beiden Artusromane Hartmanns, den Erec und den Iwein, mithilfe des von John Burrows und Hugh Craig entwickelten Zeta-Tests einer kontrastiven Analyse unterzogen. Dabei werden die einzelnen Texte in Abschnitte gleicher Länge zerteilt (hier in Abschnitte zu 2000 Wörtern), die jeweils von einer Textgruppe (Wolfram bzw. Hartmann) im Vergleich zur anderen konstant bevorzugten Wörter ermittelt und schließlich die einzelnen Textpartien in eine graphische Darstellung gebracht, bei der wieder Textabschnitte mit ähnlichem Wortgebrauch näher zusammensortiert werden.[21] Als Testgruppe sind der Analyse noch Wolframs Willehalm, Gottfrieds Tristan und Hartmanns Legendendichtungen hinzugefügt worden (Abbildung 2).
In der Darstellung repräsentiert jedes Symbol (Kreis, Kreuz und Dreieck) jeweils einen Textabschnitt. Bei den roten Kreisen handelt es sich um Textpartien aus Wolframs Parzival (also aus der ersten Textgruppe), bei den grünen Dreiecken um Abschnitte aus Hartmanns Artusromanen (der zweiten Textgruppe). Kreuze stellen Abschnitte aus der Testgruppe dar (Willehalm, Tristan und Hartmanns Legenden), wobei die Partien aus dem Willehalm rot, die aus dem Tristan blau und die aus Hartmanns Legenden grün eingefärbt sind.
Überwiegend zeigt sich wieder ein relativ klarer Unterschied zwischen den Autoren, die Textpartien sind nicht weit über das Raster verteilt, sondern ordnen sich entsprechend den Gruppierungen zusammen. Der Willehalm erscheint zusammen mit dem Parzival deutlich von Hartmann abgesetzt und die Legenden Hartmanns finden sich bei seinen Artusromanen. Einzig beim Tristan gibt es Unschärfen, da er sich teilweise mit den Werken Hartmanns vermischt.
Spätestens an diesem Punkt wäre es nun interessant zu wissen, welche Wörter für diese Sortierung verantwortlich sind.Eine Auflistung der für die Differenzierung der beiden Korpora aussagekräftigsten Wörter sieht folgendermaßen aus (Abbildung 3):
Ausgangspunkt der Darstellung ist das Wolfram-Korpus,[22] über dem horizontalen Strich in der Mitte liegen die von Wolfram im Vergleich zu Hartmann konstant häufig gebrauchten Wörter, unter dem Strich die von Wolfram vermiedenen Wörter. Die erste Position unter den vermiedenen Wörtern nimmt das Wort ›kam‹ ein, das im Mittelhochdeutschen die 1. und 3. Pers. Sg. Präteritum des neuhochdeutschen Verbs ›kommen‹ ausdrückt. Das Wort ist deutlich von der Mittellinie abgesetzt, wird also von Wolfram gegenüber Hartmann in besonders auffälliger Weise gemieden.[23] Doch ist gerade dies kein Beleg dafür, dass Hartmann etwa öfter von ›kommen‹ sprechen würde als Wolfram, denn die 1. und 3. Pers. Sg. von ›komen‹ kann im Mittelhochdeutschen auch ›kom‹ lauten. Und genau diese Form ›kom‹ tritt nun bei Wolfram anstelle von ›kam‹ auf, wodurch sich der scheinbare Mangel an ›kam‹-Formen in den Wolfram-Texten erklärt. Die Verteilung der Formen ›kom/kam‹ ist regional bedingt, ›kam‹ ist nämlich die Variante, die tendenziell im südwestdeutschen (alemannischen) Raum bevorzugt wird, aus dem Hartmann stammt.[24] Dass die Verwendung von ›kam‹ tatsächlich auf Hartmann zurückgeht und nicht erst durch spätere Abschreiber seiner Werke eingeführt wurde, lässt sich in einigen Fällen sogar sichern, nämlich dann, wenn das Wort auch im Reim auftritt, und dort auf Wörter reimt, die nicht nur im Alemannischen, sondern auch überregional auf die Silbe ‑am enden.[25] Die Schreiber des Mittelalters hatten zwar grundsätzlich keine Bedenken, den Text, den sie kopierten, ihrem eigenen Dialekt anzupassen, im Fall eines Reimpaars hätten sie jedoch den Text regelrecht umschreiben müssen, um etwa die Form ›kom‹ in ›kam‹ zu ändern.
Nun eignet sich so gesehen das Wortpaar ›kom‹ versus ›kam‹ bei der direkten Gegenüberstellung tatsächlich hervorragend zur Differenzierung zwischen Hartmann und Wolfram,[26] allerdings ist damit über einen möglichen Individualstil Hartmanns noch wenig ausgesagt.[27] Zudem dürfte dieser letztlich regionale Einflussfaktor eine mögliche Klassifizierung nach Autorschaften bei einem Korpus mit mehreren Autoren unterlaufen. So erscheint es etwa durchaus denkbar, dass das vom Computer berechnete Näheverhältnis von Gottfried und Hartmann, das in den oben gezeigten Clusterdarstellungen ersichtlich ist, darauf zurückgeht, dass auch Gottfried – und weite Teile der Tristan-Überlieferung – wie Hartmann aus dem südwestdeutschen Raum stammen.
Und schließlich bleibt die Verteilung der Formen ›kom‹ versus ›kam‹ anfällig für Schreiber- und Herausgeber-Einflüsse, zumindest solange sie nicht im Reim auftreten. Gleich dieses erste Wort in der Rangliste bietet also einen Beleg für die oben beschriebenen Störfaktoren, die die Autorzuordnung behindern können. Für weitergehende stilometrische Untersuchungen könnte es sich daher als sinnvoll erweisen, mit lemmatisierten Texten zu arbeiten, um diese Verzerrungen auszuschließen. Leider gibt es dafür aber noch nicht ausreichend offen zugängliche lemmatisierte E-Texte, die zur Analyse herangezogen werden können. Zudem lässt sich am Beispiel zeigen, dass die Lemmatisierung noch nicht alle systematischen Probleme löst, die die unterschiedliche Schreibung mit sich bringt: Blickt man nämlich zurück auf die Reimbindung des Wortes und betrachtet man nach der Gruppe der Hartmann-Texte nun jene der Wolfram-Texte, dann zeigt sich, dass Wolfram ›kom‹ im Reim nie gebraucht. Dies hat seinen guten Grund, der darin liegt, dass im Mittelhochdeutschen ein Reimwort auf ‑om sehr viel schwerer zu finden ist als ein Reim auf ‑am.[28] Das heißt also, dass ein Autor, der die Form ›kom‹ verwendet, diese im Reim weniger zum Einsatz bringen kann. Eine hohe Frequenz von ›kom‹ wäre so gesehen noch auffälliger als eine gleich hohe Frequenz von ›kam‹ – und dieser Unterschied ginge bei der Lemmatisierung verloren.[29]
Neben diesen problematischen Fällen gibt es in der Wortliste nun aber auch Marker, die eindeutig nicht auf regionale oder Schreibereinflüsse zurückzuführen sind. Ein Beispiel hierfür wäre das Wort ›prîs‹, das in der Liste der von Wolfram bevorzugten Wörter etwas überraschend an zweiter Stelle aufscheint. Für ›prîs‹, was dem Neuhochdeutschen ›Preis‹ im Sinne von Lob, Ruhm und Anerkennung entspricht, gibt es keine doppelte Wortform, der ›prîs‹ wird also tatsächlich viel häufiger in den Wolfram-Texten thematisiert als bei Hartmann.
Die Frage ist nun, ob ›prîs‹ also ein Wort darstellt, das besonders typisch für den Individualstil von Wolfram ist oder ob andere Faktoren bei dieser Verteilung eine Rolle spielen. Zur Beantwortung dieser Frage ist es zunächst von Relevanz, dass ›prîs‹ ein inhaltlich bedeutendes Substantiv ist und kein lediglich füllendes Funktionswort. Die jüngere stilometrische Forschung präferiert für die Unterscheidung von Autorstilen bekanntlich eher inhaltsleere Funktionswörter wie Artikel, Pronomen oder Konjunktionen, da diese von den Autoren tendenziell unbewusst eingesetzt werden.[30] ›prîs‹ als semantisch aussagekräftiges Wort hingegen wäre so gesehen eher unter den topic-bezogenen Markern einzuordnen, also unter den Worten, deren Verwendung beispielsweise von der Thematik oder der Gattung beeinflusst wird.[31] Nun ist ›prîs‹ im Sinne von Belohnung ritterlicher Bewährung zweifelsohne ein Wort, das man in höfischer Artusliteratur erwarten würde, aber es bleibt immer noch auffällig, dass das Wort in den Artusromanen Hartmanns viel seltener auftaucht. Und ebenso erklärungsbedürftig wäre, wieso Wolfram ›prîs‹ sowohl im Parzival als auch im Willehalm häufiger gebraucht, die streng genommen gar nicht zur selben Gattung gehören.[32] Viel mehr als eine Gattungsvorgabe scheint sich hier also eine Art Dichterkonzept Wolframs anzudeuten, der den höfischen Leitbegriff ›prîs‹ gattungsübergreifend zum Einsatz bringt.[33]
3. Gattungsstil
Diese Zwischenstellung des Wortes ›prîs‹ zwischen den einzelnen Stilebenen bringt mich nun wieder zurück zu der Frage, ob mittelalterliche Literatur vermehrt von Traditionsvorgaben beeinflusst ist und zurück zu dem vielschichtigen Begriff der Gattung. Die Verwendung von ›prîs‹ bei Wolfram hat gezeigt, dass es offensichtlich gewisse thematische oder konzeptuelle Vorgaben gibt, die quer zu diesen Gattungen liegen. Parzival und Willehalm gehören aus literaturwissenschaftlicher Sicht zwar unterschiedlichen Gattungen an, sie sind aber aus sprachlicher Sicht durch ein ähnliches Vokabular geprägt, mit dem Wolfram auf seine spezielle Art ein höfisches Idealbild entwirft. Das heißt aber, dass der stilistische Befund nicht immer ausreichend zur Differenzierung von Gattungen ist, zumindest von Gattungen, wie sie in der Literaturwissenschaft eingeführt sind.
Aus literaturwissenschaftlicher Sicht sind Gattungen nämlich vielschichtige Gebilde, die sich nicht oder nicht nur durch einen ähnlichen Stil auszeichnen, sondern auch durch ähnliche Thematik, ähnliche Figurenkonstellationen oder andere Faktoren bestimmt sein können. Gattungen sind so gesehen Sammelbegriffe, die ganz unterschiedliche Aspekte vereinen, die nicht immer auf derselben kategorialen Ebene liegen müssen. So kann etwa das rein äußerlich-formal hervorgehobene Sonett (eine Gedichtform mit zweimal vier und zweimal drei Zeilen) ebenso als Untergattung gelten wie beispielsweise der sich durch seine Hauptfigur auszeichnende Alexanderroman (ein episches Werk, welches über das Leben Alexanders des Großen erzählt). Letztlich – so hat die literaturwissenschaftliche Gattungstheorie bereits seit den 1970er Jahren herausgearbeitet – sind Gattungen in erster Linie institutionell bestimmt, sie sind Ordnungsbegriffe, die in die literarische Diskussion eingeführt werden und den Erwartungshorizont von Autoren und Lesern determinieren.[34]
Das heißt aber auch, dass der literaturwissenschaftliche Gattungsbegriff nicht unbedingt mit dem sprachwissenschaftlichen Begriff von Textsorten deckungsgleich sein muss.Dass es ratsam ist, bei der textstatistischen Analyse zwischen eher literaturwissenschaftlich bestimmten genres und eher linguistisch bestimmten text types zu differenzieren, hat bereits Douglas Biber erkannt, der sich in den 90er Jahren mit der stilometrischen Gattungsbestimmung beschäftigt hat und damit als Vorreiter auf dem Gebiet gelten kann. Genres sind für Biber, »text varieties that are readily recognized and ›named‹ within a culture (e.g., letters, press editorials, sermons, conversation)«, entsprechen also dem institutionell bestimmten, literaturwissenschaftlichen Modell, während der Begriff text types für »varieties that are defined linguistically (rather than perceptually)«[35] vorbehalten ist. Zwar können sich sowohl genres als auch text-types durch gewisse stilistische Eigenarten auszeichnen, aber nur text-types sind per definitionem dadurch determiniert:
»Both genres and text types can be characterized by reference to co-occurring linguistic features, but text types are further defined quantitatively such that the texts in a type all share frequent use of the same set of co-occurring linguistic features.«[36]
Genres müssen dagegen nicht unbedingt sprachlich kohärent sein: »Genres have a perceptual basis in a given culture, but they are not necessarily linguistically coherent.«[37]
Das Problem scheint mir nun zu sein, dass die stilometrische Analyse eher dafür geschaffen ist, text types zu untersuchen, dass es aus literaturwissenschaftlicher Sicht aber eigentlich aufschlussreicher wäre, genres bestimmen zu können. Aus literaturwissenschaftlicher Sicht sind Gattungen hochgradig unfeste Größen, die vor allem aufgrund ihrer historischen Veränderlichkeit nur schwer zu fassen sind. Nur allzu oft scheinen sich Texte der gattungsmäßigen Einordnung zu widersetzen bzw. die einmal festgelegten Gattungsgrenzen zu überschreiten. Diese Schwierigkeiten bei der Kategorisierung hat die Gattungsforschung dazu gebracht, Gattungen als historisch offene Kategorien mit prototypensemantischen Kernen zu definieren. Und einmal mehr ist die Situation im Mittelalter besonders prekär, denn anders als wir das vom heutigen Literaturbetrieb gewöhnt sind, ist Literatur im Mittelalter kein ausdifferenziertes, institutionalisiertes Teilsystem der Gesellschaft. Es fehlen die festen Rahmenbedingungen, die wir von einem modernen Literaturbetrieb kennen, wo die Zugehörigkeit von Texten zu Gattungen viel stärker reflektiert werden, als dies im Mittelalter der Fall war. Mittelalterliche volkssprachige Textsorten hingegen sind eher durch eine sich immer wieder neu formierende, mündliche Aufführungssituation determiniert als durch eine feste Vorstellung davon, wie Gattungen aussehen müssen.[38]
Ich möchte an meinem letzten Beispiel zeigen, was dieser Umstand für die Kategorienbildung bedeuten kann. Ich gehe dazu von der Gattung der Epik zum Bereich der Lyrik über. Die mittelhochdeutsche Lyrik wird traditionell in zwei Unterarten eingeteilt, in den Minnesang und den Sangspruch. Die Abgrenzung zwischen diesen beiden Unterarten ist äußerst unscharf und letztlich nur thematisch bedingt. Minnesang ist grundsätzlich Dichtung, in der von höfischer Liebe, also der so genannten Minne, die Rede ist. Demgegenüber kann der Sangspruch nur negativ definiert werden, er gilt als alles das im Rahmen mittelalterlicher Lieddichtung, was nicht Minnesang ist.[39]
Wollte man sich nun mit stilometrischen Methoden an einer genaueren Differenzierung dieser beiden Formen versuchen, so wird ersichtlich, dass eine Auszählung der häufigsten Wörter für den Minnesang ein durchaus interessantes Ergebnis bringt, das schon in einer Darstellung der bekannten Minnesang-Anthologie Minnesangs Frühling als Wordcloud auf dem ersten Blick ins Auge fällt (Abbildung 4):[40]
Es zeigt sich, dass diese Gattung ganz offensichtlich durch den überdurchschnittlich häufigen Gebrauch des Personalpronomens in der ersten Person geprägt ist (also in erster Linie durch ›ich‹, aber auch durch die abgeleiteten Formen ›mir‹ und ›mich‹). Dies entspricht der gängigen Einschätzung des Minnesangs als Rollenlyrik, bei der der Sänger sein Ich zwischen den beiden Polen ›ich minne‹ und ›ich singe‹ konstituiert. Viel mehr als um die höfische Liebe selbst geht es also im Minnesang um das Singen davon, um das Ich, das sich als Liebender definiert.[41] Der Sangspruch scheint demgegenüber kein ähnlich klares Bild zu bieten, was bis zu einem gewissen Grad bei einer nur negativ definierten Textgruppe auch zu erwarten ist.
Dieser Befund könnte damit zu tun haben, dass der Minnesang ein relativ streng formiertes Handeln mit ritualähnlichem Charakter darstellt, das seinen festen Platz in der höfischen Festkultur hat[42] und sich daher auch durch besondere formale und thematische Stringenz auszeichnet. Der Sangspruch hingegen ist eher eine lockere Form, die vielfältige Füllungen zulässt. Diese Schieflage deutet darauf hin, dass die einzelnen literarischen Gattungen im Mittelalter offenbar keine gleichgeordneten Kategorien darstellen: Stärker profilierten Textgruppen stehen solche gegenüber, die weniger ausgeprägt sind. Und eine solche ungleichgewichtete Kategorienbildung wäre auch bei einer quantitativen Auswertung zu berücksichtigen. Es steht zu vermuten, dass man der Komplexität von Gattungskategorien durch eine stilometrische Auswertung alleine nicht gerecht werden kann. Notwendig wäre hier ein multi-dimensionaler Zugang, der auch andere Faktoren wie Thematik, Figurenkonstellation und schließlich auch die institutionelle Einbettung von Gattungen in den Blick nimmt.[43]
4. Schluss
Ich breche hier meine Beispielreihe ab und fasse meine Überlegungen zusammen: Ich hoffe mit meinen Explorationen gezeigt zu haben, dass sowohl traditionelle Literaturwissenschaft als auch Stilometrie bei gegenseitiger Kenntnisnahme voneinander profitieren können. Die traditionelle Literaturwissenschaft wird wohl erst dann bereit sein, sich auf quantifizierende Verfahrensweisen einzulassen, wenn diese den Anschluss an ihre aktuellen Fragestellungen suchen. Wenn diese Verbindung aber hergestellt ist, dann – so legen die hier gezeigten vorläufigen Ergebnissen zumindest nahe – könnte die Stilometrie durchaus ihren Beitrag zu theoretischen Debatten der Mediävistik leisten, etwa wenn es um die Frage geht, ob der Individualstil und damit die Profilierung von Autorschaft vielleicht nicht doch eine größere Rolle spielt als mitunter in der mediävistischen Forschung angenommen. Umgekehrt sollte die Stilometrie darauf achten, was die traditionelle Literaturwissenschaft in Hinblick auf die verwendeten Kategorien zu sagen hat. Denn tut sie das nicht und überblendet leichtfertig quantitative Textanalyse und Hermeneutik, dann lassen sich zwar messbare Ergebnisse erzielen, die aber an den Objekten der Literaturwissenschaft vorbeigehen. Erst die Herausarbeitung der Differenzen schafft die Voraussetzung für eine gegenseitige Befruchtung der Disziplinen und ermöglicht einen ›methodischen Brückenschlag‹, der über die bloße ›feindliche Übernahme‹ hinausgeht.[44]