Abstract
Die erste Frauenbewegung ist eine der großen sozialen Bewegungen des 19. und frühen 20. Jahrhunderts mit einem beträchtlichen Kommunikationsaufkommen. Wir fragen in diesem Beitrag, wie sich sprach-, themen- und kommunikationsgeschichtliche Forschungen in diesem Bereich durch Digital Humanities-Verfahren unterstützen lassen. Wir stellen die Konzeption eines integrierten Dokumentationssystems vor, das eine lexikalische Dokumentation, ein Volltext-Korpus und sprach- bzw. kommunikationsgeschichtliche Untersuchungen verbindet, und zeigen, wie sich die Forschungsarbeit an eine große Forschungsinfrastruktur (CLARIN-D) anbinden lässt.
The first women's movement of the 19th and early 20th centuries was one of the major social movements which produced an immense body of texts. In this paper, we explore the ways in which research into the history of language use, topic development, and forms of communication in the first women's movement can be supported by Digital Humanities methods. We present an integrated documentation system that combines lexical documentation, a full-text corpus and linguistic investigations (such as on argumentation, word usage, etc.), and we show how this type of research activity can be integrated into a large infrastructure project (CLARIN-D).
- 1. Einleitung
- 2. Die erste Frauenbewegung
- 3. Kommunikations- und Sprachgeschichte der alten Frauenbewegung. Fachliche Ziele und Fragestellungen
- 3.1 Diskursorganisation
- 3.2 Handlungs- und Argumentationsstrukturen
- 3.3 Wortgebrauch
- 4. Eine integrierte Publikations- und Dokumentationsumgebung
- 4.1 Digitale Quellentexte und das TeF-Korpus
- 4.2 Dokumentation des Wortgebrauchs
- 4.3 Sprach- und kommunikationsbezogene Untersuchungsergebnisse
- 5. Möglichkeiten der digitalen Unterstützung der Untersuchungen
- 5.1 Digitale Texte
- 5.2 Formen des Markup und der Annotation
- 5.3 Editorische Erschließung
- 5.4 Formen der Wortschatz- und Wortgebrauchserschließung
- 5.5 Argumentations- bzw. Kontroversen-Visualisierung
- 6. Die Anbindung an das Infrastrukturprojekt CLARIN-D
- 6.1 Das TeF-Korpus im Deutschen Textarchiv
- 6.2 Schnittstellen der lexikalischen Dokumentation
- 7. Zusammenfassung und Ausblick
- Bibliographische Angaben
- Abbildungslegenden und -nachweise
1. Einleitung
In diesem Beitrag stellen wir laufende Arbeiten und Planungen für ein Forschungsprojekt zum Sprachgebrauch und zu Formen der Kommunikation im Umkreis der sogenannten ersten oder alten Frauenbewegung (1865–1933) vor.[1] Zentraler Gegenstand sind Texte von Autorinnen, die der ersten Frauenbewegung zuzuordnen sind. Wir berücksichtigen für bestimmte Gesichtspunkte, z.B. intertextuelle Bezüge, aber auch Texte von Gegnerinnen und Gegnern. Im Mittelpunkt dieses Beitrags steht die Frage, inwiefern digitale Ressourcen und Verfahren die sprachlichen und kommunikationsgeschichtlichen Untersuchungen und die darauf bezogene Ergebnispräsentation unterstützen bzw. verbessern können. Es werden darüber hinaus Überlegungen angestellt, wie solche Arbeiten an ein Infrastrukturprojekt (Clarin-D) angebunden werden können.
Wir gehen hierfür in fünf Schritten vor: Zunächst stellen wir die erste Frauenbewegung kurz vor (Abschnitt 2). Daran anschließend präzisieren wir unsere wesentlichen sprach- und kommunikationsgeschichtlichen Fragestellungen (Abschnitt 3). Aufbauend darauf stellen wir die Konzeption eines integrierten digitalen Dokumentationssystems für sprach- und kommunikationsgeschichtliche Befunde vor (Abschnitt 4) und fragen, wie digitale Ressourcen die sprachlichen und kommunikationsgeschichtlichen Untersuchungen selbst fördern können (Abschnitt 5). Abschließend präsentieren wir Überlegungen zur Anbindung solcher Arbeiten an die Infrastruktur, die im Clarin-D-Projekt derzeit aufgebaut wird (Abschnitt 6).
2. Die erste Frauenbewegung
Die erste Frauenbewegung gehörte zu den großen sozialen Strömungen des 19. und frühen 20. Jahrhunderts. Mitglieder waren im Wesentlichen Frauen, auch wenn Männer aus dem proletarischen und liberalen Spektrum – vor allem in der Mitte des 19. Jahrhunderts – diese Bewegung auch mittrugen. Den Kernziel der Partizipation von Frauen an der bürgerlichen Gesellschaft dienten u.a. die Verbesserung der Lage der Frauen im Bereich der Bildung und der Beteiligungsmöglichkeiten in den Bereichen Politik und Erwerbsarbeit. Eng verbunden mit den Diskussionen um die Rechte von Frauen waren Auseinandersetzungen um Lebensentwürfe von Frauen und um Fragen des Geschlechterverhältnisses.
Die Bewegung formte verschiedene Flügel aus und setzte sich aus einer dezidiert bürgerlichen Strömung (mit einer gemäßigten und einer radikaleren Richtung) und einer proletarischen zusammen. Hinter den verschiedenen Flügeln standen unterschiedliche Emanzipationskonzepte und sich teilweise widersprechende methodische Ansichten. Zu den prominenten Autorinnen des bürgerlichen Flügels gehörten etwa Helene Lange, Gertrud Bäumer, Lida Gustava Heymann, Anita Augspurg und Auguste Kirchhoff, die zentrale Autorin im Lager der proletarischen Frauenbewegung war zweifellos Clara Zetkin.[2]
Die erste Frauenbewegung des 19. und beginnenden 20. Jahrhunderts war auch eine kommunikative Bewegung. Denn um ihre Forderungen im öffentlichen Raum zu thematisieren und zu begründen, nutzten die Vertreterinnen (und auch ein paar wenige männliche Unterstützer) der Frauenbewegung ganz unterschiedliche Medien und kommunikative Formen. Dazu gehörten mündliche Formen, wie z.B. Reden oder Redebeiträge in Gremien, vor allem aber handelt es sich um medial verbreitete, geschriebene Texte. In eigenen Zeitschriften, in Petitionen, in umfangreichen Begleitschriften zu Petitionen, in Sitzungsprotokollen, privaten Briefen, Flugschriften und Monographien legten die Autorinnen ihre Anliegen, Motive, Hoffnungen, Forderungen und Argumente dar und versuchten so, die Notwendigkeit von Veränderungen der Geschlechterordnung zu begründen.[3] Ein fünfbändiges Handbuch der Frauenbewegung, das 1901–1906 von Helene Lange und Gertrud Bäumer herausgegeben wurde (Abbildung 1), systematisiert aus einer zeitgenössischen Perspektive den erreichten Stand der Diskussion in den unterschiedlichen Themenbereichen:
Eine über 700 Seiten umfassende Bibliographie Die Frauenfrage in Deutschland. Strömungen und Gegenströmungen 1790-1930, die 1934 von Hans Sveistrup und Agnes von Zahn-Harnack herausgegeben wurde, dokumentiert die Texte aus dem Umkreis der ersten Frauenbewegung und das erweiterte kommunikative Umfeld der einzelnen Fragen, Streitpunkte und Themenbereiche (Abbildung 2).
Die erste Frauenbewegung im deutschsprachigen Raum ist eingebettet in einen mehrsprachigen Quellenraum, in dem nicht nur deutsche Quellen, sondern auch Bezugstexte aus der europäischen Tradition der Aufklärung (z.B. Rousseau, Wollstonecraft), der europäischen Frauenbewegung und aus dem nordamerikanischen Diskurs des 19. Jahrhunderts für argumentative Zwecke genutzt wurden. Dieser Befund verweist auf die enge Verflechtung weltweiter Frauenbewegungen, die in der Gründung des ICW (= International Council of Women, 1888) einen organisatorischen Rahmen fanden, auf die auch private Vernetzung der Protagonistinnen und auf eine damit verbundene dichte Kommunikation.[4]
Zentrale Themenfelder, Streitpunkte und Forderungen in der Hochphase der ersten Frauenbewegung um 1900 betreffen vor allem die folgenden vier Bereiche[5]:
- (i) politische Partizipation (u.a. aktives und passives Wahlrecht),
- (ii) Bildung (u.a. Mädchenschulwesen, Hochschulzugang),
- (iii) Erwerbsarbeit (u.a. Zugang zu beruflichen Tätigkeiten, gerechter Lohn) und
- (iv) Sexualmoral (u.a. Prostitutionsdiskurs, §218, uneheliche Mutterschaft).
Einzelne Themen der ersten Frauenbewegung um 1900 sind in ihren sozial- und ideengeschichtlichen Grundzügen recht gut erforscht. Dagegen ist eine umfassende und detaillierte Untersuchung und Dokumentation von kommunikativen Verfahren, Thematisierungspraktiken sowie des Sprachgebrauchs der Autorinnen und der Texte im Umkreis der ersten Frauenbewegung bisher nach wie vor ein Desiderat.
3. Kommunikations- und Sprachgeschichte der alten Frauenbewegung.
Fachliche Ziele und Fragestellungen
Unser fachliches Ziel ist es, einen Beitrag zur bislang nicht bzw. nur in Ansätzen geschriebenen Kommunikations- und Sprachgeschichte der ersten Frauenbewegung und zu einer Themen- bzw. Thematisierungsgeschichte zahlreicher Fragen zu leisten, bei denen die Ordnung der Geschlechterverhältnisse im Zentrum stehen.[6] Im Vordergrund unseres Vorhabens steht dabei die interne und externe Kommunikation im Umkreis der ersten Frauenbewegung.
Die systematische Analyse des Sprachgebrauchs und der kommunikativen Strukturen lässt sich drei großen Untersuchungsbereichen zuordnen: (i) Diskursorganisation; (ii) Handlungsformen, Argumentationsweisen und Thematisierungspraktiken; (iii) Wortgebrauch.
Fragestellungen dieser Art sind im Schnittpunkt von historischer Diskursanalyse, historischer Argumentationsforschung und historischer Lexikologie und Semantik zu verorten. Dabei sind im Einzelnen auch zahlreiche weitere Disziplinen berührt, z.B. historische Soziolinguistik, historische Textlinguistik, Bildungsgeschichte, Geschlechtergeschichte, Sozialgeschichte.
Die genannten Untersuchungsbereiche lassen sich mit Leitfragen konkretisieren, die auch als Grundlage für die Beurteilung dienen sollen, inwiefern einzelne Digital Humanities-Werkzeuge und -Methoden für die jeweiligen Teilfragen und Teilaufgaben erheblich und nützlich sein können.
3.1 Diskursorganisation
Texte und Kommunikationsbeiträge im Rahmen der ersten Frauenbewegung sind in aller Regel keine isolierten Einzelereignisse. Vielmehr sind sie auf übergeordnete Fragestellungen und Themen bezogen und weisen vielfach Bezüge zu thematisch verwandten Beiträgen, zu gegnerischen Schriften und Textpassagen in Schriften von Gewährsleuten, die zur Stützung eigener Positionen genutzt werden, auf. Einzelne Kommunikationsbeiträge sind Teile größerer Einheiten, die sich als Diskurse modellieren und auf die sich unterschiedliche Methoden der linguistischen Diskursforschung anwenden lassen. Besonders produktiv erscheinen uns dafür die methodischen und beschreibungspraktischen Vorschläge der Düsseldorfer Schule um Georg Stötzel, Martin Wengeler und Dietrich Busse, die bislang in Breite vor allem für eine Sprachgeschichte der Nachkriegszeit genutzt wurden.[7]
Im Hinblick auf den Aspekt der Diskursorganisation lassen sich folgende Leitfragen formulieren, die zum einen auf eine kommunikationsgeschichtliche Kartographie der thematischen Stränge zielen, die darüber hinaus aber auch beschreibungspraktische Grundlagen für die Auswahl von Texten und die Entscheidung darüber liefern, in welcher Weise und mit welcher Detailgenauigkeit einzelne Texte herangezogen werden sollen. Zu diesen Leitfragen gehören insbesondere die folgenden:
- (i) Wie lassen sich einzelne thematische und diskursive Stränge abgrenzen und in ihren Verläufen und diskursiven Zusammenhängen rekonstruieren?
- (ii) Welche Einzeltexte gehören jeweils zu einem bestimmten diskursiven Strang?
- (iii) Welche Medien und textuellen Darstellungsformen werden in einem bestimmten diskursiven Strang jeweils (von wem) genutzt?
- (iv) Welche intertextuellen Bezüge sind zwischen einzelnen Beiträgen und zwischen Teilen von Beiträgen eines diskursiven Strangs erkennbar?
- (v) Mit welchen sprachlichen Verfahren etablieren die Autorinnen Bezüge zu anderen Texten, die entweder zur Stützung eigener Positionen oder aber als Beispiele für gegnerische Positionen angeführt werden?
- (vi) Welche Beteiligungsrollen sind in einzelnen Diskursen und Teildiskursen erkennbar?
3.2 Handlungs- und Argumentationsstrukturen
Die Analyse von Formen des sprachlichen Handelns ist ein zentraler Schwerpunkt der Untersuchung einzelner Texte. Dabei wird gefragt, welche sprachlichen Handlungen überhaupt genutzt werden (z.B. etwas fordern, etwas behaupten, eine Behauptung stützen, jemandem etwas vorwerfen, etwas bestreiten, etwas veranschaulichen), in welcher Abfolge sprachliche Handlungen typischerweise oder in Einzelfällen sequenziert werden und mit welchen sprachlichen Mitteln sie dabei realisiert werden können. Auch die Frage, welche thematischen Aspekte im Rahmen des sprachlichen Handelns zur Sprache kommen, ist ein wichtiger Untersuchungsaspekt.[8] Wenn es um strittige Aspekte geht, spielen natürlich Formen des Argumentierens und des Stützens eine zentrale Rolle. Die unterschiedlichen Werkzeuge der (historischen) Argumentationsforschung sind deshalb von besonderer Bedeutung für unser Vorhaben.
In sehr offener Form kann man diesen Untersuchungsbereich mit folgenden Leitfragen ansprechen:
- (i) Was sind zentrale sprachliche Handlungen und Handlungssequenzen? Was ist ihre kommunikative Rolle?
- (ii) Wie tragen unterschiedliche kommunikative Verfahren und Thematisierungspraktiken zur Etablierung und Stützung bestimmter Sichtweisen bei?
- (iii) Welche sprachlichen Mittel und Verfahren werden dafür im Einzelnen benutzt?
- (iv) Welche Argumentationsformen werden gebraucht, um Sichtweisen und Forderungen zu stützen?
- (v) Welche thematischen Aspekte werden im Rahmen des sprachlichen Handelns genutzt, um Forderungen zu stützen, Sichtweisen einzuführen, Gegner zu diskreditieren usw.?
3.3 Wortgebrauch
Der Wortgebrauch spielt, wie in anderen Diskursen auch, eine zentrale Rolle, nicht nur für die Bewältigung thematischer und textfunktionaler Aufgaben, sondern auch für die Erzeugung bestimmter Sichtweisen bei der Behandlung umstrittener Fragen. Ein Wort wie »Überbürdung« gehört z.B. in den thematischen Umkreis der Diskussion um die Reform der Mädchenbildung. [9] Zu den textfunktionalen sprachlichen Mitteln gehören zum Beispiel die Konnektoren (»nicht nur«, »auch«, »aber«) oder Aufzählungs- und Textstrukturierungsmittel wie »zunächst«. Eine spezifische Sichtweise ist an Wörter wie »Eigenart«, »Geschlechtsunterschied«, »intellektuelle Grenzlinie« oder »Arbeitsteilung« gebunden, die z.B. von Helene Lange im Hinblick auf unterschiedliche Lebens- und Wirkungssphären von Männern und Frauen postuliert wird. Helene Lange bewegt sich damit im Rahmen einer verbreiteten Denkfigur, die man als Differenzhypothese bezeichnen kann. Aber auch traditionelle lexikologische Fragestellungen, z.B. Fragen nach der Rolle von Wortbildungen (»Antistimmrechtlerin«) oder von Fremdwörtern (»vicarieren«) müssen mit einbezogen werden. In Bezug auf solche und andere Aspekte des Wortgebrauchs in Texten der ersten Frauenbewegung kann man folgende Leitfragen formulieren:
- (i) Wie lässt sich der Wortgebrauch dieser Texte in seiner spezifischen Funktionalität charakterisieren und dokumentieren?
- (ii) Wie tragen unterschiedliche Formen des Wortgebrauchs dazu bei, Sichtweisen auf Geschlechterverhältnisse zu konstituieren und neue Forderungen zu stützen, durchzusetzen oder ihre Umsetzung zu verhindern?
- (iii) Welche Funktion haben unterschiedliche Wortschatzeinheiten bei der Organisation dieser Texte?
- (iv) Wie unterscheidet sich das lexikalische Profil von Texten aus dem Diskurs um Frauenfragen im Umkreis der ersten Frauenbewegung von Texten aus anderen Domänen des Sprachgebrauchs?
- (v) Welche Rolle spielen Wortbildung, Metaphorik, lexikalische Kreativität und andere Verfahren als kommunikative Ressourcen?
Damit sind die wesentlichen Bereich kurz charakterisiert, in denen unsere fachlichen Ziele liegen. Wir kommen nun zur Unterstützung der Arbeit durch digitale Ressourcen und betrachten diese Frage zunächst vom Ende her: Wie sollen und können die Befunde zu den gerade genannten Forschungsbereichen formuliert, publiziert und in geeigneter Form dokumentiert werden? Damit sind wir bei einer ersten Form der Unterstützung eines solchen Projekts durch eine integrierte digitale Publikations- und Dokumentationsumgebung.
4. Eine integrierte Publikations- und Dokumentationsumgebung
Eine integrierte digitale Dokumentations- und Publikationsumgebung umfasst drei wesentliche Säulen bzw. Komponenten, deren Bestandteile untereinander vernetzt sind: (i) ein strukturiertes digitales Textkorpus; (ii) eine lexikalische Komponente zur Charakterisierung und Dokumentation des Wortgebrauchs; (iii) eine Komponente mit sprach- und kommunikationsbezogenen Untersuchungen.
4.1 Digitale Quellentexte und das TeF-Korpus
Im Rahmen unserer Arbeiten haben wir erste Quellentexte als Volltexte erfasst und in standardkonformer Weise gemäß den Richtlinien der Text Encoding Initiative in der aktuell gültigen Version aufbereitet (TEI-P5). Bei der Auswahl haben wir uns bislang an einzelnen Themensträngen (Diskussion um die Mädchenschulreform im Anschluss an die sogenannte Gelbe Broschüre), an größeren Themenbereichen (Wahlrechtsfrage) und an wichtigen Autorinnen (z.B. Hedwig Dohm, Helene Lange) orientiert.
Die Textkodierung erfolgt im sogenannten Basisformat des Deutschen Textarchivs der BBAW (DTABf), das für die Aufbereitung historischer Texte mit dem Ziel entwickelt wurde, eine einheitliche und interoperable Annotation für eine Vielzahl verschiedener Texte zu schaffen. Das DTABf ist eine echte Teilmenge des TEI-P5-Standards und wird im Infrastrukturprojekt CLARIN-D als Best-Practice-Modell für historische Korpora genutzt.[10] Alle Texte durchlaufen einen Qualitätssicherungszyklus über den web-basierten und das kollaborative Arbeiten ermöglichenden DTAQ-Bereich des Deutschen Textarchivs.
Abbildung 3 und Abbildung 4 zeigen zwei Screenshots, auf denen die wesentlichen Eigenschaften dieser Umgebung zu erkennen sind: a) die Annotation der Texte im DTABf-Format, verbunden mit der Möglichkeit, daraus unterschiedliche Ausgabeformate zu erzeugen, insbesondere das in CLARIN-D genutzte TCF-Format, welches für Annotations- und Text-Mining-Aufgaben genutzt wird, eine HTML-Ansicht für die Lektüre auf dem Desktop sowie ein epub- oder mobi-Format für die Ansicht auf mobilen Endgeräten; b) das synoptische Text/Bild-Arrangement und c) das DTAQ-Modul für die Korrekturarbeiten am Text und am Markup.
Ziel der Korrektur im DTAQ ist die Schaffung einer stabilen Version, die dann auch dauerhaft referenziert werden kann. Dies ist zum Beispiel standardisiert über einen CTS-Server (Canonical Text Services for big data) möglich, wie er derzeit in dem Leipziger Projekt The Library of Billion Words (Crane / Heyer) entwickelt wird.
Ein weiterer wichtiger Aspekt besteht darin, dass wir einzelne Texte nicht nur ins DTA einspeisen, sondern zusammen mit einer kommentierenden Einleitung bzw. Untersuchung als ›richtige‹ Veröffentlichung in der Elektronischen Bibliothek der Justus-Liebig-Universität Gießen publizieren (werden). Dieser Schritt hängt mit der unterschiedlichen Art der Gewichtung bzw. Zählung von elektronischen Texten und ›richtigen‹ Publikationen im akademischen Belohnungssystem zusammen, aber auch mit der bibliothekarischen Katalogisierung und dem zusätzlichen Anreiz, der dadurch geschaffen werden kann. Im Hinblick auf die DH-Unterstützung bedeutet dies unter anderem, dass wir ein geeignetes Satzsystem benötigen, das aus einer XML-kodierten Quelle ein vernünftiges Satzprodukt erstellt. Obwohl es eine Reihe von Systemen gibt (z.B. Tustep, Indesign, XML-Print), ist diese Aufgabe in der praktischen Umsetzung nicht trivial. Sie ist nur dann vollautomatisch möglich, wenn die Texte im Vorfeld einheitlich bezüglich ihrer TEI-P5-Kodierung annotiert wurden. Ein Beispiel hierfür liefert die an der BBAW entwickelte Digitale Arbeitsumgebung für das BBAW-Editionsvorhaben Schleiermacher in Berlin 1808–1834.
Die Frage der Textmenge und des Mengengerüsts steht vorläufig nicht im Vordergrund, weil wir derzeit themenorientiert arbeiten und die gewählten Themenbereiche sukzessive ausbauen. Der weitere Ausbau geht in die Richtung eines strukturierten Korpus zu Texten der ersten Frauenbewegung (TeF-Korpus), in dem alle wesentlichen thematischen Stränge abgedeckt sein sollen. Mit Hilfe zusätzlicher Metadaten (neben Autorin, Datierung etc.) sollen dann auch Markierungen zu spezifischen Diskursbereichen (z.B. Wahlrechtsdiskurs), zu einzelnen Themensträngen, zu den genutzten Text- und Medientypen erfolgen, ggf. auch um Autorinnen den bereits erwähnten ›Flügeln‹ innerhalb der Frauenbewegung zuordnen zu können.
4.2 Dokumentation des Wortgebrauchs
Die zweite Komponente des integrierten Publikations- und Dokumentationssystems dient der Charakterisierung und der Dokumentation des Wortgebrauchs. Hier beschreiben wir in erster Linie die lexikalischen Mittel, die für die kommunikativen Ziele innerhalb der Diskurse im Umkreis der ersten Frauenbewegung erheblich sind. Dazu gehören, um nur drei Beispielgruppen zu nennen, Bezeichnungen für zentrale Forderungen (»Frauenstimmrecht«), Bezeichnungen, die bestimmten Denkfiguren und Grundannahmen zuzuordnen sind (z.B. »Sphäre«, »Herd«), oder auch der polemische Wortschatz (z.B. »Frauenlandsturm« als abschätzige Bezeichnung der Gegnerinnen und Gegner, als es um die Petitionen zum Bürgerlichen Gesetzbuch um 1900 ging).
Der Kern der lexikalischen Beschreibungen sind strukturierte Wortartikel, in denen die einzelnen Verwendungsweisen (Lesarten) von Wörtern lexikographisch beschrieben und mit geeigneten Belegen auf den textuellen Gebrauch bezogen werden. Darüber hinaus werden die einzelnen Bedeutungspositionen durch Deskriptoren intern markiert, so dass eine thematische, funktionale, gruppenspezifische usw. Erschließung des Wortgebrauchs ermöglicht wird.
Im Folgenden geben wir einen Ausschnitt aus einem solchen Artikel: Die wesentlichen Informationspositionen lassen sich entsprechend den Vorgaben der TEI-P5 in Form- und Bedeutungsbeschreibungen unterteilen. Zu den Formangaben gehören das Lemma (genauer die Lemmazeichengestaltangabe) und die grammatischen Angaben, zur Bedeutungsbeschreibung die Lesarten, Bedeutungsparaphrasen und Belege sowie die Markierungen zu unterschiedlichen Gebrauchsdimensionen (z.B. diasystematische Merkmale, Bezüge zu argumentativ-ideologischen Systemstellen). Über die Belegstellenangabe, wenn diese eindeutig auf den Ursprungstext über einen persistenten Identifizierer referenzierbar ist, ist eine Verlinkung mit dem Volltext möglich. Die Markierungen dienen der systematischen Erschließung des Wortgebrauchs, können aber auch genutzt werden, um einzelne Verwendungsweisen von Ausdrücken mit denjenigen Passagen in den Untersuchungen zu verlinken, in denen der entsprechende Aspekt (z.B. Wortbildung oder eine bestimmte Denk-Systemstelle) behandelt wird. Die Verwendungsweise des Substantivs Herd, die sich auf die Systemstelle »Differenzhypothese« bezieht, würde im Druckbild etwa so aussehen:
Eine Verlinkung ist aber nicht nur vom Wortartikel aus denkbar. Umgekehrt lässt sich über das Stichwort und ggf. die Verwendungsweisen-Zählung aus den monographischen Darstellungen heraus auf Artikel und Artikelteile verweisen. Wir greifen damit eine Darstellungsidee auf, die Alfred Schirmer in seinem Wörterbuch der Kaufmannssprache (1911) entworfen und damals mit typographischen Mitteln realisiert hatte. Wenn die Belegstellenangaben in den Wortartikeln seiten- und zeilengenau mit den Volltexten verbunden werden, erweitern wir auf diese Weise traditionelle diskursanalytische Darstellungsformen[11] um eine lexikographische Komponente und um eine Anbindung an die Volltexte.
Eine wichtige Zielsetzung der lexikalischen Dokumentation ist es darüber hinaus, die Resultate und Befunde systematisch ›ansprechbar‹ zu machen für die laufenden und zukünftigen Wörterbuchprojekte, z.B. beim DWDS, beim IDS oder auch an den Akademien. Hierfür ist es nötig, entsprechende Kodierungsschemata zu entwerfen (im Falle von XML wären dies XML-Schemata), mit denen die Anbindung an diese Projekte über Schnittstellen automatisierbar möglich ist. Als Beispiel dient der bereits oben aufgeführte Wortartikel für Herd. Der Artikel ist hier in die Werkstattsprache des DWDS (vgl. Abbildung 5) überführt.[12] Diese ist, was die lexikographischen Merkmale angeht, verlustfrei in den TEI-P5-Standard überführbar. Die Metadaten hingegen, wie beispielsweise Quelle und Zeitstempel, können durch eine Anpassung (customization) von TEI-P5 abgebildet werden. Über die Elemente <Verweis>, <Ziel_url> und <Ziellesart> lässt sich ein Artikel aus dem Tef-Wörterbuch direkt auf die Lesart Nr. 1 des entsprechenden Artikels im DWDS-Wörterbuch referenzieren (Abbildung 5).
4.3 Sprach- und kommunikationsbezogene Untersuchungsergebnisse
Idealerweise sind auch Untersuchungsergebnisse zum Wortgebrauch und zu kommunikativen Aspekten ein Teil der digitalen Dokumentation, soweit dies nicht mit anderen Vorgaben kollidiert. Zu solchen Darstellungen gehören etwa Qualifikationsschriften über bestimmte Bereiche der Diskussion (z.B. Frauenwahlrecht), aufsatzartige Darstellungen zu einzelnen Untersuchungsaspekten (z.B. Wortbildung), aber auch die Einleitungen und kommentierenden Untersuchungen zu Einzeltexten. Das Vernetzungspotential aus den Untersuchungen in Richtung lexikalische Dokumentation wurde bereits erwähnt. Umgekehrt lässt sich auch aus der lexikalischen Dokumentation heraus auf bestimmte Kapitel einer Untersuchung verweisen, sofern diese Textteile referenziert und durch Anker adressierbar sind. Wir geben ein schematisches Beispiel dafür (Abbildung 6).
Wir verlassen nun den Bereich der digital integrierten Ergebnisdokumentation und kommen zu der Frage, wie sich die sprachlichen und kommunikationsbezogenen Untersuchungen, die ja den wissenschaftlichen Kern des Projekts darstellen, mit digitalen Mitteln unterstützen lassen.
5. Möglichkeiten der digitalen Unterstützung der Untersuchungen
Unser Ziel besteht nicht primär darin, die Möglichkeiten der digitalen Geisteswissenschaften bzw. Digital Humanities (DH) im Bereich der ›avantgardistischen‹ Anwendungen zu erweitern. Wir sind primär an der Frage interessiert, wie sich fachlich vorgegebene Zielsetzungen durch die Anwendung von DH-Ressourcen und -Werkzeugen unterstützen lassen. Und wir sind im Hinblick auf eine kritische Prüfung des Mehrwert-Versprechens auch interessiert an den typischen Schwierigkeiten sowie an Grenzen der Anwendbarkeit, der Nützlichkeit und der Effizienz von DH-Methoden.
Unsere Fragestellungen und Zielsetzungen sind zum einen projektspezifisch, sie haben darüber hinaus aber exemplarischen Charakter. Wir betrachten unser Thema auch als stellvertretend bzw. typisch für eine ganze Klasse von diskursorientierten, pragmatischen und lexikologischen bzw. historisch-semantischen Fragestellungen und der damit verbundenen Nutzung digitaler Textkorpora und Werkzeuge. Es ist damit ein paradigmatischer Fall für die Anforderungen, die geisteswissenschaftliche Projekte dieser Art an die Datennutzungsmethoden der DH stellen.
Wir stellen hier zunächst basale Anwendungen von DH-Verfahren zusammen, deren Nutzen in der Korpuslinguistik und in der Texttechnologie unumstritten und weithin akzeptiert ist.
5.1 Digitale Texte
Digitale Texte werden zusammen mit den darauf bezogenen Konkordanzwerkzeugen und Rechercheverfahren in erster Linie im Bereich der lexikalischen Analyse genutzt. Zu den fachlichen Zwecken in diesem Bereich gehören u.a. die Unterscheidung von Verwendungsweisen und ihre semantische Beschreibung, die Ermittlung spezifischer Diskursfunktionen von Wörtern, die Ermittlung von Wortbildungszusammenhängen und die Beurteilung von Frequenzverhältnissen innerhalb von Texten, Textgruppen, aber auch vor dem Hintergrund eines Referenzkorpus.
5.2 Formen des Markup und der Annotation
Formen des Markup und der automatischen Annotation spielen − unabhängig von ihrer Rolle für Standardisierung, Interoperabilität, Nachnutzbarkeit − für fachliche Interessen im engeren Sinne zunächst eine eher vermittelte bzw. vorbereitende Rolle, etwa bei kombinierten Abfragen, in denen Wortarten berücksichtigt werden sollen und bei denen ein Part-of-Speech-Tagging genutzt wird. Mit automatischen Mitteln lassen sich Wortformen lemmatisieren und ggf. zerlegen, Eigennamen erkennen, mit Thesauri kann ein semantisches Tagging vorbereitet werden, auch stehen eine Reihe von Parsern zur Verfügung, mit denen sich syntaktische Annotationen erstellen lassen, die u.a. für die Analyse von Konstruktionsmustern genutzt werden können.
Höherwertige Formen der Annotation, gerade dann, wenn diese verlässlich sein sollen, müssen jedoch nach wie vor händisch erstellt werden. Hierzu gehören insbesondere:
- die Markierung von Verwendungsweisen im Rahmen der lexikalischen Dokumentation im Hinblick auf semantische, kommunikative und argumentative Aspekte des Gebrauchs der betreffenden Ausdrücke (sie erlaubt es, die beträchtliche Komplexität des Wortschatzes überschaubar und für Abfragen zugänglich zu machen; z.B. »Suche alle Personenbezeichnungen, mit denen eine abwertende Festlegung verbunden ist«);
- die Auszeichnung von Formen der Metaphorik und anderer rhetorischer bzw. rhetorisch-lexikalischer Strategien;
- die Auszeichnung unterschiedlicher Argumenttypen und ihrer Rolle in größeren argumentativen Kontexten;
- die Auszeichnung von spezifischen Diskursphänomenen wie z.B. intertextuelle Bezüge zu gegnerischen oder stützenden Texten.
Zu den Herausforderungen in diesem Bereich gehört es, dass relevante Textteile von ganz unterschiedlicher Größe sein können und dass unterschiedliche Parameter der Textorganisation auch zu überlappenden Annotationsstrukturen führen und somit inline in XML nicht kodiert werden können. Das Problem der überlappenden Annotationsstrukturen ist jedoch in einem stand-off- und Mehrebenenverfahren lösbar, z.B. in Systemen wie ANNIS oder WebAnno.
5.3 Editorische Erschließung
Auch die digitale editorische Erschließung von Diskursthemen gehört mit zu den fachlichen Aufgaben, die im Sinne einer nachhaltigen und vielfältigen Nutzbarkeit der Texte in Form von kommentierten, thematischen Spezialkorpora geschehen kann.
5.4 Formen der Wortschatz- und Wortgebrauchserschließung
Zu den zentralen Unterstützungsformen gehört auch die Nutzung korpuslinguistischer und lexikographischer Werkzeuge, mit denen digitale Texte bearbeitet, ausgewertet und verglichen werden können. Im Vordergrund stehen dabei semantische Aspekte, Fragen des diskursspezifischen Gebrauchsprofils von Wörtern, morphologische Zusammenhänge in diskursspezifischen Wortschatzsektoren, Frequenzverhältnisse und Frequenzentwicklungen sowie der Abgleich von Texten des TeF-Korpus mit zeitgenössischen Referenzkorpora.
5.5 Argumentations- bzw. Kontroversen-Visualisierung
Verfahren der Argumentations- bzw. Kontroversen-Visualisierung sind ein Bereich, den wir noch nicht erprobt haben, dessen Anwendbarkeit auf historische Auseinandersetzungen wir aber ins Auge fassen.[13]
6. Die Anbindung an das Infrastrukturprojekt CLARIN-D
Unser Projekt zeigt in exemplarischer Weise auf, wie schon bei den Vorarbeiten die Anbindung an eine Infrastrukturumgebung (in unserem Fall Clarin-D) mit bedacht werden kann. Sie betrifft (i) das TeF-Korpus und (ii) die lexikalische Dokumentation.
6.1 Das TeF-Korpus im Deutschen Textarchiv
Das Zentrum Sprache der Berlin-Brandenburgischen Akademie der Wissenschaften (BBAW) ist Partner im Clarin-D-Verbund und damit den Zielen der Standardisierung, der Nachhaltigkeit, der Interoperabilität und der freien Nachnutzbarkeit verpflichtet. Ebenfalls Teil des Zentrum Sprache der BBAW ist das Deutsche Textarchiv (DTA), welches die Aufnahme wichtiger historischer Volltexte in hoher Qualität mit dem Ziel verfolgt, ein Referenzkorpus für das ältere Neuhochdeutsch für die Forschung bereitzustellen. Die Zusammenarbeit des Projekts mit dem DTA liefert für beide Parteien Vorteile: Das Projekt erhält eine sprachtechnologische Expertise, die es allein niemals in dieser Form erreichen könnte; umgekehrt wird das DTA durch die Zusammenarbeit sozusagen ›gefüttert‹ mit neuen Texten aus einem ganz bestimmten Segment des Sprachgebrauchs, das bisher deutlich unterrepräsentiert war.
Eine solche Art von Zusammenarbeit könnte ein Standardmodell für neue korpusgestützte Projekte im Bereich der Geisteswissenschaften sein, bei denen oft das Problem besteht, dass jedes Projekt ›das Rad neu erfindet‹, nicht selten aber auch hinter den etablierten Standards für das Datenmanagement zurückbleibt. Kooperationen dieser Art setzen allerdings voraus, dass eine Einrichtung wie das DTA langfristig als wissenschaftliche Zentraleinrichtung für historische Korpustexte und als Ansprechpartner für neue Projekte zur Verfügung steht (und entsprechend finanziert wird).
6.2 Schnittstellen der lexikalischen Dokumentation
Im Clarin-D-Projekt sind mehrere Zentren vertreten, zu deren Aufgaben die nachhaltige Pflege digitaler lexikalischer Ressourcen gehört. Zu nennen sind hier vor allem das Institut für Deutsche Sprache (Mannheim) und die Arbeitsstelle des Digitalen Wörterbuchs, einem Langzeitvorhaben der BBAW (Berlin).
An Projekte wie das unsere, das spezifische lexikalische Ergebnisse produzieren und dokumentieren soll, kann man folgende Anforderungen stellen:
- (i) Aufbereitung der lexikalischen Dokumentation in strukturierter Form, die den Best-Practice-Richtlinien entspricht, wie sie im Projektverbund von Clarin-D formuliert werden. Im Hinblick auf die Quellentexte bedeutet dies, dass die Daten bezüglich Metadaten und Textdaten im DTABf-Format vorliegen müssen.
- (ii) Besonders wichtig, auch für die interne Vernetzung von Dokumenten, sind eindeutige und praktikabel adressierbare Referenzierungen auf Seiten-, Paragraphen- und ggf. auch Zeilenebene, die auch für Schnittstellen von auswärtigen Systemen nutzbar sind. Auf diese Weise können die Befunde, die in unseren Spezialuntersuchungen dokumentiert sind, auch von allgemeineren Darstellungen aus digital angesprochen werden. Zum Beispiel könnten etwa Wortschatzdokumentationen zum Diskurs um das Frauenwahlrecht auch vom DWDS, von den IDS-Seiten oder von woerterbuchnetz.de aus angesteuert und verlinkt werden.
7. Zusammenfassung und Ausblick
Gegenstand des vorliegenden Beitrags war es, einen Überblick über die laufenden und geplanten Arbeiten zum Sprachgebrauch und zu Formen der Kommunikation in der ersten Frauenbewegung zu geben. Wir haben zunächst die wichtigsten fachlichen Fragestellungen im Bereich der Diskursorganisation, der Handlungs- und Argumentationsformen sowie des Wortgebrauchs erläutert und daran anschließend zu zeigen versucht, welche Rolle eHumanities- bzw. DH-Werkzeuge bei der Ergebnisdokumentation und bei den fachlich orientierten Untersuchungen spielen können.
Eine wichtige Frage war auch die, wie solche Arbeiten rechtzeitig und schon bei der Planung an Infrastruktur-Umgebungen wie Clarin-D angebunden werden können, um die Befolgung fachlicher DH-Standards sicherzustellen.
Die Ausführungen zu diesem spezifischen Projekt betrachten wir gleichzeitig als ein Diskussionsangebot über die Möglichkeiten und Erfordernisse von Projekten, deren Ziele und Gegenstände thematisch unterschiedlich, strukturell aber ähnlich gelagert sind.
Fußnoten
-
[1]Zu den Vorarbeiten gehören insbesondere: (i) ein vom Land Hessen (HMWK) gefördertes Pilot-Projekt (6/2011–12/2011); (ii) eine Gießener Magisterarbeit zu Thematisierungspraktiken und Wortgebrauch im Diskurs um die Mädchenschulreform; (iii) ein laufendes Vorhaben zu Wortgebrauch und Thematisierungspraktiken im Diskurs um das Frauenwahlrecht 1850–1918. Gegenstand dieser Arbeit ist auch die Zusammenstellung eines thematischen Korpus und eines digital nutzbaren und facettiert erschlossenen Glossars; (iv) die Integration von digitalen Volltexten aus dem Themenbereich der Frauenfragen um 1900 in das Deutsche Textarchiv als Teil des CLARIN-D-Verbunds; (v) die Ausarbeitung von kommunikations- und sprachgeschichtlichen Fallstudien sowie von Prototypen der lexikalischen Dokumentation.
-
[2]Zur Frauenbewegung vgl. die Überblicksdarstellungen von Schaser 2006 und Gerhard 1991.
-
[3]Zu den Zeitschriften vgl. Wolff 2007.
-
[4]Vgl. Schöck-Quinteros 2007.
-
[5]Vgl. Wischermann 2003, S. 17 und passim; Mädchenschulgeschichte(n) 2008; Handbuch der Frauenbewegung 1901–1906.
-
[6]Vgl. hierzu auch Gloning 2012.
-
[7]
-
[8]Zum Verhältnis von Handlungsstruktur und Themenstruktur vgl. Schröder 2003; Fritz 2013.
-
[9]Vgl. das Ariadne-Themenheft Mädchenschulgeschichte(n) 2008.
-
[10]
-
[11]Z.B. im Band Kontroverse Begriffe (Stötzel / Wengeler 1995).
-
[12]
-
[13]Vgl. hierzu etwa die Arbeiten von Michael Hoffmann. Auf der Mailingliste ArgThry wurden immer wieder Fragen und Probleme der digitalen Visualisierung von Argumentationen behandelt, so zum Beispiel die Konkurrenz in der Darstellung von sequenziellen und hierarchischen Zusammenhängen im Rahmen von Argumentationen.
Bibliographische Angaben
- Dietrich Busse / Wolfgang Teubert: Ist Diskurs ein sprachwissenschaftliches Objekt? Zur Methodenfrage der historischen Semantik. In: Begriffsgeschichte und Diskursgeschichte. Hg. von Dietrich Busse / Fritz Hermanns / Wolfgang Teubert. Opladen 1994, S. 10–28. [Nachweis im OPAC]
- Gerd Fritz: Dynamische Texttheorie. Gießen 2013. [online]
- Ute Gerhard: Unerhört. Die Geschichte der deutschen Frauenbewegung. Reinbeck 1991. [Nachweis im OPAC]
- Alexander Geyken: Methoden bei der Wörterbuchplanung in Zeiten der Internetlexikographie. In: Lexicographica 30 (2014), S. 73–111. [Nachweis im GBV]
- Thomas Gloning: Diskursive Praktiken, Textorganisation und Wortgebrauch im Umkreis der ersten Frauenbewegung. In: Historische Pragmatik. Hg. von Peter Ernst. Berlin, Boston 2012, S. 127–146 (= Jahrbuch für germanistische Sprachgeschichte 3). [Nachweis im GBV]
- Mädchenschulgeschichte(n). Die preußische Mädchenschulreform und ihre Folgen. Ariadne 53/54 (2008). [Nachweis im GBV]
- Susanne Haaf / Alexander Geyken / Frank Wiegand: The DTA ›Base Format‹: A TEI Subset for the Compilation of a Large Reference Corpus of Printed Text from Multiple Sources. In: Journal of the Text Encoding Initiative (jTEI), 8 (2015). DOI: 10.4000/jtei.1114 [online]
- Handbuch der Frauenbewegung. Hg. von Helene Lange / Gertrud Bäumer. Band I–V. Berlin 1901–1906. [Nachweis im GBV]
- Helene Lange: Die höhere Mädchenschule und ihre Bestimmung. Begleitschrift zu einer Petition an das preußische Unterrichtsministerium und das preußische Abgeordnetenhaus. Berlin 1887. [Nachweis im GBV]
- Helene Lange: Kampfzeiten. Aufsätze und Reden aus vier Jahrzehnten. 2 Bände. Berlin 1928. [Nachweis im GBV]
- Öffentlicher Sprachgebrauch. Praktische, theoretische und historische Perspektiven. Georg Stötzel zum 60. Geburtstag gewidmet. Hg. von Karin Böke / Matthias Jung / Martin Wengeler. Opladen 1996. [Nachweis im GBV]
- Politische Netzwerkerinnen. Internationale Zusammenarbeit von Frauen 1830–1960. Hg. von Eva Schöck-Quinteros / Anja Schüler / Annika Wilmers / Kerstin Wolff. Berlin 2007. [Nachweis im GBV]
- Angelika Schaser: Frauenbewegung in Deutschland. Darmstadt 2006. [Nachweis im GBV]
- Thomas Schröder: Die Handlungsstruktur von Texten. Ein integrativer Beitrag zur Texttheorie. Tübingen 2003. [Nachweis im GBV]
- Georg Stötzel / Martin Wengeler: Kontroverse Begriffe. Geschichte des öffentlichen Sprachgebrauchs in der Bundesrepublik Deutschland. In Zusammenarbeit mit Karin Böke, Hildegard Gorny, Silke Hahn, Matthias Jung, Andreas Musolff, Cornelia Tönnesen. Berlin, New York 1995. [Nachweis im GBV]
- Hans Sveistrup / Agnes von Zahn-Harnack: Die Frauenfrage in Deutschland. Strömungen und Gegenströmungen 1790–1930. Sachlich geordnete und erläuterte Quellenkunde. Burg 1934. [Nachweis im GBV]
- Ulla Wischerman: Frauenbewegungen und Öffentlichkeiten um 1900. Netzwerke – Gegenöffentlichkeiten – Protestinszenierungen. Königstein 2003. [Nachweis im GBV]
- Kerstin Wolff: Ein ungewöhnlicher Schreib-Ort? Frauenrechtlerinnen im deutschen Kaiserreich und ihr politisches Schreiben im Frauenverein – Eine Annäherung. In: Frauen in der literarischen Öffentlichkeit 1780–1918. Hg. von Caroline Bland / Elisa Müller-Adams. Bielefeld 2007, S. 121–142. [Nachweis im GBV]
Abbildungslegenden und -nachweise
- Abb. 1: Helene Lange, Frontispiz, aus: Lange 1928, Bd. 1 (links); Handbuch der Frauenbewegung, Titelblatt, aus: Lange / Bäumer 1901–1906, Bd. 4 [online] (rechts).
- Abb. 2: Bibliographie zur Geschichte der Frauenbewegung 1790–1930 (1934) (Quelle: Thomas Gloning, privat).
- Abb. 3: Arbeitsumgebung im DTA/DTAQ (Deutsches Textarchiv, Qualitätssicherung) (Screenshot: Thomas Gloning).
- Abb. 4: Arbeitsumgebung im DTA/DTAQ (Deutsches Textarchiv, Qualitätssicherung) (Screenshot: Thomas Gloning).
- Abb. 5: Anbindung an das DWDS-Wörterbuch (Quelle: Alexander Geyken).
- Abb. 6: Verbindung von Wortgebrauchsdokumentation, Untersuchungen, Volltext. (Eigene Darstellung: Thomas Gloning).