<?xml version="1.0" encoding="utf-8"?>
<?xml-model href="https://zfdg.de/sites/default/files/medien/zfdg.rng" type="application/xml" schematypens="http://relaxng.org/ns/structure/1.0"?>
<?xml-model href="https://zfdg.de/sites/default/files/medien/zfdg.rng" type="application/xml" schematypens="http://purl.oclc.org/dsdl/schematron"?>
<TEI xmlns="http://www.tei-c.org/ns/1.0" xmlns:tei="http://www.tei-c.org/ns/1.0">
   <teiHeader>
      <fileDesc>
         <titleStmt>
            <title level="a" type="full">OHTM-Dashboard. Interaktives visuelles
               Topic-Modeling-Analyse-Tool</title>
            <title level="a" type="short">OHTM-Dashboard</title>
            <respStmt>
               <resp ref="http://id.loc.gov/vocabulary/relators/aut">Author</resp>
               <resp ref="https://credit.niso.org/contributor-roles/conceptualization/">Conceptualization</resp>
               <resp ref="https://credit.niso.org/contributor-roles/formal-analysis/">Formal analysis</resp>
               <resp ref="https://credit.niso.org/contributor-roles/investigation/">Investigation</resp>
               <resp ref="https://credit.niso.org/contributor-roles/software/">Software</resp>
               <resp ref="https://credit.niso.org/contributor-roles/writing-original-draft/">Writing&#160;– original draft</resp>
               <persName>
                  <forename>Philipp</forename>
                  <surname>Bayerschmidt</surname>
                  <email>philipp.bayerschmidt@fernuni-hagen.de</email>
                  <idno type="gnd">139340135X</idno>
                  <idno type="orcid">0009-0002-2743-2455</idno>
                  <affiliation>FernUniversität in Hagen</affiliation>
               </persName>
            </respStmt>
         </titleStmt>
         <editionStmt>
            <edition n="1.0"/>
            <respStmt>
               <resp ref="http://id.loc.gov/vocabulary/relators/dtm">Technische Redaktion</resp>
               <persName>
                  <forename>Martin</forename>
                  <surname>de la Iglesia</surname>
                  <idno type="gnd">1095143719</idno>
                  <idno type="orcid">0000-0002-9319-4793</idno>
               </persName>
            </respStmt>
            <respStmt>
               <resp ref="http://id.loc.gov/vocabulary/relators/dtm">Technische Redaktion</resp>
               <persName>
                  <forename>Maximilian</forename>
                  <surname>Görmar</surname>
                  <idno type="gnd">1077317964</idno>
                  <idno type="orcid">0000-0003-3608-1140</idno>
               </persName>
            </respStmt>
            <respStmt>
               <resp ref="http://id.loc.gov/vocabulary/relators/pfr">Textredaktion</resp>
               <persName>
                  <forename>Karoline</forename>
                  <surname>Lemke</surname>
                  <idno type="gnd">1187840033</idno>
                  <idno type="orcid">0000-0002-1604-672X</idno>
               </persName>
            </respStmt>
         </editionStmt>
         <publicationStmt>
            <publisher n="Redaktionssitz">
               <orgName>Herzog August Bibliothek</orgName>
               <address>
                  <addrLine>Lessingplatz 1</addrLine>
                  <addrLine>38304 Wolfenbüttel</addrLine>
               </address>
            </publisher>
            <publisher n="herausgebendes Organ">
               <orgName>Forschungsverbund Marbach Weimar Wolfenbüttel</orgName>
               <address>
                  <addrLine>Burgplatz 4</addrLine>
                  <addrLine>99423 Weimar</addrLine>
               </address>
            </publisher>
            <publisher n="herausgebendes Organ">
               <orgName>Digital Humanities im deutschsprachigen Raum e. V.</orgName>
               <address>
                  <addrLine>Hamburg</addrLine>
               </address>
            </publisher>
            <date n="1.0" when="2026-07-01">01.07.2026</date>
            <idno type="doi">10.17175/2026_009</idno>
            <idno type="ppn">1971798894</idno>
            <availability status="free">
               <licence target="https://creativecommons.org/licenses/by-sa/4.0/">CC BY-SA 4.0,
                  sofern nicht anders angegeben.</licence>
            </availability>
         </publicationStmt>
         <seriesStmt>
            <title level="j">Zeitschrift für digitale Geisteswissenschaften</title>
            <idno type="issn">2510-1358</idno>
            <idno type="ppn">819494402</idno>
            <idno type="doi">10.17175/zfdg.01</idno>
            <biblScope unit="volume">11</biblScope>
            <biblScope unit="article">9</biblScope>
         </seriesStmt>
         <sourceDesc>
            <p>Born digital: no previous source exists.</p>
         </sourceDesc>
      </fileDesc>
      <encodingDesc>
         <editorialDecl>
            <p>Letzte Überprüfung aller Verweise: <date when="2026-06-02">02.06.2026</date>
            </p>
         </editorialDecl>
         <schemaRef url="https://zfdg.de/sites/default/files/medien/zfdg.odd"/>
      </encodingDesc>
      <profileDesc>
         <textClass>
            <keywords n="Beitragstyp">
               <term>Projektvorstellung</term>
            </keywords>
            <keywords n="GND">
               <term ref="https://d-nb.info/gnd/4115456-3">Oral History</term>
               <term ref="https://d-nb.info/gnd/4265353-8">Topic Modeling</term>
               <term ref="https://d-nb.info/gnd/1036568350">Visual Analytics</term>
               <term ref="https://d-nb.info/gnd/4116522-6">Softwareentwicklung</term>
            </keywords>
         </textClass>
      </profileDesc>
   </teiHeader>
   <text xml:lang="de">
      <front>
         <div type="abstract" xml:lang="de">
            <p>Im <term type="dh">Topic Modeling</term> gestaltet sich die Analyse der statistischen
               Ergebnisse als umständlich und bedarf häufig einer visuellen Aufarbeitung. Das im
               Rahmen des DFG-geförderten Projekts ›Oral-History.Digital‹ entwickelte Tool
                  <title>Oral History Topic Modeling Dashboard (OHTM-Dashboard)</title> bietet einen
               Lösungsansatz und ist auf die spezifischen Anforderungen lebensgeschichtlicher
               Interviews optimiert. Nach einer methodischen Einführung in das <term type="dh"
                  >LDA</term>-Verfahren und einem vergleichenden Überblick über bestehende
               Analyse-Tools werden die Dashboard-Funktionen präsentiert. Anhand einer Case Study
               zur Analyse von Heimat- und Beheimatungsprozessen in einem Korpus von 991 Interviews
               aus sieben verschiedenen Archiven wird der Einsatz von OHTM-Dashboard gezeigt.</p>
         </div>
         <div type="abstract" xml:lang="en">
            <p>In <term type="dh">topic modeling</term>, analyzing statistical results can be
               complex and often requires visual interpretation. The <title>Oral History Topic
                  Modeling Dashboard (OHTM Dashboard)</title>, a tool developed as part of the
               DFG-funded project ›Oral-History.Digital‹, offers a solution and is optimized for the
               specific requirements of life history interviews. Following a methodological
               introduction to the <term type="dh">LDA</term> procedure and a comparative overview
               of existing analysis tools, the dashboard functions will be presented. The use of
               OHTM-Dashboard will be demonstrated through a case study analyzing processes of home
               and settlement in a corpus of 991 interviews from seven different archives.</p>
         </div>
      </front>
      <body>
         <div type="chapter">
            <head>1. Einleitung</head>
            <p>Die wachsende Zugänglichkeit von Oral-History-Interviewbeständen durch die
               fortschreitende Digitalisierung, insbesondere durch die Entstehung des Online-Archivs
                  <ref target="https://portal.oral-history.digital/de">Oral-History.Digital
                  (OH.D)</ref>, führt zu der Frage, wie die Vielzahl von Interviews zukünftig
               analysiert und erforscht werden kann. Welche Möglichkeiten&#160;– neben den
               Standardlösungen wie Volltextsuche oder Metadatenfiltern&#160;– gibt es, um tausend
               Interviews aus verschiedenen Archiven und unterschiedlichen thematischen
               Forschungsprojekten perspektivisch in einer Sekundäranalyse sammlungsübergreifend zu
               untersuchen? Um dieser Frage nachzugehen, wurde ein Forschungskorpus mit insgesamt
               991 Interviews aus sieben verschiedenen Archiven zusammengestellt: aus dem <ref
                  target="https://deutsches-gedaechtnis.fernuni-hagen.de/">Archiv Deutsches
                  Gedächtnis (ADG)</ref> des <ref
                  target="https://www.fernuni-hagen.de/geschichteundbiographie/">Instituts für
                  Geschichte und Biographie der FernUniversität in Hagen</ref>, dem Archiv <ref
                  target="https://www.zwangsarbeit-archiv.de/">Zwangsarbeit 1939–1945 (ZWA)</ref>
               und <ref target="https://www.cdoh.net/">Colonia Dignidad. Ein chilenisch-deutsches
                  Oral-History-Archiv (CDG)</ref> der <ref target="https://www.fu-berlin.de/">Freien
                  Universität Berlin</ref>, der Interviewsammlung der <ref
                     target="https://portal.oral-history.digital/fzh-wde/de">Werkstatt der Erinnerung
                  (WdE)</ref> der <ref target="https://zeitgeschichte-hamburg.de/home.html"
                  >Forschungsstelle für Zeitgeschichte in Hamburg</ref>, dem <ref
                  target="https://www.flucht-vertreibung-versoehnung.de/bibliothek-zeitzeugenarchiv/zeitzeugen-archiv"
                  >Zeitzeugenarchiv</ref> des <ref
                  target="https://www.flucht-vertreibung-versoehnung.de/de/home"
                  >Dokumentationszentrum Flucht, Vertreibung, Versöhnung (FVV)</ref>, der Sammlung
                  <ref
                  target="https://www.museum-friedland.de/sammlung/erzaehlende-lebensgeschichten"
                  >Erzählte Lebensgeschichte</ref> des <ref
                  target="https://www.museum-friedland.de/">Museums Friedland (MFL)</ref> und einer
               Sammlung des <ref target="https://hait.tu-dresden.de/ext/">Hannah-Arendt-Instituts
                  für Totalitarismusforschung (HAIT)</ref> zu Kindergarten und Schule in der DDR.
               Ausschlaggebend für die Zusammenstellung des Korpus war zum einen die Abbildung der
               thematischen Breite des Online-Archivs und zum anderen die Voraussetzung, dass die
               Transkripte vollständig digitalisiert vorlagen. Da ein solches Korpus zu umfangreich
               für eine manuelle Analyse ist, wurde die Methode des <term type="dh">Topic
                  Modelings</term><note type="footnote">Vgl. <ref
                     target="#blei_et_al_allocation_2003">Blei et&#160;al. 2003</ref>,
                  S.&#160;993–1022.</note>, aufbauend auf gemeinsamen Vorarbeiten mit Dennis Möbus,
               Tobias Hodel und Ina Serif,<note type="footnote">Vgl. <ref
                     target="#moebus_vermaechtnis_2020">Möbus 2020</ref>, S.&#160;162–180; <ref
                     target="#hodel_et_al_inferenzen_2022">Hodel et&#160;al. 2022</ref>; <ref
                     target="#franken_moebus_mensch_2024">Franken&#160;/ Möbus 2024</ref>.</note>
                  gewählt.<note type="footnote">Vgl. <ref target="#bayerschmidt_ohtm_2026"
                     >Bayerschmidt 2026</ref>.</note> Topic Modeling ist ein probabilistisches
               Verfahren aus dem Bereich des <term type="dh">Text Mining</term>, einem Unterbereich
               des <term type="dh">Natural Language Processing</term>, bei dem das gemeinsame
               Vorkommen von Wörtern innerhalb eines Textkorpus auf Grundlage von statistischen
               Verteilungen berechnet und zu verschiedenen Gruppen, sogenannten Topics, zugeordnet
               wird. Die Topics können thematisch interpretiert und in die jeweiligen Dokumente
               zurückverfolgt werden. Diese Zurückführung auf die jeweiligen Dokumente bzw.
               Transkripte ist ein zentraler Bestandteil der Analyse. In der Kombination von <term
                  type="dh">distant</term> und <term type="dh">close reading</term> können
               Erkenntnisse zum Vorschein kommen, die über eine rein manuelle Analyse nicht gefunden
               worden wären.<note type="footnote">Vgl. <ref target="#jaenicke_et_al_text_2017"
                     >Jänicke et&#160;al. 2017</ref>, S.&#160;226–250; <ref
                     target="#krautter_scales_2024">Krautter 2024</ref>, S.&#160;261–286.</note>
               Dieser Wechsel der Perspektive, auch bekannt als <term type="dh">scalable
                  reading</term>,<note type="footnote">Vgl. <ref target="#zeppezauer-wachauer_reading_2021">Zeppezauer-Wachauer 2021</ref>.</note> ist kein einmaliges Vorgehen, sondern ein stetiges
               Wechselspiel, bei dem die Ergebnisse auf verschiedenen Ebenen und aus verschiedenen
               Perspektiven miteinander in Bezug gesetzt werden. Da die manuelle Auswertung der
               Topic-Modeling-Ergebnisse und der Wechsel der verschiedenen Ebenen sehr zeitaufwendig
               und vor allem sehr unübersichtlich sind, wurde ein eigenes interaktives visuelles
               Topic-Modeling-Analyse-Tool entwickelt, das <title>Oral History Topic Modeling
                  Dashboard (OHTM-Dashboard)</title>.<note type="footnote">Vgl. <ref
                     target="#bayerschmidt_ohtm_-2025-2026">Bayerschmidt 2025–2026</ref>; das Dashboard kann
                  online auf der Archivseite des ADG frei zugänglich ausprobiert werden: <ref
                     target="https://ohtm-dash.oral-history.digital/"
                     >https://ohtm-dash.oral-history.digital/</ref>.</note>
            </p>
         </div>
         <div type="chapter">
            <head>2. Topic Modeling</head>
            <p>Es gibt eine Vielzahl unterschiedlicher Algorithmen für Topic Modeling. In einer
               Studie haben Ina Serif, Tobias Hodel und Dennis Möbus herausgearbeitet, dass das
                  <term type="dh">Latent Dirichlet Allocation-Verfahren (LDA)</term><note
                  type="footnote">Vgl. <ref target="#blei_et_al_allocation_2003">Blei et&#160;al.
                     2003</ref>.</note> für die Arbeit mit lebensgeschichtlichen Interviews am
               besten funktioniert.<note type="footnote">Vgl. <ref
                     target="#hodel_et_al_inferenzen_2022">Hodel et&#160;al. 2022</ref>.</note> LDA
               geht von der Grundannahme aus, dass jedes Dokument eine Zusammensetzung verschiedener
               Themen ist. Das Verfahren berechnet die statistische Verteilung und Nähe der Wörter
               zueinander und teilt diese einzelnen Topics zu, die Anzahl der Topics ist dabei frei
               wählbar. Als Ergebnis erhält man die Topic-Wort-Verteilung und die
               Topic-Dokument-Verteilung. Die Topic-Wort-Verteilung gibt die Wörter der jeweiligen
               Topics, absteigend nach ihrer Gewichtung, als Wortliste an. Die
               Topic-Dokument-Verteilung enthält die Wahrscheinlichkeiten, die jedes Topic innerhalb
               eines Dokuments besitzt.</p>
            <table xml:id="tab001">
               <row>
                  <cell>Topic-Nummer</cell>
                  <cell>Ersten 20 Wörter des Topics</cell>
               </row>
               <row>
                  <cell>44</cell>
                  <cell>deutsch, polen, deutschland, polnisch, sprache, russisch, pole, lernen, land, deutsche, familie, russland, friedland, türkei, stadt, russe, heimat, ausländer, türkisch, grenze,</cell>
               </row>
               <trailer>
                  <ref type="intern" target="tab001">Tab. 1</ref>: Topic-Wort-Verteilung des Topics
                  44.</trailer>
            </table>
            <table xml:id="tab002">
               <row>
                  <cell>Topic</cell>
                  <cell>Topic-Gewichtung</cell>
               </row>
               <row>
                  <cell>44</cell>
                  <cell>0.5990997305708491</cell>
               </row>
               <row>
                  <cell>94</cell>
                  <cell>0.21392577268082863</cell>
               </row>
               <row>
                  <cell>0</cell>
                  <cell>0.04873578232889533</cell>
               </row>
               <row>
                  <cell>87</cell>
                  <cell>0.02992986020180754</cell>
               </row>
               <row>
                  <cell>50</cell>
                  <cell>0.020996276856984443</cell>
               </row>
               <trailer>
                  <ref type="intern" target="tab002">Tab. 2</ref>: Beispielhafte
                  Topic-Dokument-Verteilung.</trailer>
            </table>
            <p>Es ist wichtig anzumerken, dass die Wortlisten der Topics alleine auf der
               statistischen Verteilung der Wörter innerhalb des Forschungskorpus gebildet werden
               und keine externen Informationen für die Berechnung verwendet werden. Die Wortlisten
               besitzen aber dennoch semantische Gemeinsamkeiten, die aus dem gemeinsamen Auftreten
               innerhalb von Sätzen oder Textabschnitten resultieren. Die Themen ergeben sich somit
               aus dem thematischen Kontext, in dem die Wörter zusammen verwendet werden. Diese
               können sich auf ein oder mehrere Themen beziehen, abhängig vom Kontext des Korpus. Um
               diese inhaltlichen Gemeinsamkeiten in Form von Themen greifen zu können, müssen die
               Ergebnisse durch die Forschenden interpretiert werden. Nur so können die Topics
               thematisch genutzt und in die Textabschnitte zurückverfolgt werden.</p>
            <p>Bevor die Topics berechnet werden können, muss das zu untersuchende Textkorpus
               vorbereitet werden. Im <term type="dh">Preprocessing</term> können verschiedene
               Methoden gewählt und miteinander kombiniert werden, um die Ergebnisse des Topic
               Modelings für die Analyse zu verbessern:<note type="footnote">Eine detaillierte
                  Ausführung des Preprocessings und seiner Einflüsse findet sich in <ref
                     target="#moebus_et_al_topic_2026">Möbus et&#160;al. 2026</ref>.</note></p>
            <list type="ordered">
               <item>Die Entfernung von <term type="dh">Stopwords</term>, also Wörtern, die sehr
                  häufig vorkommen und deshalb die Ergebnisse verrauschen können. Dies können
                  beispielsweise Pronomen, Konjunktionen, Präpositionen etc. sein. Die Auswahl der
                  zu entfernenden Stopwords ist stark von der jeweiligen Quellenart und der
                  Forschungsfrage abhängig.</item>
               <item>Die Bereinigung von Satzzeichen, Paratext sowie Timecodes und
                  Sprecher*innenkürzeln.</item>
               <item>Die Lemmatisierung von Wörtern, also die Rückführung von Wörtern auf ihre
                  Grundform.</item>
               <item>Die Unterteilung der Dokumente und ihrer Sätze in einzelne Wörter bzw.
                  Wortlisten, die sogenannte Tokenisierung, damit die Berechnung auf Grundlage der
                  einzelnen Wörter erfolgen kann.</item>
            </list>
            <p>Aus dem Originaltext »Und das war dann mein großes Glück! (lacht) Habe noch nie
               soviel Geld, wie ich da verdient habe.« wird nach dem Preprocessing z.&#160;B. dieser
               verarbeitete Text: »großes, glück, geld, verdienen«.</p>
            <p>Diese vorverarbeiteten Wortlisten sind, je nach Länge der einzelnen Dokumente des
               Korpus, die Grundlage des Topic Modelings. Auf ihnen werden die statistische
               Verteilung der Wörter und damit die Topics berechnet. Im Fall der
               lebensgeschichtlichen Interviews sind die Transkripte von einem Umfang zwischen
               60 und 100 Seiten deutlich zu lang für eine direkte Berechnung, weshalb sie in kleinere
               Textdokumente, sogenannte <term type="dh">Chunks</term>, unterteilt werden müssen.
               Für Interviews hat sich in gemeinsamen Vorarbeiten eine Länge von 500 Wörtern pro
               Chunk bzw. 100 Wörtern pro Chunk nach der Stopwords-Entfernung als geeignet
                  erwiesen.<note type="footnote">Vgl. <ref target="#moebus_et_al_topic_2026">Möbus
                     et&#160;al. 2026</ref>.</note> Lebensgeschichtliche Interviews bestehen aus
               einer freien Erzählung, die häufig Themenwechsel oder andere thematische Einschübe
               enthalten, die durch das <term type="dh">Chunking</term> in der Topic-Verteilung
               berücksichtigt werden können.</p>
            <div type="subchapter">
               <head>2.1 Analyseebenen des Topic-Modelings</head>
               <p>Die beiden ersten Analyseebenen, die Topic-Wort-Verteilung und die
                  Topic-Dokument-Verteilung, bilden die Grundlage für das distant reading. Für das
                  close reading ist es wichtig, die Topic-Dokument-Verteilung auf die nicht
                  verarbeiteten Texte zurückzuführen. Wurden die Dokumente nicht gechunkt, ist diese
                  Zurückführung leicht umsetzbar. Bei gechunkten Dokumenten müssen die Dateien aber
                  bereits vor der Topic-Berechnung so aufbereitet worden sein, dass die Ergebnisse
                  der Chunks auf die jeweiligen Textstellen im Dokument zurückverfolgt werden
                  können. Wäre das Chunking ein einmaliger Vorgang, der nach festen Regeln erfolgt,
                  könnten die jeweiligen Dokumente, in diesem Fall Interviews, zuvor in kleinere
                  Teildokumente unterteilt werden und erst dann dem Korpus hinzugefügt werden.
                  Allerdings ist der Vorgang nicht einheitlich, sondern stark von den Inhalten und
                  der Struktur der Dokumente abhängig und auch stark vom jeweiligen
                  Forschungsinteresse geprägt.<note type="footnote">Vgl. <ref
                        target="#moebus_et_al_topic_2026">Möbus et&#160;al. 2026</ref>,
                     S.&#160;21–27.</note> Somit stellt das Chunking einen dynamischen Prozess dar,
                  der erst durch Evaluation der Ergebnisse festgelegt werden kann. Deshalb bietet
                  die OHTM-Pipeline (vgl. <ref type="intern" target="#hd11">Kapitel 4</ref>) und das
                  OHTM-Dashboard ein variables System, das unabhängig von der gewählten Chunklänge
                  die Ergebnisse ohne eigene Vorarbeiten auf die Textstellen und auch auf das
                  Originaldokument zurückverfolgen kann. Bei gechunkten Dokumenten erhält man durch
                  die Addition der Topic-Dokument-Verteilung aller zum Dokument gehörigen
                  Teildokumente die durchschnittliche Topic-Verteilung für das gesamte Dokument bzw.
                  in diesem Fall für das gesamte Interview. Addiert man die
                  Topic-Dokument-Verteilung aller Dokumente zusammen, erhält man die Korpusebene,
                  die Topic-Verteilung für das Forschungskorpus. Wenn das Korpus nicht nur aus einer
                  Sammlung besteht, sondern wie in diesem Fall aus verschiedenen Archiven, ist es
                  wichtig, die Korpusebene für die verschiedenen Teilkorpora bilden zu können.
                  Insgesamt ergeben sich bei der Arbeit mit Topic Modeling folgende
                  Analyseebenen:</p>
               <list type="unordered">
                  <item>Topic-Wort-Verteilung (Wortliste)</item>
                  <item>Topic-Chunk-Verteilung</item>
                  <item>Topic-Dokument-Verteilung → Dokumentebene</item>
                  <item>unverarbeitetes Dokument → Dokumentansicht</item>
                  <item>Teilkorpusebene</item>
                  <item>Korpusebene</item>
               </list>
               <p>All diese Analyseebenen können für eine Auswertung der Ergebnisse kombiniert und
                  miteinander in Bezug gesetzt werden, je nach Interesse.</p>
            </div>
         </div>
         <div type="chapter">
            <head>3. Bestehende Topic-Modeling-Analyse-Tools</head>
            <p>Obwohl die statistischen Ergebnisse des Topic Modelings sehr gute Einblicke in den
               Aufbau und mögliche Inhalte von Dokumenten liefern, sind diese an sich jedoch schwer
               zu erschließen und zu verstehen.<note type="footnote">Vgl. beispielsweise <ref
                     target="#chaney_blei_topic_2012">Chaney&#160;/ Blei 2012</ref>,
                  S.&#160;1.</note> Deshalb haben sich schon früh Visualisierungen für die
               Interpretation als mögliche Lösung herauskristallisiert und sind bis heute ein fester
               Bestandteil des Topic Modelings.<note type="footnote">Vgl. <ref
                     target="#blei_topic_2012">Blei 2012</ref>, S.&#160;84; <ref
                     target="#sievert_shirley_ldavis_2014">Sievert&#160;/ Shirley 2014</ref>; <ref
                     target="#chuang_et_al_visualization_2012">Chuang et&#160;al. 2012</ref>; <ref
                     target="#liu_et_al_exploration_2021">Liu et&#160;al. 2021</ref>.</note> Im
               Folgenden wird ein kurzer Überblick über bereits bestehende Lösungen gegeben und
               aufgezeigt, welche Schwachstellen in Bezug auf die Darstellung der verschiedenen
               Analyseebenen bestehen.</p>

            <div type="subchapter">
               <head>3.1 LDAvis und Topic Cloud</head>
               <p>Angebote wie ›LDAvis‹<note type="footnote">Vgl. <ref
                        target="#sievert_shirley_ldavis_2014">Sievert&#160;/ Shirley
                     2014</ref>.</note> (<ref type="graphic" target="#ohtm-dash_001"
                     >Abbildung&#160;1</ref>) oder die ›Topic Cloud‹<note type="footnote">Vgl. <ref
                        target="#roennqvist_et_al_exploration_2014">Rönnqvist et&#160;al.
                     2014</ref>.</note> (<ref type="graphic" target="#ohtm-dash_002"
                     >Abbildung&#160;2</ref>) bieten eine informative Darstellung der
                  Topic-Wort-Verteilung und zeigen die Verhältnisse der Topics und der Wörter
                  untereinander sowie zu anderen Topics an. Zusätzlich wird auch die
                  Topic-Verteilung für das gesamte Korpus visualisiert.</p>
               <figure>
                  <graphic xml:id="ohtm-dash_001" url="Medien/ohtm-dash_001.png">
                     <desc>
                        <ref type="intern" target="#abb1">Abb.&#160;1</ref>: LDAvis mit der globalen
                        Topic-Ansicht auf der linken Seite und den Wort-Balkendiagrammen auf der
                        rechten Seite. [Aus: <ref target="#sievert_shirley_ldavis_2014"
                           >Sievert&#160;/ Shirley 2014</ref>, S.&#160;64]</desc>
                  </graphic>
               </figure>
               <figure>
                  <graphic xml:id="ohtm-dash_002" url="Medien/ohtm-dash_002.png">
                     <desc>
                        <ref type="intern" target="#abb2">Abb.&#160;2</ref>: »termvOverview« der
                        Topic Cloud. [Aus: <ref target="#roennqvist_et_al_exploration_2014"
                           >Rönnqvist et&#160;al. 2014</ref>, S.&#160;3]</desc>
                  </graphic>
               </figure>
               <p>Allerdings fehlen in beiden Lösungen die Topic-Dokument-Verteilung und die
                  Dokument-Ansicht sowie die Möglichkeit gechunkte Dokumente darzustellen.</p>
            </div>
            <div type="subchapter">
               <head>3.2 Uncertainty-Aware Topic Modeling Visualization</head>
               <p>Valerie Müller, Christian Sieg und Lars Linsen haben 2021 ein interaktives Tool
                  publiziert, welches sie für die Exploration von Unsicherheiten im Topic Modeling
                  nutzen, darunter verstehen sie die Abweichungen und Unterschiede verschiedener
                  Modelle mit unterschiedlichen Parametern.<note type="footnote">Vgl. <ref
                        target="#mueller_et_al_topic_2021">Müller et&#160;al. 2021</ref>.</note> Für
                  die Topic-Dokument-Verteilung wurde ein Balkendiagramm gewählt.</p>
               <figure>
                  <graphic xml:id="ohtm-dash_003" url="Medien/ohtm-dash_003.png">
                     <desc>
                        <ref type="intern" target="#abb3">Abb.&#160;3</ref>:
                        Topic-Dokument-Verteilung. [Aus: <ref target="#mueller_et_al_topic_2021"
                           >Müller et&#160;al. 2021</ref>, S.&#160;4]</desc>
                  </graphic>
               </figure>
               <p>Die qualitative Analyse erfolgt in einer Dokumentansicht mit dem unverarbeiteten
                  Text sowie den farblichen Markierungen der Wörter zu ihren Topics. Mehrere Fenster
                  bieten weitere Informationen.<note type="footnote">Vgl. <ref
                        target="#mueller_et_al_topic_2021">Müller et&#160;al. 2021</ref>,
                     S.&#160;4–5.</note> Leider ist das Tool nicht <term type="dh">open source</term>
                  zugänglich und kann daher nicht weiterentwickelt werden, weshalb das Tool hier
                  nicht weiter beachtet wird.</p>
               <figure>
                  <graphic xml:id="ohtm-dash_004" url="Medien/ohtm-dash_004.png">
                     <desc>
                        <ref type="intern" target="#abb4">Abb.&#160;4</ref>: Dokumentenansicht für
                        das close reading. [Aus: <ref target="#mueller_et_al_topic_2021">Müller
                           et&#160;al. 2021</ref>, S.&#160;5]</desc>
                  </graphic>
               </figure>
            </div>
            <div type="subchapter">
               <head>3.3 DARIAH Topics Explorer</head>
               <p>Im deutschsprachigen Raum ist der <ref
                     target="https://dariah-de.github.io/TopicsExplorer/">DARIAH Topics
                     Explorer</ref> bekannt, eine kompakte Softwarelösung, die die einfach
                  bedienbare Berechnung eines Topic Models und deren visuelle Auswertung
                     bietet.<note type="footnote">Vgl. <ref target="#simmler_et_al_topic_2019"
                        >Simmler et&#160;al. 2019</ref>.</note> Die Ergebnisse können auf mehreren
                  Ebenen analysiert und teilweise interaktiv verknüpft werden. Zunächst kann die
                  Topic-Wort-Verteilung angezeigt werden, und über einen Klick auf ein Topic gelangt
                  man zu einer Topic-Dokument-Verteilung für das gewünschte Topic.</p>
               <figure>
                  <graphic xml:id="ohtm-dash_005" url="Medien/ohtm-dash_005.png">
                     <desc>
                        <ref type="intern" target="#abb5">Abb.&#160;5</ref>:
                        Topic-Dokument-Verteilung für das ausgewählte Topic im DARIAH Topics Explorer
                        [Screenshot: Philipp Bayerschmidt 2026]</desc>
                  </graphic>
               </figure>
               <p>Durch einen Klick auf das jeweilige Dokument gelangt man zu einer detaillierteren
                  Topic-Dokument-Verteilung für das ausgewählte Dokument samt Rückbezug auf die
                  unverarbeiteten Texte. Jedoch ist die Topic-Übersicht am Seitenanfang wenig
                  intuitiv und liefert nur mit geschicktem Einsatz des Mauszeigers weiterführende
                  Informationen.</p>
               <figure>
                  <graphic xml:id="ohtm-dash_006" url="Medien/ohtm-dash_006.png">
                     <desc>
                        <ref type="intern" target="#abb6">Abb.&#160;6</ref>: Detaillierte
                        Topic-Dokument-Verteilung für ein Dokument im DARIAH Topics Explorer.
                        [Screenshot: Philipp Bayerschmidt 2026]</desc>
                  </graphic>
               </figure>
               <p>Zusätzlich gibt es auch eine gesamte Topic-Dokument-Verteilung in Form einer <term
                     type="dh">Heatmap</term>, allerdings ohne interaktive Verknüpfung zurück in die
                  jeweiligen Dokumente.</p>
               <figure>
                  <graphic xml:id="ohtm-dash_007" url="Medien/ohtm-dash_007.png">
                     <desc>
                        <ref type="intern" target="#abb7">Abb.&#160;7</ref>:
                        Topic-Dokument-Verteilung des DARIAH Topics Explorers. [Screenshot: Philipp
                        Bayerschmidt 2026]</desc>
                  </graphic>
               </figure>
               <p>Mehrere Anzeigen gleichzeitig darzustellen, ist nicht möglich, da sich bei einer
                  Verlinkung der Ebenen immer die neue Ebene öffnet und die vorherige Ebene
                  schließt. Die gleichzeitige Darstellung mehrerer Ebenen würde eine bessere
                  Verknüpfung der Ergebnisse ermöglichen und das scalable reading ungemein
                  erleichtern. Die Berechnung der Topic-Verteilung erfolgt lediglich auf Grundlage
                  von TXT-Dateien oder XML-Dateien, zudem fehlt die Möglichkeit, die Texte zu
                  chunken oder Teilkorpora zu bilden. Ein <term type="dh">Parametertuning</term>,
                  das insbesondere für die Reproduzierbarkeit der Methode zentral ist, wird nur in
                  sehr begrenztem Umfang durch die Einstellung der Anzahl der Topics und der
                  Iterationen der Berechnungen ermöglicht. Weiterhin fehlt die Möglichkeit
                  spezifische Parameter wie <term type="dh">Random Seed</term>, <term type="dh"
                     >optimize_interval</term> und <term type="dh">alpha</term> einzustellen. Zu
                  beachten ist, dass der DARIAH Topics Explorer nicht als tiefgreifendes Tool für
                  Topic Modeling gedacht ist, sondern als einfacher Einstieg in die Methode dienen
                     soll.<note type="footnote">Vgl. <ref target="#simmler_et_al_topics_2026">Simmler et&#160;al. 2026</ref>.</note>
               </p>
            </div>
            <div type="subchapter">
               <head>3.4 Leipziger-Corpus-Miner</head>
               <p>Eine weitere aus Deutschland stammende Lösung ist der interaktive
                  ›Leipziger-Corpus-Miner (iLCM)‹<note type="footnote">Vgl. <ref
                        target="#kahmann_et_al_application_2021">Kahmann et&#160;al.
                     2021</ref>.</note>, eine umfangreiche Software mit zahlreichen <term type="dh"
                     >Machine-Learning-</term> und Natural-Language-Processing-Verfahren, unter
                  anderem auch Topic Modeling. Die jeweiligen Ergebnisse können immer auf die
                  unverarbeiteten Texte zurückgeführt werden; außerdem bietet die Software die
                  Möglichkeit, durch eigene Skripts Funktionen anzupassen oder zu erweitern. Jedoch
                  konnte aufgrund der erwarteten Datenstruktur und Textlogik das Chunking von
                  Interviews innerhalb der Software nicht umgesetzt werden.</p>
               <figure>
                  <graphic xml:id="ohtm-dash_008" url="Medien/ohtm-dash_008.png">
                     <desc>
                        <ref type="intern" target="#abb8">Abb.&#160;8</ref>: Validierungsoberfläche
                        des iLCM. [Screenshot: Philipp Bayerschmidt 2026]</desc>
                  </graphic>
               </figure>

            </div>

            <div type="subchapter">
               <head>3.5 Topic Words in Context</head>
               <p>Das Tool ›Topic Words in Context‹ (TwiC)<note type="footnote">Vgl. <ref
                        target="#armoza_topic_2017">Armoza 2017</ref>.</note> bietet unter anderem
                  Zugang zur Topic-Korpus-Verteilung und Topic-Dokument-Verteilung sowie zu einem
                  Topic-Cluster-View, bei dem die Dokumente nach dem Topic mit dem höchsten Gewicht
                  geclustert werden und Verbindungen zu ähnlichen Ergebnissen geknüpft werden.</p>
               <figure>
                  <graphic xml:id="ohtm-dash_009" url="Medien/ohtm-dash_009.png">
                     <desc>
                        <ref type="intern" target="#abb9">Abb.&#160;9</ref>: Analyseansicht des
                        TwiC. [Aus: <ref target="#armoza_topic_2017">Armoza 2017</ref>]</desc>
                  </graphic>
               </figure>
               <p>Die Dokumente können in der unverarbeiteten Form angezeigt werden, wobei die
                  Wörter der Topics und die Stopwords farblich markiert werden. In der Ansicht
                  werden in Teilfenstern weitere wichtige Informationen angezeigt, wie die
                  Korpusebene (links oben), Topic-Dokument-Verteilung (rechts oben),
                  Topic-Wort-Verteilung mit Textvorschau (links unten) und die Dokumentenansicht
                  (rechts unten). Diese sind interaktiv miteinander verbunden. Die Anwendung ist
                  aber, besonders in der visuellen Repräsentation, auf Gedichte und deren Länge
                  optimiert. So wird in der Topic-Dokument-Verteilung keine vollständige Liste
                  angezeigt, sondern eine abstrakte Vorschau des Dokuments, in der die ersten zehn
                  Zeilen als Rechtecke abgebildet sind, farblich markiert nach dem entsprechenden
                  Topic. Die Topics werden als Ringe dargestellt, die in der
                  Topic-Dokument-Verteilung um die Rechtecke der Dokumente angezeigt werden. Bei
                  kleinerer Topic-Anzahl ist das sinnvoll, bei größerer Zahl kann dies schnell
                  unübersichtlich werden. Teilkorpora können nicht angelegt und dargestellt werden
                  und Dateien können ausschließlich im TXT-Format importiert werden.</p>
            </div>
            <div type="subchapter">
               <head>3.6 Zwischenfazit Analyse-Tools</head>
               <p>All diese Analyseangebote bieten zahlreiche Funktionen, um
                  Topic-Modeling-Ergebnisse interaktiv und visuell darzustellen. Jedoch erlaubt es
                  keine der Lösungen, alle vorher herausgearbeiteten Analyseebenen anzusteuern oder
                  interaktiv mit einander zu verknüpfen. Der Import ist fast ausschließlich auf
                  TXT-Formate beschränkt. Das größte Problem besteht darin, dass sie oft auf die
                  eigenen Quellengattungen der Forschungsprojekte angepasst sind und die Möglichkeit
                  zu chunken fehlt. Ein Analyse-Tool für lebensgeschichtliche Interviews muss die
                  Topic-Modeling-Ergebnisse auf der Korpus-, der Archiv-, der Interview- und der
                  Chunk-Ebene darstellen und interaktiv miteinander verknüpfen sowie die
                  Dokument-Ansicht samt Metadaten wie Sprecher*innenkürzel oder Timecodes anzeigen
                  können. Um diese spezifischen Anforderungen ermöglichen zu können, wird das
                  OHTM-Dashboard als neue Analyselösung präsentiert.</p>
            </div>
         </div>
         <div type="chapter">
            <head>4. Das OHTM-Dashboard</head>
            <p>Da meine Forschungsarbeit und damit die Entstehung des Tools im Rahmen des von der
               DFG geförderten Projekts ›Oral-History.Digital‹ entstanden ist, lagen die
               Interviewtranskripte im Exportformat des Archivs als CSV-Datei vor. Diese Datei
               enthält in den verschiedenen Spalten die Timecodes, Sprecher*innenkürzel und
               Textpassagen. Diese vorgegebene Struktur macht einen einheitlichen Import in die
               Topic-Modeling-Pipeline sehr einfach und erleichtert das Auslesen der
               Metainformationen von Timecodes und Sprecher*innenkürzeln, die für die Berechnung
               keine Rolle spielen, aber für die Auswertung wichtig sind. Ein Grundproblem von Topic
               Modeling ist, dass vor der eigentlichen Berechnung die zugrunde liegenden Daten
               formell aufbereitet und oft individuell abgestimmt werden müssen. Da die Verbindung
               zwischen Sprecher*innenkürzeln und Timecodes für die Analyse von Interviews wichtig
               ist, wäre es viel zu umständlich, die Transkripte in TXT-Dateien umzuwandeln und die
               Informationen herauszuparsen.</p>
            <p>Um den spezifischen Anforderungen lebensgeschichtlicher Interviews zu entsprechen und
               alle relevanten Ebenen analysieren zu können, wurde ein eigenes interaktives
               visuelles Analyse-Tool entwickelt. Dafür müssen die Dateien jedoch bereits vor der
               eigentlichen Topic-Modeling-Berechnung strukturiert und aufeinander beziehbar
               abgespeichert werden, da dies mit den reinen <ref
                  target="https://mimno.github.io/Mallet/topics">Mallet</ref>-Ergebnissen nicht
               möglich ist. Deshalb ist das entwickelte Analyse-Tool nicht losgelöst von der
               dazugehörigen Topic-Modeling-Pipeline nutzbar, da dort die Grundlage für die visuelle
               Analyse geschaffen werden musste. Die Oral-History-Topic-Modeling-Pipeline
               (OHTM-Pipeline) ist eine Python-Pipeline, die auf Grundlage von LDA-MALLET (aufbauend
               auf gemeinsamen Vorarbeiten mit Dennis Möbus) entwickelt wurde.<note type="footnote"
                  >Vgl. <ref target="#moebus_vermaechtnis_2020">Möbus 2020</ref>, S.&#160;162–180;
                     <ref target="#hodel_et_al_inferenzen_2022">Hodel et&#160;al. 2022</ref>; <ref
                     target="#franken_moebus_mensch_2024">Franken&#160;/ Möbus 2024</ref>; <ref
                     target="#bayerschmidt_ohtm_2026">Bayerschmidt 2026</ref>.</note> Die Pipeline
               speichert das Korpus, die Topic-Modeling-Ergebnisse und alle relevanten Einstellungen
               in einer einzigen Datei, dem OHTM-File, das eine eigens entwickelte
               JSON-Datenstruktur enthält. Auf Grundlage dieser Datenstruktur wurde das auf dem
               Python-Paket <ref target="https://plotly.com/">Plotly</ref> basierende Dashboard<note
                  type="footnote">Vgl. <ref target="#bayerschmidt_ohtm_2026b">Bayerschmidt
                     2026b</ref>. Das Dashboard ist frei zugänglich und kann online auf der
                  Archivseite des ADG ausprobiert werden: <ref
                     target="https://ohtm-dash.oral-history.digital/"
                     >https://ohtm-dash.oral-history.digital/</ref>.</note> entwickelt, das mit dem
               Python-Skript des OHTM-Dashboards geöffnet wird. Um das Tool auch für Forschende
               anderer Disziplinen nutzbar zu machen, kann die Pipeline mit einfachen TXT-Dateien
               genutzt werden. Sollten die Daten spezifische Eigenheiten mitbringen, kann der Import
               innerhalb der Pipeline individuell angepasst werden.</p>
            <p>Der Vorteil und das Alleinstellungsmerkmal des OHTM-Dashboards sind die interaktive
               Verknüpfung aller Analyseebenen untereinander sowie die stetige Bezugnahme zu den
               Interviews des Korpus, um die wechselseitige Exploration (oder auch Evaluation) zu
               ermöglichen. Im Folgenden wird das Dashboard samt seinen einzelnen Funktionen
               vorgestellt, beginnend bei der obersten Ebene, der Topic-Korpus-Verteilung, hinunter
               bis zur Dokumentenansicht. Die Begriffswahl entspricht der Quellengattung dieser
               Forschungsarbeit. Da die einzelnen Interviews gechunkt wurden, besteht die unterste
               Ebene, die Dokumentenebene, aus den einzelnen Chunks. Darauf folgt die
               Interviewebene. Die einzelnen Teil-Korpora entsprechen den Archiven, aus denen die
               Interviews stammen, und das Korpus umfasst alle Interviews.</p>

            <div type="subchapter">
               <head>4.1 Bar-Graph-Ansicht</head>
               <p>Die Navigation innerhalb des Dashboards erfolgt über den »Menü«-Button auf der
                  linken Seite, wie <ref type="graphic" target="#ohtm-dash_010"
                     >Abbildung&#160;10</ref> zeigt. So lassen sich die verschiedenen Analyseebenen
                  ansteuern.</p>
               <figure>
                  <graphic xml:id="ohtm-dash_010" url="Medien/ohtm-dash_010.png">
                     <desc>
                        <ref type="intern" target="#abb10">Abb.&#160;10</ref>: Navigationsmenü im
                        Menüband. [Screenshot: Philipp Bayerschmidt 2026]</desc>
                  </graphic>
               </figure>
               <p>Die »Bar-Graph«-Ansicht (<ref type="graphic" target="#ohtm-dash_011"
                     >Abbildung&#160;11</ref>) zeigt ein Balkendiagramm, welches die
                  Topic-Korpus-Verteilung präsentiert und neben der Gesamtgewichtung (Höhe der
                  Balken) auch die Archive berücksichtigt und abbildet (farbliche Teilbalken).</p>
               <figure>
                  <graphic xml:id="ohtm-dash_011" url="Medien/ohtm-dash_011.png">
                     <desc>
                        <ref type="intern" target="#abb11">Abb.&#160;11</ref>:
                        Topic-Korpus-Verteilung in der »Bar-Graph«-Ansicht. [Screenshot: Philipp
                        Bayerschmidt 2026]</desc>
                  </graphic>
               </figure>
               <p>Die einzelnen Archive können über die Legende angesteuert und separat ein- oder
                  ausgeblendet werden. Unterhalb des Balkendiagramms können in den drei
                  Eingabezeilen Topic-Nummern eingetragen werden, um anschließend die ersten dreißig
                  Wörter des entsprechenden Topics auszugeben. Mit der Maus kann über die einzelnen
                  Balken gefahren werden, um weitere Informationen zu erhalten. Durch einen Klick
                  auf einen Balken wird das entsprechende Topic auf der linken Seite im Menüband
                  mitsamt der ersten zwanzig Wörter ausgegeben. Diese Funktion ist in jedem Graphen
                  des Dashboards integriert, um die jeweilige Topic-Nummer jederzeit ohne große
                  Umstände auf die jeweiligen Wörter zurückzuführen.</p>
            </div>
            <div type="subchapter">
               <head>4.2 Topic-Wörter</head>
               <p>Die Topic-Wort-Verteilung kann auf der Seite »Topic-Wörter« eingesehen werden,
                  indem man die Anzahl der gewünschten Wörter einträgt, woraufhin diese als Liste
                  angezeigt werden. Da die tatsächliche Gewichtung der Wörter eine geringere Rolle
                  spielt als das Zusammenspiel der Wörter, wurde auf die Ausgabe der tatsächlichen
                  Gewichtung verzichtet. Innerhalb des OHTM-Files ist diese Information
                  hinterlegt.</p>
               <figure>
                  <graphic xml:id="ohtm-dash_012" url="Medien/ohtm-dash_012.png">
                     <desc>
                        <ref type="intern" target="#abb12">Abb.&#160;12</ref>: Topic-Wörter-Ansicht.
                        [Screenshot: Philipp Bayerschmidt 2026]</desc>
                  </graphic>
               </figure>
            </div>
            <div type="subchapter">
               <head>4.3 Heatmap</head>
               <p>Die »Heatmap« (<ref type="graphic" target="#ohtm-dash_013"
                  >Abbildung&#160;13</ref>) bietet einen Überblick über die
                  Topic-Interview-Verteilung, die summierte durchschnittliche Topic-Gewichtung pro
                  Interview. Da die Interviews zuvor gechunkt wurden, ermöglicht diese Übersicht
                  einen Einblick in die Topic-Verteilung pro Interview und zeigt, welche Topics im
                  gesamten Interview am höchsten gewichtet sind.</p>
               <figure>
                  <graphic xml:id="ohtm-dash_013" url="Medien/ohtm-dash_013.png">
                     <desc>
                        <ref type="intern" target="#abb13">Abb.&#160;13</ref>:
                        Topic-Interview-Verteilung in der Heatmap. [Screenshot: Philipp Bayerschmidt
                        2026]</desc>
                  </graphic>
               </figure>
               <p>Über die Auswahl eines Topics in der Grafik durch einen Klick können die
                  entsprechenden Wörter im Menüband angezeigt werden. Die Heatmap kann bequem über
                  das Ziehen eines Feldes mit der Maus gezoomt werden. Über das Dropdownmenü
                  »Corpus« können die einzelnen Archive ausgewählt und die Heatmap dementsprechend
                  gefiltert werden. Eine weitere Filteroption, auswählbar über den Schalter
                  »Filter«, bietet die Möglichkeit, die Heatmap nach einem bestimmten Topic samt
                     <term type="dh">Threshold</term> filtern zu lassen.</p>
               <p>Da sich die Heatmap in der Darstellung an maximalen und minimalen Werten
                  orientiert und die Gewichtung aller Werte in entsprechenden Relationen dargestellt
                  wird, können bei starken Extremen die einzelnen Werte verblassen und undeutlich
                  erscheinen. Mit dem Schalter »Z-Score« wird eine Standardabweichung der Werte
                  berechnet, um die Spitzen zu glätten und die Darstellung deutlicher zu machen.
                  Dadurch wird die Lesbarkeit und Aussagekraft der Heatmap für das gesamte Korpus
                  erhöht und die Identifikation von allgemeinen Outliern erleichtert.</p>
               <figure>
                  <graphic xml:id="ohtm-dash_014" url="Medien/ohtm-dash_014.png">
                     <desc>
                        <ref type="intern" target="#abb14">Abb.&#160;14</ref>: Z-Score-bereinigte
                        Heatmap. [Screenshot: Philipp Bayerschmidt 2026]</desc>
                  </graphic>
               </figure>
            </div>
            <div type="subchapter">
               <head>4.4 Interview-Heatmap</head>
               <p>Eine Ebene weiter gelangen wir zur »Interview-Heatmap« (<ref type="graphic"
                     target="#ohtm-dash_015">Abbildung&#160;15</ref>), die die
                  Topic-Chunk-Verteilung der jeweiligen Interviews anzeigt.</p>
               <figure>
                  <graphic xml:id="ohtm-dash_015" url="Medien/ohtm-dash_015.png">
                     <desc>
                        <ref type="intern" target="#abb15">Abb.&#160;15</ref>: Interview-Heatmap,
                           <ref target="#adg0001">Interviewausschnitt adg0001</ref>. [Screenshot:
                        Philipp Bayerschmidt 2026]</desc>
                  </graphic>
               </figure>
               <p>Dennis Möbus entwickelte im Rahmen von OH.D die Interview-Heatmap, in der die
                  Achsen getauscht und die Chunks in chronologischer Reihenfolge auf der x-Achse
                  abgebildet werden, um so den Topic-Verlauf im Interviewverlauf visualisieren zu
                     können.<note type="footnote">Vgl. <ref target="#moebus_interview_2025">Möbus
                        2025</ref>.</note> Durch die Integration in das Dashboard können mit einem
                  Klick auf das entsprechende Chunk die zum ausgewählten Topic gehörenden Wörter im
                  Menüband angezeigt und die dazugehörige Transkriptpassage in unverarbeiteter Form
                  samt zugehörigen Sprecher*innenkürzeln unterhalb der Heatmap ausgegeben werden.
                  Wenn der Schalter »Marker« aktiviert ist, wird der ausgewählte Chunk farblich
                  markiert. Zusätzlich werden der Timecode des entsprechenden Chunks sowie, wenn
                  rechtlich und technisch möglich, ein Direktlink zum entsprechenden Audiofile der
                  Textstelle im OH.D-Archiv angezeigt.</p>
               <p>Über die beiden Pfeiltasten kann im Interviewtranskript geblättert und der
                  vorherige und nachfolgende Chunk samt Text angezeigt werden, der Marker bewegt
                  sich mit. Eine Angleichung der Ergebnisse über die Berechnung des Z-Scores ist
                  erneut möglich, allerdings fällt die Verbesserung deutlich geringer aus als bei
                  der Korpus-Heatmap.</p>
            </div>
            <div type="subchapter">
               <head>4.5 Overview</head>
               <p>Das Kernstück des OHTM-Dashboards findet sich in der »Overview«-Seite (<ref
                     type="graphic" target="#ohtm-dash_016">Abbildung&#160;16</ref>), die die
                  verschiedenen Analyseebenen gleichzeitig zugänglich macht und eine kombinierte,
                  interaktive Nutzung ermöglicht. Dadurch wird ein scalable reading in der
                  Kombination aus close und distant reading möglich.</p>
               <figure>
                  <graphic xml:id="ohtm-dash_016" url="Medien/ohtm-dash_016.png">
                     <desc>
                        <ref type="intern" target="#abb16">Abb.&#160;16</ref>: Analyseebenen in der
                        Overview-Ansicht, <ref target="#adg0002">Interviewausschnitt adg0002</ref>.
                        [Screenshot: Philipp Bayerschmidt 2026]</desc>
                  </graphic>
               </figure>
               <p>In jedem der Graphen ist es möglich durch einen Klick auf das Topic die
                  entsprechenden Wörter im Menüband anzeigen zu lassen. Wenn man auf ein Feld in der
                  Korpus-Heatmap klickt, wird das entsprechende Interview in der Interview-Heatmap
                  angezeigt. Durch die Auswahl eines Chunks dieses Interviews kann der
                  unverarbeitete Text ausgegeben werden, der sich über die Pfeiltasten navigieren
                  lässt.</p>
               <p>Diese Kombination ermöglicht es auf explorative Weise die Ergebnisse
                  entsprechend der Forschungsfrage zu analysieren. Wurde ein passendes Topic
                  gefunden, kann ausgelesen werden, wie das Topic im gesamten Korpus oder in
                  einzelnen Archiven vertreten ist, welche durchschnittliche Gewichtung es in den
                  einzelnen Interviews besitzt und wie die tatsächliche Verteilung innerhalb eines
                  Chunks aussieht. Die Chunk-Ansicht kann Informationen zur Korrelation von Topics
                  bei aufeinanderfolgenden Chunks liefern und so Erkenntnisse über vorausgegangene
                  oder nachfolgende Themen liefern. Verschiedene Interviews und die entsprechenden
                  Textstellen können miteinander verglichen werden, wobei die jeweiligen Topics
                  stets auf die zugehörigen Wörter zurückgeführt werden können.</p>
               <p>Über die drei Optionsschalter im Menüband können zusätzliche Optionen für alle
                  Seiten des Dashboards aktiviert werden. Mit »Tooltips anzeigen« werden beim Hovern
                  über den verschiedenen Feldern Texte zur Funktionalität eingeblendet.</p>
               <figure>
                  <graphic xml:id="ohtm-dash_017" url="Medien/ohtm-dash_017.png">
                     <desc>
                        <ref type="intern" target="#abb17">Abb.&#160;17</ref>: Tooltip-Anzeige im
                        Dashboard, <ref target="#adg1215">Interviewausschnitt adg1215</ref>.
                        [Screenshot: Philipp Bayerschmidt 2026]</desc>
                  </graphic>
               </figure>
               <p>In der OHTM-Pipeline können die Topics nach dem Trainieren eines Modells von
                  Forschenden mit Schlagwörtern bzw. Labels versehen werden. Durch die Aktivierung
                  von »Topic Labels« werden diese Schlagwörter innerhalb der Ausgabe im Dashboard
                  zusätzlich zu den Topic-Nummern angezeigt. Da die Labels eine Interpretation
                  darstellen, ist es wichtig, dass die Topics stets auf die Topic-Wörter
                  zurückgeführt werden können.</p>
               <figure>
                  <graphic xml:id="ohtm-dash_018" url="Medien/ohtm-dash_018.png">
                     <desc>
                        <ref type="intern" target="#abb18">Abb.&#160;18</ref>: Label-Anzeige für die
                        einzelnen Topics, <ref target="#adg2443">Interviewausschnitt adg2443</ref>.
                        [Screenshot: Philipp Bayerschmidt 2026]</desc>
                  </graphic>
               </figure>
               <p>Bei einer großen Topic-Anzahl können mehrere Topics ähnliche Themen abdecken,
                  beispielsweise mehrere Topics zum Themenkreis »Familie«. Diese können in der
                  OHTM-Pipeline händisch zu selbstbenannten Clustern zusammengefügt werden, sodass
                  beispielsweise anstatt der hier im Beispiel vorhandenen 100 Topics nur 25
                  Topic-Cluster angezeigt werden.</p>
               <p>Unterhalb dieser Optionen werden einige generelle Informationen zum geladenen
                  Topic Model angezeigt. Im Impressum und Glossar können über eine Textdatei
                  Informationen für Nutzende hinterlegt werden, die durch einen Klick geöffnet
                  werden kann.</p>
               <figure>
                  <graphic xml:id="ohtm-dash_019" url="Medien/ohtm-dash_019.png">
                     <desc>
                        <ref type="intern" target="#abb19">Abb.&#160;19</ref>: Cluster-Anzeige, <ref
                           target="#adg2467">Interviewausschnitt adg2467</ref>. [Screenshot: Philipp
                        Bayerschmidt 2026]</desc>
                  </graphic>
               </figure>
            </div>
            <div type="subchapter">
               <head>4.6 Chunk-Suche und Chunk-Analyse</head>
               <p>Zusätzlich bietet das Dashboard zwei weitere Analyseebenen, die es ermöglichen,
                  das Forschungskorpus gezielt nach passenden Textstellen zu durchsuchen.</p>
               <p>Über die »Chunk-Suche« können entweder die Chunks des gesamten Korpus (»Korpus
                  Search«) oder eines einzelnen Interviews (»Interview Search«), einstellbar über das
                  Dropdown-Menü, nach einem Topic samt Schwellenwert gesucht werden.</p>
               <figure>
                  <graphic xml:id="ohtm-dash_020" url="Medien/ohtm-dash_020.png">
                     <desc>
                        <ref type="intern" target="#abb20">Abb.&#160;20</ref>: Textsuche in den
                        Chunks, Interviews des Museums Friedland. [Screenshot: Philipp Bayerschmidt
                        2026]</desc>
                  </graphic>
               </figure>
               <p>Anschließend werden alle Ergebnisse in einer Tabelle mitsamt des Topic-Gewichts,
                  der Interview-ID, der Chunk-Nummer, dem unverarbeiteten Text und den ersten fünf
                  Topics des Chunks ausgegeben. Eine weitere Analysemöglichkeit erweitert die
                  Chunk-Suche, indem nicht nur der Text ausgegeben wird, sondern ähnlich wie in der
                  Overview alle relevanten Ebenen mit in die Ergebnispräsentation eingebunden
                  werden, die »Chunk-Analyzation«-Seite.</p>
               <figure>
                  <graphic xml:id="ohtm-dash_021" url="Medien/ohtm-dash_021.png">
                     <desc>
                        <ref type="intern" target="#abb21">Abb.&#160;21</ref>: Chunk-Analyzation mit
                        Chunk-Suche und weiteren Analyseebenen, <ref target="#adg0021"
                           >Interviewausschnitt adg0021</ref>. [Screenshot: Philipp Bayerschmidt
                        2026]</desc>
                  </graphic>
               </figure>
               <p>Das Korpus kann nach einem bestimmten Topic samt Schwellenwert gefiltert werden.
                  Das Balkendiagramm zeigt die Topic-Verteilung der Ergebnisse, die Heatmap die
                  Topic-Chunk-Verteilung an. Zusätzlich werden die Anzahl der gefundenen Chunks und
                  die Anzahl der jeweiligen Interviews ausgegeben. Wie in der Interview-Heatmap kann
                  durch die Auswahl eines Chunks der unverarbeitete Text angezeigt werden. Daneben
                  finden sich zum einen die gesamte Topic-Verteilung des einzelnen Chunks sowie die
                  Summe aller Top-5 Topics in den Ergebnissen. Wenn man den »Correlations«-Schalter
                  aktiviert, kann die Suche noch um ein zweites Topic samt Parameter als zusätzliche
                  Filterfunktion ausgewählt werden.</p>
            </div>
            <div type="subchapter">
               <head>4.7 Nicht berücksichtigte Funktionalitäten</head>
               <p>Die Entwicklung des Dashboards hatte die Kombination von distant und close reading
                  im Blick, um das Wechselspiel von scalable reading zu ermöglichen. Dabei wurden
                  einige Funktionalitäten nicht umgesetzt, weil sie für dieses Ziel nicht zwingend
                  notwendig erschienen. Dazu zählt die aus dem LDAvis oder Topic Cloud bekannte
                  Topic-Wort-Verteilung, die die Verbindungen der Topics und gemeinsamer Wörter
                  untereinander darstellt. Des Weiteren können innerhalb der Dokument-Ansicht die
                  Wörter nicht entsprechend ihrer zugehörigen Topics oder Stopwords farblich
                  markiert werden, wie es beispielsweise im TwiC möglich ist. Ebenso wurde darauf
                  verzichtet, die Gewichtung der Wörter in der Topic-Wort-Ansicht auszugeben.</p>
            </div>
         </div>
         <div type="chapter">
            <head>5. Topic ›Beheimatung‹&#160;– ein Use Case</head>
            <p>In meinem Promotionsprojekt <title>Topic ›Beheimatung‹</title> analysiere ich
               lebensgeschichtliche Interviews der Oral History hinsichtlich enthaltener Erzählungen
               über die Themen ›Heimat‹ und ›Beheimatungsprozesse‹<note type="footnote">Vgl. <ref
                     target="#mitzscherlich_heimat_2019">Mitzscherlich 2019</ref>,
                  S.&#160;183–196.</note>. Dabei soll untersucht werden, wie Menschen, die nach
               Deutschland gekommen und hier geblieben sind, innerhalb ihrer Lebensgeschichten über
               diese Themen erzählen. Der Fokus liegt weniger auf der Einordnung in die historische
               Entwicklung des Begriffs ›Heimat‹<note type="footnote">Vgl. <ref
                     target="#kueck_heimat_2022">Kück 2022</ref>; <ref
                     target="#oesterhelt_geschichte_2021">Oesterhelt 2021</ref>; <ref
                     target="#scharnowski_heimat_2019">Scharnowski 2019</ref>.</note>, sondern
               vielmehr auf den individuellen Erzählungen und den Aspekten des persönlichen
               Verständnisses sowie der eigenen Gestaltung von Heimat.<note type="footnote">Vgl.
                     <ref target="#jaeger_heimat_2017">Jäger 2017</ref>, S.&#160;12; <ref
                     target="#demantowsky_heimat_2021">Demantowsky 2021</ref>, S.&#160;187; <ref
                     target="#mitzscherlich_heimat_2019">Mitzscherlich 2019</ref>, S.&#160;184,
                  187–188.</note> Welche Erfahrungen haben die Menschen gemacht und wie lassen sich
               die verschiedenen Erzählungen dieser Migrant*innen auch mit Bezug auf die jeweiligen
               historischen Rahmenbedingungen vergleichen? Mithilfe von Topic Modeling und dem
               OHTM-Dashboard wird das zuvor vorgestellte Forschungskorpus aus 991 Interviews
               hinsichtlich dieses Forschungsinteresses analysiert. Dabei spielte das Dashboard
               nicht nur nach der finalen Berechnung eine Rolle, sondern auch schon zuvor. Zur
               Bestimmung der verschiedenen Topic-Modeling-Parameter (Topic-Anzahl, Chunk-Länge,
               Iterationen) ist es wichtig, die Ergebnisse zu analysieren und durch das Vergleichen
               verschiedener Modelle die idealen Werte zu finden. Über das Dashboard konnten
               visuelle Vergleiche zur Verteilung der Topics über das Korpus durchgeführt werden. So
               erlaubten die verschiedenen Visualisierungen (z.&#160;B. Balkendiagramm und Heatmap)
               in Kombination mit einem close reading bestimmter Chunks und der Überprüfung der
               zugeordneten Topics die Herausarbeitung wichtiger Erkenntnisse. Somit half das
               Dashboard schon während der Berechnung des Topic Models.<note type="footnote">Vgl.
                     <ref target="#bayerschmidt_moebus_leben_2025">Bayerschmidt&#160;/ Möbus
                     2026</ref>.</note>
            </p>
            <p>Über die Topic-Wörter-Ansicht konnte im OH.D-Modell das Topic 44 ausfindig gemacht
               werden, welches aufgrund seiner Wörter inhaltlich passend zum Thema ›Beheimatung‹
               ist. Ziel war es dann, über die Topic-Dokument-Verteilung die Interview-Chunks zu
               finden, in denen dieses Topic dominant ist und damit die Textpassagen, in denen über
               Heimat und Beheimatung erzählt wird.</p>
            <figure>
               <graphic xml:id="ohtm-dash_022" url="Medien/ohtm-dash_022.png">
                  <desc>
                     <ref type="intern" target="#abb22">Abb.&#160;22</ref>: Topic-Wörter-Ansicht mit
                     markiertem Topic 44. [Screenshot: Philipp Bayerschmidt 2026]</desc>
               </graphic>
            </figure>
            <table xml:id="tab003">
               <row>
                  <cell>Topic-Nummer</cell>
                  <cell>Ersten 20 Wörter des Topics</cell>
               </row>
               <row>
                  <cell>44</cell>
                  <cell>deutsch, polen, deutschland, polnisch, sprache, russisch, pole, lernen, land, deutsche, familie, russland, friedland, türkei, stadt, russe, heimat, ausländer, türkisch, grenze,</cell>
               </row>
               <trailer>
                  <ref type="intern" target="tab003">Tab. 3</ref>: Topic-Wort-Verteilung des Topics
                  44.</trailer>
            </table>
            <p>Das Balkendiagramm (<ref type="graphic" target="#ohtm-dash_013"
                  >Abbildung&#160;23</ref>) zeigt über die farbliche Unterteilung sehr deutlich,
               dass das Topic 44 in mehreren Teilkorpora vorkommt und so eine sammlungsübergreifende
               Suche möglich ist: ZWA, ADG, MFL, WDE.</p>
            <figure>
               <graphic xml:id="ohtm-dash_023" url="Medien/ohtm-dash_023.png">
                  <desc>
                     <ref type="intern" target="#abb23">Abb.&#160;23</ref>: Balkendiagramm mit
                     markiertem Topic 44. [Screenshot: Philipp Bayerschmidt 2026]</desc>
               </graphic>
            </figure>
            <p>Die Heatmap zeigt, dass es einige Interviews innerhalb des Korpus gibt, in denen
               Topic 44 im Durchschnitt markant präsent ist. Das Cluster im unteren Bereich der
               Heatmap zeigt, dass das Topic in den Interviews einer Sammlung besonders stark
               vertreten ist. Diese Informationen sind ein erster Hinweis darauf, welche Interviews
               eventuell mehrere Erzählpassagen zum gesuchten Thema enthalten, das sich in der
               durchschnittlichen Gewichtung wiederfindet.</p>
            <figure>
               <graphic xml:id="ohtm-dash_024" url="Medien/ohtm-dash_024.png">
                  <desc>
                     <ref type="intern" target="#abb24">Abb.&#160;24</ref>: Heatmap mit markiertem
                     Topic 44. [Screenshot: Philipp Bayerschmidt 2026]</desc>
               </graphic>
            </figure>
            <p>Nachdem über die Textsuche die Chunks gefiltert wurden, in denen Topic 44 den
               höchsten Wert besitzt, zeigt das höchste Ergebnis eine interessante Textpassage.</p>
            <figure>
               <graphic xml:id="ohtm-dash_025" url="Medien/ohtm-dash_025.png">
                  <desc>
                     <ref type="intern" target="#abb25">Abb.&#160;25</ref>: Textsuche mit dem
                     höchsten Chunk zu Topic 44, Interviews des Museums Friedland. [Screenshot: Philipp
                     Bayerschmidt 2026]</desc>
               </graphic>
            </figure>
            <p>Bei den hier Interviewten handelt es sich um zwei Personen, die aus Kasachstan nach
               Deutschland migriert sind. Die Textpassage zeigt sehr schön, wie die interviewten
               Personen sich in Deutschland heimisch fühlen und sogar den dialektalen Ausdruck
               »Dahoam« verwenden, um ihre Verbindung zum Ankunftsland zu unterstreichen.</p>
            <p>Für den tatsächlichen Analyseprozess sind die Overview-Ansicht und die zahlreichen
               Verknüpfungen der Analyseebenen sehr hilfreich. Für die vorangegangen Teilschritte
               wurden für eine deutlichere Darstellung die Einzelansichten der Elemente der
               Overview-Ansicht gewählt.</p>
            <figure>
               <graphic xml:id="ohtm-dash_026" url="Medien/ohtm-dash_026.png">
                  <desc>
                     <ref type="intern" target="#abb26">Abb.&#160;26</ref>: Overview-Ansicht.
                     [Screenshot: Philipp Bayerschmidt 2026]</desc>
               </graphic>
            </figure>
            <p>Die »Chunk-Analyse« ist nun für das weitere Vorgehen von zentraler Bedeutung, da sie
               die Ergebnisse noch einmal nach einer anderen Logik sortiert, die für die Forschung
               relevant ist. Denn vordergründig werden Interviewpassagen, in denen über Heimat und
               Beheimatungsprozesse gesprochen wird, gesucht. Sollte dies beispielsweise nur in ein
               bis zwei Chunks stattfinden, würde das in der Korpus-Heatmap unter Umständen
               übersehen werden, da sie in der durchschnittlichen Topic-Verteilung im Interview
               untergehen. Deshalb ist die Kombination der verschiedenen Ergebnisebenen in der
               »Chunk-Analyse« sinnvoll, weil sie die Chunks als eigenständige Dokumente nutzt. Für
               die nächste Analyse wurde nach allen Chunks gesucht, deren Wert über 0.1 liegt,
               abhängig davon, dass der höchste Wert bei 0.5 lag und ein möglichst breites Spektrum
               abgebildet werden sollte. Der Grenzwert konnte deshalb festgelegt werden, weil bei
               vorherigen Analysen von einzelnen Textstellen auch passende Inhalte gefunden wurden,
               bei denen Werte von knapp über 0.1 lagen.</p>
            <figure>
               <graphic xml:id="ohtm-dash_027" url="Medien/ohtm-dash_027.png">
                  <desc>
                     <ref type="intern" target="#abb27">Abb.&#160;27</ref>: Chunk-Analyzation, <ref
                        target="#FZH-WdE_2027">Interviewausschnitt FZH&#160;/ WdE 2027</ref>.
                     [Screenshot: Philipp Bayerschmidt 2026]</desc>
               </graphic>
            </figure>
            <p>Das Ergebnis zeigt, dass es für Topic 44 insgesamt 1.153 Chunks mit einem
               Topic-Gewicht von über 0.1 gibt, die sich aus insgesamt 344 Interviews
               zusammensetzen. Die Anzeige oben rechts gibt noch eine genauere Aufteilung der
               Archive, aus denen die Interviews stammen, an. Diese mithilfe des Dashboards
               gefundenen Chunks können anschließend in einem close reading weiter ausgewertet
               werden und die Ergebnisse in die Topic-Korrelationen eingebunden werden.</p>
         </div>
         <div type="chapter">
            <head>6. Fazit</head>
            <p>Die bisher bestehenden visuellen Analyse-Tools bieten in Ansätzen gute Möglichkeiten,
               Topic-Modeling-Ergebnisse zu analysieren, jedoch haben sie einige entscheidende
               Mängel. So können zum einen nicht immer alle Analyseebenen angesteuert werden,
               sondern meist nur eine eingeschränkte Auswahl, und zum anderen ist die gleichzeitige
               Darstellung der Ebenen sowie die interaktive Verknüpfung nicht immer ausreichend
               gegeben. Zudem sind einige der Angebote nicht open source zugänglich und besitzen
               eingeschränkte Import-Formate. Ein Grundproblem besteht in der Varianz und den
               Anforderungen verschiedener Quellengattungen und Forschungskorpora, die
               unterschiedliche Bedürfnisse an Topic-Modeling-Pipelines und Analyse-Tools stellen.
               Zusätzlich sind die notwendigen Analyseebenen und deren Kombination nicht nur von der
               Quellengattung, sondern auch von der jeweiligen Fragestellung abhängig.</p>
            <p>Das OHTM-Dashboard bietet eine umfangreiche visuelle Analysemöglichkeit, die Zugriff
               auf nahezu alle vorhandenen Analyseebenen bietet und diese interaktiv miteinander
               kombiniert. Dies ermöglicht einen intuitiven Zugang, der sich Ebene für Ebene
               verfeinern lässt. Mithilfe des OHTM-Dashboards ist es möglich, das Korpus aus
               lebensgeschichtlichen Interviews auf ein gesuchtes Topic hin zu analysieren. Dabei
               ist das Dashboard nicht nur während der Analyse anwendbar, sondern auch bereits zuvor
               während der Topic-Modeling-Berechnung zur Validierung und zum Vergleich von
               verschiedenen Modellen, um Parameter zu bestimmen. Auch wenn das Dashboard durch die
               Ausgabe von Timecodes und einem Direktlink zum Interview im Archiv auf
               lebensgeschichtliche Interviews aus dem OH.D-Archiv spezialisiert ist, kann es ohne
               Probleme mit reinen TXT-Dateien genutzt werden. Denn das Dashboard funktioniert auf
               Grundlage des OHTM-Files, das durch die OHTM-Pipeline erstellt wird, die neben den
               Transkript-CSV-Dateien auch TXT-Dateien verarbeiten kann. Durch den Open-Source-Zugang und einen modularen Aufbau ist sowohl die Pipeline als auch das Dashboard
               individuell anpassbar. Durch die Kombination des OHTM-Files und des Dashboards ist es
               darüber hinaus möglich, Forschungsergebnisse anderer Forscher*innen zu evaluieren,
               indem Zugriff auf das OHTM-File gewährt wird und dieses mit dem Dashboard geöffnet
               werden kann.</p>
         </div>

      </body>
      <back>
         <div type="bibliography">
            <head>Bibliografie</head>
            <listBibl>
               <bibl xml:id="armoza_topic_2017">Jonathan Armoza: Topic Words in Context (TWiC), In:
                  Jonathan Armoza: jarmoza. GitHub. 2017. Datenset. [<ref
                     target="https://github.com/jarmoza/twic">online</ref>]</bibl>
               <bibl xml:id="bayerschmidt_ohtm_2026">Philipp Bayerschmidt: OHTM, an Oral
                  History Topic Modeling Pipeline. In: Philipp Bayerschmidt: bayerschphi.
                  GitHub. 2026. Datenset. [<ref
                     target="https://github.com/bayerschphi/ohtm_pipeline">online</ref>]</bibl>
               <bibl xml:id="bayerschmidt_ohtm_2025-2026">Philipp Bayerschmidt: OHTM-Dashboard.
                  In: Oral History Digital. GitHub. 2025–2026. Datenset. [<ref
                     target="https://github.com/oral-history-digital/OHTM-Dashboard"
                  >online</ref>]</bibl>
               <bibl xml:id="bayerschmidt_moebus_leben_2025">Philipp Bayerschmidt&#160;/ Dennis
                  Möbus: Leben gelabelt. Computergestützte Inhaltverzeichnisse für
                  Oral-History-Interviews. In: BIOS&#160;– Zeitschrift für Biographieforschung, Oral
                  History und Lebensverlaufanalysen 38 (2025), H.&#160;1+2, S.&#160;83–104. <ptr
                     type="gbv" cRef="1967045003"/>
               </bibl>
               <bibl xml:id="binder_heimat_2008">Beate Binder: Heimat als Begriff der
                  Gegenwartsanalyse. Gefühle der Zugehörigkeit und soziale Imaginationen in der
                  Auseinandersetzung um Einwanderung. In: Zeitschrift für Volkskunde 104 (2008),
                  H.&#160;1, S.&#160;1–17. <ptr type="gbv" cRef="1624056490"/>
               </bibl>
               <bibl xml:id="blei_et_al_allocation_2003">David Meir Blei&#160;/ Andrew Y Ng&#160;/
                  Michael I. Jordan: Latent Dirichlet Allocation. In: Journal of Machine Learning
                  Research 3 (2003), H. 4–5, S.&#160;993–1022. [<ref target="https://www.jmlr.org/papers/volume3/blei03a/blei03a.pdf">online</ref>] <ptr type="gbv" cRef="327304472"/>
               </bibl>
               <bibl xml:id="blei_topic_2012">David Meir Blei: Probabilistic Topic Models. In:
                  Association for Computing Machinery (Hg.): Communications of the ACM 55 (2012),
                  H.&#160;4, S.&#160;77–84. HTML. DOI: <ref
                     target="https://doi.org/10.1145/2133806.2133826">10.1145/2133806.2133826</ref>
               </bibl>
               <bibl xml:id="chaney_blei_topic_2012">Allison Chaney&#160;/ David Meir Blei:
                  Visualizing Topic Models. In: ICWSM 2012. 6. International AAAI Conference on
                  Weblogs and Social Media. Tagungsband (Dublin, 04.–07.06.2012). Dublin 2012,
                  S.&#160;419–422. HTML. DOI: <ref target="https://doi.org/10.1609/icwsm.v6i1.14321"
                     >10.1609/icwsm.v6i1.14321</ref>
               </bibl>
               <bibl xml:id="chuang_et_al_visualization_2012">Jason Chuang&#160;/ Christopher D.
                  Manning&#160;/ Jeffrey Heer: Termite: Visualization Techniques for Assessing
                  Textual Topic Models. In: Genny Tortora&#160;/ Stefano Levialdi&#160;/ Maurizio
                  Tucci (Hg.): AVI ’12. International Working Conference on Advanced Visual
                  Interfaces. Tagungsband (Capri, Italien, 21.–25.05.2012). New York 2012,
                  S.&#160;74–77. DOI: <ref target="https://doi.org/10.1145/2254556.2254572"
                     >10.1145/2254556.2254572</ref>
               </bibl>
               <bibl xml:id="demantowsky_heimat_2021">Marko Demantowsky: Was soll das bloß mit
                  dieser Heimat. In: Jan Matthias Hoffrogge&#160;/ Martin Schlutow&#160;/ Max
                  Twickler (Hg.): Geschichtsbewusstsein in der Gesellschaft. Festschrift für Bernd
                  Schönemann zum 65. Geburtstag. Unter Mitarbeit von Bernd Schönemann (=&#160;Forum
                  Historisches Lernen). Frankfurt&#160;/ Main 2021, S.&#160;170–188. <ptr type="gbv"
                     cRef="1748344137"/>
               </bibl>
               <bibl xml:id="franken_moebus_mensch_2024">Lina Franken&#160;/ Dennis Möbus: Mensch
                  und Maschine als Team. Exploratives Topic Modeling und manuelle Annotation in der
                  qualitativen Sozialforschung. In: Zeitschrift für digitale Geisteswissenschaften 9
                  (2024). 23.05.2024. HTML&#160;/ XML&#160;/ PDF. DOI: <ref
                     target="https://doi.org/10.17175/2024_003">10.17175/2024_003</ref>
               </bibl>
               <bibl xml:id="hodel_et_al_inferenzen_2022">Tobias Hodel&#160;/ Dennis Möbus&#160;/
                  Ina Serif: Von Inferenzen und Differenzen. Ein Vergleich von
                  <hi rend="italic">Topic-Modeling-Engines</hi> auf Grundlage historischer Korpora. In: Selin Gerlek&#160;/
                  Sarah Kissler&#160;/ Thorben Mämecke&#160;/ Dennis Möbus (Hg.): Von Menschen und
                  Maschinen&#160;– Mensch-Maschine-Interaktion in digitalen Kulturen. Hagen 2022,
                  S.&#160;185–209. PDF. DOI: <ref
                     target="https://doi.org/10.57813/20220623-153139-0"
                     >10.57813/20220623-153139-0</ref>
               </bibl>
               <bibl xml:id="jaeger_heimat_2017">Jens Jäger: Heimat. In: zeitgeschichte DIGITAL.
                  09.11.2017. HTML. DOI: <ref target="https://doi.org/10.14765/zzf.dok.2.1113.v1"
                     >10.14765/zzf.dok.2.1113.v1</ref>
               </bibl>
               <bibl xml:id="jaenicke_et_al_text_2017">Stefan Jänicke&#160;/ Greta Franzini&#160;/
                  Muhammad Faisal Cheema&#160;/ Gerik Scheuermann: Visual Text Analysis in Digital
                  Humanities. In: Computer Graphics Forum 36 (2017), H.&#160;6, S.&#160;226–250.
                  DOI: <ref target="https://doi.org/10.1111/cgf.12873">10.1111/cgf.12873</ref>
               </bibl>
               <bibl xml:id="kahmann_et_al_application_2021">Christian Kahmann&#160;/ Andreas
                  Niekler&#160;/ Gregor Wiedemann: Application of the Interactive Leipzig Corpus
                  Miner as a Generic Research Platform for the Use in the Social Sciences. arXiv.
                  06.10.2021. DOI: <ref target="https://doi.org/10.48550/arXiv.2110.02708"
                     >10.48550/arXiv.2110.02708</ref>
               </bibl>
               <bibl xml:id="krautter_scales_2024">Benjamin Krautter: The Scales of (Computational)
                  Literary Studies. Martin Mueller’s Concept of Scalable Reading in Theory and
                  Practice. In: Florentina Armaselu&#160;/ Andreas Fickers (Hg.): Zoomland.
                  Exploring Scale in Digital History and Humanities (=&#160;Studies in Digital
                  History and Hermeneutics, 7). Basel u.&#160;a. 2024, S.&#160;261–286. DOI: <ref
                     target="https://doi.org/10.1515/9783111317779-011"
                     >10.1515/9783111317779-011</ref>
               </bibl>
               <bibl xml:id="kueck_heimat_2022">Svenja Kück: Heimat und Migration. Ein
                  transdisziplinärer Ansatz anhand biographischer Interviews mit geflüchteten
                  Menschen in Deutschland (=&#160;Sozial- und Kulturgeographie, 43). Bielefeld 2022. <ptr type="gbv" cRef="173475821X"/>
               </bibl>
               <bibl xml:id="liu_et_al_exploration_2021">Huan Liu&#160;/ Yubo Tao&#160;/ Yining
                  Qiu&#160;/ Wenda Huang&#160;/ Hai Lin: Visual Exploration of Software Evolution
                  via Topic Modeling. In: Journal of Visualization 24 (2021), H.&#160;4,
                  S.&#160;827–844. PDF&#160;/HTML. DOI: 10.1007/s12650-020-00739-7</bibl>
               <bibl xml:id="mitzscherlich_heimat_2019">Beate Mitzscherlich: Heimat als subjektive
                  Konstruktion. Beheimatung als aktiver Prozess. In: Edoardo Costadura&#160;/ Klaus
                  Ries&#160;/ Christiane Wiesenfeldt (Hg.): Heimat global. Modelle, Praxen und
                  Medien der Heimatkonstruktion (=&#160;Edition Kulturwissenschaft, 188). Bielefeld
                  2019, S.&#160;183–196. <ptr type="gbv" cRef="1669242285"/>
               </bibl>
               <bibl xml:id="moebus_vermaechtnis_2020">Dennis Möbus: Holleriths Vermächtnis&#160;–
                  ein Beitrag zur Geschichte von Frauen in der EDV. Topic Modeling als Methode
                  digitaler Sekundäranalyse. In: BIOS&#160;– Zeitschrift für Biographieforschung,
                  Oral History und Lebensverlaufanalysen 33 (2020), H.&#160;2, S.&#160;162–180. <ptr
                     type="gbv" cRef="1909642312"/></bibl>
               <bibl xml:id="moebus_interview_2025">Dennis Möbus: Interview Chronology Analysis
                  (ICA): Verläufe von (lebensgeschichtlichen) Interviews visuell analysieren. In:
                  Nils Reiter&#160;/ Thomas Haider&#160;/ Daniel Kababgi&#160;/ Hendrik Buschmeier
                  (Hg.): DHd 2025. Under Construction. 11. Jahrestagung des Verbands Digital
                  Humanities im deutschsprachigen Raum. Konferenzabstracts (Bielefeld,
                  03.–06.03.2025). Bielefeld 2025, S.&#160;469–471. PDF. DOI: <ref
                     target="https://doi.org/10.5281/zenodo.15269143">10.5281/zenodo.15269143</ref>
               </bibl>
               <bibl xml:id="moebus_et_al_topic_2026">Dennis Möbus&#160;/ Philipp
                  Bayerschmidt&#160;/ Tobias Hodel&#160;/ Ina Serif: Topic Modeling für die
                  Geschichtswissenschaft (=&#160;Zeitschrift für digitale Geisteswissenschaften /
                  Working Paper, 5). Wolfenbüttel 2026. 17.06.2026. HTML&#160;/ XML&#160;/ PDF. DOI:
                     <ref target="https://doi.org/10.17175/wp_2026b">10.17175/wp_2026b</ref></bibl>
               <bibl xml:id="mueller_et_al_topic_2021">Valerie Müller&#160;/ Christian Sieg&#160;/
                  Lars Linsen: Uncertainty-Aware Topic Modeling Visualization. arXiv. 18.10.2021.
                  DOI: <ref target="https://doi.org/10.48550/arXiv.2110.09247"
                     >10.48550/arXiv.2110.09247</ref>
               </bibl>
               <bibl xml:id="oesterhelt_geschichte_2021">Anja Oesterhelt: Geschichte der Heimat. Zur
                  Genese ihrer Semantik in Literatur, Religion, Recht und Wissenschaft
                  (=&#160;Studien und Texte Zur Sozialgeschichte der Literatur, 157). Berlin
                  u.&#160;a. 2021. <ptr type="gbv" cRef="1920844201"/>
               </bibl>
               <bibl xml:id="roennqvist_et_al_exploration_2014">Samuel Rönnqvist&#160;/ Xiaolu
                  Wang&#160;/ Peter Sarlin: Interactive Visual Exploration of Topic Models Using
                  Graphs. arXiv. 19.09.2014. Version 2 vom 27.11.2014. DOI: <ref
                     target="https://doi.org/10.48550/arXiv.1409.5623"
                     >10.48550/arXiv.1409.5623</ref>
               </bibl>
               <bibl xml:id="scharnowski_heimat_2019">Susanne Scharnowski: Heimat. Geschichte eines
                  Missverständnisses. Darmstadt 2019. <ptr type="gbv" cRef="1040608779"/>
               </bibl>
               <bibl xml:id="sievert_shirley_ldavis_2014">Carson Sievert&#160;/ Kenneth Shirley:
                  LDAvis: A Method for Visualizing and Interpreting Topics. In: Jason Chuang&#160;/
                  Spence Green&#160;/ Marti Hearst&#160;/ Jeffrey Heer&#160;/ Philipp Koehn (Hg.):
                  Interactive Language Learning, Visualization, and Interfaces. Workshop. Abstracts
                  (Baltimore, US-MD, 27.06.2014). Baltimore, US-MD 2014, S.&#160;63–70. DOI: <ref
                     target="https://doi.org/10.3115/v1/W14-31">10.3115/v1/W14-31</ref>
               </bibl>
               <bibl xml:id="simmler_et_al_topic_2019">Severin Simmler&#160;/ Thorsten Vitt&#160;/
                  Steffen Pielström: Topic Modeling with Interactive Visualizations in a GUI
                  Tool. In: ADHO 2019. Complexities. Annual International Digital Humanities
                  Conference of the Alliance of Digital Humanities Organizations. Konferenzabstracts
                  (Utrecht, NL, 09.07.–12.07.2019). Utrecht 2019. DOI: <ref
                     target="https://doi.org/10.34894/ENV3TX">10.34894/ENV3TX</ref>
               </bibl>
               <bibl xml:id="simmler_et_al_topics_2026">Severin Simmler&#160;/ Thorsten Vitt&#160;/
                  Steffen Pielström: Topics Explorer. In: DARIAH-DE (Hg.): Digitale
                  Forschungsinfrastruktur für die Geistes- und Kulturwissenschaften. Letzter
                  Zugriff: 20.03.2026. HTML. [<ref target="https://dariah-de.github.io/TopicsExplorer/">online</ref>]</bibl>
               <bibl xml:id="zeppezauer-wachauer_reading_2021">Katharina Zeppezauer-Wachauer: Distant Reading, Close Reading, Scalable
                  Reading. In: KONDE Weißbuch. Hg. von Helmut Klug unter Mitarbeit von Selina Galka und Elisabeth Steiner im HRSM Projekt »Kompetenznetzwerk Digitale Edition«. 2021. Handle: <ref target="hdl.handle.net/11471/562.50.71">11471/562.50.71</ref></bibl>
            </listBibl>
         </div>
         <div type="bibliography">
            <head>Quellen</head>
            <listBibl>
               <bibl xml:id="adg0001">A., Frau, Interview adg0001, 10.09.1981. Archiv »Deutsches
                  Gedächtnis«. Forschungsdatenzentrum des Instituts für Geschichte und Biographie.
                     [<ref
                     target="https://deutsches-gedaechtnis.fernuni-hagen.de/de/interviews/adg0001"
                     >online</ref>]</bibl>
               <bibl xml:id="adg0002">A., Johanna, Interview adg0002, 19.02.1982, 31.03.1982,
                  15.04.1981. Archiv »Deutsches Gedächtnis«. Forschungsdatenzentrum des Instituts
                  für Geschichte und Biographie. [<ref
                     target="https://deutsches-gedaechtnis.fernuni-hagen.de/de/interviews/adg0002"
                     >online</ref>]</bibl>
               <bibl xml:id="adg1215">M., Elfriede, Interview adg1215, 22.11.1990. Archiv »Deutsches
                  Gedächtnis«. Forschungsdatenzentrum des Instituts für Geschichte und Biographie.
                     [<ref
                     target="https://deutsches-gedaechtnis.fernuni-hagen.de/de/interviews/adg1215"
                     >online</ref>]</bibl>
               <bibl xml:id="adg2443">K., Reinhard, Interview adg2443, 12.12.2002. Archiv »Deutsches
                  Gedächtnis«. Forschungsdatenzentrum des Instituts für Geschichte und Biographie.
                     [<ref
                     target="https://deutsches-gedaechtnis.fernuni-hagen.de/de/interviews/adg2443"
                     >online</ref>]</bibl>
               <bibl xml:id="adg2467">H., Margret, Interview adg2467, 8.10.2003. Archiv »Deutsches
                  Gedächtnis«. Forschungsdatenzentrum des Instituts für Geschichte und Biographie.
                     [<ref
                     target="https://deutsches-gedaechtnis.fernuni-hagen.de/de/interviews/adg2467"
                     >online</ref>]</bibl>
               <bibl xml:id="adg0021">H., Hans, Interview adg0021, 19.11.1980. Archiv »Deutsches
                  Gedächtnis«. Forschungsdatenzentrum des Instituts für Geschichte und Biographie.
                     [<ref
                     target="https://deutsches-gedaechtnis.fernuni-hagen.de/de/interviews/adg0021"
                     >online</ref>]</bibl>
               <bibl xml:id="FZH-WdE_2027">FZH-WdE 2027, Interview mit Frau X (Alias) am 14.03.1993.
                  Interviewer Patrick Wanger.</bibl>
            </listBibl>
         </div>
      </back>
   </text>
</TEI>
