5 Suchergebnisse

Automatisierte Identifikation und Lemmatisierung historischer Berufsbezeichnungen in deutschsprachigen Datenbeständen

Berufsangaben sind ein typisches Element vieler historischer Texte. Um solche vielfältigen Berufsbezeichnungen in Texten nicht nur automatisch zu erfassen, sondern gleichsam zu standardisieren und zu klassifizieren, stellen die Autor*innen einen eigens hierfür entwickelten Algorithmus vor.
Autor*innen
Jan Michael Goldberg
Katrin Moeller
(Version 2.0)

»[E]in Vater, dächte ich, ist doch immer ein Vater«. Figurentypen im Drama und ihre Operationalisierung

Dieser Artikel behandelt die Operationalisierung von Figurentypen im deutschsprachigen Drama. Ausgehend von der dramen- und theatergeschichtlichen Forschung werden Figuren bestimmt, die einem der drei Figurentypen ›Intrigant*in‹, ›tugendhafte Tochter‹ und ›zärtlicher Vater‹ entsprechen.
Autor*innen
Benjamin Krautter
Janis Pagel
Nils Reiter
Marcus Willand
(Version 2.0)

Vorstellung eines (teil-)automatisierten Verfahrens zur Analyse der Multimodalität von Webseiten

Der vorliegende Artikel stellt ein Verfahren zur (teil-)automatisierten Analyse der Multimodalität von Webseiten vor. Dabei steht im Fokus, unbekannte Webseiten auf deren Multimodalität hin zu untersuchen, ohne dass diese vorher annotiert oder sonst anderweitig in Bezug auf ihre Multimodalität analysiert worden wären.
Autor*innen
Thomas Jurczyk
(Version 2.0)

Publishing an OCR ground truth data set for reuse in an unclear copyright setting. Two case studies with legal and technical solutions to enable a collective OCR ground truth data set effort

When working with digitized historical prints researchers frequently find themselves confronted with unclear copyright settings. This article therefore not only tries to give guidelines on how to deal with these problems, but also offers two case studies including legal and technical solutions for creation and reuse of individual data sets.
Autor*innen
David Lassner
Julius Coburger
Clemens Neudecker
Anne Baillot
(Version 1.0)