Der Beitrag vollzieht die Entwicklung von Themenschwerpunkten und Stimmungsbildern zum Klimaschutz in österreichischen Zeitungen in einem Zeitraum von zwanzig Jahren mittels einer computergestützten quantitativen Datenanalyse unter Verwendung von Topic- und Sentiment-Analyse nach.
Berufsangaben sind ein typisches Element vieler historischer Texte. Um solche vielfältigen Berufsbezeichnungen in Texten nicht nur automatisch zu erfassen, sondern gleichsam zu standardisieren und zu klassifizieren, stellen die Autor*innen einen eigens hierfür entwickelten Algorithmus vor.
Anknüpfend an den 1950 von Alan Turing entwickelten Turing-Test vergleicht vorliegender Aufsatz inhaltliche Analysen eines historischen Briefwechsels, die einmal ›vom Menschen‹ mittels ›close reading‹ und anschließender Vergabe von Schlagworten und einmal ›von der Maschine‹ mittels Topic Modeling erzeugt wurden.
In recent years, Automatic Writer Identification (AWI)
has received a lot of attention in the document analysis community. This
article analyses how current state-of-the-art methods in writer identification
perform on historical documents.
Für die DH in Mediävistik und Frühneuzeitforschung stellt die Digitalisierung von Handschriften ein zentrales Feld dar. Da jede Handschrift eigene Charakteristika aufweist, führt die automatische Erstellung eines maschinenlesbaren Textes durch Optical Character Recognition (OCR) anhand von Digitalisaten meist zu fehlerhaften Ergebnissen.