Anknüpfend an den 1950 von Alan Turing entwickelten Turing-Test vergleicht vorliegender Aufsatz inhaltliche Analysen eines historischen Briefwechsels, die einmal ›vom Menschen‹ mittels ›close reading‹ und anschließender Vergabe von Schlagworten und einmal ›von der Maschine‹ mittels Topic Modeling erzeugt wurden.
In recent years, Automatic Writer Identification (AWI)
has received a lot of attention in the document analysis community. This
article analyses how current state-of-the-art methods in writer identification
perform on historical documents.
Für die DH in Mediävistik und Frühneuzeitforschung stellt die Digitalisierung von Handschriften ein zentrales Feld dar. Da jede Handschrift eigene Charakteristika aufweist, führt die automatische Erstellung eines maschinenlesbaren Textes durch Optical Character Recognition (OCR) anhand von Digitalisaten meist zu fehlerhaften Ergebnissen.