<?xml version="1.0" encoding="utf-8"?>
<?xml-model href="https://zfdg.de/sites/default/files/medien/zfdg.rng" type="application/xml" schematypens="http://relaxng.org/ns/structure/1.0"?>
<?xml-model href="https://zfdg.de/sites/default/files/medien/zfdg.rng" type="application/xml" schematypens="http://purl.oclc.org/dsdl/schematron"?>
<TEI xmlns="http://www.tei-c.org/ns/1.0" xmlns:tei="http://www.tei-c.org/ns/1.0">
    <teiHeader>
        <fileDesc>
            <titleStmt>
                <title level="a" type="full">Bildähnlichkeit und Bildsuche: Geistes- und
                    informationswissenschaftliche Zugänge zu historischem Material&#160;–
                    Vorwort</title>
                <title level="a" type="short">Vorwort</title>
                <respStmt>
                    <resp ref="http://id.loc.gov/vocabulary/relators/aut">Author</resp>
                    <resp ref="https://credit.niso.org/contributor-roles/writing-original-draft/">Conceptualization</resp>
                    <resp ref="https://credit.niso.org/contributor-roles/writing-original-draft/">Writing&#160;– original draft</resp>
                    <resp ref="https://credit.niso.org/contributor-roles/writing-review-editing/">Writing – review &amp; editing </resp>
                    <persName>
                        <forename>Hartmut</forename>
                        <surname>Beyer</surname>
                        <email>beyer@hab.de</email>
                        <idno type="gnd">136449824</idno>
                        <idno type="orcid">0000-0002-1158-1547</idno>
                        <affiliation>Herzog August Bibliothek Wolfenbüttel</affiliation>
                    </persName>
                </respStmt>
                <respStmt>
                    <resp ref="http://id.loc.gov/vocabulary/relators/aut">Author</resp>
                    <resp ref="https://credit.niso.org/contributor-roles/writing-original-draft/">Conceptualization</resp>
                    <resp ref="https://credit.niso.org/contributor-roles/writing-original-draft/">Writing&#160;– original draft</resp>
                    <resp ref="https://credit.niso.org/contributor-roles/writing-review-editing/">Writing – review &amp; editing </resp>
                    <persName>
                        <forename>Thomas</forename>
                        <surname>Mandl</surname>
                        <email>mandl@uni-hildesheim.de</email>
                        <idno type="gnd">138432600</idno>
                        <idno type="orcid">0000-0002-8398-9699</idno>
                        <affiliation>Universität Hildesheim</affiliation>
                    </persName>
                </respStmt>
            </titleStmt>
            <editionStmt>
                <edition n="1.0"/>
                <respStmt>
                    <resp ref="http://id.loc.gov/vocabulary/relators/dtm">Technische
                        Redaktion</resp>
                    <persName>
                        <forename>Martin</forename>
                        <surname>de la Iglesia</surname>
                        <idno type="gnd">1095143719</idno>
                        <idno type="orcid">0000-0002-9319-4793</idno>
                    </persName>
                </respStmt>
                <respStmt>
                    <resp ref="http://id.loc.gov/vocabulary/relators/dtm">Technische
                        Redaktion</resp>
                    <persName>
                        <forename>Maximilian</forename>
                        <surname>Görmar</surname>
                        <idno type="gnd">1077317964</idno>
                        <idno type="orcid">0000-0003-3608-1140</idno>
                    </persName>
                </respStmt>
                <respStmt>
                    <resp ref="http://id.loc.gov/vocabulary/relators/pfr">Textredaktion</resp>
                    <persName>
                        <forename>Karoline</forename>
                        <surname>Lemke</surname>
                        <idno type="gnd">1187840033</idno>
                        <idno type="orcid">0000-0002-1604-672X</idno>
                    </persName>
                </respStmt>
            </editionStmt>
            <publicationStmt>
                <publisher n="Redaktionssitz">
                    <orgName>Herzog August Bibliothek</orgName>
                    <address>
                        <addrLine>Lessingplatz 1</addrLine>
                        <addrLine>38304 Wolfenbüttel</addrLine>
                    </address>
                </publisher>
                <publisher n="herausgebendes Organ">
                    <orgName>Forschungsverbund Marbach Weimar Wolfenbüttel</orgName>
                    <address>
                        <addrLine>Burgplatz 4</addrLine>
                        <addrLine>99423 Weimar</addrLine>
                    </address>
                </publisher>
                <publisher n="herausgebendes Organ">
                    <orgName>Digital Humanities im deutschsprachigen Raum e. V.</orgName>
                    <address>
                        <addrLine>Hamburg</addrLine>
                    </address>
                </publisher>
                <date n="1.0" when="2026-05-21">21.05.2026</date>
                <idno type="doi">10.17175/sb008_001</idno>
                <idno type="ppn">1967467552</idno>
                <availability status="free">
                    <licence target="https://creativecommons.org/licenses/by-sa/4.0/">CC BY-SA 4.0,
                        sofern nicht anders angegeben.</licence>
                </availability>
            </publicationStmt>
            <seriesStmt>
                <title level="j">Zeitschrift für digitale Geisteswissenschaften</title>
                <title level="m">Bildähnlichkeit und Bildsuche: Geistes- und informationswissenschaftliche Zugänge zu historischem Material</title>
                <title level="s">Sonderbände</title>

                <respStmt>
                    <resp ref="http://id.loc.gov/vocabulary/relators/edt">Editor</resp>
                    <persName>
                        <forename>Hartmut</forename>
                        <surname>Beyer</surname>
                        <email>beyer@hab.de</email>
                        <idno type="gnd">136449824</idno>
                        <idno type="orcid">0000-0002-1158-1547</idno>
                        <affiliation>Herzog August Bibliothek Wolfenbüttel</affiliation>
                    </persName>
                </respStmt>
                <respStmt>
                    <resp ref="http://id.loc.gov/vocabulary/relators/edt">Editor</resp>
                    <persName>
                        <forename>Thomas</forename>
                        <surname>Mandl</surname>
                        <email>mandl@uni-hildesheim.de</email>
                        <idno type="gnd">138432600</idno>
                        <idno type="orcid">0000-0002-8398-9699</idno>
                        <affiliation>Universität Hildesheim, Institut für Informationswissenschaft
                            &amp; Sprachtechnologie</affiliation>
                    </persName>
                </respStmt>
                <idno type="issn">2510-1366</idno>
                <idno type="ppn">1930709293</idno>
                <idno type="doi">10.17175/sb008</idno>
                <idno type="url">https://www.zfdg.de/sonderband/8</idno>
                <biblScope unit="specialvolume">8</biblScope>
                <biblScope unit="article">1</biblScope>
            </seriesStmt>
            <sourceDesc>
                <p>Born digital: no previous source exists.</p>
            </sourceDesc>
        </fileDesc>
        <encodingDesc>
            <editorialDecl>
                <p>Letzte Überprüfung aller Verweise: <date when="2026-03-30">30.03.2026</date>
                </p>
            </editorialDecl>
            <schemaRef url="https://zfdg.de/sites/default/files/medien/zfdg.odd"/>
        </encodingDesc>
        <profileDesc>
            <textClass>
                <keywords n="Beitragstyp">
                    <term>Fachartikel</term>
                </keywords>
                <keywords n="GND">
                    <term ref="https://d-nb.info/gnd/4202994-6">Ähnlichkeit</term>
                    <term ref="https://d-nb.info/gnd/4006684-8">Bildverarbeitung</term>
                    <term ref="https://d-nb.info/gnd/4138803-3">Kunstgeschichte</term>
                    <term ref="https://d-nb.info/gnd/4026894-9">Informatik</term>
                    <term ref="https://d-nb.info/gnd/4148875-1">Datensammlung</term>

                </keywords>
            </textClass>
        </profileDesc>
    </teiHeader>
    <text xml:lang="de">
        <body>
            <div type="chapter">
                <p>Der vorliegende Sonderband der ZfdG geht zurück auf die Tagung ›Ähnlichkeit und
                    Methode: Digitale Perspektiven für die Arbeit mit historischem Bildmaterial‹,
                    die vom 11.–13.10.2023 an der Herzog August Bibliothek Wolfenbüttel stattfand.
                    Organisiert wurde sie im Rahmen des Projekts ›Automatische Bilderkennung
                    frühneuzeitlicher Porträtgrafik als App‹ (PortApp), gefördert vom
                    Niedersächsischen Ministerium für Wissenschaft und Kultur (MWK). Die Tagung
                    widmete sich aktuellen Entwicklungen der KI-gestützten Bilderkennung und ihren
                    Auswirkungen auf die Arbeit mit historischem Bildmaterial in den
                    Geisteswissenschaften sowie an den bestandshaltenden Institutionen.</p>
                <p>Ausgangspunkt der Tagung war der Begriff der Ähnlichkeit. Die Suche nach
                    Ähnlichkeiten kann als fundamentale Methode der Digital Humanities im Bereich
                    der Bildanalyse gelten. Damit verweist die automatische Bildverarbeitung auf den
                    Ähnlichkeitsbegriff, dessen produktive Neufassung ein generelles Desiderat der
                    Bildwissenschaften ist. Seine Rückbindung an den Wahrnehmungsprozess und der
                    hierüber einfließende Relativismus sorgen neben den in künstlerischen
                    Werkprozessen bewusst erzeugten Ähnlichkeiten für eine Vervielfachung der
                    Beschreibungsmöglichkeiten für Ähnlichkeit. Die Entwicklung KI-gestützter
                    Bilderkennung und die kontinuierliche Erweiterung digitaler Bildsammlungen im
                    kunsthistorischen Bereich regt die Entwicklung von Ansätzen für deren
                    Adressierbarkeit anhand von Kriterien visueller Ähnlichkeit an. Neben
                    Bildähnlichkeitssuchen für betont heterogene Datenbanken entstehen auf spezielle
                    Sammlungen zugeschnittene Tools, die näher eingegrenzte Forschungsinteressen
                    bedienen.</p>
                <p>Die Kategorie der Ähnlichkeit erhält durch die aktuelle technische Entwicklung
                    völlig neue Relevanz, insofern die maschinelle Analyse eine Vielzahl an
                    Ähnlichkeiten zutage fördert, deren Einordnung nur durch umfassende
                    Berücksichtigung der möglichen Beziehungen zwischen Bildern möglich ist. Von der
                    KI erkannte Ähnlichkeiten können eine Vielzahl an Ursachen haben, darunter
                    Material und Technik, Darstellungskonventionen, Imitation und Reproduktion sowie
                    die Identität des dargestellten Gegenstandes. In die Entwicklung automatischer
                    Bilderkennungssysteme fließt daher eine Fülle von Vorannahmen ein, und die
                    Suchergebnisse weisen einen kaum zu vermeidenden Bias in Hinblick auf die
                    ausgewählten Bildelemente und Trainingsmethoden auf. Herausforderung ist es
                    daher, automatische Bilderkennung und Interpretation in eine produktive
                    Wechselbeziehung zu bringen. Um der Problematik des Ähnlichkeitsbegriffs in
                    bildwissenschaftlicher Perspektive Rechnung zu tragen, wurde der thematische
                    Fokus für die Publikation des Sonderbandes angepasst: Es wird nicht mehr von
                    einer objektiv zu erfassenden Ähnlichkeit ausgegangen, die die Grundlage der
                    digitalen Methodik bilden kann, sondern stattdessen wird die Ähnlichkeit von
                    ihrer digitalen Erfassbarkeit in der Bildsuche her gedacht.</p>
                <p>Die Vorträge umfassten eine große Bandbreite an geisteswissenschaftlich
                    relevantem Material, darunter antike Vasen, klassische Malerei,
                    Buchillustrationen, Ornamentik und heutige Fotografie. Neben
                    Kunsthistoriker*innen kamen auch Vertreter*innen der Informationswissenschaft
                    sowie Kurator*nnen von Bilddatenbanken zu Wort. Die Vorträge zeigten, dass
                    zwischen menschlicher Bildinterpretation und den Ergebnissen der automatischen
                    Bilderkennung trotz aller Fortschritte unverändert ein großer Abstand besteht,
                    so dass eine geisteswissenschaftliche Nutzung der Ergebnisse vielfach nur in der
                    Vorselektion aus dem sonst unübersehbaren Bildmaterial besteht. Eine wichtige
                    Voraussetzung für die Automatisierung spezieller Fragestellungen besteht im
                    Vorhandensein umfassender Trainingsdaten, die gerade für historisches Material
                    und das jeweils spezifische Erkenntnisinteresse nur sehr aufwändig zu gewinnen
                    sind. Der durch das Trainingsmaterial erzeugte Bias erweist sich als ein
                    zentrales Problem der automatisierten Bildforschung. Einerseits handelt es sich
                    um Algorithmen, die an modernem Material und oft aus einem kommerziellen
                    Interesse heraus entwickelt wurden (dazu besonders Leonardo Impett),
                    andererseits bevorzugt auch die Materialauswahl der Kulturinstitutionen den
                    Mainstream der europäischen Hochkultur (was u.&#160;a. im Vortrag von Beate
                    Löffler deutlich wurde). Hieraus folgt die Notwendigkeit eines
                    materialspezifischen Trainings, das forschungsrelevante Bildpartien priorisiert
                    (dazu z.&#160;B. Corinna Reinhardt sowie die Beiträge zu PortApp). Als wichtiger
                    Schritt hin zu einer geisteswissenschaftlichen Nutzbarkeit automatisierter
                    Bildsuchen wurden immer wieder multimodale Modelle dargestellt (z.&#160;B. durch
                    Julian Stalter und Peter Bell), die textuelle und bildliche Informationen
                    gleichzeitig prozessieren. Insgesamt ist der Begriff der Ähnlichkeit in der
                    geisteswissenschaftlichen Tradition zu vielschichtig und unscharf, um auf
                    automatisierte Bilderkennungsverfahren übertragen zu werden. Auch ohne das ist
                    aber die informationstechnische Bestimmung partieller Übereinstimmungen von
                    großem Wert für die bildwissenschaftliche Arbeit.</p>
              </div>
                <div type="chapter">
                    <head>Die Beiträge des Sonderbands</head>
                <p>Die Verarbeitung von Bildern für die Geisteswissenschaften erfordert den
                    interdisziplinären Dialog zwischen Bildwissenschaften und digitalen
                    Wissenschaften. Die Metapher des Dialogs ergreifen Elke Katharina Wittich und
                    Ralph Ewerth als Leitidee für ihren Beitrag. Sie führen dieses Gespräch im Sinne
                    eines Sokratischen Dialogs, der von Grundbegriffen ausgeht. So zeigt sich oft
                    schnell, wie heterogen Grundbegriffe wie Ähnlichkeit oder Klassifikation
                    verstanden werden. Dabei wird auch die Suchmaschine <ref
                        target="https://www.iart.vision/">iART</ref> diskutiert, die von der TIB
                    Hannover entwickelt und gehostet wird. Das System iART erlaubt die Nutzung von
                    sehr aktuellen multimodalen Modellen für die Suche in kunsthistorischen
                    Beständen. So können Textsuchen unmittelbar auf Bilder angewandt werden, ohne
                    dass eine textuelle Übereinstimmung mit vergebenen Metadaten erforderlich
                    ist.</p>
                <p>Die Suchmaschine iART bildet auch den Gegenstand des Beitrags von Julian Stalter,
                    Matthias Springstein und Stefanie Schneider. Sie erweitern darin das Konzept der
                    Ähnlichkeitssuche im Bild- und Textraum noch um eine Erklärungskomponente.
                    Ausgehend von einigen Beispielen aus der Kunstgeschichte zeigen sie den
                    Spannungsraum auf, den Ergebnisse in iART erzeugen können. Grundsätzlich
                    erzeugen tiefe Lernsysteme, wie sie auch in Bildverarbeitungssystemen auf der
                    Basis von <term type="dh">Convolutional Neural Networks (CNNs)</term> implementiert sind, Ergebnisse,
                    die durch völlig undurchsichtige Verfahren zustande kommen. Ideen aus dem
                    Bereich <term type="dh">Explainable Artificial Intelligence (XAI)</term> versuchen, Gründe für
                    Entscheidungen zu liefern. Gerade in der Forschung verlangen die Nutzenden auch
                    Erklärungen. Stalter et&#160;al. nehmen dazu mit der Architektur der neuronalen
                    Netze und den genutzten Trainingsdaten zwei Aspekte in den Blick, die bei den
                    meisten Systemen sehr intransparent sind, welche jedoch gute Ansätze für eine
                    bessere Verständlichkeit und damit ein kritischeres Verständnis bieten.</p>
                <p>Ines Röckl, Thomas Hudcovic und Gabriel Zachmann stellen eine sehr spannende
                    interdisziplinäre Auseinandersetzung mit einem ornamentalen Element vor. Die
                    Rocaille, die im 18. Jahrhundert in Augsburg entwickelt wurde, greift Muscheln
                    und Baumrinde als Basis auf und kombiniert diese zu schwunghaften und komplexen
                    Mustern. Die innere Vielfalt der an sich unverkennbaren Klasse von
                    Rocaille-Formen erforderte das Trainieren und Entwickeln eines eigenen, dafür
                    optimierten <term type="dh">Vision-Language-Modells</term>, welches Ähnlichkeitsvorschläge finden und
                    generieren kann.</p>
                <p>Matthias Zinnen, Sabine Lang, Andreas Maier und Vincent Christlein stellen eine
                    weitere Kooperation zwischen digitalen Wissenschaften und Bildwissenschaften
                    vor. Die Grundlage für dieses Projekt liefern die Digitalisierungen von
                    Auktions- und Verkaufskatalogen aus dem Kunsthandel (German Sales), aus denen
                    zahlreiche Abbildungen von Kunstwerken extrahiert werden konnten. Eine derartige
                    Datengrundlage unterstützt die Provenienzforschung, die bisher teilweise auf
                    textbasierte Datenquellen beschränkt blieb. Das Projekt greift auch auf aktuelle
                    Bildsuchverfahren auf der Basis tiefer <term type="dh">Embeddings</term> zurück, um sehr ähnliche
                    Objekte zu erkennen.</p>
                <p>Ulf Otto greift ebenfalls einen speziellen Datenbestand aus dem kulturellen Erbe
                    auf und befasst sich mit Theaterfotografie. Der Autor stellt die Frage nach der
                    Ähnlichkeit von zwei Szenen auf der Bühne und stößt damit an die Fundamente der
                    Disziplin. Der Autor betont, wie die Akzeptanz von Daten als Grundlage für die
                    Disziplin eine neue Perspektive öffnet und andere Fragestellungen erst erlaubt.
                    Der Beitrag geht auf Szenen und Körper als Objekte der Fotografie ein und
                    diskutiert wie mehrere andere die notwendigen Anpassungen bei neuronalen
                    Architekturen und Lernverfahren.</p>
                    <p>Auch der Ansatz von Beate Löffler nutzt <term type="dh">neuronale Modellarchitekturen</term>, um Inhalte
                    durchsuchbar zu machen. In ihrem Beitrag steht die Zuordnung von Bildern zu
                    geographischen und zeitlichen Angaben im Fokus. Dieser Zusammenhang fehlt oft
                    bei ethnographischen Sammlungen und könnte bei einer automatischen Erkennung
                    hergestellt werden. Eine spezifische Anpassung von Bildsystemen für die
                    Architektur war dazu erforderlich. Das Projekt nutzt also Bildsucherverfahren
                    für die Architekturgeschichte und exploriert die Grenzen dieser Methoden.</p>
                <p>Anhand der Bildähnlichkeitssuche für die druckgrafischen Portraits der Herzog
                    August Bibliothek (PortApp) beschreiben Thomas Mandl, Sebastian Diem, Hole
                    Rößler und Hartmut Beyer die Forschungsrelevanz einer Bildähnlichkeitssuche für
                    diese in der Frühen Neuzeit weitverbreitete und bislang wenig erforschte Gattung
                    bildender Kunst. Sie ergibt sich sowohl aus der Masse des Materials als auch aus
                    den spezifischen Überlieferungsbedingungen, die durch Wiederverwendung und
                    Kontextwechsel einzelner Portraits gekennzeichnet sind. Im Vergleich mit anderen
                    Bildsuchmaschinen zu historischem Material wird der technische Ansatz von
                    PortApp herausgearbeitet; er beruht auf der Kombination mehrerer
                    <term type="dh">Deep-Learning-Modelle</term> im Rahmen eines Ensemblemodells, das ein für Nutzende
                    konfigurierbares Ranking erzeugt.</p>
                <p>Mit der praktischen Anwendbarkeit der Bildähnlichkeitssuche für Portraits
                    beschäftigt sich Nina Niedermeier in ihrem Beitrag ›Kunsthistorische
                    Streiflichter in die Blackbox‹. Ein besonderer Schwerpunkt liegt auf der
                    Identifikation von Bildregionen (<term type="dh">regions of interest</term>),
                    durch die Nutzer*nnen ihre Suchanfrage durch individuelle Schwerpunktsetzungen
                    modulieren können. Der Artikel wertet anhand dreier Fallstudien die
                    Funktionalität der Ähnlichkeitssuche und ihren Nutzen hinsichtlich
                    kunsthistorischer Fragestellungen aus.</p>
                <p>Insgesamt geben die ausgewählten Beiträge einen sehr guten Einblick in das
                    aktuelle Ringen der Bild-Disziplinen bei der reflektierten Integration von
                    KI-Verfahren in ihr Methodenrepertoire.</p>
                <p>Hildesheim und Wolfenbüttel, im April 2026
                   <lb/>Thomas Mandl und Hartmut Beyer
                </p>
                </div>
        </body>
    </text>
</TEI>
