<?xml version="1.0" encoding="utf-8"?>
<?xml-model href="https://zfdg.de/sites/default/files/medien/zfdg.rng" type="application/xml" schematypens="http://relaxng.org/ns/structure/1.0"?>
<?xml-model href="https://zfdg.de/sites/default/files/medien/zfdg.rng" type="application/xml" schematypens="http://purl.oclc.org/dsdl/schematron"?>
<TEI xmlns="http://www.tei-c.org/ns/1.0" xmlns:tei="http://www.tei-c.org/ns/1.0">
   <teiHeader>
      <fileDesc>
         <titleStmt>
            <title level="a" type="full">Eine Tulpe ist eine Tulpe ist keine Tulpe. Ein Dialog über
               Methoden und Fachdiskurse in der Kunstwissenschaft und Informatik</title>
            <title level="a" type="short">Eine Tulpe ist eine Tulpe ist keine Tulpe</title>
            <respStmt>
               <resp ref="http://id.loc.gov/vocabulary/relators/aut">Author</resp>
               <resp ref="https://credit.niso.org/contributor-roles/methodology/">Methodology</resp>
               <resp ref="https://credit.niso.org/contributor-roles/writing-original-draft/"
                  >Writing&#160;– original draft</resp>
               <resp ref="https://credit.niso.org/contributor-roles/writing-review-editing/"
                  >Writing&#160;– review &amp; editing</resp>
               <persName>
                  <forename>Elke Katharina</forename>
                  <surname>Wittich</surname>
                  <email>wittich@zew.uni-hannover.de</email>
                  <idno type="gnd">102370837X</idno>
                  <idno type="orcid">0000-0002-0643-9431</idno>
                  <affiliation>Leibniz Universität Hannover</affiliation>
               </persName>
            </respStmt>
            <respStmt>
               <resp ref="http://id.loc.gov/vocabulary/relators/aut">Author</resp>
               <resp ref="https://credit.niso.org/contributor-roles/conceptualization/"
                  >Conceptualization</resp>
               <resp ref="https://credit.niso.org/contributor-roles/methodology/">Methodology</resp>
               <resp ref="https://credit.niso.org/contributor-roles/writing-original-draft/"
                  >Writing&#160;– original draft</resp>
               <resp ref="https://credit.niso.org/contributor-roles/writing-review-editing/"
                  >Writing&#160;– review &amp; editing</resp>
               <persName>
                  <forename>Ralph</forename>
                  <surname>Ewerth</surname>
                  <email>ewerth@uni-marburg.de</email>
                  <idno type="gnd">136056962</idno>
                  <idno type="orcid">0000-0003-0918-6297</idno>
                  <affiliation>Philipps-Universität Marburg</affiliation>
               </persName>
            </respStmt>
         </titleStmt>
         <editionStmt>
            <edition n="1.0"/>
            <respStmt>
               <resp ref="http://id.loc.gov/vocabulary/relators/dtm">Technische Redaktion</resp>
               <persName>
                  <forename>Martin</forename>
                  <surname>de la Iglesia</surname>
                  <idno type="gnd">1095143719</idno>
                  <idno type="orcid">0000-0002-9319-4793</idno>
               </persName>
            </respStmt>
            <respStmt>
               <resp ref="http://id.loc.gov/vocabulary/relators/dtm">Technische Redaktion</resp>
               <persName>
                  <forename>Maximilian</forename>
                  <surname>Görmar</surname>
                  <idno type="gnd">1077317964</idno>
                  <idno type="orcid">0000-0003-3608-1140</idno>
               </persName>
            </respStmt>
            <respStmt>
               <resp ref="http://id.loc.gov/vocabulary/relators/pfr">Textredaktion</resp>
               <persName>
                  <forename>Karoline</forename>
                  <surname>Lemke</surname>
                  <idno type="gnd">1187840033</idno>
                  <idno type="orcid">0000-0002-1604-672X</idno>
               </persName>
            </respStmt>
         </editionStmt>
         <publicationStmt>
            <publisher n="Redaktionssitz">
               <orgName>Herzog August Bibliothek</orgName>
               <address>
                  <addrLine>Lessingplatz 1</addrLine>
                  <addrLine>38304 Wolfenbüttel</addrLine>
               </address>
            </publisher>
            <publisher n="herausgebendes Organ">
               <orgName>Forschungsverbund Marbach Weimar Wolfenbüttel</orgName>
               <address>
                  <addrLine>Burgplatz 4</addrLine>
                  <addrLine>99423 Weimar</addrLine>
               </address>
            </publisher>
            <publisher n="herausgebendes Organ">
               <orgName>Digital Humanities im deutschsprachigen Raum e. V.</orgName>
               <address>
                  <addrLine>Hamburg</addrLine>
               </address>
            </publisher>
            <date n="1.0" when="2026-05-21">21.05.2026</date>
            <idno type="doi">10.17175/sb008_002</idno>
            <idno type="ppn">1968281398</idno>
            <availability status="free">
               <licence target="https://creativecommons.org/licenses/by-sa/4.0/">CC BY-SA 4.0,
                  sofern nicht anders angegeben.</licence>
            </availability>
         </publicationStmt>
         <seriesStmt>
            <title level="j">Zeitschrift für digitale Geisteswissenschaften</title>
            <title level="m">Bildähnlichkeit und Bildsuche: Geistes- und informationswissenschaftliche Zugänge zu historischem Material</title>
            <title level="s">Sonderbände</title>

            <respStmt>
               <resp ref="http://id.loc.gov/vocabulary/relators/edt">Editor</resp>
               <persName>
                  <forename>Hartmut</forename>
                  <surname>Beyer</surname>
                  <email>beyer@hab.de</email>
                  <idno type="gnd">136449824</idno>
                  <idno type="orcid">0000-0002-1158-1547</idno>
                  <affiliation>Herzog August Bibliothek Wolfenbüttel</affiliation>
               </persName>
            </respStmt>
            <respStmt>
               <resp ref="http://id.loc.gov/vocabulary/relators/edt">Editor</resp>
               <persName>
                  <forename>Thomas</forename>
                  <surname>Mandl</surname>
                  <email>mandl@uni-hildesheim.de</email>
                  <idno type="gnd">138432600</idno>
                  <idno type="orcid">0000-0002-8398-9699</idno>
                  <affiliation>Universität Hildesheim, Institut für Informationswissenschaft &amp;
                     Sprachtechnologie</affiliation>
               </persName>
            </respStmt>
            <idno type="issn">2510-1366</idno>
            <idno type="ppn">1930709293</idno>
            <idno type="doi">10.17175/sb008</idno>
            <idno type="url">https://www.zfdg.de/sonderband/8</idno>
            <biblScope unit="specialvolume">8</biblScope>
            <biblScope unit="article">2</biblScope>
         </seriesStmt>
         <sourceDesc>
            <p>Born digital: no previous source exists.</p>
         </sourceDesc>
      </fileDesc>
      <encodingDesc>
         <editorialDecl>
            <p>Letzte Überprüfung aller Verweise: <date when="2026-04-10">10.04.2026</date>
            </p>
         </editorialDecl>
         <schemaRef url="https://zfdg.de/sites/default/files/medien/zfdg.odd"/>
      </encodingDesc>
      <profileDesc>
         <textClass>
            <keywords n="Beitragstyp">
               <term>Fachartikel</term>
            </keywords>
            <keywords n="GND">
               <term ref="https://d-nb.info/gnd/4138803-3">Kunstgeschichte</term>
               <term ref="https://d-nb.info/gnd/7667574-9">Bildsuchmaschine</term>
               <term ref="https://d-nb.info/gnd/4129594-8">Computer Vision</term>
            </keywords>
         </textClass>
      </profileDesc>
   </teiHeader>
   <text xml:lang="de">
      <front>
         <div type="abstract" xml:lang="de">
            <p>In diesem Dialog zwischen einer Kunsthistorikerin und einem Informatiker werden
               Möglichkeiten und Herausforderungen des Einsatzes von Methoden der künstlichen
               Intelligenz (KI) für kunst- und bildwissenschaftliche Fragestellungen erörtert. Dabei
               werden einerseits laufende Projekte als Beispiele genutzt und andererseits
               methodische Fragestellungen an Bildwerken, Arbeitsweisen und Kulturen der
               Fachdisziplinen erschlossen. Behandelt werden neben Bildähnlichkeit Fragen nach der
               Klassifizierung und nach Interpretationen und Wertungen. Wir möchten mit diesem
               Dialog zur Klärung solcher Fragen beitragen, um das große Potenzial der
               Zusammenarbeit auch zur Weiterentwicklung der Methoden zu nutzen.</p>
         </div>
         
         <div type="abstract" xml:lang="en">
            <p>In this dialogue, an art historian and a computer scientist discuss the possibilities
               and challenges of artificial intelligence (AI) methods for issues in art and visual
               studies. On the one hand, we use current projects as examples and, on the other hand,
               we explore methodological issues using works of art, methods and cultures of the
               specialist disciplines. In addition to image similarity, we address questions of
               classification and interpretations and judgements. Through our dialogue, we aim to
               contribute to answering such questions in order to exploit the great potential of
               cooperation for the further development of methods.</p>
         </div>
      </front>
      <body>
         <div type="chapter">
            <head>Dialog</head>
            <p><hi rend="italic">Seit der Antike wird der literarische Dialog durchgängig als Form
                  des theoretischen Diskurses genutzt, häufig um sich ungeklärten Fragestellungen
                  anzunähern oder um weit auseinanderliegende Positionen durch vertiefende
                  Argumentationsketten anzunähern.</hi><note type="footnote"> Vgl. <ref
                     type="bibliography" target="#foellinger_mueller_hg_dialog_2013"
                     >Föllinger&#160;/ Müller 2013.</ref>
               </note>
               <hi rend="italic">Wir gehen davon aus, dass KI im kunstwissenschaftlichen Diskurs
                  weit mehr sein kann als ein technisches Hilfsmittel. Wir wollen den Dialog nutzen,
                  um herauszufinden, was die jeweils andere Seite wissen sollte über Methoden und
                  Arbeitsweisen der zunächst weit auseinanderliegenden geisteswissenschaftlich und
                  technisch arbeitenden Fachdisziplinen.</hi></p>
            <p><hi rend="bold">Elke Katharina Wittich:</hi> Wir arbeiten an der Leibniz Universität
               in mehreren Projekten daran, die technischen Möglichkeiten der KI mit qualitativen
               Fragestellungen der Kunstwissenschaft zu verbinden. Zu diesen Fragestellungen zählen
               solche zur Ikonographie und zu Gattungen mit hohen quantitativen Ausprägungen wie der
               Numismatik oder der Druckgraphik. Übergeordnet stellt sich die Frage, ob bzw. wie
               Wissenschaftsdisziplinen zusammenarbeiten können, wenn die eine qualitativ und häufig
               induktiv und die andere quantitativ und maßgeblich deduktiv arbeitet? Kann eine
               Bildsuchmaschine, wie Ihr sie gerade entwickelt, diese unterschiedlichen methodischen
               Ansätze zusammenführen?</p>
            <p>
               <hi rend="bold">Ralph Ewerth:</hi> Die Idee unserer Bildsuchmaschine <ref
                  target="https://iart.vision/">iART</ref> ist, Forschende mit
               bildwissenschaftlichen Fragestellungen bei der Recherche nach Bildern
               unterschiedlicher Gattungen zu unterstützen (vgl. <ref type="graphic"
                  target="#tulpe_001">Abbildung 1</ref>). In einem nächsten Schritt planen wir
               Funktionalitäten, die auch beim formalen oder inhaltlichen Vergleich von Bildern
               helfen. Diese Bildsuchmaschine haben wir in einem von der DFG geförderten Projekt
               (siehe <ref target="https://projects.tib.eu/iart/partner/">Projekthomepage</ref> bzw.
                  <ref target="https://gepris.dfg.de/gepris/projekt/415796915">GEPRIS</ref>)
               zusammen mit einem Kollegen aus der Kunstgeschichte (Prof. Hubertus Kohle) und einem
               weiteren Informatiker (Prof. Eyke Hüllermeier), beide LMU München, entwickelt. In der
               Suchmaschine <hi rend="italic">iART</hi> kann man mithilfe einer textuellen Suchanfrage oder einem
               Beispielbild nach ähnlichen Bildern in verschiedenen Datenbanken, die frei zugreifbar
               sind, suchen. Die Bilder in den Datenbanken werden zuvor mit unseren KI-Methoden,
               genauer mit Methoden des maschinellen Sehens (Computer Vision) automatisch analysiert
               und mithilfe von hochdimensionalen Vektoren, bestehend aus vielen Zahlenwerten,
               hinsichtlich unterschiedlicher Aspekte beschrieben. Diese Aspekte können sich auf die
               Farbgebung, das Vorhandensein von Objekten, aber auch auf interpretatorische Aspekte
               beziehen. </p>
            <figure>
               <graphic xml:id="tulpe_001" url="Medien/tulpe_001.png">
                  <desc>
                     <ref type="intern" target="#abb1">Abb.&#160;1</ref>: Internetseite der
                     Bildsuchmaschine <hi rend="italic">iART</hi>. [Screenshot: Elke Katharina Wittich 2025]</desc>
               </graphic>
            </figure>
            <p><hi rend="bold">Elke Katharina Wittich:</hi> Du sprichst von numerischer
               Beschreibung, unser Werkzeug ist die Sprache. Für uns Kunstwissenschaftler*innen
               stellt die Bildanalyse eine sehr grundlegende Methodik dar, die auf einer genauen
               Bildbeschreibung fußt.<note type="footnote">Vgl. <ref type="bibliography"
                     target="#boehm_bildbeschreibung_1995">Boehm 1995</ref>.</note> Beschrieben wird
               deduktiv vom Großen zum Kleinen und vom Formalen zum Inhaltlichen. Wertungen werden
               strengstens vermieden. Ich nutze ein prägnantes Beispiel von Martin Warnke, und
               zitiere in Kürze eine exemplarische Bildanalyse aus seinem berühmten Buch über Peter
               Paul Rubens zum großformatigen Gemälde <title>Die Folgen des Krieges</title> von 1637–38, heute im Palazzo Pitti in Florenz (vgl. <ref
                  type="graphic" target="#tulpe_002">Abbildung 2</ref>).</p>
            <figure>
               <graphic xml:id="tulpe_002" url="Medien/tulpe_002.png">
                  <desc>
                     <ref type="intern" target="#abb2">Abb.&#160;2</ref>: Peter Paul Rubens: <hi
                        rend="italic">Die Folgen des Krieges</hi>, 1637–38, Palazzo Pitti, Florenz
                     [Bild: <ref
                        target="https://de.wikipedia.org/wiki/Datei:Rubens_-_The_Consequences_of_War.jpg"
                        >Wikimedia Commons</ref>, Public Domain]</desc>
               </graphic>
            </figure>
            <p><quote type="grosszitat">Der vehemente Diagonalzug aus dem Bild […], beherrscht das
                  Bildfeld. Das gerade hochgestemmte Säulenpaar am linken Bildrand dient optisch nur
                  als Anhaltspunkt, von dem aus die Sturzvorgänge im Bild verfolgt werden können:
                  die klagend vorkippende Europa, die weggezerrte Venus, die vergeblichen Griffe der
                  Putti und der erfolgreiche Zugriff der Furie. Der vordringende Mars bedroht mit
                  der Spitze seines Kurzschwertes die weggedrückten Opfer des eisernen Zeitalters,
                  die Reste aus dem goldenen Zeitalter sind.</quote><note type="footnote">
                  <ref type="bibliography" target="#warnke_peter_2006">Warnke 2006</ref>,
                  S.&#160;151.</note>
            </p>
            <p>
               <hi rend="bold">Ralph Ewerth:</hi> Um die Unterschiede von Bildanalyse in unseren
               beiden Disziplinen zu zeigen, ist dies ein sehr gutes Beispiel. Für den Entwurf von
               Algorithmen oder die Annotation von Trainingsbeispielen anhand von KI-Methoden
               (genauer gesagt, für Methoden des maschinellen Lernens, einem Teilgebiet der KI), die
               anhand von Beispieldaten Muster in diesen Daten lernen, wäre diese Bildanalyse bzw.
               Bildbeschreibung nur eingeschränkt hilfreich. Aus meiner Sicht würde eine präzise
               Definition der hier verwendeten Begriffe wie ›Diagonalzug‹ oder ›vehementer
               Diagonalzug‹, ›dient optisch nur als Anhaltspunkt‹, ›klagend‹, ›vorkippend‹,
               ›weggezerrte Venus‹, ›vergeblichen Griffe‹ etc. fehlen. Vermutlich ist es auch nicht
               leicht möglich, diese Begriffe formal strikt zu definieren. </p>
            <p><hi rend="bold">Elke Katharina Wittich:</hi> Martin Warnke nutzt seine
               Bildbeschreibung als ein hermeneutisches Werkzeug mit langer philosophischer
               Tradition; allein die Wortprägung <quote>Sturzvorgänge im Bild</quote><note type="footnote"><ref type="bibliography" target="#warnke_peter_2006">Warnke 2006</ref>, S.&#160;151.</note> zeigt ja, wie mit sprachlichen Mitteln eine bildanaloge
               Ausdruckskraft erzeugt wird. Nicht umsonst gilt Ekphrasis, das Übertreffen des
               Kunstwerks durch seine Beschreibung, als hohe Kunst.<note type="footnote">Vgl. <ref
                     type="bibliography" target="#kennedy_meek_hg_encounters_2019">Kennedy&#160;/
                     Meek (Hg.) 2019</ref>.</note> Geben wir nicht etwas Wichtiges auf, wenn wir uns
               auf technische Beschreibungen verlassen? Oder anders gefragt: Vielleicht machen wir
               uns durch eine an technischen Bedarfen ausgerichtete Beschreibung erst in letzter
               Konsequenz bewusst, welche Qualitäten eine kunstwissenschaftlich angelegte
               Bildbeschreibung hat.</p>
            <p>
               <hi rend="bold">Ralph Ewerth:</hi> Hierzu habe ich zu wenig Kenntnisse in der
               Kunstgeschichte. Als Informatiker scheinen mir hier (formale) Bildbeschreibung und
               Bildanalyse&#160;/ <seg type="nobreak">-&#x200D;interpretation</seg> vermischt und diese Vermischung erscheint
               mir ein Nachteil zu sein. Es wird nicht beschrieben, warum die Sturzvorgänge als
               solche interpretiert werden, könnten es nicht auch Flug- oder Schwebevorgänge sein?
               Ich denke, eine strengere Trennung von formalen Aspekten (Farbe, Form, Textur, im
               Bild vorhandene Objekte und Szenerie, soweit nur anhand des Bildes erkennbar) und
               Analyse und Interpretation (kann ich Objekte näher spezifizieren, Personenidentitäten
               erkennen und weitere Informationen, z.&#160;B. den Ort oder Metaphorik, deuten
               mithilfe von Kontextinformationen außerhalb des Bildes) könnte hier von Nutzen sein
               und auch den Dialog von Informatik und Kunstgeschichte verbessern. </p>
            <p><hi rend="bold">Elke Katharina Wittich:</hi> Natürlich können wir Objekte und
               Personen an Attributen, Haltungen oder Kontexten erkennen&#160;– dieses Wissen und
               die Erfahrung damit, in welcher Zeit Kontexte in welcher Form eingesetzt wurden,
               macht ja einen guten Teil unserer Wissenschaft aus.</p>
            <p>
               <hi rend="bold">Ralph Ewerth:</hi> Außerdem sind meiner Ansicht nach hier
               Bildbeschreibung und die Bildanalyse&#160;/ <seg type="nobreak">-&#x200D;interpretation</seg> vermischt. So
               sind in der Beschreibung des Formalen bereits (subjektive) Interpretationen und
               Informationen, die sich nicht allein aus dem Bild entnehmen lassen, enthalten. </p>
            <p><hi rend="bold">Elke Katharina Wittich:</hi> Das mag daran liegen, dass in der Kunst
               des 17. Jahrhunderts die formale Anlage eines Bildes häufig mit einer semantischen
               Aussage eng verschränkt ist. Nehmen wir bei dem Gemälde <title>Die Folgen des Krieges
               </title>den Fuß des Mars, er wird genau auf der unteren Bildmitte aufgesetzt (<ref
                  type="graphic" target="#tulpe_003">Abbildung 3</ref>). Auf dieser Bildmitte ballen
               sich die Ereignisse, eine imaginäre Linie verläuft durch den Helm und ein Auge des
               Kriegsgottes Mars, dann durch ein Handgelenk der Venus, schließlich durch das Knie
               und einen Fuß des Mars. Dieser Fuß zertritt ein Blatt mit dem Bild der drei Grazien,
               die in einem solchen Krieg offenbar keinen Ort haben. Kann KI die Engführung von
               formalen und semantischen Aspekten erkennen?</p>
            <figure>
               <graphic xml:id="tulpe_003" url="Medien/tulpe_003.png">
                  <desc>
                     <ref type="intern" target="#abb3">Abb.&#160;3</ref>: Peter Paul Rubens: [Fuß
                     des Mars]. Detail der <hi rend="italic">Folgen des Krieges</hi>, 1637–38.
                     Palazzo Pitti, Florenz [Bild: <ref
                        target="https://de.wikipedia.org/wiki/Datei:Rubens_-_The_Consequences_of_War.jpg"
                        >Wikimedia Commons</ref>, Public Domain]</desc>
               </graphic>
            </figure>
            <p>
               <hi rend="bold">Ralph Ewerth:</hi> Grundsätzlich erscheint mir das möglich. Zu einem
               gewissen Grad, der für Forschende aus der Kunstgeschichte aber nicht ausreichend gut
               und korrekt ist, können dies <term type="dh">Vision-Language-Modelle</term>
               möglicherweise bereits. Bei diesen Modellen gibt es aber noch mehrere Probleme: 1)
               Sie erzeugen zu oft Halluzinationen oder stellen falsche Aussagen auf. 2) Nicht alle
               diese Modelle greifen, Stand jetzt, auf externe Wissensquellen zu bzw. können die
               Korrektheit der Informationen in diesen nicht gut bewerten. 3) Daher können sie
               oftmals, Stand jetzt, keine Quellen ihres ›Wissens‹ benennen bzw. nicht korrekt
               zitieren. </p>
            <p><hi rend="bold">Elke Katharina Wittich:</hi> Verstehe, ganz grundsätzlich kann Eure
               Technik nur gut sein, wenn sie Zugang zu ausreichend und qualitativ hochwertigen
               Quellen erhält und diese erschließen kann. Die Bildanalyse mittels
               Computer-Vision-Methoden, die mit Beispieldaten trainiert wurden, beruft sich auf
               zahlreiche Muster aus anderen Bildern, d.&#160;h. sie ist nur möglich durch den
               Vergleich mit sehr vielen Mustern, die zuvor gesammelt, eingegeben und von neuronalen
               Netzwerken erlernt wurden. Unsere kunstwissenschaftliche Bildanalyse ist jedoch in
               der Regel am Einzelobjekt ausgerichtet, zum Beispiel am <title>Martyrium des Heiligen
               Sebastian von Andreas Mantegna</title>, entstanden 1450, heute im Kunsthistorischen Museum in
               Wien; man kann es in <hi rend="italic">iART</hi> unter dem Suchbegriff ›Saint Sebastian‹ auffinden (<ref
                  type="graphic" target="#tulpe_004">Abbildungen 4</ref> und <ref type="graphic"
                  target="#tulpe_005">5</ref>). Wir fertigen eine genaue Bildbeschreibung an und
               gehen dann weiter zur Analyse, erst auf dieser Grundlage setzt die Interpretation
               an.</p>
            <figure>
               <graphic xml:id="tulpe_004" url="Medien/tulpe_004.png">
                  <desc>
                     <ref type="intern" target="#abb4">Abb.&#160;4</ref>: Ergebnis der Bildsuche
                     unter dem Suchbegriff ›Saint Sebastian‹ in <hi rend="italic">iART</hi>. [Screenshot: Elke Katharina
                     Wittich 2025]</desc>
               </graphic>
            </figure>
            <figure>
               <graphic xml:id="tulpe_005" url="Medien/tulpe_005.png">
                  <desc>
                     <ref type="intern" target="#abb5">Abb.&#160;5</ref>: Andrea Mantegna: <hi
                        rend="italic">Heiliger Sebastian</hi>, 1450, Kunsthistorisches Museum, Wien.
                     [Bild: <ref
                        target="https://de.wikipedia.org/wiki/Datei:Andrea_Mantegna_-_St._Sebastian_-_Google_Art_Project.jpg"
                        >Wikimedia Commons</ref>, Public Domain]</desc>
               </graphic>
            </figure>
            <p>Hierzu ziehen wir Vergleichsbeispiele vom gleichen und anderen Künstlern der gleichen
               Zeit heran wie der <title>Heilige Sebastian</title> von Sandro Botticelli von 1474
               aus den Staatlichen Museen zu Berlin, ein weiteres Exemplar von Andrea Mantegna aus
               dem Louvre in Paris und eines von Liberale da Verona von 1495 aus der Brera in
               Mailand. Wir schauen auch, wie sich der Bildtypus zuvor und danach entwickelt hat,
               etwa im Zusammenhang mit dem Auftreten von Seuchen (der Heilige Sebastian wurde als
               Schutzpatron gegen die Pest angerufen).<note type="footnote"> Vgl. <ref
                     type="bibliography" target="#matt_hg_sebastian_2003">Matt (Hg.)
                  2003</ref>.</note> Das heißt, wir arbeiten grundsätzlich nicht quantitativ,
               sondern qualitativ.</p>
            <p>
               <hi rend="bold">Ralph Ewerth:</hi> Die Annahme am Anfang, dass Bildanalyse sich auf
               zahlreiche Muster aus anderen Bildern berufe, trifft meines Erachtens nicht genau das
               danach genannte Szenario. Wir Menschen könnten schwerlich eine Bildbeschreibung
               erstellen für ein einzelnes Bild, wenn wir nicht Tag für Tag unseres Lebens
               massenhaft visuelle Informationen gesehen und Informationen dazu erhalten hätten, was
               diese visuellen Informationen zu bedeuten haben. Vereinfacht gesagt, auch wenn die
               menschliche visuelle Wahrnehmung gänzlich anders als Computer-Vision-Modelle
               funktioniert: Auch wir Menschen erkennen und interpretieren Objekte durch die
               Verarbeitung von sehr vielen Mustern, die wir zuvor wahrgenommen haben, und über
               deren Art und Bedeutung wir Informationen erhalten haben. Wenn wir wiederum
               künstliche neuronale Netze trainiert haben (mit vielen Bildern), dann können wir
               damit auch einzelne Objekte analysieren und dann im nächsten Schritt
               Ähnlichkeitsvergleiche mit anderen ausgewählten Bildern ziehen. </p>
            <p><hi rend="bold">Elke Katharina Wittich:</hi> Und dennoch beruft sich die
               Kunstwissenschaft auf eine jahrhundertelange Tradition seit der Renaissance, also
               einer Zeit, die wohl kunsttheoretisch über Wahrnehmung und Wahrnehmungstäuschung
               diskutierte, jedoch über keinerlei Kenntnisse kognitiv psychischer Funktionen
               verfügte. Stattdessen wurden aber die Methoden der Wahrnehmung ganz ohne Maschine
               verfeinert. Ich kann aus meinem Studium nur bestätigen, dass wir eine Schule des
               Sehens, ein intensives Training der Wahrnehmung visueller Erscheinungen durchlaufen
               haben. Dies war kognitiv durchaus anstrengend, aber darauf beruht ein hohes Gut
               unserer Zunft, die sogenannte ›Kennerschaft‹; neben Wahrnehmung zählen auch Erinnern
               und Ordnen, also das Wissen um die Ausprägungen der Erscheinungen und ihre Verortung
               in Ort und Zeit.</p>
            <p>
               <hi rend="bold">Ralph Ewerth:</hi> Sicher können Forschende aus der Kunstgeschichte
               besser qualitative Analysen durchführen, während die KI-Methoden den Vorteil in
               quantitativen Fragestellungen bzw. der Verarbeitung von großen Bilddatenmengen haben.
               Letztlich liegt die Chance hier darin, dass Mensch (als Forschende) und Maschine (als
               ›intelligentes‹ Werkzeug) zusammenarbeiten. Ich denke, die typischen Vergleiche (die
               ich auch gerne anstelle), ob Mensch oder Maschine etwas besser können, sind oft gar
               nicht so relevant bzw. zielführend, hier in dem Sinne, dass wir möglichst rasch zu
               neuen Erkenntnissen in der Forschung kommen möchten. </p>
            <p><hi rend="bold">Elke Katharina Wittich:</hi> Ich komme noch einmal auf den Heiligen
               Sebastian zurück, um Dir unsere Interessen und Vorgehensweisen zu erklären. Es geht
               uns um den Bildtypus: das ungewöhnlich überhöhte Format, die Nahsichtigkeit, die
               Körperhaltung, die Engführung mit ruinösen antiken Bau- und auch mit antiken
               Körperformen. Vor allem aber geht es uns um das <hi rend="italic">eine Bild</hi>. Und
               wir haben eine grundlegende Ordnung nach Zeit und Raum hinterlegt, würden also zum
               Beispiel Mantegnas Sebastian nicht mit einem Bildwerk aus viel späterer Zeit oder mit
               einem Artefakt von einem anderen Kontinent vergleichen wollen. Wir würden vielmehr
               Gruppen von Kunstwerken um ein oder zwei zentrale Bildwerke formieren, an denen etwas
               gezeigt werden kann. Diese Gruppen sind jedoch, verglichen mit Datensätzen in der
               Data Science, recht klein.</p>
            <p>
               <hi rend="bold">Ralph Ewerth:</hi> Ja, dies ist für eine Maschine kein Problem, hier
               gehe ich davon aus, dass ein*e Forscher*in den relevanten Datenbestand entsprechend
               eingrenzt und eine Software wie <hi rend="italic">iART</hi> ermöglicht dies den Nutzenden zum Beispiel
               bereits. So kann man etwa die Suche auf bestimmte Datenbanken und anhand weiterer
               Kriterien mittels facettierter Suche eingrenzen. Außerdem arbeiten wir gerade an
               Erweiterungen von <hi rend="italic">iART</hi>, um den Vergleich zwischen zwei oder mehreren Bildwerken
               anhand von automatisch generierten Merkmalen formaler oder inhaltlicher Art zu
               ermöglichen. </p>
            <p><hi rend="bold">Elke Katharina Wittich:</hi> Unter dem Stichwort ›Saint Sebastian‹
               sind auf <hi rend="italic">iART</hi> jedoch auch Werke zu finden, die keinen Heiligen Sebastian zeigen,
               sondern mythologische oder andere religiöse Figuren, häufig Christus. Hier kann man
               den Zusammenhang noch nachvollziehen, da eine hypothetische Christusähnlichkeit ein
               ausgemachtes Ziel solcher Bildstrategien war.<note type="footnote"> Vgl. <ref
                     type="bibliography" target="#aurnhammer_steiger_hg_christus_2020"
                     >Aurnhammer&#160;/ Steiger (Hg.) 2020</ref>.</note> Aber es taucht in <hi rend="italic">iART</hi> zum
               Beispiel auch ein Merkur von Hendrick Goltzius aus dem Jahr 1611 auf, den man leicht
               am geflügelten Helm erkennen kann (<ref type="graphic" target="#tulpe_004"
                  >Abbildungen 4</ref> unten links und <ref type="graphic" target="#tulpe_006"
                  >Abbildung 6</ref>). Ein*e Kunsthistoriker*in erkennt natürlich sofort, dass die
               beiden Gemälde des Heiligen Sebastian wenig mit dem <title>Merkur</title> von
               Goltzius zu tun haben. Wie also funktioniert Mustererkennung, wenn doch hier
               entscheidende Details wie der geflügelte Helm und der Kaduceus (Schlangenstab) nicht
               zur Identifikation der Figur als Merkur genutzt wurden?</p>
            <figure>
               <graphic xml:id="tulpe_006" url="Medien/tulpe_006.png">
                  <desc>
                     <ref type="intern" target="#abb6">Abb.&#160;6</ref>: Hendrick Goltzius: <hi
                        rend="italic">Merkur</hi>, 1611, Frans Hals Museum, Haarlem. [Bild:
                     <ref target="https://de.wikipedia.org/wiki/Datei:Mercury_by_Hendrick_Goltzius.jpg">Wikimedia Commons</ref>, Public Domain]</desc>
               </graphic>
            </figure>
            <p>
               <hi rend="bold">Ralph Ewerth:</hi> Die Mustererkennung, hier in Form der
               Ähnlichkeitssuche, basiert auf dem Vergleich von hochdimensionalen Vektoren, die
               jeweils aus einer festen Anzahl von Zahlenwerten bestehen. Hierbei kann es passieren,
               dass eine Ähnlichkeit in Aspekten vorliegt, die für uns Menschen generell oder im
               jeweiligen Suchkontext irrelevant sind. </p>
            <p> Anzumerken ist auch, dass in <hi rend="italic">iART</hi> eine feste Zahl von Suchtreffern zurückgeliefert
               wird, zum Beispiel 200. Sollte es in der durchsuchten Datenbank aber nur 50 relevante
               Bilder (hier mit Heiligen ähnlich zu Saint Sebastian) geben, dann werden auch 150
               irrelevante Bilder zurückgeliefert. Man könnte natürlich versuchen, dies automatisch
               zu erkennen, dies ist aber schwieriger als es zunächst den Anschein haben mag und
               noch nicht mit hoher Genauigkeit möglich. </p>
            <p><hi rend="bold">Elke Katharina Wittich:</hi> Nun ja, wir wundern uns dann natürlich,
               weil wir die 150 irrelevanten Bilder nicht zuordnen können, wie wir es gewohnt sind.
               Und dies führt uns zu einem zentralen Kritikpunkt an den Digital Humanities, er
               betrifft die Anhäufung von Kunstwerken, denen eine oder mehrere Sachverhalte
               gemeinsam sind, denn eine solche Akkumulation wird weder eine Theorie begründen
               können noch zuverlässig Erkenntnisgewinn evozieren;<note type="footnote"> Vgl. <ref
                     type="bibliography" target="#leroi_algorithmus_2015">Leroi 2015</ref>.</note>
               dies ist dem Grundkonflikt zwischen quantitativer und qualitativer Methodik
               geschuldet. Mit Methoden der Computer Vision kann man in Bildern Objekte erkennen,
               mit automatischer Posenschätzung die Haltung von Figuren oder Objekten bestimmen und
               viele analoge Beispiele, z.&#160;B. bei den Beinen des Heiligen Sebastian, ausfindig
                  machen.<note type="footnote"> Vgl. <ref type="bibliography"
                     target="#szeliski_vision_2022">Szeliski 2022</ref>.</note> Das ist schon
               interessant, aber eben keine Frage der Quantität. Und ob künstlerisch gestaltete
               Figuren in Malerei und Skulptur verschiedener Zeiten in ihren Körperhaltungen
               vergleichbar sind, nach welchen Kriterien dies erkundet und welche auf Erkenntnis
               abzielende Frage so beantwortet würde, ist damit nicht geklärt.</p>
            <p>Wir Kunstwissenschaftler*innen glaubten lange, uns so grundsätzlich von
               Naturwissenschaftler*innen zu unterscheiden, dass in der englischen Sprache nur eine
               der Gruppen den Begriff der Science in der Bezeichnung führen konnte, eben die
               Natural Science, während die Humanities bloß dastanden mit nichts als sich selbst.
               Wir kommen aus einer seit der Renaissance gepflegten Tradition kunsttheoretisch
               abwägender Diskurse, um Gegenstände der Kunstausübung und Kunstrezeption, um Schritt
               für Schritt eine philosophisch fundierte Begründung von Werturteilen
               herauszuarbeiten.</p>
            <p>Nehmen wir die <title>Allegorie des Disegno</title>, also der Zeichenkunst, von
               Angelika Kauffmann von 1778–1780 aus der Royal Academy in London (<ref type="graphic"
                  target="#tulpe_007">Abbildung 7</ref>).<note type="footnote"> Vgl. <ref
                     type="bibliography" target="#baumgaertel_et_al_kauffmann_2024">Baumgärtel
                     et&#160;al. 2024</ref>. </note> Eine Frau zeichnet den Torso Belvedere in
               Rückenansicht. Wie man diesen Torso, wie man besonders die fehlenden Unterschenkel
               und Arme ergänzen könnte, war damals Gegenstand ästhetischer Diskurse, ihn von allen
               Seiten zu zeichnen Praxis der Künstler*innen. Man muss sich vorstellen, die Figuren
               zu drehen. Tut man dies, so erkennt man, dass die Frau beim zeichnerischen
               Nachvollzug die Körperhaltung des Pythagoras aus Raffaels <title>Schule von
                  Athen</title> von 1510–1511 im Vatikan einnimmt, sich also absichert bei einer
               berühmten antiken Skulptur und gleichzeitig bei einem Künstler, der das
               Antikenstudium perfektioniert hat. Solche Adaptionen, nicht nur ganzer Figuren,
               sondern einzelner Körperteile und ihrer Posen&#160;– gedrehter Köpfe, erhobener Arme,
               übergeschlagener Beine&#160;– aufzuspüren, könnte mit Unterstützung durch KI
               sicherlich hilfreich sein. Für uns stellt sich dennoch die Frage: Würde es einen
               zusätzlichen Erkenntnisgewinn erbringen, darüber hinaus auch die schiere Masse an
               solchen Adaptionen zu kennen?</p>
            <figure>
               <graphic xml:id="tulpe_007" url="Medien/tulpe_007.png">
                  <desc>
                     <ref type="intern" target="#abb7">Abb.&#160;7</ref>: Angelika Kauffmann: <hi
                        rend="italic">Allegorie des Disegno</hi>, 1778–1780, Royal Academy at
                     Burlington House, London. [Bild: Royal Academy, Public Domain]</desc>
               </graphic>
            </figure>
            <p>
               <hi rend="bold">Ralph Ewerth:</hi> Zunächst wäre ich neugierig, welche
               Digital-Humanities-Arbeiten einfach ›Kunstwerke anhäufen‹? Zur Frage, ob die Kenntnis
               von vielen Adaptionen einen Erkenntnisgewinn bringt: Wenn es hierzu keine
               interessante Forschungsfragestellungen in der Kunstgeschichte gibt, dann bringt es
               nichts. Vielleicht gibt es aber durchaus solche Forschungsfragen, bei denen es
               wichtig wäre, die Adaptionen zu kennen? </p>
            <p><hi rend="bold">Elke Katharina Wittich:</hi> Man müsste es erproben, täten wir dies
               nicht, würden wir uns im Umkehrschluss die Möglichkeit nehmen, Neues zu entdecken,
               wären wie gefangen in Gruppen von Kunstwerken, die über lange Zeiträume als
               zusammengehörig tradiert, wohl auch gelegentlich variiert oder ergänzt wurden, jedoch
               als verbindlicher Kanon Gegenstand der immer weiter getriebenen Diskurse waren. Diese
               Diskurse thematisieren ebenfalls tradierte Methoden und Kontexte, nur selten werden
               sie grundlegend neu ausgerichtet. Schon die Aussicht darauf, dass KI diese
               kanonischen Gruppen, Kontexte und Methoden in Frage stellen könnte, rüttelt an den
               Grundfesten der Disziplin.</p>
            <p>Es muss einmal gesagt werden: Wir haben einfach ein Problem mit dem Unfertigen der
               KI-gestützten Technik, sie ist noch so unvollkommen. Wir haben in der Kunstgeschichte
               oder Archäologie eine sehr strenge Lehre durchlaufen: Gefordert wurden
               Denkmälerkenntnis und methodische Fertigkeiten in einer Kombination aus methodischem
               Vorgehen und ausgefeilter Argumentationstechnik. Wir tun uns nicht nur schwer damit,
               unvollkommene KI-gestützte Recherchetools zu nutzen, es ist ausgeschlossen dies zu
               tun.</p>
            <p>
               <hi rend="bold">Ralph Ewerth:</hi> Ich verstehe das Argument nicht ganz. Wenn die
               Alternative ist, gar nicht in einem Bilddatenbestand suchen zu können, dann würde ich
               doch lieber mit einem ›unvollkommenen‹ Recherche-Tool suchen, als gar nicht suchen zu
               können. Sehr viele und die meisten der wissenschaftlich tätigen Menschen nutzen in
               ihrem Berufs- und Forschungsalltag seit über 20 Jahren Suchmaschinen, die
               unvollkommen sind, aber dennoch für viele Aufgaben von großem Nutzen. Wir hörten
               nicht auf, Suchmaschinen zu nutzen, nur weil manchmal die Ergebnisse nicht
               zufriedenstellend waren oder auch noch sind, und gleichzeitig wurden die Technologien
               dahinter immer ausgefeilter. </p>
            <p> Und: Vielleicht ist es für Deine Forschungsprozesse und Vorgehensweisen als
               Kunsthistorikerin nicht hilfreich, aber es könnte für andere Forschende in den
               Digital Humanities hilfreich sein, die große Bilddatenbanken nach bestimmten Motiven
               durchsuchen möchten oder sich von den teils überraschenden&#160;– und
               zugegebenermaßen auch Fehler enthaltenden&#160;– Trefferlisten zu neuen
               Fragestellungen inspirieren lassen möchten. </p>
            <p> Es kommt sicherlich darauf an, dass man eine gewisse KI-Methoden-Kompetenz hat und
               versteht, für welche Teile des Forschungsprozesses KI-Methoden eingesetzt werden
               können und für welche nicht. Hierbei sind aber vor allem auch wir Informatiker und
               Software-Entwickler gefragt, die Tools leicht erlernbar und verstehbar zu gestalten.
               Hier haben wir auch bei <hi rend="italic">iART</hi> noch einiges zu tun. Ansonsten: Wenn eine Methode eine
               zu hohe Fehlerrate für einen bestimmten Forschungszweck hat, dann sollte man sie
               natürlich nicht einsetzen. </p>
            <p><hi rend="bold">Elke Katharina Wittich:</hi> Für die Forschung in der Kunst- und
               Bildwissenschaft wurden zu früheren Zeiten umfangreiche Zettelkästen, später dann
               aufbauend komplexe Bilddatenbanken zu kunstwissenschaftlichen Fragestellungen
               aufgebaut. Prominente Beispiele wie die seit 1995 an der Humboldt Universität zu
               Berlin angesiedelte Bilddatenbank <title>Census of Antique Works of Art and
                  Architecture Known in the Renaissance</title> sind zwar in der Nutzung
               anspruchsvoll, zeigen jedoch andererseits das hohe Potenzial solch komplexer
               Vernetzung von Wissensständen.<note type="footnote"> Vgl. <ref type="bibliography"
                     target="#census_forschungsprojekt_2022">Census of Antique Works of Art
                     2022</ref>. </note> KI könnte womöglich mehr, das dauert aber noch.</p>
            <p>
               <hi rend="bold">Ralph Ewerth:</hi> Ich denke, die KI-gestützten Methoden sind
               Werkzeuge, die man entsprechend ihrer Fähigkeiten einsetzen sollte. Wenn diese
               Fähigkeiten für bestimmte Forschungszwecke nicht ausreichen, dann sollte man sie
               klarerweise nicht einsetzen. Hilfreich sind diese Methoden immer dann, wenn es darum
               geht eine große Menge von Daten zu analysieren oder eine große Menge von Daten zu
               durchsuchen&#160;– dies kann natürlich auch die Suche nach Kontextinformationen
               beinhalten, die nicht in der Bilddatenbank enthalten sind, sondern in anderen
               Datenbanken, im Web, oder bei einem Chatbot erfragt werden können. Die Suche bzw.
               Analyse von großen Datenmengen sind Aufgabenstellungen, die wir Menschen in der Regel
               nicht so gut bewältigen können wie Maschinen. </p>
            <p><hi rend="bold">Elke Katharina Wittich:</hi> Ich gebe ein Beispiel: in Rom steht seit
               der Antike das überlebensgroße Reiterstandbild des Marc Aurel. Ein Künstler könnte
               dieses Reiterstandbild im 16. Jahrhundert adaptiert haben, um damit einen König oder
               Kurfürsten in Vergleich mit dem berühmten antiken Herrscher zu setzen, eine über
               lange Zeiträume vielfach genutzte Bildstrategie.<note type="footnote"> Vgl. <ref
                     type="bibliography" target="#warnke_herrscherbildnis_2011">Warnke 2011</ref>;
                     <ref type="bibliography" target="#groeling_kaiser_2007">Groeling
                  2007</ref>.</note> Aber dieser Künstler war nie in Rom. Um den Beweis zu führen,
               dass der Künstler das Reiterstandbild dennoch gekannt haben könnte, würde man im
                  <title>Census</title> nachsehen, ob das Reiterstandbild damals als Druckgraphik
               verbreitet war. Es geht also um das Aufspüren von Belegen für Thesen.</p>
            <p>
               <hi rend="bold">Ralph Ewerth:</hi> Ja, das ist ein gutes Beispiel für ein
               Suchszenario mit einer Anfrage, die mit einer Suchmaschine wie <hi rend="italic">iART</hi> heute unterstützt
               und möglicherweise mit einer einzigen Suchanfrage beantwortet werden kann. Und
               hierbei kann die Suchanfrage sogar in natürlicher Sprache formuliert werden&#160;–
               dies ist etwas, das vor vier Jahren technisch in der Qualität noch gar nicht möglich
               war: beliebige Anfragen an eine Bilddatenbank in natürlicher Sprache zu formulieren,
               weit über einzelne Stichwörter oder Wortlisten hinaus&#160;– und oftmals plausible
               Ergebnislisten mit relevanten Bildern zu erhalten. </p>
            <p><hi rend="bold">Elke Katharina Wittich:</hi> Anders als <title>Census</title> würde
               aber eine durch KI-unterstützte Suche, zum Beispiel in <hi rend="italic">iART</hi>, unter dem Schlagwort
               ›man on a horse‹ viele Adaptionen des Reiterstandbilds des Marc Aurel, daneben aber
               noch unzählige andere Reiter auf Pferden zeigen&#160;– für unsere Begriffe
               unsortiert, für Euch sicherlich eher Entwicklungsstand. Selbst wenn ich die
               Möglichkeiten zur Einschränkung der Suchparameter in <hi rend="italic">iART</hi> nutze, finde ich u.&#160;a.
               eine kleine Adaption des Reiterstandbilds in Porzellan, die ich tatsächlich noch
               nicht kannte, aber ich muss sie dennoch aus unzähligen anderen, für die Frage nicht
               relevanten Bildern heraussuchen.</p>
            <p>
               <hi rend="bold">Ralph Ewerth:</hi> Für einen solchen Fall bietet <hi rend="italic">iART</hi> bereits eine
               Möglichkeit, die Bilder aus den Suchergebnissen zu gruppieren (sortieren), nämlich
               mittels der Clusteringfunktion. Primär ist <hi rend="italic">iART</hi> eine Suchmaschine, das Gruppieren und
               Sortieren von Bildern ist aber in einem weiteren Schritt möglich; facettierte Suche
               wäre eine weitere Möglichkeit, die Trefferliste auf Knopfdruck einzuschränken. </p>
            <p><hi rend="bold">Elke Katharina Wittich:</hi> Als wir für die Tagung in Wolfenbüttel
               unseren Vortrag vorbereiteten, stellte ich fest, dass Ihr nicht Iconclass zur
               Metadaten-Annotation nutzt.<note type="footnote"> Vgl. <ref type="bibliography"
                     target="#iconclass_2024">Iconclass 2024</ref>.</note> Ich vermutete, dass die
               Suche nach Bildähnlichkeit allein auf Grundlage visueller Merkmale&#160;– Formen,
               Mustern, Verdichtungen usw.&#160;– geschieht. Dies hatte im Umkehrschluss meine
               Einschätzung provoziert, dass ich unter diesen Voraussetzungen nicht finden kann, was
               ich als Kunstwissenschaftlerin annehme finden zu müssen, denn meine antrainierten
               Suchkriterien sind nicht rein visuell. Ich hatte damals dafür plädiert&#160;– und bei
               der Tagung gab es für dieses Argument Unterstützung&#160;–, Eure Methoden und die
               Klassifikation nach Iconclass zu verbinden; dies würde sehr viele Irrläufer
               aussortieren helfen, die uns noch so sehr stören.</p>
            <p>
               <hi rend="bold">Ralph Ewerth:</hi> Unser Ansatz unterstützt nicht nur die Suche nach
               Bildähnlichkeit allein auf Grundlage visueller Merkmale. Wenn Metadaten nach der
               Iconclass-Taxonomie vorhanden sind, dann können diese von einer Bildsuchmaschine wie
               <hi rend="italic">iART</hi> bereits jetzt direkt genutzt werden, als Stichwort für eine facettierte Suche. </p>
            <p><hi rend="bold">Elke Katharina Wittich:</hi> Dies ist ein sehr gutes Beispiel dafür,
               wie sich die Disziplinen annähern können, um die zugänglichen Technologien für die
               wissenschaftliche Praxis zu adaptieren und nutzbar zu machen. Auch sehe ich im Dialog
               die große Chance die Weiterentwicklung der Technologien einerseits durch die
               Reflexion methodischer Anforderungen und andererseits durch kritische Fragen zu
               fördern.</p>
            <p>
               <hi rend="bold">Ralph Ewerth:</hi> Die Frage ist allerdings, wie zuvor eine große
               Menge von Bilddaten nach der sehr umfangreichen Iconclass-Taxonomie annotiert werden
               kann. Für uns Menschen ist das in der Regel zu zeit- und kostenintensiv. Auch für
               KI-Methoden ist es ein schwieriges Problem aus mehreren Gründen, wir haben hierfür
               vor kurzem ein System vorgestellt, das diesen manuellen Prozess teilweise
               automatisieren kann durch generierte Vorschläge.<note type="footnote"> Vgl. <ref
                     type="bibliography" target="#springstein_et_al_narratives_2024">Springstein
                     et&#160;al. 2024</ref>.</note>
            </p>
            <p> Das von uns genutzte Vision-Language-Modell, das unabhängig von vorab definierten
               Kategorisierungen wie Iconclass ist, ist grundsätzlich in der Lage, auch Personen,
               Objekte und Bedeutungen von Bildinhalten zu erkennen. Hierbei arbeitet es natürlich
               nicht perfekt und macht dabei auch Fehler. Zudem können unabhängig von der
               Bildähnlichkeitssuche auch weitere Metadaten, sofern verfügbar, in die Suche mit
               einbezogen werden. Wir arbeiten daran, diese Metadaten automatisch zu generieren
               mittels der oben erwähnten Methode und hoffen, dies bald auch in <hi rend="italic">iART</hi> integrieren zu
               können. </p>
            <p><hi rend="bold">Elke Katharina Wittich:</hi> Das ist gut, denn eine Einschränkung der
               Suche auf visuelle Merkmale bedeutet für meine kunstwissenschaftliche Recherche mit
               <hi rend="italic">iART</hi>, dass ich alles Erlernte, also die Suche nach Künstlernamen und Objekttiteln,
               nach Bild- oder Bautypen, nach Zeiträumen und Orten beiseiteschieben und abstrakter
               vorgehen muss. Es ist schon sehr ungewohnt, weder mit ›Marc Aurel‹ noch mit
               ›Reiterstandbild‹ noch mit ›Spätantike‹ arbeiten zu können, sondern ›man on a horse‹
               einzugeben, um zum Reiterstandbild des Marc Aurel zu gelangen. Andererseits habe ich
               trotz all meiner Denkmälerkenntnis noch nie eine solche Zusammenstellung analoger
               Bildmotive gesehen wie unter dem Suchbegriff ›man on a horse‹ in <hi rend="italic">iART</hi>.</p>
            <p>
               <hi rend="bold">Ralph Ewerth:</hi> Grundsätzlich ist es möglich, mit
               Vision-Language-Modellen wie dem CLIP-Modell<note type="footnote"> Vgl. <ref
                     type="bibliography" target="#radford_et_al_models_2021">Radford et&#160;al.
                     2021</ref>.</note> mit all den genannten Suchanfragen zu recherchieren und
               oftmals auch relevante Treffer zu erhalten. Es stimmt aber, dass man diese Modelle
               noch weiter verbessern muss, indem man sie z. B. spezifisch mit Daten aus der
               Kunstgeschichte trainiert oder feinanpasst. </p>
            <p><hi rend="bold">Elke Katharina Wittich:</hi> Bei van Gogh kann das gehen, unter den
               Schlagworten ›Marc Aurel‹ und auch ›equestrian statue of Marc Aurelius‹ habe
               ich&#160;– Stand Oktober 2024&#160;– noch nicht das Gewünschte gefunden.
               Wahrscheinlich muss ich mich darauf einstellen, dass sich diese Technik entwickelt,
               rasch zwar, aber sie ist eben noch nicht in allen Belangen ausgereift. Zugleich bin
               ich davon überzeugt, dass wir Kunstwissenschaftler*innen Euch vieles mitteilen und
               erklären müssten, damit Ihr die Technik gut einsetzbar gestaltet. Denn wie solltet
               Ihr wissen, was wir brauchen und was uns voranbringen kann, wenn wir es Euch nicht
               sagen?</p>
            <p>
               <hi rend="bold">Ralph Ewerth:</hi> Das Ungewohnte könnte sein, dass Du in <hi rend="italic">iART</hi> mit
               noch viel umfangreicheren Beschreibungen nach Bildern suchen kannst, so wie ich das
               oben beschrieben habe. </p>
            <p><hi rend="bold">Elke Katharina Wittich:</hi> Ja, das ist aufregend und eine Option
               auf die Weiterentwicklung der Disziplin. Ich sehe auch noch weitere Felder, in denen
               sich Eure Technologie als Motor der reflexiven Auseinandersetzung mit unserer
               Disziplin erweisen könnte. Aufgrund der Beschäftigung mit KI habe ich mich nun sehr
               viel mit Klassifizierungen befasst und muss sagen, auch Iconclass ist
               menschengemacht, also mit Wertungen behaftet, z.&#160;B. werden bestimmte Gattungen
               anderen gegenüber bevorzugt, gut erforschte Kontexte sind überproportional vertreten,
               andere gar nicht aufgenommen, gattungsübergreifende Zusammenhänge werden eher negiert
               als herausgestellt und vieles mehr. Vielleicht sollte man <hi rend="italic">iART</hi> und Euren Methoden
               erst einmal Platz geben, solche Zusammenhänge rein visuell zu vermitteln, und diesen
               Prozess kritisch begleiten?</p>
            <p>Die Auseinandersetzung mit KI kann die Aufmerksamkeit dafür schärfen, wie normiert
               kunstwissenschaftliche Klassifizierungen sind, etwa die Frage, was zusammengehört und
               was miteinander in Beziehung gesetzt wird. Das Werk eines Künstlers oder einer
               Künstlerin gehört zusammen, Beispiele einer Gattung aus der gleichen Zeit und dem
               gleichen Umfeld wie niederländische Stillleben des 17. Jahrhunderts können gemeinsam
               diskutiert, stilistische Ausprägungen wie Obergaden gotischer Kathedralen miteinander
               verglichen werden. Man kommt vom einzelnen Werk und geht über eine vergleichbare
               Gruppe zu Kontexten.</p>
            <p>
               <hi rend="bold">Ralph Ewerth:</hi> Mein Eindruck von der Iconclass-Taxonomie ist
               auch, dass die Kategorien nicht sehr scharf und präzise definiert sind und
               Verzerrungen enthalten, z.&#160;B. in dem Sinne, dass bestimmte Kategorien
               überproportional vertreten sind. Hier denke ich in der Tat, dass algorithmische oder
               neuronale Modelle dazu beitragen können, Definitionen zu überdenken und zu
               präzisieren. </p>
            <p><hi rend="bold">Elke Katharina Wittich:</hi> In jedem Fall werden digitale Techniken
               und Methoden einen Einfluss auf unser Denken haben; bestenfalls könnten sie
               Erkenntnisse und neue Taxonomien hervorbringen. Methoden, Klassifizierungen,
               Ordnungen und Argumentationsketten kommen auf den Prüfstand, mutmaßlich werden
               monographische Studien an Bedeutung verlieren. Wir werden unser Tun überdenken
               müssen, z.&#160;B. unseren Hang zur historischen Ordnung. Womöglich haben wir uns in
               einer geschichtsphilosophischen Konzeption des 19. Jahrhunderts verfangen und
               KI-gestützte Untersuchungen größerer Datenmengen würden uns neue Zugänge eröffnen. Im
               Grunde sieht man bereits an digitalen Enzyklopädien, dass sich Wissensstände und mit
               ihnen Erschließungsmethoden radikal ändern.<note type="footnote"> Vgl. <ref
                     type="bibliography" target="#rahmstorf_wikipedia_2023">Rahmstorf
                  2023</ref>.</note>
            </p>
            <p>Wenn man einmal&#160;– nur als Gedankenexperiment&#160;– sagen würde, unsere
               Setzungen, welche Bilder wie in welchen Gruppen zusammengehören, würden durch KI
               unterwandert und mitsamt den Kanonbildungen aufgrund von Forschungstraditionen
               gänzlich infrage gestellt: Wäre es diesen Preis wert, die über lange Zeit geprägten
               kunstwissenschaftlichen Diskurse mit sämtlichen, doch häufig auf
               Forscherpersönlichkeiten oder Schulen zentrierten Wertungen beiseiteschieben zu
               können und Neuland zu betreten, ein Neuland, das uns durch die schiere Masse an
               Bildbeispielen zu anderen Ordnungssystemen zwingt?</p>
            <p>
               <hi rend="bold">Ralph Ewerth:</hi> Ja, ich würde aber nicht sagen, dass es uns durch
               die schiere Masse zu anderen Ordnungssystemen bringt, sondern uns die Möglichkeit
               gibt, auf Knopfdruck nach sehr unterschiedlichen Eigenschaften Bilder der Ähnlichkeit
               nach zu suchen bzw. zu gruppieren. </p>
            <p><hi rend="bold">Elke Katharina Wittich:</hi> Mit einem Projekt zur Digitalisierung
               und Bereitstellung von Münzdaten bereiten wir gemeinsam u.&#160;a. eine akademische
               Weiterbildung von Kurator*innen von Sammlungsbeständen in Museen und anderen
               Institutionen vor: wie können sie die Digitalisierung zur Aufarbeitung bislang wenig
               beachteter Objekte und zugleich zu Ausstellungen nutzen, die in dieser Form ohne KI
               nicht möglich wären?<note type="footnote"> Vgl. <ref type="bibliography"
                     target="#keskintepe_woschech_hg_intelligenz_2021">Keskintepe&#160;/ Woschech
                     (Hg.) 2021</ref>; <ref type="bibliography"
                     target="#murphy_et_al_hg_intelligenz_2022">Murphy et&#160;al. (Hg.)
                  2022</ref>.</note> Von diesem Projekt verspreche ich mir viele Erkenntnisse über
               das Zusammenwirken von Kunstwissenschaft und Informatik, da wir am konkreten Fall
               methodische Probleme z.&#160;B. der Rezeption lösen müssen.</p>
            <p>In der Kunstwissenschaft und Archäologie ist Antikenrezeption sehr gut erforscht. Auf
               Münzen und Medaillen erscheinen die Verfahren der Antikenrezeption wie in einem
               Brennglas gebündelt, denn die Bildaussagen müssen auf sehr kleinem Raum unterkommen.
               Sie sind darum häufig abstrahiert und setzen auf wiederkehrende Prinzipien. So werden
               Herrscher häufig im strengen Profil oder als Büste gezeigt und somit in die Tradition
               römischer Kaiser gestellt. Kann es sein, dass <hi rend="italic">iART</hi> oder andere KI-unterstützte
               Suchfunktionen so viele Münzen in dieser Tradition finden werden, dass frühere
               qualitativ ausgerichtete Fragestellungen der Numismatik infrage gestellt werden?</p>
            <p>
               <hi rend="bold">Ralph Ewerth:</hi> Das verstehe ich nicht ganz. Wieso werden
               qualitativ ausgerichtete Fragestellungen infrage gestellt, wenn eine Bildsuchmaschine
               viele Beispiele hierzu finden würde? Dies wäre doch vielmehr eine quantitative oder
               empirische Unterstützung der qualitativen Aussage, oder? </p>
            <p><hi rend="bold">Elke Katharina Wittich:</hi> Nicht zwangsläufig. Kunstwissenschaft
               und Archäologie haben eine lange Tradition, dadurch haben sich Fragestellungen nach
               dem Zusammenhang von Kunstwerken herausgebildet, die das gleiche Thema behandeln, zur
               gleichen Zeit entstanden sind oder aus der Hand eines Künstlers stammen. Also hat man
               Gruppen wie eben jenen heiligen Sebastian in der Kunst des 15. Jahrhunderts oder das
               Augustusbild der römischen Antike oder auch Darstellungen des gekreuzigten Christus
               aus dem Spätmittelalter vergleichend untersucht und sie in eine Reihung gebracht, die
               aufwendig begründet wurde.</p>
            <p>An der zeitgenössischen Kunst kann man bereits deutlich ablesen, wie sehr digitale
               Methoden die Kunstpraxis verändern. In der älteren Kunst ist das hypothetische
               Christusbild&#160;– obgleich vielfältig imaginierend dargestellt, kopiert und
               adaptiert&#160;– immer das eine Bild des einen Gottes. Neuere, teils, jedoch nicht
               notwendig KI-generierte Kunst wie z.&#160;B. von Lucio Greco, zeigt unter dem Titel
                  <title>100 Faces of Christ</title> mit Öl auf Leinwand, also einer
               althergebrachten Materialität, einen geschundenen Christus, eingebunden in eine Masse
               anderer leidender Christusfiguren, allesamt der Kunstgeschichte des Mittelalters und
               der Renaissance entlehnt (<ref type="graphic" target="#tulpe_008">Abbildung
                  8</ref>).<note type="footnote"> Vgl. <ref type="bibliography"
                     target="#greco_gesichter_2023">Greco 2023</ref>.</note> Die visuelle
               Verwandtschaft der künstlerischen Zusammenschau von Adaptionen mit dem Suchergebnis
               in Bilddatenbanken ist frappierend und macht uns Kunstwissenschaftler*innen zugleich
               deutlich, dass wir mit solchen Zusammenstellungen bislang nicht gearbeitet haben.</p>
            <figure>
               <graphic xml:id="tulpe_008" url="Medien/tulpe_008.png">
                  <desc>
                     <ref type="intern" target="#abb8">Abb.&#160;8</ref>: Lucio Greco: <hi
                        rend="italic">100 Faces of Christ</hi>, 99teilig, 2016–2022, NordArt 2023.
                     [Fotografie: Elke Katharina Wittich 2023]</desc>
               </graphic>
            </figure>
            <p>KI rüttelt also an den Traditionen in der Wissenschaftsgeschichte unserer Disziplin
               und das ist sicher nicht direkt beabsichtigt bei der Entwicklung von KI-Methoden.
               Häufig gibt es berühmte Wissenschaftler*innen, die, begründet mit ihrer Kennerschaft,
               einen Standard gesetzt haben. Andere Autor*innen erheben dann später mit einem neu
               entdeckten Beispiel in der Gruppe Anspruch auf Umstellung der Ordnung. An dem Ansatz
               a) eine überschaubare und nachweislich zusammengehörige Gruppe an Artefakten in b)
               eine wissenschaftlich begründete Ordnung zu bringen und sich dabei c) auf
               Kennerschaft ausgewiesener Fachkolleg*innen zu verlassen, ändert dies aber
               nichts.</p>
            <p>Erst KI bringt Unruhe ins System, dann nämlich, wenn sehr viel mehr Beispiele
               eingebracht werden, die nominell zur Gruppe der Artefakte gehören könnten, weil
               inzwischen ganze Sammlungsbestände digitalisiert wurden und auch lange nicht gezeigte
               Sammlungsteile aus den riesigen Depots großer Museen zugänglich sind. Haben denn die
               Kunstwissenschaftler*innen dies mit ihrer Kennerschaft nicht gewusst, diese Beispiele
               nicht gekannt? Ich überspitze hier bewusst, um die Tragweite zu verdeutlichen. Ganz
               bestimmt wird dies die Sicht auf jene älteren kanonischen Schriften und damit auch
               auf die Methodik verändern.</p>
            <p>
               <hi rend="bold">Ralph Ewerth:</hi> Das erscheint mir eher ein Fortschritt zu sein und
               kein Problem darzustellen. Selbst eine herausragende Kennerschaft muss bzw. kann im
               Allgemeinen doch nicht perfekt sein. Im besten Fall lernen wir etwas darüber, wenn
               Forschende Lücken in ihrer Kennerschaft hatten und können ggf. unvollständige oder
               verzerrte Schlussfolgerungen entdecken. Ich würde annehmen, dass sich Forschende, die
               sich für das Thema begeistern, gerade auch diese mit der beschriebenen Kennerschaft,
               darüber freuen, neue Denkanstöße und Hinweise zu erhalten&#160;– im Sinne der Sache
               und insbesondere des Erkenntnisfortschritts. Dies würde nicht bedeuten, frühere
               wissenschaftliche Leistungen oder Kennerschaft infrage zu stellen, sondern die
               zugrundeliegende Forschung noch besser zu verstehen, neu einordnen zu können, oder
               gar frühere Erkenntnisse zu widerlegen. Es wäre doch nicht vernünftig, ein Werkzeug
               trotz der möglichen Vorteile nicht zu nutzen, wenn es uns zum Beispiel hilft, zu
               neuen Erkenntnissen zu gelangen&#160;– nur weil es zu einem früheren Zeitpunkt
               notwendig war, ohne dieses Werkzeug auszukommen. </p>
            <p> Es kommt meines Erachtens darauf an, sich der Stärken und Schwächen von Mensch und
               Maschine (KI) bewusst zu sein: Mit einer riesigen Menge von Daten umgehen zu können,
               das ist der potenzielle Vorteil von Maschinen. Die Suchergebnisse und andere
               systemgenerierte Artefakte qualitativ einzuordnen, zu hinterfragen, zu reflektieren
               und zu neuen Erkenntnissen zu gelangen, hier sind wir Menschen den Maschinen&#160;–
               noch&#160;– überlegen. </p>
            <p><hi rend="bold">Elke Katharina Wittich:</hi> Mit digitalen Methoden können sehr viel
               rascher als bislang weitaus mehr Gegenstände des jeweiligen Forschungsgebietes
               zusammengestellt oder zugänglich gemacht werden; gleichzeitig wird auch viel mehr
               dazu veröffentlicht. Anders als z.&#160;B. die Geschichtswissenschaft und weiter
               gefasst die Digital Humanities verharren etliche Kunsthistoriker*innen noch in der
               Vorstellung, wir könnten unseren Zuständigkeitsbereich weiterhin überschauen.<note
                  type="footnote"> Vgl. <ref type="bibliography"
                     target="#jannidis_et_al_hg_humanities_2017">Jannidis et&#160;al. (Hg.)
                     2017</ref>; <ref type="bibliography" target="#antenhofer_et_al_humanities_2024"
                     >Antenhofer et&#160;al. 2024</ref>.</note> Aber alles deutet darauf hin, dass
               dies kaum so bleiben kann. Mindestens werden z.&#160;B. die Vorzüge digitaler
               Editionspraktiken oder digitaler Rekonstruktionen von Kulturgut neue Standards
                  definieren.<note type="footnote"> Vgl. <ref type="bibliography"
                     target="#kulturgutretter_2024">KulturGutRetter 2024</ref>.</note>
            </p>
            <p>Vielleicht brauchen wir neue Ordnungssysteme. Es zeigt sich ja schon etwas länger,
               dass quantitativ erschließbare Wissensstände in ihren angestammten
               Behältnissen&#160;– Sammlungen und Archive&#160;– eine größere Aufmerksamkeit
                  erhalten.<note type="footnote"> Vgl. <ref type="bibliography"
                     target="#kunstforum_2022">Kunstforum 2022</ref>.</note> Auch Praktiken wie das
               Sammeln, das Beschreiben und Beschriften, das Memorieren, auch das Umsortieren nach
               anderen Kategorien gehören dazu. Interessanterweise beschäftigen sich Künstler*innen,
               die mit KI arbeiten, wie z.&#160;B. die Britin Anna Ridler mit solchen
                  Praktiken.<note type="footnote"> Vgl. <ref type="bibliography"
                     target="#ridler_myriad_2018">Ridler 2018</ref>.</note> Sie hat Tausende von
               Tulpen fotografiert und per Hand klassifiziert, bevor sie eine KI mit den Daten
               trainiert hat.</p>
            <p>
               <hi rend="bold">Ralph Ewerth:</hi> Der Vorteil von KI-Systemen ist, dass sie in sehr
               kurzer Zeit große Datenmengen nach unterschiedlichen Kriterien gruppieren oder
               klassifizieren können. Beim Gruppieren werden Datenobjekte, hier Bilder, der
               Ähnlichkeit nach in gleiche (wenn sehr ähnlich) oder unterschiedliche (wenn eher
               unähnlich) Gruppen zugeordnet. Bei der Klassifikation werden Bilder Kategorien
               zugeordnet, und zwar anhand automatisch erlernter Regeln, die aber leider für
               Menschen typischerweise nicht gut interpretierbar sind. Es wird aber momentan
               intensiv daran geforscht, die hinter solchen Zuordnungen liegenden Regeln und Muster
               den Nutzer*innen besser erklären zu können. Hierfür kommen natürlich auch große
               Sprachmodelle in Frage. </p>
            <p><hi rend="bold">Elke Katharina Wittich:</hi> Tatsächlich modelliert Anna Ridler in
                  <title>Myriad (Tulips)</title> (2018) (<ref type="graphic" target="#tulpe_009"
                  >Abbildung 9</ref>) und dem darauf aufbauenden <title>Mosaic Virus</title> (2019)
               ihre Daten, das heißt sie definiert mit Annotationen Datenstrukturen und ihre
               Beziehungen untereinander.<note type="footnote"> Vgl. <ref type="bibliography"
                     target="#ridler_virus_2019">Ridler 2019</ref>.</note> Dies geschieht auf der
               Grundlage ihrer Klassifizierungen nach Farben und dem Zustand der Blüte vom Aufblühen
               bis zum vollständigen Verblühen. Dabei nutzt sie jahrhundertelang gepflegte Praktiken
               wie z.&#160;B. die bereits im 17. Jahrhundert gängige Darstellung von Blühpflanzen in
               allen Stadien; bei ihr wird dann eine Videoinstallation KI-generierter auf- und
               abblühender Tulpen daraus.</p>
            <figure>
               <graphic xml:id="tulpe_009" url="Medien/tulpe_009.png">
                  <desc>
                     <ref type="intern" target="#abb9">Abb.&#160;9</ref>: Anna Ridler: <hi
                        rend="italic">Tulips</hi>, 2018, Website der Künstlerin. [Screenshot: Elke
                     Katharina Wittich 2025]</desc>
               </graphic>
            </figure>
            <p>Anna Ridler schreibt:</p>
            <p><quote type="grosszitat">The process of making datasets is almost like craft&#160;–
                  repetitive, time-consuming, …, but necessary in order to produce something
                  beautiful. And there is a skill to it […]. If the dataset is too big, […], the
                  results will be too good and the quirks and oddities that make it an interesting
                  medium to explore will disappear; if it is too small it will not have enough
                  information […], either producing nothing or one or two variations […]. Therefore,
                  each photograph is carefully selected, as part of an iterative process, to produce
                  the type of result that I desired.</quote><note type="footnote">
                  <ref type="bibliography" target="#ridler_myriad_2018">Ridler
               2018</ref>.</note></p>
            <p>Dies ist dann mehr eine künstlerische Form des Modellierens oder?</p>
            <p>
               <hi rend="bold">Ralph Ewerth:</hi> Einerseits ja, es ist aber auch recht technisch.
               Denn das, was Anna Ridler hier bezüglich der Erstellung von Datensätzen beschreibt,
               ist auch bei der Erstellung von Trainingsdatenmengen ein wichtiger Aspekt. Wenn ich
               einem KI-System beibringen möchte, in Bildern Rosen, Tulpen, Lilien etc.
               unterscheiden zu können, dann benötige ich eine ausreichend große Menge von
               Beispielen. Wenn aber in der Klasse ›Tulpen‹ rote Tulpen dominieren, dann wird das
               System möglicherweise gelbe Tulpen nicht gut von anderen hellen Blumen unterscheiden
               können. Wenn in der Klasse ›Rose‹ zudem Bilder mit gelben Rosen dominieren, dann
               lernt das System eine ungewollte und zu Klassifikationsfehlern führende Verzerrung:
               Wenn eine gelbe Blume in einem neuen Bild klassifiziert werden soll, dann wird das
               System zur Antwort ›Rose‹ tendieren. Das heißt, es ist wichtig, dass für jede
               Blumenklasse alle möglichen Erscheinungsformen von Objekten&#160;– wir nennen das in
               der Regel Merkmale (Features)&#160;– oft genug und ungefähr gleich oft vorkommen. Und
               heutige große neuronale Netze benötigen grundsätzlich sehr viele Beispiele, um solche
               Klassen und Merkmale selbstständig zu lernen. </p>
            <p><hi rend="bold">Elke Katharina Wittich:</hi> In der zeitgenössischen Kunst arbeitet
               man also längst mit KI, auch ist bereits von digitalen Bildkulturen die Rede,<note
                  type="footnote"> Vgl. <ref type="bibliography" target="#merzmensch_kikunst_2023"
                     >Merzmensch 2023</ref>.</note> das heißt KI ist einerseits ein Werkzeug,
               andererseits viel mehr: Themenlieferant, Impulsgeber der Konzepte und auch aktives
               Material, das sich weiterdenkt. Und dies ist etwas anderes als Bewegung im
               Bewegtbild, denn potenziell arbeitet KI, ist sie einmal angestoßen, weiter, immer
               weiter, so wie Mikroben. Jedenfalls ist dies bei der Finnin Jenna Sutela so, in
                  <title>nimiia cétiï</title> (2018) kommunizieren KI und Mikroben in einer
               gemeinsam entwickelten Sprache, die wir nicht verstehen.<note type="footnote"> Vgl.
                     <ref type="bibliography" target="#sutela_homepage_2024">Sutela
                  2024</ref>.</note>
            </p>
            <p>
               <hi rend="bold">Ralph Ewerth:</hi> Da möchte ich gerne einhaken, denn die Analogie
               mit den Mikroben ist nicht vollständig korrekt. Das ist eine oft zu hörende Annahme,
               dass KI-Systeme permanent&#160;– quasi live&#160;– dazulernen. Es gibt zwar eine
               Richtung des Maschinellen Lernens, die sich damit beschäftigt, die kommt aber meines
               Erachtens bei den meisten Anwendungen nicht zum Einsatz. Bei vielen eingesetzten
               Systemen ist es so, dass ein bestimmter Lernstand konserviert wird und man wendet ein
               fertig trainiertes System an, das man zuvor evaluiert hat. Mit der Zeit sammelt man
               dann möglicherweise neue Daten, sei es aus der Interaktion mit dem System oder aus
               anderen Datenquellen. Es kann aber Tage, Wochen, Monate dauern, bis man eine neue
               Version eines Systems trainiert hat, welche die vorherige Version ersetzt. </p>
            <p><hi rend="bold">Elke Katharina Wittich:</hi> In der zeitgenössischen Kunst prägt KI
               einen neuartigen Zugang zu Kunst, häufig über die Erfahrung ephemerer und immersiver
               Räume, in denen wir sind oder unter bestimmten, technisch erzeugten Umständen sein
                  könnten.<note type="footnote"> Vgl. <ref type="bibliography"
                     target="#fast_hg_shift_2023">Fast (Hg.) 2023</ref>.</note> Dies hat natürlich
               eine lange Vorgeschichte in der Ablösung der bildenden Künste von vormodernen
               Praktiken in der Zeit um 1800 und dann nochmals radikaler um 1900; dies betrifft
               u.&#160;a. die Ablösung von ikonographischen Sinnsystemen, denn z.&#160;B. abstrakte
               Kompositionen entziehen sich vollständig einem solchen Zugriff. Die Rolle von KI in
               der zeitgenössischen Kunst wird man zudem nur vor dem Hintergrund der Konzeptkunst
               und der Medienkunst das 20. und beginnenden 21. Jahrhunderts erschließen können.</p>
            <p>Dann ist es aber tatsächlich so, dass man als Kunstwissenschaftler*in diesen
               Ausprägungen nicht mehr gerecht werden kann, wenn man nicht auch die technischen
               Aspekte von KI einschätzen kann. Schlüssel zum Zugang zu diesen Techniken in der
               zeitgenössischen Kunst sind jedoch weiterhin die genaue Beschreibung und der Einbezug
               der Bedingungen unserer Wahrnehmung. Allerdings verstehen wir in der
               Kunstwissenschaft etwas anderes darunter als Ihr in der Informatik, nämlich einen
               theoriegeprägten philosophischen Zugang im Gegensatz zu einem
               psychologisch-physiologischen Ansatz.<note type="footnote"> Vgl. <ref
                     type="bibliography" target="#hartmann_hg_weibel_2024">Hartmann (Hg.)
                  2024</ref>; <ref type="bibliography" target="#weier_rendering_2019">Weier
                     2019</ref>.</note> Zwar gibt es eine wahrnehmungsorientierte Kunstwissenschaft,
               die für den Bereich der Moderne ja doch auch mit Emotionen und damit psychologischen
               Effekten rechnen muss, aber diese Ansätze scheinen sich doch sehr von Euren Zugängen
               zu unterscheiden.</p>
            <p>Wer sich als Kunstwissenschaftler*in nicht mit den technischen Voraussetzungen und
               Wirkweisen, kurz mit der Logik der KI auskennt, könnte rasch ins Hintertreffen
               geraten, kann nicht mehr mitreden. Früher kam man als Mittelalterspezialist*in gut
               ohne Theoreme zeitgenössischer Kunst aus, mit KI könnte es jedoch anders werden.
               Anwendungen von KI prägen neben Kunstpraxis und Kunstmarkt zeitgleich in
               weitreichender Weise viele und zentrale Bereiche unserer Lebensumwelt, richten sie
               neu aus, manipulieren mitunter: das Gesundheitswesen ebenso wie das Bankwesen und das
                  Bildungswesen.<note type="footnote"> Vgl. <ref type="bibliography"
                     target="#joerissen_bildung_2020">Jörrisen 2020</ref>; <ref type="bibliography"
                     target="#ackermann_egger_hg_begegnungen_2021">Ackermann&#160;/ Egger (Hg.)
                     2021</ref>.</note> In der kunstwissenschaftlichen Praxis wirken sie durch
               Recherche, digitale Publikationspraktiken und die Anlage und Erschließung von
               Datenbanken auch in die Forschung von Mittelalterspezialist*innen hinein&#160;– man
               wird sich nicht entziehen können.</p>
            <p>Vielleicht kommt bildende Kunst gerade erst im Zeitalter von KI zu ihrer eigentlichen
               subversiven Stärke, der irrlichternden Spiegelung der Zustände, der unübersehbaren
               Hervorhebung der Fehlstellen, der marktschreierischen Herausstellung der absurden
               Menge an Energie, die KI-generierte Kunst benötigt,<note type="footnote"> Vgl. <ref
                     type="bibliography" target="#scheer_codes_2019">Scheer 2019</ref>.</note> um da
               zu sein und schnell auch wieder nicht mehr da zu sein, dann nämlich, wenn das
               technische Werkzeug nicht mehr in der Version, mit der ein Kunstwerk hervorgebraucht
               wurde, verfügbar ist. Mit der alten Version von bildgenerierender KI ist dann auch
               das Kunstwerk aussortiert, nicht mehr aufrufbar.</p>
            <p>Als es mir zu viel wurde mit der großen Begeisterung an der KI-gestützten Suche nach
               Bildähnlichkeit, habe ich mir als Intervention den Titel unseres Beitrags ausgedacht:
               eine Tulpe ist eine Tulpe ist keine Tulpe. Damit spiele ich auf ein Blatt aus dem
                  <title>Sinnepoppen</title> von Roemer Visscher aus dem Jahr 1614 an, ein
               Emblem-Buch (<ref type="graphic" target="#tulpe_010">Abbildung 10</ref>).<note
                  type="footnote"> Vgl. <ref type="bibliography"
                     target="#strasser_wade_hg_domaenen_2004">Strasser&#160;/ Wade 2004</ref>; <ref
                     type="bibliography" target="#kuepper_abhandlungen_2005">Küpper 2005</ref>.
                  Siehe auch <ref target="http://emblematica.library.illinois.edu/">Emblematica
                     online 2010–2022</ref>.</note> Die beiden Tulpen sind auf diesem Blatt
               nahsichtig vorgestellt, unten liegen, wie bei einer botanischen Zeichnung, Zwiebeln.
               Wie in der Emblematik üblich, werden die Tulpen nicht als Pflanzen gesehen, sondern
               als Sinnbild, stehen nämlich für die Dummheit im Umgang mit Geld.<note
                  type="footnote">
                  <quote>Een dwaes en zijn gelt zijn haest ghescheyden</quote>&#160;– Ein Narr und
                  sein Geld sind schnell voneinander getrennt. Zitiert nach der Ausgabe in der
                  Universitätsbibliothek Leiden.</note>
            </p>
            <figure>
               <graphic xml:id="tulpe_010" url="Medien/tulpe_010.png">
                  <desc>
                     <ref type="intern" target="#abb10">Abb.&#160;10</ref>: Ergebnis der Bildsuche
                     unter dem Suchbegriff ›tulips‹ in <hi rend="italic">iART</hi> mit einen Blatt aus <hi rend="italic"
                        >Sinnepoppen</hi> von Roemer Visscher, 1614. [Screenshot: Elke Katharina
                     Wittich 2025]</desc>
               </graphic>
            </figure>
            <p>Ich spreche von dem Unterschied zwischen der bildlichen Darstellung einer Tulpe, mit
               der eine Tulpe gezeigt werden soll, und der bildlichen Darstellung einer Tulpe, die
               sinnbildlich für die Torheit, mit teuren Tulpen zu spekulieren, steht. Denn das Blatt
               aus dem Emblembuch <title>Sinnepoppen</title> von 1614 nimmt Bezug auf die sogenannte
               Tulpomanie in den Niederlanden des 17. Jahrhunderts, als man für eine Tulpenzwiebel
               so viel zahlen musste wie für ein Bürgerhaus in Amsterdam.<note type="footnote"> Vgl.
                     <ref type="bibliography" target="#goldgar_tulipmania_2007">Goldgar
                  2007</ref>.</note> Auch Anna Ridler nimmt darauf Bezug, das Auf- und Abblühen der
               KI-generierten Tulpen in <title>Mosaic Virus</title> ist von Börsenkursen
               ausgelöst.</p>
            <p>Andererseits kann alles, was man anhand von Form, Farbe und Umriss, Art und
               Charakteristik, Materialität, Herstellungsweise, gar Prozessualität und
               Entwicklungsoption beschreiben kann, auch nachgeahmt, demnach von KI genutzt werden.
               Es könnte also eine ›Ähnlichkeit = Sinnbild‹ definiert werden, die sich von anderen
               Ähnlichkeiten in der Kunstwissenschaft unterscheidet, z.&#160;B. eine Ähnlichkeit in
               der Pinselführung als einem technischen Aspekt, eine Ähnlichkeit in der Motivwahl als
               einer intellektuellen Entscheidung zugunsten der Bildaussage und eine Ähnlichkeit der
               Form, letztere abgelesen sowohl an Körpern wie an Bauteilen.</p>
            <p>
               <hi rend="bold">Ralph Ewerth:</hi> Die große Herausforderung für die
               Ähnlichkeitssuche in einer Bilddatenbank mit einem Anfragebild ist, dass ohne weitere
               Kontextinformation völlig unklar ist, nach welchen Aspekten und Eigenschaften
               (›Features‹) eines Bildes ähnliche Bilder gefunden werden sollen. Woher sollte eine
               Bildsuchmaschine das wissen? Genau so könnte ein Mensch mit dieser knapp formulierten
               Aufgabe wenig anfangen: <quote>Finde mir bitte ein ähnliches Bild zu diesem
                  Tulpenbild!</quote> So etwas können wir gut als ein ›ill-posed problem‹, eine
               schlecht formulierte Problemstellung bezeichnen. Eine solche Bitte bzw. Anfrage ist
               zu unscharf definiert und benötigt mehr Kontext und spezifische, möglichst
               objektivierbare Ähnlichkeitskriterien. </p>
            <p><hi rend="bold">Elke Katharina Wittich:</hi> Dies ist ein gutes Beispiel: wie sollten
               wiederum wir wissen, was die Maschine kann und was nicht bzw. was wir ihr sagen
               müssten, damit sie gut arbeiten kann?</p>
            <p>
               <hi rend="bold">Ralph Ewerth:</hi> Ein KI-System kann&#160;– glücklicherweise&#160;–
               nicht die Gedanken der Nutzer*innen lesen, und selbst wenn&#160;– könnten wir
               Menschen immer genau ausdrücken, wonach wir suchen? Dies bedeutet, dass man dem
               System weitere Informationen geben muss, zum Beispiel, dass es um Farbe, Form,
               Textur, Objekt, Motiv, Epoche, historischen, gesellschaftlichen und kulturellen
               Kontext, Symbolik etc. oder um eine Kombination solcher Aspekte geht. Je
               konfigurierbarer das System ist oder je mehr es natürlichsprachige Anweisungen
               (Eingaben = ›Prompts‹) versteht, umso besser. </p>
            <p><hi rend="bold">Elke Katharina Wittich:</hi> Allerdings müsste man auch die Theoreme
               einbeziehen, dass man sich im 18. Jahrhundert mit ›Ähnlichkeit‹ auf einen
               ästhetischen Diskurs bezieht, der von einem Artikel in Johann Georg Sulzers
                  <title>Allgemeine(r) Theorie der Schönen Künste</title> ausgelöst wurde, während
               im 20. Jahrhundert gerade der ›Abdruck‹ von Menschen und Objekten, also eine zu
               genaue und darum nicht erstrebenswerte ›Ähnlichkeit‹ im Sinne Sulzers, eine ganz
               andere Wertigkeit hatte.<note type="footnote"> Vgl. <ref type="bibliography"
                     target="#sulzer_aehnlichkeit_1771">Sulzer 1771</ref>; <ref type="bibliography"
                     target="#didi-huberman_aehnlichkeit_1999">Didi-Huberman 1999</ref>.</note> Man
               müsste also bei ›Ähnlichkeit‹ zwischen einer vollständigen Entsprechung von
               Dargestelltem und Darstellung und verschiedenen Graden der ›Ähnlichkeit‹
               unterscheiden.</p>
            <p>
               <hi rend="bold">Ralph Ewerth:</hi> In einem KI-System werden typischerweise solche
               ›Ähnlichkeitsgrade‹ berechnet, entweder für ein Merkmal oder eine Menge von
               Merkmalen; alternativ könnte man eine Distanzmetrik verwenden, die den Grad an
               Unähnlichkeit misst. Die Werte einer Ähnlichkeitsmetrik liegen üblicherweise entweder
               zwischen 0 und 1 oder zwischen -1 und 1, das hängt von der Art der gewählten Metrik,
               d.&#160;h. Ähnlichkeitsfunktion ab. Der Wert 1 wäre zu vergeben, wenn man ein Bild
               mit einer exakten Kopie vergleicht, geringere Werte deuten auf eine geringere
               Ähnlichkeit hin. Insofern unterscheidet man also nur graduelle Abstufungen von
               Ähnlichkeit und streng genommen fällt ein Bild nie aus der Kategorie ›ähnlich‹
               heraus. Das wäre Definitionssache: wir könnten sagen, wenn die Ähnlichkeit zwischen
               zwei Bildern 0 ist, dann sind sie unähnlich. Wollen wir sie aber anfangen ähnlich zu
               nennen bei einem Ähnlichkeitswert von 0,00000001? Oder doch lieber ab einem Wert über
               0,5? Für Klassifikationsaufgaben muss man hier sinnvolle Schwellenwerte finden,
               erfreulicherweise nehmen uns KI-Systeme diese Aufgabe ab, aber machen hierbei auch
               Fehler&#160;– im Übrigen oftmals zwangsläufig, wenn es sich um Grenzfälle, subjektive
               Klassifizierungen oder nicht sehr präzise definierte oder definierbare Kategorien
               handelt. </p>
            <p><hi rend="bold">Elke Katharina Wittich:</hi> Sehr reizvoll scheint es mir auch zu
               sein, das Aufeinandertreffen von Bild und Text wie in den Emblembüchern genauer zu
               untersuchen und mit Wissenschaftstheorien und <seg type="nobreak">-&#x200D;praktiken</seg> wie dem Memorieren
               in Verbindung zu bringen. Kunstwerke stehen in Traditionen, Künstler*innen nehmen
               darauf Bezug und schaffen komplexe semantische Systeme. Anna Ridler zum Beispiel
               interpretiert die Tradition der Blumenstillleben und der botanischen Illustrationen
               des 17. Jahrhunderts und überträgt zugleich die Börsenspekulation in zeitgenössische
               Ausdrucksformen. Wir Kunstwissenschaftler*innen sind es jedoch weniger gewohnt,
               dieses Wissen als System zu abstrahieren, wie es mit Methoden und Technologien der
                  <term type="dh">Knowledge Representation</term> in der Informatik möglich
                  ist.<note type="footnote"> Vgl. <ref type="bibliography"
                     target="#harmelen_et_al_hg_handbook_2008">Harmelen et&#160;al. (Hg.)
                  2008</ref>.</note>
            </p>
            <p>Die Ikonographie als kunstwissenschaftliche Methodik muss ein wunderbares
               Experimentierfeld für die <term type="dh">Computer Vision</term> sein, allerdings
               eines mit Fallstricken, wie das Beispiel aus der Emblematik zeigt. Für manche
               Kunstgattungen und manche Zeiten wird man jedoch sehr viel finden, wenn KI nach
               Umrissen z.&#160;B. verschiedener Vögel fahndet, allein auf dem
                  <title>Paradiesgärtchen</title> im Frankfurter Städel lassen sich mehr als zehn
               verschiedene Vogelarten finden. Aber man muss halt wissen, dass nicht alle Kunstwerke
               auf diese Weise sinnvoll bearbeitet werden können, und es auch weitere Methoden mit
               anderen Anforderungen gibt.</p>
            <p>
               <hi rend="bold">Ralph Ewerth:</hi> Ein Computer-Vision-System nutzt typischerweise
               nur die Bildinformation als Eingabe. Daraus lassen sich natürlich keine
               Interpretationen bezüglich einer möglichen Symbolik und Bedeutung in einem bestimmten
               zeitlichen, geografischen, künstlerischen Kontext ableiten. Hierzu benötigt man
               gewissermaßen multimodale KI-Systeme, die gleichzeitig Informationen aus anderen
               Ausdrucksformen (Modalitäten) wie zum Beispiel Text oder einer Wissensrepräsentation
               in einem Wissensgraphen verarbeiten und daraus Schlussfolgerungen ziehen können. </p>
            <p><hi rend="bold">Elke Katharina Wittich:</hi> Man muss auch bedenken, dass nicht alle
               Kunst ikonographisch angelegt ist, dies bricht in der Moderne auf. Und schwierig wird
               es mit Bildmustern, denen komplexe ästhetische Verweissysteme hinterlegt sind. Bei
               antiken Skulpturen ist dies der Fall bzw. ihrer Haltung, Kopfwendung, der Hände und
               Füße, die man bei Raffael wiederfindet und dann in den folgenden Generationen bei
               Nachahmern in Italien und den Niederlanden, häufig gedreht, anders gekleidet, neu
               frisiert, häufig in anderen Gattungen ausgeführt und von der zweidimensionalen
               Ansicht in eine dreidimensionale Figur übertragen&#160;– auch sprachlich ist dieses
               Phänomen mit Antikenrezeption nur unzureichend klassifiziert.</p>
            <p>Das wäre aber aus meiner Perspektive ein erstrebenswertes Ziel, mit Hilfe von KI zum
               Beispiel den <title>Census</title> zu potenzieren und eben nicht nur <quote>Antique
                  Works of Art and Architecture Known in the Renaissance</quote> zu erschließen,
               sondern darüber hinaus mit Posen- und Gestenerkennung die Körperpartien antiker
               Skulpturen in der Kunst der Frühen Neuzeit aufzuspüren. Vielleicht würde es helfen,
               wenn wir Kunstwissenschaftler*innen viel mehr davon berichteten, was wir suchen und
               mit welchen Strategien Künstler*innen zu verschiedenen Zeiten gearbeitet haben. Auf
               jeden Fall sollten wir uns austauschen.</p>
            <p>
               <hi rend="bold">Ralph Ewerth:</hi> Ja, dem kann ich mich nur anschließen. Und
               vielleicht würde es helfen, wenn wir Informatiker noch besser erklärten, was
               KI-Methoden können und was nicht. Aber ich bin sehr optimistisch, dass wir da auf
               beiden Seiten und in den Digital Humanities noch große Fortschritte machen werden.
            </p>
         </div>
      </body>
      <back>
         <div type="bibliography">
            <head>Bibliografie</head>
            <listBibl>
               <bibl xml:id="ackermann_egger_hg_begegnungen_2021">Judith Ackermann&#160;/ Benjamin
                  Egger (Hg.): Transdisziplinäre Begegnungen zwischen postdigitaler Kunst und
                  kultureller Bildung. Perspektiven aus Wissenschaft, Kunst und Vermittlung.
                  Wiesbaden 2021. <ptr type="gbv" cRef="1734747307"/>
               </bibl>
               <bibl xml:id="antenhofer_et_al_humanities_2024">Christina Antenhofer&#160;/ Christoph
                  Kühberger&#160;/ Arno Strohmeyer (Hg.): Digital Humanities in den
                  Geschichtswissenschaften. Wien 2024. <ptr type="gbv" cRef="1843646749"/>
               </bibl>
               <bibl xml:id="aurnhammer_steiger_hg_christus_2020">Achim Aurnhammer&#160;/ Johann
                  Anselm Steiger (Hg.): Christus als Held und seine heroische Nachfolge. Zur
                  »Imitatio Christi« in der frühen Neuzeit (Ausstellung:
                  Helden&#160;– Heroisierung&#160;– Heroismen, Freiburg, 30.05.–01.06.2019). Berlin
                  u.&#160;a. 2020. <ptr type="gbv" cRef="1689372524"/>
               </bibl>
               <bibl xml:id="baumgaertel_et_al_kauffmann_2024">Bettina Baumgärtel&#160;/ Inken Maria
                  Holubec&#160;/ Gabriele Ewenz: Angelika Kauffmann Research Project. Letzter
                  Zugriff: 31.10.2024. HTML. [<ref target="https://www.angelika-kauffmann.de/"
                     >online</ref>]</bibl>
               <bibl xml:id="boehm_bildbeschreibung_1995">Gottfried Boehm: Bildbeschreibung. Über die
                  Grenzen von Bild und Sprache. In: Gottfried Boehm&#160;/ Helmut Pfotenhauer (Hg.):
                  Beschreibungskunst&#160;– Kunstbeschreibung. München 1995, S.&#160;23–40. <ptr
                     type="gbv" cRef="171867572"/>
               </bibl>
               <bibl xml:id="census_forschungsprojekt_2022">Census of Antique Works of Art and
                  Architecture Known in the Renaissance. Forschungsprojekt an der Professur für
                  Kunstgeschichte der Frühen Neuzeit am Institut für Kunst- und Bildgeschichte der
                  Humboldt-Universität zu Berlin. Letzte Aktualisierung: 24.08.2022. HTML. [<ref
                     target="https://www.census.de/projekt/">online</ref>]</bibl>
               <bibl xml:id="didi-huberman_aehnlichkeit_1999">Georges Didi-Huberman: Ähnlichkeit und
                  Berührung. Archäologie, Anachronismus und Modernität des Abdrucks. Köln 1999. <ptr
                     type="gbv" cRef="1606032755"/>
               </bibl>
               <bibl xml:id="emblematicaa_2010-2022">Emblematica online. 2010–2022. HTML. [<ref
                     target="http://emblematica.library.illinois.edu/">online</ref>]</bibl>
               <bibl xml:id="fast_hg_shift_2023">Friederike Fast (Hg.): SHIFT. KI und die zukünftige
                  Gemeinschaft (Ausstellung, Kunstmuseum Stuttgart&#160;/ MARTa Herford,
                  04.02.–21.05.2023&#160;/ 17.06.–15.10.2023). Köln u.&#160;al. 2023. <ptr
                     type="gbv" cRef="1830866168"/>
               </bibl>
               <bibl xml:id="foellinger_mueller_hg_dialog_2013">Sabine Föllinger&#160;/ Gernot
                  Michael Müller (Hg.): Der Dialog in der Antike. Formen und Funktionen einer
                  literarischen Gattung zwischen Philosophie, Wissensvermittlung und dramatischer
                  Inszenierung. Berlin 2013. <ptr type="gbv" cRef="733779123"/>
               </bibl>
               <bibl xml:id="greco_gesichter_2023">Lucio Greco: 100 Gesichter Christi, 2016–2022.
                  In: NordArt 2023. 2023. PDF. [<ref
                     target="https://www.nordart.de/fileadmin/downloads/kuenstler/2023/NordArt2023_Greco_Lucio.pdf"
                     >online</ref>]</bibl>
               <bibl xml:id="goldgar_tulipmania_2007">Anne Goldgar: Tulipmania. Money, Honor, and
                  Knowledge in the Dutch Golden Age. Chicago u.&#160;a. 2007. <ptr type="gbv"
                     cRef="1605569070"/>
               </bibl>
               <bibl xml:id="groeling_kaiser_2007">Cindy Groeling: Kaiser Marc Aurel. Abbild und
                  Vorbild eines Herrscherideals. Ein Beitrag zur Rezeption der Antike. Saarbrücken
                  2007. <ptr type="gbv" cRef="538231823"/>
               </bibl>
               <bibl xml:id="harmelen_et_al_hg_handbook_2008">Frank van Harmelen&#160;/ Vladimir
                  Lifschitz&#160;/ Bruce Porter (Hg.): Handbook of Knowledge Representation.
                  Amsterdam 2008. <ptr type="gbv" cRef="544021592"/>
               </bibl>
               <bibl xml:id="hartmann_hg_weibel_2024">Idis Hartmann (Hg.): Enzyklopädie der Medien.
                  6 Bände. Berlin 2015–2024. Band 6 (2024): Theorie und Medien. Wahrnehmung und
                  Wandel der Welt durch und mit Medien. Ausgewählte Schriften von Peter Weibel. <ptr
                     type="gbv" cRef="1758470356"/>
               </bibl>
               <bibl xml:id="iart_vision_2026">iArt.vision. Letzter Zugriff: 26.03.2026. HTML. [<ref
                     target="https://iart.vision/">online</ref>]</bibl>
               <bibl xml:id="iconclass_2024">Iconclass Plus Edition. In: Iconclass. Letzter Zugriff:
                  31.10.2024. HTML. [<ref target="https://iconclass.org/">online</ref>]</bibl>
               <bibl xml:id="jannidis_et_al_hg_humanities_2017">Fotis Jannidis&#160;/ Hubertus
                  Kohle&#160;/ Malte Rehbein (Hg.): Digital Humanities. Eine Einführung. Stuttgart
                  2017. <ptr type="gbv" cRef="876170386"/>
               </bibl>
               <bibl xml:id="joerissen_bildung_2020">Benjamin Jörissen: Ästhetische Bildung im
                  Regime des Komputablen. In: Zeitschrift für Pädagogik 66 (2020), H.&#160;3,
                  S.&#160;341–356. DOI: <ref target="https://doi.org/10.25656/01:25798"
                     >10.25656/01:25798</ref>
               </bibl>
               <bibl xml:id="kennedy_meek_hg_encounters_2019">David Kennedy&#160;/ Richard Meek
                  (Hg.): Ekphrastic Encounters. New Interdisciplinary Essays on Literature and
                  Visual Arts. Manchester 2019. <ptr type="gbv" cRef="1642812382"/>
               </bibl>
               <bibl xml:id="keskintepe_woschech_hg_intelligenz_2021">Yasemin Keskintepe&#160;/ Anke
                  Woschech (Hg.): Künstliche Intelligenz: Maschinen, Lernen, Menschheitsträume
                  (Ausstellung: Deutsches Hygiene-Museum Dresden, 06.11.2021–28.08.2022). Göttingen
                  2021. <ptr type="gbv" cRef="1757352953"/>
               </bibl>
               <bibl xml:id="kuepper_abhandlungen_2005">Joachim Küpper: Abhandlungen&#160;– Bild und
                  Text. Zu einigen systematischen Implikaten der frühneuzeitlichen Emblematik. In:
                  Zeitschrift für Ästhetik und allgemeine Kunstwissenschaft 50 (2005), H.&#160;1,
                  S.&#160;77–110. <ptr type="gbv" cRef="129555290"/>
               </bibl>
               <bibl xml:id="kulturgutretter_2024">KulturGutRetter (Cultural Heritage Response
                  Unit&#160;– CHRU), ein Projekt des Deutschen Archäologischen Instituts (DAI), des
                  Leibniz-Zentrums für Archäologie (LEIZA) und der Bundesanstalt Technisches
                  Hilfswerk (THW). Letzter Zugriff: 31.10.2024. HTML. [<ref
                     target="https://www.kulturgutretter.org/projekt/">online</ref>]</bibl>
               <bibl xml:id="leroi_algorithmus_2015">Armand Marie Leroi: Cicero zählen. Algorithmus
                  oder Kritik? Plädoyer für eine universelle Kunsttheorie. In: Süddeutsche Zeitung vom 06.03.2015. <ptr type="gbv" cRef="777785226"/>
               </bibl>
               <bibl xml:id="matt_hg_sebastian_2003">Gerald Matt (Hg.): Heiliger Sebastian: A
                  Splendid Readiness for Death (Ausstellung: Heiliger Sebastian, Kunsthalle Wien,
                  14.11.2003–15.02.2004). Wien 2003. <ptr type="gbv" cRef="370245598"/>
               </bibl>
               <bibl xml:id="merzmensch_kikunst_2023">Merzmensch: KI-Kunst. Kollaboration von Mensch
                  und Maschine (=&#160;Digitale Bildkulturen). Berlin 2023. <ptr type="gbv"
                     cRef="1843652366"/>
               </bibl>
               <bibl xml:id="murphy_et_al_hg_intelligenz_2022">Oonagh Murphy&#160;/ Elena
                  Villaespesa&#160;/ Luba Elliott (Hg.): Künstliche Intelligenz und Museen. Ein
                  Toolkit. Karlsruhe 2022. <ptr type="gbv" cRef="1817194194"/>
               </bibl>
               <bibl xml:id="radford_et_al_models_2021">Alec Radford&#160;/ Jong Wook Kim&#160;/
                  Chris Hallacy&#160;/ Aditya Ramesh&#160;/ Gabriel Goh&#160;/ Sandhini
                  Agarwal&#160;/ Girish Sastry&#160;/ Amanda Askell&#160;/ Pamela Mishkin&#160;/ Jack
                  Clark&#160;/ Gretchen Krueger&#160;/ Ilya Sutskever: Learning Transferable Visual
                  Models From Natural Language Supervision. In: Marina Meila&#160;/ Tong Zhang
                  (Hg.): 38th International Conference on Machine Learning. Conference Proceedings
                  (Online, 18.–24.07.2021). 2021, S.&#160;8748–8763. HTML. [<ref
                     target="https://proceedings.mlr.press/v139/radford21a.html"
                  >online</ref>]</bibl>
               <bibl xml:id="rahmstorf_wikipedia_2023">Olaf Rahmstorf: Wikipedia. Die rationale
                  Seite der Digitalisierung? Entwurf einer Theorie. Bielefeld 2023. <ptr type="gbv"
                     cRef="1800450389"/>
               </bibl>
               <bibl xml:id="ratkowitsch_hg_ekphrasis_2006">Christine Ratkowitsch (Hg.): Die
                  poetische Ekphrasis von Kunstwerken. Eine literarische Tradition der Großdichtung
                  in Antike, Mittelalter und früher Neuzeit (=&#160;Sitzungsberichte der
                  Österreichischen Akademie der Wissenschaften, 735). Wien 2006. <ptr type="gbv"
                     cRef="508395186"/>
               </bibl>
               <bibl xml:id="ridler_myriad_2018">Anna Ridler: Myriad (Tulips). 2018. HTML. [<ref
                     target="https://annaridler.com/works/myriad-tulips">online</ref>]</bibl>
               <bibl xml:id="ridler_virus_2019">Anna Ridler: Mosaic Virus 2019. 2019. HTML. [<ref
                     target="https://annaridler.com/works/mosaic-2019">online</ref>]</bibl>
               <bibl xml:id="scheer_codes_2019">Ursula Scheer: Wenn Codes Blüten treiben. In:
                  Frankfurter Allgemeine Zeitung vom 31.05.2019, Nr. 23, S.&#160;54. <ptr type="gbv"
                     cRef="171067800"/>
               </bibl>
               <bibl xml:id="springstein_et_al_narratives_2024">Matthias Springstein&#160;/ Stefanie
                  Schneider&#160;/ Javad Rahnama&#160;/ Julian Stalter&#160;/ Maximilian
                  Kristen&#160;/ Eric Müller-Budack&#160;/ Ralph Ewerth: Visual Narratives:
                  Large-Scale Hierarchical Classification of Art-Historical Images. In: IEEE&#160;/
                  CVF Winter Conference on Applications of Computer Vision (WACV). Conference
                  Proceedings (Waikoloa, 04.–08.01.2024). New York 2024, S.&#160;7220–7230. PDF.
                  DOI: 10.1109/WACV57701.2024.00705</bibl>
               <bibl xml:id="strasser_wade_hg_domaenen_2004">Gerhard F. Strasser&#160;/ Mara R. Wade
                  (Hg.): Die Domänen des Emblems. Außerliterarische Anwendungen der Emblematik
                  (=&#160;Wolfenbütteler Arbeiten zur Barockforschung, 39). Wiesbaden 2004. <ptr
                     type="gbv" cRef="389234923"/>
               </bibl>
               <bibl xml:id="sulzer_aehnlichkeit_1771">Johann Georg Sulzer: Artikel »Ähnlichkeit«.
                  In: Johann Georg Sulzer: Allgemeine Theorie der schönen Künste. 2 Bände. Leipzig
                  1771–1774. Band 1 (1771), S.&#160;14–16. <ptr type="gbv" cRef="144530872"/>
               </bibl>
               <bibl xml:id="sutela_homepage_2024">Jenna Sutela: [Homepage]. Letzter Zugriff:
                  31.10.2024. HTML. [<ref target="https://jennasutela.com/">online</ref>]</bibl>
               <bibl xml:id="szeliski_vision_2022">Richard Szeliski: Computer Vision. Algorithms and
                  Applications. Cham, CH 2022. <ptr type="gbv" cRef="1755872151"/>
               </bibl>
               <bibl xml:id="warnke_peter_2006">Martin Warnke: Rubens. Leben und Werk. 2. Auflage.
                  Köln 2006. <ptr type="gbv" cRef="517968835"/>
               </bibl>
               <bibl xml:id="warnke_herrscherbildnis_2011">Martin Warnke: Herrscherbildnis. In: Uwe
                  Fleckner&#160;/ Martin Warnke&#160;/ Hendrik Ziegler (Hg.): Handbuch der
                  politischen Ikonographie. 2 Bände. München 2011. Band 1: Abdankung bis Huldigung,
                  S. 481–490. <ptr type="gbv" cRef="1865099635"/>
               </bibl>
               <bibl xml:id="weier_rendering_2019">Martin Weier: Perception-Driven Rendering.
                  Techniques for the Efficient Visualization of 3D Scenes Including View- and
                  Gaze-Contingent Approaches. Dissertation, Universität des Saarlandes. Saarbrücken
                  2019. DOI: <ref target="https://doi.org/10.22028/D291-30124 "
                     >10.22028/D291-30124</ref>
               </bibl>
               <bibl xml:id="kunstforum_2022">Zukunftsressource Archiv. Kunst als Medium von
                  Erinnerung und Imagination. Kunstforum International, H. 280 (2022). <ptr type="gbv"
                     cRef="1794009132"/></bibl>
            </listBibl>
         </div>
      </back>
   </text>
</TEI>
