<?xml version="1.0" encoding="utf-8"?>
<?xml-model href="https://zfdg.de/sites/default/files/medien/zfdg.rng" type="application/xml" schematypens="http://relaxng.org/ns/structure/1.0"?>
<?xml-model href="https://zfdg.de/sites/default/files/medien/zfdg.rng" type="application/xml" schematypens="http://purl.oclc.org/dsdl/schematron"?>
<TEI xmlns="http://www.tei-c.org/ns/1.0" xmlns:tei="http://www.tei-c.org/ns/1.0">
   <teiHeader>
      <fileDesc>
         <titleStmt>
            <title level="a" type="full">Ornamentale Schwünge und Neuronale Netze.
               Ähnlichkeitsanalysen Augsburger Rocaille-Drucke des 18. Jahrhunderts</title>
            <title level="a" type="short">Ornamentale Schwünge und Neuronale Netze</title>
            <respStmt>
               <resp ref="http://id.loc.gov/vocabulary/relators/aut">Author</resp>
               <resp ref="https://credit.niso.org/contributor-roles/conceptualization/"
                  >Conceptualization</resp>
               <resp ref="https://credit.niso.org/contributor-roles/data-curation/">Data
                  curation</resp>
               <resp ref="https://credit.niso.org/contributor-roles/investigation/"
                  >Investigation</resp>
               <resp ref="https://credit.niso.org/contributor-roles/methodology/">Methodology</resp>
               <resp ref="https://credit.niso.org/contributor-roles/project-administration/">Project
                  administration</resp>
               <resp ref="https://credit.niso.org/contributor-roles/validation/">Validation</resp>
               <resp ref="https://credit.niso.org/contributor-roles/visualization/"
                  >Visualization</resp>
               <resp ref="https://credit.niso.org/contributor-roles/writing-original-draft/"
                  >Writing&#160;– original draft</resp>
               <resp ref="https://credit.niso.org/contributor-roles/writing-review-editing/"
                  >Writing&#160;– review &amp; editing</resp>
               <persName>
                  <forename>Ines</forename>
                  <surname>Röckl</surname>
                  <email>ines.roeckl@ur.de</email>
                  <idno type="gnd">124504592X</idno>
                  <idno type="orcid">0009-0004-7807-6782</idno>
                  <affiliation>Universität Regensburg</affiliation>
               </persName>
            </respStmt>

            <respStmt>
               <resp ref="http://id.loc.gov/vocabulary/relators/aut">Author</resp>
               <resp ref="https://credit.niso.org/contributor-roles/formal-analysis/">Formal
                  analysis</resp>
               <resp ref="https://credit.niso.org/contributor-roles/investigation/"
                  >Investigation</resp>
               <resp ref="https://credit.niso.org/contributor-roles/software/">Software</resp>
               <persName>
                  <forename>Thomas</forename>
                  <surname>Hudcovic</surname>
                  <email>hudo@uni-bremen.de</email>
                  <idno type="gnd">139402584X</idno>
                  <idno type="orcid">0009-0005-9970-3228</idno>
                  <affiliation>Universität Bremen</affiliation>
               </persName>
            </respStmt>

            <respStmt>
               <resp ref="http://id.loc.gov/vocabulary/relators/aut">Author</resp>
               <resp ref="https://credit.niso.org/contributor-roles/funding-acquisition/">Funding
                  acquisition</resp>
               <resp ref="https://credit.niso.org/contributor-roles/project-administration/">Project
                  administration</resp>
               <resp ref="https://credit.niso.org/contributor-roles/supervision/">Supervision</resp>
               <resp ref="https://credit.niso.org/contributor-roles/writing-review-editing/"
                  >Writing&#160;– review &amp; editing</resp>
               <persName>
                  <forename>Gabriel</forename>
                  <surname>Zachmann</surname>
                  <email>zach@cs.uni-bremen.de</email>
                  <idno type="gnd">12349981X</idno>
                  <idno type="orcid">0000-0001-8155-1127</idno>
                  <affiliation>Universität Bremen</affiliation>
               </persName>
            </respStmt>

         </titleStmt>
         <editionStmt>
            <edition n="1.0"/>
            <respStmt>
               <resp ref="http://id.loc.gov/vocabulary/relators/dtm">Technische Redaktion</resp>
               <persName>
                  <forename>Martin</forename>
                  <surname>de la Iglesia</surname>
                  <idno type="gnd">1095143719</idno>
                  <idno type="orcid">0000-0002-9319-4793</idno>
               </persName>
            </respStmt>
            <respStmt>
               <resp ref="http://id.loc.gov/vocabulary/relators/dtm">Technische Redaktion</resp>
               <persName>
                  <forename>Maximilian</forename>
                  <surname>Görmar</surname>
                  <idno type="gnd">1077317964</idno>
                  <idno type="orcid">0000-0003-3608-1140</idno>
               </persName>
            </respStmt>
            <respStmt>
               <resp ref="http://id.loc.gov/vocabulary/relators/pfr">Textredaktion</resp>
               <persName>
                  <forename>Karoline</forename>
                  <surname>Lemke</surname>
                  <idno type="gnd">1187840033</idno>
                  <idno type="orcid">0000-0002-1604-672X</idno>
               </persName>
            </respStmt>
         </editionStmt>
         <publicationStmt>
            <publisher n="Redaktionssitz">
               <orgName>Herzog August Bibliothek</orgName>
               <address>
                  <addrLine>Lessingplatz 1</addrLine>
                  <addrLine>38304 Wolfenbüttel</addrLine>
               </address>
            </publisher>
            <publisher n="herausgebendes Organ">
               <orgName>Forschungsverbund Marbach Weimar Wolfenbüttel</orgName>
               <address>
                  <addrLine>Burgplatz 4</addrLine>
                  <addrLine>99423 Weimar</addrLine>
               </address>
            </publisher>
            <publisher n="herausgebendes Organ">
               <orgName>Digital Humanities im deutschsprachigen Raum e. V.</orgName>
               <address>
                  <addrLine>Hamburg</addrLine>
               </address>
            </publisher>
            <date n="1.0" when="2026-05-21">21.05.2026</date>
            <idno type="doi">10.17175/sb008_004</idno>
            <idno type="ppn">1950651703</idno>
            <availability status="free">
               <licence target="https://creativecommons.org/licenses/by-sa/4.0/">CC BY-SA 4.0,
                  sofern nicht anders angegeben.</licence>
            </availability>
         </publicationStmt>
         <seriesStmt>
            <title level="j">Zeitschrift für digitale Geisteswissenschaften</title>
            <title level="m">Bildähnlichkeit und Bildsuche: Geistes- und informationswissenschaftliche Zugänge zu historischem Material</title>
            <title level="s">Sonderbände</title>
            <respStmt>
               <resp ref="http://id.loc.gov/vocabulary/relators/edt">Editor</resp>
               <persName>
                  <forename>Hartmut</forename>
                  <surname>Beyer</surname>
                  <email>beyer@hab.de</email>
                  <idno type="gnd">136449824</idno>
                  <idno type="orcid">0000-0002-1158-1547</idno>
                  <affiliation>Herzog August Bibliothek Wolfenbüttel</affiliation>
               </persName>
            </respStmt>
            <respStmt>
               <resp ref="http://id.loc.gov/vocabulary/relators/edt">Editor</resp>
               <persName>
                  <forename>Thomas</forename>
                  <surname>Mandl</surname>
                  <email>mandl@uni-hildesheim.de</email>
                  <idno type="gnd">138432600</idno>
                  <idno type="orcid">0000-0002-8398-9699</idno>
                  <affiliation>Universität Hildesheim, Institut für Informationswissenschaft &amp;
                     Sprachtechnologie</affiliation>
               </persName>
            </respStmt>
            <idno type="issn">2510-1366</idno>
            <idno type="ppn">1930709293</idno>
            <idno type="doi">10.17175/sb008</idno>
            <idno type="url">https://www.zfdg.de/sonderband/8</idno>
            <biblScope unit="specialvolume">8</biblScope>
            <biblScope unit="article">4</biblScope>
         </seriesStmt>
         <sourceDesc>
            <p>Born digital: no previous source exists.</p>
         </sourceDesc>
      </fileDesc>
      <encodingDesc>
         <editorialDecl>
            <p>Letzte Überprüfung aller Verweise: <date when="2026-03-25">25.03.2026</date>
            </p>
         </editorialDecl>
         <schemaRef url="https://zfdg.de/sites/default/files/medien/zfdg.odd"/>
      </encodingDesc>
      <profileDesc>
         <textClass>
            <keywords n="Beitragstyp">
               <term>Projektvorstellung</term>
            </keywords>
            <keywords n="GND">
               <term ref="https://d-nb.info/gnd/4011119-2">Datenbank</term>
               <term ref="https://d-nb.info/gnd/7503866-3">Frühe Neuzeit</term>
               <term ref="https://d-nb.info/gnd/4138803-3">Kunstgeschichte</term>
               <term ref="https://d-nb.info/gnd/4193754-5">Maschinelles Lernen</term>
               <term ref="https://d-nb.info/gnd/4830853-5">Multimodales System</term>
               <term ref="https://d-nb.info/gnd/4043886-7">Ornament</term>
               <term ref="https://d-nb.info/gnd/4180694-3">Segmentierung</term>
            </keywords>
         </textClass>
      </profileDesc>
   </teiHeader>
   <text xml:lang="de">
      <front>

         <div type="abstract" xml:lang="de">
            <p>Versteht man das Bemühen um die Kategorie der Ähnlichkeit als kunsthistorische
               Aufgabe, stößt man bei der ornamentalen Form des Rokokos auf ein Paradox: Einerseits
               scheint die Rocaille das Prinzip der Ähnlichkeit zu verkörpern, da sie etwa die
               Stofflichkeit von Muscheln oder Rinde aufgreifen kann. Andererseits fällt es extrem
               schwer, die enorm wandelbaren Rocaille-Kompositionen untereinander zu vergleichen.
               Unser Projekt widmet sich diesem Problem mittels Analysen von Augsburger
               Druckgrafiken des 18. Jahrhunderts. Über Verfahren des Deep Learning werden
               annotierte Klassen des Ornaments in neuronalen Netzen trainiert. Ziel des Projekts
               ist eine Anwendung, die via Bild- oder Texteingabe durch ein Vision-Language-Model
               Ähnlichkeitsvorschläge generiert.</p>
         </div>

         <div type="abstract" xml:lang="en">
            <p>If one understands the category of similarity as an art historical task, a paradox
               arises in ornamental forms of Rococo: On one hand, the Rocaille seems to embody the
               principle of similarity, by mimicing for example the texture of shells or bark. On
               the other hand, it is very difficult to compare the highly variable Rocaille
               compositions with each other. Our project focuses on this problem through the
               analysis of Augsburg prints from the 18th century. Using deep learning techniques,
               annotated classes of ornaments are trained in neural networks. The goal of the
               project is an application that generates similarity suggestions via image or text
               input through a vision-language model.</p>
         </div>
      </front>
      <body>
         <div type="chapter">
            <head>1. Befragungen der Rocailles in der Augsburger Druckgrafik des 18.
               Jahrhunderts</head>
            <p><quote type="grosszitat">Ist es denn also nöthig, eine Sache mit lauter
                  Hirngespinsten zu verzieren, mit Dingen, die in der Welt nicht zu finden sind,
                  oder die sich nicht schicken? Und da ein jeder Verständiger, der da fraget, was es
                  denn eigentlich vorstellen soll, sich mit der Antwort begnügen muß: es sey
                  Roccaille, Grotesque, Arabesque, a la Chinoise, oder en gout barroque: kurz um, es
                  sey so Mode!</quote><note type="footnote">
                  <ref type="bibliography" target="#krubsacius_gedanken_1759">Krubsacius 1759</ref>,
                  S.&#160;35. Die Ergebnisse dieses Beitrages sind aus einem laufenden
                  Forschungsprojekt an der Universität Bremen und der Universität Regensburg
                  erwachsen, Projektleitung Julian Jachmann (Universität Regensburg,
                  Kunstgeschichte) und Gabriel Zachmann (Universität Bremen, Computer Vision),
                  Wissenschaftliche Mitarbeiter*innen: Ines Röckl (Universität Regensburg,
                  Kunstgeschichte), Thomas Hudcovic (Universität Bremen, Computer Vision): Gefördert
                  durch die Deutsche Forschungsgemeinschaft (DFG)&#160;– Projektnummer 461631274,
                  Geschäftszeichen JA 1976/2-1. Projekt und Datenbank: <ref
                     target="https://rocaille-ornament.de/">https://rocaille-ornament.de/</ref>
               </note>
            </p>
            <p>Die harsche Kritik, die Friedrich August Krubsacius 1759 verlauten ließ, adressiert
               die Ornamentform der Rocaille<note type="footnote"> Zum Begriff Rocaille vgl. <ref
                     type="bibliography" target="#irmscher_style_2009">Irmscher 2009</ref>,
                  S.&#160;340.</note>, die im 18. Jahrhundert im Medium der Druckgrafik von
               Frankreich ihren Weg nach Augsburg fand und sich formal aus der französischen
               Regencé-Groteske entwickelt hat.<note type="footnote"> Vgl. <ref type="bibliography"
                     target="#bauer_rocaille_1962">Bauer 1962</ref>, S.&#160;3–11; <ref
                     type="bibliography" target="#augustyn_buchillustration_1997">Augustyn
                     1997</ref>, S.&#160;789–794; <ref type="bibliography"
                     target="#irmscher_style_2009">Irmscher 2009</ref>, S.&#160;343–346.</note> In
               der Reichsstadt Augsburg wurde das Ornament ebenfalls im Druck zunächst kopiert und
               anschließend rezipiert, aber auch in zahlreichen Materialien wie Stuck, Porzellan,
               Holz oder Beschlagwerk umgesetzt. Die Augsburger Blätter wurden im 18. Jahrhundert so
               zum Schauplatz der Rocaille und es entstanden zwischen 1737<note type="footnote">
                  Exemplarisch ist die Rocaille in der Augsburger Druckgrafik um 1736 bei Gottfried
                  Bernhard Göz nachweisbar (vgl. <ref type="bibliography"
                     target="#wildmoser_gottfried_1985">Wildmoser 1985</ref>,
                  S.&#160;316–319).</note> und 1770 tausende an zumeist undatierten Drucken, die in
               Serien von meist vier bis zwölf organisiert waren.<note type="footnote"> Zum
                  Druckzentrum Augsburger vgl. <ref type="bibliography"
                     target="#gier_janota_hg_buchdruck_1997">Gier&#160;/ Janota (Hg.) 1997</ref>;
                     <ref type="bibliography" target="#paas_hg_augsburg_2001">Paas (Hg.) 2001</ref>;
                     <ref type="bibliography" target="#paas_et_al_hg_augsburg_2013">Paas et&#160;al.
                     (Hg.) 2013</ref>.</note>
            </p>
            <p>Diffamierende Schriften wie von Krubsacius spiegeln demzufolge nicht nur den Zeitgeist des anklingenden Klassizismus,<note type="footnote"> Vgl. <ref type="bibliography" target="#bauer_rocaille_1962">Bauer 1962</ref>, S.&#160;41–47, 63–69; <ref type="bibliography" target="#irmscher_style_2009">Irmscher 2009</ref>, S.&#160;410–411.</note> sondern liefern neben der Bewertung auch eine zeitgenössische Beschreibung,<note type="footnote"> Es ist bereits von Herrmann Bauer angemerkt worden, dass es <quote>keine gleichzeitige Theorie des Rocaille-Ornaments</quote> (<ref type="bibliography" target="#bauer_rocaille_1962">Bauer 1962</ref>, S.&#160;41) gibt. Weiter vermerkt er: <quote>Interessant ist, daß [sic] in diesem Bereich all die Phänomene, wie sie hier [=&#160;Bauers Publikation <title>Rocaille. Zur Herkunft und zum Wesen eines Ornament-Motivs</title>] analysiert wurden, schon gesehen und mit großem Ekel, auch in bornierter edler Einfalt registriert wurden</quote> (<ref type="bibliography" target="#bauer_rocaille_1962">Bauer 1962</ref>, S.&#160;41).</note> die Rückschlüsse auf die Charakterisierung der Ornamentform gibt: Wenn die Rocaille aus <quote>Dingen [bestünde], die in der Welt nicht zu finden sind, oder die sich nicht schicken</quote><note type="footnote"><ref type="bibliography" target="#krubsacius_gedanken_1759">Krubsacius 1759</ref>, S.&#160;35.</note>, ist von freien und fantastischen Formationen die Rede, die zwischen Natur und Kunst<note type="footnote"> Vgl. <ref type="bibliography" target="#irmscher_style_2009">Irmscher 2009</ref>, S.&#160;339–340.</note> zu verorten sind und dem vernunftgetriebenen und naturverständigen Klassizisten nur negativ aufstoßen können. Auf Quellen wie die von Krubsacius bezugnehmend, lassen sich in der Rocaille-Forschung des 20. und 21. Jahrhunderts<note type="footnote"> Neben <ref type="bibliography" target="#bauer_rocaille_1962">Bauer 1962</ref> und <ref type="bibliography" target="#irmscher_style_2009">Irmscher 2009</ref> sind monografische Publikationen zu einzelnen Protagonist*innen zu nennen. Zu Franz Xaver Habermann: <ref type="bibliography" target="#krull_franz_1977">Krull 1977</ref>; zu Gottfried Bernhard Göz: <ref type="bibliography" target="#isphording_gottfried_1982">Isphording 1982</ref>; <ref type="bibliography" target="#isphording_gottfried_1984">Isphording 1984</ref>; <ref type="bibliography" target="#wildmoser_gottfried_1984">Wildmoser 1984</ref>; <ref type="bibliography" target="#wildmoser_gottfried_1985">Wildmoser 1985</ref>; zu Johann Esaias Nilson: <ref type="bibliography" target="#helke_johann_2005">Helke 2005</ref>.</note> neben dem Changieren
               zwischen Natur und Kunst eine Vielzahl von Eigenschaften ablesen, deren Ausprägungen sich jedoch je nach Künstler*in und Technik sehr verschieden gestalten.</p>
            <p>Als wesentlich für die Zielsetzung der Ähnlichkeit im Kontext von Morphologien, gilt
               das Moment des Proteischen.<note type="footnote"> Aus der proteischen Qualität lassen
                  sich die Bildwertigkeit und die Eigenplastizität ableiten, die als zentrale
                  Eigenschaften in der Sekundärliteratur zur Rocaille Eingang gefunden haben (vgl.
                     <ref type="bibliography" target="#irmscher_style_2009">Irmscher 2009</ref>,
                  S.&#160;339–340).</note> So stellt sich die Rocaille als überaus wandelbar dar und
               kann verschiedene Materialien und Formen adaptieren.<note type="footnote"> Zudem wird
                  von Irmscher die <quote>mögliche Asymmetrie (contraste)</quote> (<ref
                     type="bibliography" target="#irmscher_style_2009">Irmscher 2009</ref>,
                  S.&#160;339–340) angefügt. Zusätzlich ist die mikromegalische Struktur für die
                  Rocaille charakteristisch, mit der irrational proportionale Größenverhältnisse
                  beschrieben werden können (vgl. <ref type="bibliography"
                     target="#bauer_rocaille_1962">Bauer 1962</ref>, S.&#160;20–21).</note> Wie ein
                  <quote>alchemistischer Tiegel</quote><note type="footnote">
                  <ref type="bibliography" target="#irmscher_style_2009">Irmscher 2009</ref>,
                  S.&#160;339.</note> werden so Ähnlichkeitsbeziehung zu Naturformen virulent, wie
               etwa Assoziationen zu Schaum, Wasser, Muschel, Fels, Erde, Feder, Fledermausflügel
               oder Rinde.<note type="footnote"> Die Vielseitigkeit der Materialassoziationen schlagen sich auch in der Kritik Krubsacius’ nieder, so beschreibt er die Rocaille als <quote>Mischmasch</quote> verschiedener Dinge, wie <quote>[z]erbrochenen Muscheln, Lappen</quote> oder <quote>Federn</quote> (<ref type="bibliography" target="#krubsacius_gedanken_1759">Krubsacius 1759</ref>, S.&#160;36).</note>
               Gleichzeitig erschwert diese Wandelbarkeit die Vergleichbarkeit der verschiedenen
               Form-Ausprägungen untereinander, was sich nicht zuletzt als ekphrastisches Problem
               entpuppt. Während auf mikromorphologischer Ebene die Formen und Beschaffenheiten der
               Rocaille personalstilistische Ausprägungen abbilden können, ist für das Meta-Gerüst
               der Rocaille eine Struktur in <quote>c-, seltener s-förmige Volutenspange[n]</quote><note type="footnote">
                  <ref type="bibliography" target="#irmscher_ornament_2005">Irmscher 2005</ref>,
                  S.&#160;141.</note> ausschlaggebend. Dieses Volutenspangengerüst kann zwar&#160;–
               im proteischen Sinne&#160;– rocaillisiert<note type="footnote"> Vgl. <ref
                     type="bibliography" target="#irmscher_style_2009">Irmscher 2009</ref>,
                  S.&#160;340.</note> auftreten, ermöglicht jedoch die Vergleichbarkeit
               verschiedenster Rocaille-Formen. Ebenso können die <quote>konvexe[n] Seiten</quote><note type="footnote">
                  <ref type="bibliography" target="#irmscher_ornament_2005">Irmscher 2005</ref>,
                  S.&#160;141.</note> im weitesten Sinne als Kämme beschrieben werden, die nicht
               zwingend muschelartig ausfallen müssen.<note type="footnote"> Weiter nennt er neben dem Muschelrand <quote>phantastische Palmetten, Fledermausflügel, gereihte Godronen und ähnliche kammartig-bizarre Bildungen</quote> (<ref type="bibliography" target="#irmscher_ornament_2005">Irmscher 2005</ref>, S.&#160;141).</note>
            </p>
            <p>Die Klassifizierung in Volutenspange und Kamm erlaubt verschiedene kunsthistorische
               Befragungen: Ab wann kann von einer Ähnlichkeit hinsichtlich der Gesamtkomposition
               gesprochen werden? Wie verhält es sich mit Übereinstimmungen, die lediglich in Teilen
               erfolgt? Wie lassen sich stilistische, materielle oder zeitliche Entwicklungen durch
               den Vergleich ablesen? Mittels Verfahren der <term type="dh">Computer Vision</term>
               wird sich diesen Fragestellungen angenähert. Gleichzeitig ergeben sich auf Seiten der
                  <hi rend="italic">Computer Vision</hi> ebenso relevante Problemstellungen, etwa
               das Training von Encoder-Decoder-Netzen auf einem winzigen Datensatz mit
               Grauwertbildern, was Farbinformationen als zusätzlich diskriminierende Faktoren
               ausschließt. Hinzu kommt das Problem der nicht eindeutig identifizierbaren
               Segmentierungselemente, da die Umgebung, in der ein Element eingebettet ist, bei der
               Klassifizierung eine Rolle spielt. Die Segmentierungsobjekte sind also nicht
               ›semantisch invariant‹. Ein weiteres Problem auf Pixelebene ist der nicht-balancierte
               Datensatz, der den Netzen ein Bias (›es ist wahrscheinlicher, dass es keine Rocaille
               ist, da es nicht viele gibt‹) antrainieren würde. Das zentrale Anliegen ist jedoch
               die Untersuchung zwischen der visuellen Morphologie im Bildraum einzelner Rocaille
               oder Rocaille-Primitive und der von den Netzen gelernten internen
               Wissensrepräsentation im sogenannten <term type="dh">Latent Space</term>
               <hi rend="italic">.</hi> Genauer stellt sich die Frage, ob sich Mannigfaltigkeiten
               oder Submannigfaltigkeiten im Latent Space identifizieren lassen, die Rocailles bzw.
               Rocaille-Primitive im Bild beschreiben können, und ob es gegebenenfalls Isomorphismen
               zwischen verschiedenen (Sub-)Mannigfaltigkeiten gibt.</p>
            <p>Diese Fragestellungen schränken die Vorgehensweise ein: Zwecks der Untersuchung der
               morphologischen Ähnlichkeiten zwischen Rocaille bzw. Rocaille-Primitiven können
               komplexere Netzarchitekturen nicht verwendet werden, um die Interpretierbarkeit der
               intern aufgebauten Wissensrepräsentation im <hi rend="italic">Latent Space</hi>
               möglichst einfach zu halten.</p>
         </div>
         <div type="chapter">
            <head>2. Projektbeschreibung, Digitalisate und Metadaten</head>
            <p>Diesen Fragen widmet sich seit April 2022 das DFG-Projekt ›Digitale Morphologie der
               Ornamentik&#160;– Entwicklung von Verfahren an der Schnittstelle zwischen
               Kunstgeschichte und Computer Vision zur Analyse, Modellierung und Recherche von
               Ornamentformen am Beispiel der Augsburger Rocaille-Drucke des 18. Jhs.‹, das an der
               Universität Bremen (Gabriel Zachmann, Thomas Hudcovic) und der Universität Regensburg
               (Julian Jachmann, Ines Röckl) angesiedelt ist. Im Projekt werden mit Hilfe von
               Verfahren der Computer Vision, Künstlichen Intelligenz und neuronaler Netze
               Rocaille-Formen in Kompositionen identifizierbar gemacht, die zuvor manuell annotiert
               wurden. Zielsetzung des Projekts ist eine digital zugängliche Datenbank, die neben
               den üblichen Kategorisierungen nach kunsthistorischen Eckdaten eine Befragung
               hinsichtlich Bildähnlichkeit ermöglicht. Bezüglich der erforschten Morphologien
               können interessierte Nutzer*innen und Forscher*innen eigene Bilder von
               Rocaille&#160;– in Grafik aber auch anderen materiellen und medialen Umsetzungen, wie
               etwa Holz, Porzellan, Beschlagwerk oder Stuck&#160;– in der Suchmaschine uploaden,
               woraufhin eine Auswahl an ähnlichen Augsburger Rocaille-Drucken vorgeschlagen wird.
               Dies adressiert das bereits angesprochene Desiderat bezüglich Kategorisierung und
               Beschreibung der Rocaille.</p>
            <p>Als Datenkorpus dienen Digitalisate ornamentaler Druckgrafiken&#160;– vornehmlich
               Radierungen&#160;– die den Augsburger Rocaille-Drucken zugeordnet werden.<note
                  type="footnote"> Die Digitalisierung der Drucke erfolgte bereits im Kontext des
                  DFG-Projekts ›Augsburger Architektur- und Ornamentstichwerke. Der Anteil der
                  Kunsthandlungen an der Formierung und Verbreitung ästhetischer Modelle während des
                  18. Jahrhunderts‹ (Prof. Dr. Katharina Krause, Förderzeitraum: 2005–2010,
                  Projektnummer 19185709).</note> Zu jedem Digitalisat wurde ein Meta-Datensatz
               erstellt, der über die folgenden Kategorisierungen inklusive recherchierter Inhalte
               verfügt: ID-Nummer, Titel, Nummerierung in Folge, Zeichner*in&#160;/ Entwerfer*in,
               Stecher*in, Verleger*in, Anmerkungen, Bestand, Literatur, Digitales Bild. Durch diese
               sowohl visuelle wie auch textuelle Herangehensweise, soll auf Basis eines
               Vision-Language-Models die Vergleichbarkeit und somit die Befragung nach
               Ähnlichkeiten untereinander ermöglicht werden.</p>
         </div>
         <div type="chapter">
            <head>3. Druckgrafik und Datenkorpus: Von der Genese der Rocaille zur
               Segmentierung</head>
            <p>Der Datenkorpus besteht aus ca. 1.600 Digitalisaten, die aus verschiedenen Beständen
               in Deutschland zusammengetragen wurden. Alle Drucke sind in Augsburg im 18.
               Jahrhundert herausgegeben worden, zumeist undatiert sowie nicht coloriert und zeigen
               Rocaille-Ornament. So wie Technik und Farbe einheitlich im Datensatz auftreten, sind
               es die Kompositionen und Morphologien der Rocaille auf den ersten Blick keineswegs:
               Um eine Vorstellung über die historische Genese sowie die Struktur und Morphologie
               der Rocaille in der Druckgrafik zu bekommen, wird die Bandbreite und der
               Facettenreichtum des Datenkorpus vorgestellt. Dies ist nicht zuletzt deshalb zentral,
               da in der Annotation eine möglichst breite Streuung des Datensatzes hinsichtlich
               Autorschaft und Gattung forciert wurde, um die formale Breite des Datensatzes zu
               berücksichtigen.</p>
            <p>Für die zunächst in Frankreich entwickelte Form der Rocaille und deren Verbreitung im
               18. Jahrhundert ist das Medium der Druckgrafik seit den Anfängen von zentraler
               Bedeutung. Auch wenn die Rocaille als Namensgeberin des Rokokos gilt, sind einige
               Entwicklungsstränge zu ihrer formalen Herausbildung nicht abschließend geklärt.
               Einigkeit in der Forschung herrscht jedoch bezüglich der zentralen Rolle des
               Goldschmieds und königlichen Hofkünstler Juste-Auréle Meissonniers, der die Form in
               jenem Medium erstmals populär machte. Als Ornamentbegriff lässt sich der Terminus zum
               ersten Mal bei einer Anzeige zu Meissonniers <title>Livre d’ornemens</title> in der
               März-Ausgabe des <title>Mercure de France</title> von 1734 nachweisen.<note
                  type="footnote"> Vgl. <ref type="bibliography" target="#irmscher_style_2009"
                     >Irmscher 2009</ref>, S.&#160;340, 346–347. Vgl. weiter: <ref
                     type="bibliography" target="#bauer_rocaille_1962">Bauer 1962</ref>,
                  S.&#160;18–19.</note> Doch nicht nur begrifflich, auch formal weisen Meissonniers
               Entwürfe, die kurz vor 1730 entstanden sind, Tendenzen auf, die sich von der
               vorherigen Tradition der Regencé-Groteske mit vorwiegend Laub- und Bandelwerk
               absetzt. Während Meissonniers Werk gemeinsam mit den Entwicklungen bei Jacques de
               Lajoue und Nicolas Pineau als wegbereitend für die Rocaille gilt,<note
                  type="footnote"> Vgl. <ref type="bibliography" target="#irmscher_style_2009"
                     >Irmscher 2009</ref>, S.&#160;346. Vgl. auch zur Entstehung des Rokokos: <ref
                     type="bibliography" target="#kimball_creation_1980">Kimball 1980 [1943]</ref>,
                  S.&#160;152–174.</note> sind es vor allem Künstler wie Antoine Watteau, Claude
               Gillot, Claude III Audran, Nicolas Pineaus, Jean Mondon, Jacques de Lajoue, Pierre
               Edme Babel und François Boucher, deren Drucke in Augsburg kopiert wurden.<note
                  type="footnote"> Vgl. <ref type="bibliography" target="#irmscher_style_2009"
                     >Irmscher 2009</ref>, S.&#160;357–358.</note> Eine wesentliche Rolle kam in
               Augsburg den Verleger*innen zu, die teils auch selbst entwarfen oder stachen und als
               Kunstverlage auftraten. Persönliche Kontakte und Handelsbeziehungen waren dabei
               sowohl beim Import französischer Blätter wie auch beim Export der Augsburger Drucke
                  zentral.<note type="footnote"> Vgl. <ref type="bibliography"
                     target="#irmscher_style_2009">Irmscher 2009</ref>, S.&#160;357.</note> Die in
               Augsburg nachgestochenen Drucke wurden zumeist spiegelverkehrt umgesetzt sowie in der
               Beischrift und im Privileg verändert.<note type="footnote"> Zu den Verbreitungswegen
                  und möglichen Übernahmen gibt es bereits einzelne Forschungen. Jedoch hofft das
                  Projekt genau hier als ein Recherchetool anzusetzen, um Übernahmen von
                  ornamentalen Entwürfen nachverfolgen zu können. Studien zur Verbreitung und
                  Übernahmen von Rocaille, v. a. im Kontext von Augsburg u.&#160;a.: <ref
                     type="bibliography" target="#mandroux-frança_information-artistique_1973"
                     >Mandroux-França 1973</ref>, S.&#160;342–445; <ref type="bibliography"
                     target="#seeger_maria_2014">Seeger 2014</ref>, S.&#160;285–294; <ref
                     type="bibliography" target="#krause_theorie_2015">Krause 2015</ref>,
                  S.&#160;185–199.</note> Ein Beispiel für einen in Augsburg kopierten französischen
               Entwurf zeigt die figurativ angereicherte allegorische Szenerie (vgl. <ref type="graphic"
                  target="#rocaillen_001">Abbildung 1</ref>).</p>
            <figure>
               <graphic xml:id="rocaillen_001" url="Medien/rocaillen_001.jpg">
                  <desc>
                     <ref type="intern" target="#abb1">Abb.&#160;1</ref>: ›L’Amour Couronne.&#160;/
                     Der gekrönte Cupido‹. Sechstes Blatt einer Folge von sieben Blättern, entworfen
                     von Jean Mondon, herausgegeben bei Johann Georg Merz in Augsburg. [Fotografie: Staats- und
                     Stadtbibliothek Augsburg, Graph Merz, J.G. 41]</desc>
               </graphic>
            </figure>
            <p>Das Blatt erschien unter der Verlagsnummer 10 bei I. G. Merz (=&#160;Johann Georg
               Merz) in Augsburg und ist ein Entwurf nach Jean Mondon, der zuvor in Frankreich unter
               der Verlagsnummer C erschienen ist.<note type="footnote">Ein gründlicher Abgleich des Französischen und Augsburger Drucks kann hier nicht erfolgen. Abweichungen sind jedoch vor allem in Nummerierung, Beischrift und Anordnung der Blätter zu konstatieren. Vgl. Digitalisat <ref target="https://gallica.bnf.fr/ark:/12148/btv1b53180867m/f1.item.r=Mondon,%20François-Thomas">gallica.bnf.fr</ref>. Letzter Zugriff: 17.06.2024.  Vgl. <ref type="bibliography" target="#schmitz_katalog_1939">Schmitz 1939</ref>, Nr. 403.</note> Obwohl hier keine spiegelverkehrte
               Umsetzung vorliegt, wurden neben den Nummerierungen die Beischriften angepasst; so
               ist der Titel zweisprachig angegeben. Die bildliche Übereinstimmung ist eindeutig,
               jedoch besticht im direkten Vergleich die französische Ausführung in ihrer
               zeichnerischen Qualität. Inhaltlich wird der Sieg Cupidos verhandelt, der durch zwei
               Putti dargestellt wird.<note type="footnote"> Ggf. handelt es sich bei dem zweiten
                  Putto um Psyche. Diese Vermutung stützt sich auf die Geschichte von Amor und
                  Psyche in den <title>Metamorphosen</title> des Apuleius (vgl. <ref type="bibliography" target="#brandt_ehlers_hg_apuleius_2012">Apul. met.</ref>
                  4,28–6,24).</note> Die Figuren sind mit einem Köcher mit Pfeil und Bogen
               ausgestattet sowie mit einem (Lorbeer-)Kranz. Ob es sich bei der Szenerie um eine
               Krönung oder ein sanftes Ringen um die Krone handelt, wird durch die deutsche
               Bildunterschrift ausgedeutet: <quote>Der gekrönte Cupido.</quote> Dies würde
               bedeuten, dass der Moment hier die Krönung des vorderen Puttos zeigt, jedoch lässt
               das Wortspiel im französischen auch die reflexive Interpretation zu, was eine
               Selbst-Krönung nicht ausschließt und so die beiden Putti im zweiten Moment zu
               Kontrahent*innen macht. Drapiert sind die Putti auf einer Wolke, die auf einem
               Volutenaufbau liegt: Dieser schält sich unangekündigt aus der Erde und erschließt
               sich durch proportional große C&#x200D;- und S-&#x200D;Schwünge von rechts unten nach links oben und
               nimmt so einen Großteil des Bildraums ein. Begleitet werden die teils aus
               Volutenbündeln bestehenden Schwünge von muschelartigen Kämmen, die dem Volutenschwung
               folgen und konzentrisch zu diesen angeordnet sind. In ähnlicher Logik entstehen so
               kleine Rocaille-Kartuschen, die additiv unterhalb der Wolke (mit einem Herz) und
               links unterhalb eines weiteren Bildfelds angebracht sind. Rechts unterhalb des
               hinteren Puttos, lassen sich auch noch architektonische Elemente ausmachen. Hinzu
               kommen neben der Rocaille aus Voluten und Kämmen, Akanthus und Blumenranken.
               Akanthushäubchen bekrönen die Volutenköpfe, was vor allem am oberen linken Bildrand
               deutlich wird. Hier formieren sich die Volutenbündel zu einem angeschnittenen
               Bildfeld&#160;– einer halben Kartusche&#160;– die ihren unteren Abschluss in einem
               palmettenähnlichen gedrehten Muschel-Blatt findet. Innerhalb der Kartusche zeigt sich
               lediglich skizzenhaft eine Szenerie. Hier könnte es sich analog zu Apuleius
               Geschichte aus den <title>Metamorphosen</title> um die Schlüsselszene aus der
               Verfolgung von Apoll und Daphne bei Ovid handeln.<note type="footnote">Vgl. <ref type="bibliography" target="#von_albrecht_hg_publius_2013">Ov. met.</ref>
                  1,452–567.</note> Diese Narration wird in dem Blatt als skizzenhafte Nebenszene am
               Bildrand angeordnet. Zwar lenken die Volutenstränge zum Bildfeld oben links, jedoch
               liegt der Fokus auf den eigentlichen Nebenfiguren: Putti wie Ornament rücken in den
               Fokus der Handlung. Dies zeigt sich nicht zuletzt in dem Rocaille-Aufbau, der den
               Großteil des Blattes einnimmt und beide amourösen mythologischen Geschichten
               verbindet. Die Rocaille erscheint bildwertig und bildet sich eigenplastisch
               aus&#160;– beides Eigenschaften, die in dem proteischen Charakter begründet sind<note
                  type="footnote"> Vgl. <ref type="bibliography" target="#irmscher_style_2009"
                     >Irmscher 2009</ref>, S.&#160;339–340.</note>&#160;– und durch die metamorphen
               Szenerien selbstreferentiell ihren wandelbaren Charakter aufzeigen. Gegliedert wird
               die Narration durch die dominierenden Volutenspangen. So wird die angedeutete
               Szenerie in der Kartusche oben links zum Beiwerk anstatt als Hauptszene aufzutreten.
               Die Putti, die sonst häufig als szenisches Echo der Hauptnarration wirken, werden in
               ihrer frivolen Art mit dem im Bild vorherrschenden Hell-Dunkel-Kontrast
               hervorgehoben. Dies wird zusätzlich durch den fast leeren Himmel rechts oben mit
               leichten Wolkenschwaden betont. Das Beispiel Mondons deckt mit der
               allegorisch-mythologischen Szenerie in einem Rocaille-Aufbau bereits eine Sparte der
               im Ornamentdruck verhandelten Thematik ab und macht die Verdichtung von Ornament und
               Narration deutlich.<note type="footnote"> Zum Verhältnis zwischen Ornament und
                  Zeitlichkeit vgl. <ref type="bibliography" target="#leonhard_ornament_2011"
                     >Leonhard 2011</ref>, S.&#160;63–85.</note>
            </p>
            <p>Neben den capricciosen Aufbauten zeigen eine Vielzahl der Blätter isolierte
               Kartuschen und Schilde. Ergänzend muss neben der kunstgewerblichen Sparte, die in
               Augsburg im 18. Jahrhundert zusammen mit der Druckgrafik florierte, noch auf die
               geistlichen Themen in den Drucken hingewiesen werden.<note type="footnote">Vgl. <ref
                     type="bibliography" target="#augustyn_buchillustration_1997">Augustyn
                     1997</ref>, S.&#160;791.</note> In der bikonfessionellen Handelsmetropole<note
                  type="footnote"> Vgl. <ref type="bibliography" target="#irmscher_style_2009"
                     >Irmscher 2009</ref>, S.&#160;357.</note> wurden christliche Themen etwa vom
               Verlag der katholischen Gebrüder Klauber herausgegeben.<note type="footnote"> Vgl.
                     <ref type="bibliography" target="#augustyn_buchillustration_1997">Augustyn
                     1997</ref>, S.&#160;820–830.</note> Besondere Popularität erfuhr auch das Werk
               des protestantischen Entwerfers, Stechers und Verlegers Johann Esaias Nilson. In den
               zumeist gesellschaftlichen Darstellungen in Kombination mit Versen treten
               morphologisch eher erd- oder rindenähnliche<note type="footnote"> Vgl. <ref
                     type="bibliography" target="#bauer_rocaille_1962">Bauer 1962</ref>,
                  S.&#160;52–57; <ref type="bibliography" target="#helke_johann_2005">Helke
                     2005</ref>, S.&#160;155; <ref type="bibliography" target="#irmscher_style_2009"
                        >Irmscher 2009</ref>, u.&#160;a. S.&#160;339, 359–360.</note> Rocaille-Formen
               auf.</p>
            <p>Bei den verschiedenen (personal-)stilistischen Ausprägungen<note type="footnote">
                  Auffällig sind bei Franz Xaver Habermann die Durchgitterung der Kämme bzw. die
                  geperlten Kämme (vgl. <ref type="graphic" target="#rocaillen_002">Abbildung 2</ref>;
                  vgl. <ref type="bibliography" target="#krull_franz_1977">Krull 1977</ref>,
                  S.&#160;21–22, 46, 49). Bei Gottfried Bernhard Göz finden sich etwa lose Kämme,
                  die ohne Volute existieren, wie etwa in der Folge <title>Die Schrecken des
                     Krieges</title> (vgl. <ref type="bibliography" target="#isphording_gottfried_1982">Isphording 1982</ref>, S.&#160;47–48, 249–251; <ref type="bibliography" target="#wildmoser_gottfried_1985">Wildmoser
                     1985</ref>, S.&#160;186–189. Siehe exemplarisch <ref target="https://collections.vam.ac.uk/item/O600101/heraclytus-engraving-gottfried-bernhard-göz/?carousel-image=2012FJ7894">collections.vam.ac.uk</ref>. Letzter Zugriff: 17.06.2024.)</note> und Themen finden sich als kontinuierlichste
               Kategorisierung die C&#x200D;- und S-&#x200D;Volutenspangen mit den Kämmen. Auch wenn die Ausprägung
               der Voluten und Kämme je nach Blatt unterschiedlich ausfällt und im Projekt bereits
               über weitere Klassifizierungen nachgedacht wird, ermöglicht dieser erste Zugriff eine
               breite Vergleichbarkeit der Rocaille, die über das Medium der Druckgrafik
               hinausgeht.</p>
            <p>Um diese Zielsetzung an der Schnittstelle zur Computer Vision zu erreichen, werden
               die Kategorisierungen der Rocaille als pixelweise Klassifizierungen pro Bild (Labels)
               annotiert. Diese bilden die Ground Truth, mit denen sich die neuronalen Netze während
               des Trainingsprozesses evaluieren lassen. Das Training von neuronalen Netzen ist
               mathematisch gefasst ein Optimierungsprozess, bei dem ein Netz das Optimierungsobjekt
               darstellt, das letztendlich einer Funktion angenähert werden soll, die ein bestimmtes
               Problem löst, wie z.&#160;B. das Klassifizieren von Pixeln in Bildern. Die Ground
               Truth-Daten dienen zusammen mit dem Output des Netzes als Argumente für die
               Kostenfunktion (Loss-Funktion), die abhängig vom Trainingsziel ist, die die
               derzeitige Qualität des Netzoutputs evaluiert, d.&#160;h. eine ›Distanz‹ formuliert
               zwischen dem Sollwert (Ground Truth) und dem Istwert (Netzoutput). Die
               Rocaille-Formen inklusive der jeweiligen Annotationen liegen als Trainingsdatensatz
               einem neuronalen Netz zugrunde, dessen Aufgabe die semantische Segmentierung der
               Rocaille-Kategorien innerhalb eines Bildes ist. Dieser Ansatz wird multimodal
               erweitert mit zusätzlichen Textbeschreibungen und räumlichen Informationen wie
               Bounding Boxes, die die Trainingsbasis für ein <term type="dh">Vision Language
                  Model</term> bilden. So können zusätzlich zu der visuellen Erkennung auch
               Textassoziationen und andere Metainformationen sowohl erhalten als auch als
               Nutzereingabe beziehungsweise Frage an das Modell gestellt werden. Das zentrale Ziel
               ist jedoch die Erfassung von Ähnlichkeiten zwischen Rocailles bzw. Rocaille-Elementen
               und eine sich daraus ableitende Morphologie dieser. Dabei soll der
               Ähnlichkeitsbegriff durch Erfassung von möglichen Mannigfaltigkeiten oder ähnlich
               greifbaren Features in der von den neuronalen Netzen erlernten Wissensrepräsentation
               abgeleitet werden.</p>
         </div>
         <div type="chapter">
            <head>4. Morphologie der Rocaille: Volutenspangen und Kämme als Klassen im
               Labeling</head>
            <p>Die Identifizierung der Volutenspangen und Kämme soll anhand eines prototypischen
               Blatts aus einer Folge von vier Blättern von Franz Xaver Habermann herausgearbeitet
               werden (vgl. <ref type="graphic" target="#rocaillen_002">Abbildung 2</ref>).<note
                  type="footnote"> Vgl. u.&#160;a. <ref type="bibliography"
                     target="#schmitz_katalog_1939">Schmitz 1939</ref>, Nr. 135.</note>
            </p>
            <figure>
               <graphic xml:id="rocaillen_002" url="Medien/rocaillen_002.jpg">
                  <desc>
                     <ref type="intern" target="#abb2">Abb.&#160;2</ref>: Rocaillekompositionen.
                     Zweites Blatt einer Folge von vier Blättern, entworfen von Franz Xaver
                     Habermann, herausgegeben von Johann Georg Hertel in Augsburg. [Fotografie: © Staatsgalerie
                     Stuttgart, Graphische Sammlung, alter Bestand]</desc>
               </graphic>
            </figure>
            <p>Die Folge zeigt isolierte Rocailleentwürfe mit je acht bis neun Rocaillekompositionen
               pro Blatt. Während das Betrachten der ganzen Folge Fragen nach Variation und
               Erfindungsreichtum in den Vordergrund rückt, dient die morphologische Analyse eines
               einzelnen Blatts der Identifizierung der Klassen. Als Grundgerüst der Rocaille bilden
               sich die C-&#x200D;Spangen im Blatt deutlich ab, vereinzelt finden die als C-&#x200D;Schwünge
               geformten Spangen ihr Ende in Palmwedelornamentik oder Muscheln. Teils bilden sich
               Volutenspangen als bandartige, gerollte oder tordierte Schwünge in ihrer Kontur mit
               Volutenköpfen aus, teils verschleifen diese mit den Kämmen oder sind überlagert. Auch
               an Stellen, wo die Volutenköpfe nicht direkt sichtbar sind und das Volutenband
               verdeckt ist, modelliert sich durch die Schwünge eine konvex-konkave Torsion.</p>
            <p>S-&#x200D;Spangen und -&#x200D;Schwünge entstehen im Blatt durch tangentiale Addition von
               abwechselnd gegeneinander verlaufenden C-&#x200D;Schwüngen. Dadurch wird eine longitudinale
               Grundstruktur ermöglicht, wie sie sich links unten parallel zum Druckplattenrand
               ergibt. Durch zueinander gerichtete C-&#x200D;Schwünge und -&#x200D;Spangen werden wiederum
               runde, kartuschenähnliche Formen erzeugt, wie etwa rechts oben. Teils geben
               geschwungene C-&#x200D;Spangen die gesamte Ausrichtung vor, was sich in der Komposition
               rechts unten nachvollziehen lässt. So lassen die Strukturen verschiedene Anwendungen
               und Funktionen denkbar werden: Das longitudinale Ornament ließe sich als eine
               Rahmenleiste umsetzen, während die Kartusche oben rechts z.&#160;B. als Eckstück
               einen Richtungswechsel einleiten könnte. Allgemein verlaufen die Kämme häufig im
               näheren Kontext zu den Schwüngen in konzentrischer Biegung.</p>
            <p>Neben der immer wieder auftretenden Palmwedelornamentik und Muscheln, die teils in
               die Schwünge übergehen oder sie überlagern, finden sich in dem Blatt auch
               Blumengirlanden, filigrane vegetabile Gehänge und Akanthus. Diese Ornamente
               ›kontaminieren‹ im Sinne der Rocaillisierung die Kämme: So treten die Kämme im Blatt
               teils mit Perlen auf, erscheinen muschelähnlich, erinnern an Akanthus, oder es bilden
               sich in spangenlosen Kämmen baumrindenähnliche Formen aus. Weiter lassen sie sich die
               Kämme in ihrer Textur als Kamm-Inneres sowie in ihrer Beschaffenheit an den
               Kamm-Rändern zu ihrer Kontur befragen. Dabei ergibt sich Textur durch die Schraffur,
               die sich durch die Technik der Radierung in das digitalisierte Büttenpapier
               übertragen hat. Kreuz- und Parallelschraffur können so Rhythmisierungen oder
               Pointierung in den Kämmen erzeugen. Die so generierten Kammrillen können weiter mit
               ungleichmäßigen Durchbrechungen, gleichmäßigen Durchgitterungen oder wie hier mit
               Perlen besetzt sein. Dies lässt sich sowohl beim Akanthus als auch in den
               muschelartigen Kämmen nachweisen.</p>
            <p>Diese&#160;– hier exemplarisch ausgeführte&#160;– Klassifizierung der Morphologie der
               Rocaille in dem Blatt dient als Grundvoraussetzung für das Labeling. Um einen
               idealtypischen Zugriff der oben ausführlich beschriebenen Rocailledefinition zu
               übersetzten, wurden von den ca. 1.600 digitalisierten schwarz-weiß Drucken 753
               ausgewählt die C&#x200D;- und S-&#x200D;Spangen und Kämme abbilden und dennoch die morphologische
               Varianz der Spangen und Kämme im gesamten Datensatz widerspiegeln. Ebenso
               verdeutlicht diese Auswahl die Bandbreite der Autorschaft, Themen und Gattungen. Für
               das Training wurde in einem ersten Schritt pixelgenau annotiert (119 images) und als
               Spangen die Volutenköpfe mit dem bandartig sich abzeichnenden S-bzw. C-Schwung
               markiert. Als problematisch gestalteten sich dabei vor allem die sehr kleine
               Datenmenge von gelabelten Blättern, die topologisch nicht eindeutigen
               Segmentierungsziele, da die Volutenspangen allein wenig Aussagekraft besitzen, sowie
               der unbalancierte Datensatz, zumal in jedem Blatt eine unterschiedliche Anzahl von
               Labels gesetzt wurde. Diese Probleme erschwerten das erfolgreiche Training des
               Netzes, weshalb das Netz einem Vortraining unterzogen wurde, für das die gesamten
               nicht-gelabelten Daten verwendet wurden, zuzüglich frühneuzeitlicher Drucke mit
               ornamentalen Schwüngen wie es im Roll- und Beschlagwerk oder dem Knorpelwerk
               vorkommt. Da das Netz eine <term type="dh">U-Net</term>-artige
               Encoder-Decoder-Architektur aufweist, bot es sich an, es als die <hi rend="italic"
                  >U-Net</hi>-Komponente im <term type="dh">Denoising Diffusion Probabilistic Model
                  (DDPM)</term><note type="footnote"> Vgl. <ref type="bibliography"
                     target="#ho_et_al_denoising_2020">Ho et&#160;al. 2020</ref>,
                  S.&#160;6840–6851.</note> einzusetzen. Ein DDPM ist ein generatives Modell,
               welches in der Lage ist, den Trainingsdaten ähnliche Samples zu erzeugen. In diesem
               Fall Bilder, die den Bildern im Datensatz visuell möglichst ähnlich sind. Durch das
               Vortraining baut sich das Netz bereits Vorwissen über visuelle Features auf; von der
               Schraffur bis hin zu Strukturen, wie z.&#160;B. Komponenten der Rocaille. Intuitiv
               gesehen dient das bereits aufgebaute Vorwissen dem Netz beim Training als
               Ausgangsbasis für das Lernen der eigentlichen Aufgabe, dabei werden effektiv weniger
               Trainingsdaten (Labels) benötigt. Mathematisch lässt sich das als ein Modell
               betrachten, bei dem die im Training zu lernenden Parameter bereits so initialisiert
               sind, dass sie schneller und stabiler konvergieren. Dennoch sind <term type="dh"
                  >False Negatives</term> und <term type="dh">False Positives</term> noch möglich.
               Um die problematischen Punkte noch weiter zu reduzieren, wurden daher in einem
               zweiten Schritt in einem Zug mit den Voluten zusätzlich auch die Kämme gelabelt (184
               images). Die C&#x200D;- und S-&#x200D;Schwünge wurden erweitert als das aufgefasst, was als klare,
               lineare Verbindung in den Blättern auftaucht. Für die Kämme ist wesentlich, dass sie
               in ihrer Textur konzentrisch dem Schwung folgen und eine geschlossene Kontur
               aufweisen. Auch wurden keine isolierten Kämme gelabelt, sondern lediglich die Kämme,
               die einer Volute zuzuordnen sind. In der <term type="dh">Semantic Segmentation</term>
               wurde mit diesen zwei Segmentierungsklassen gearbeitet. ›Volute‹ und ›Kamm‹ bilden
               die Rocaille als ›Metaklasse‹ ab und stehen bidirektional in Relation zueinander. Die
               Digitalisate wurden im Labelprozess jeweils in der Folge gelabelt, was in komplexen
               und verdichteten Blättern eine dreistellige Anzahl von Labels pro Blatt
               hervorbringt.</p>
         </div>
         <div type="chapter">
            <head>5. Die Rocaille als Wissensrepräsentation im neuronalen Netz</head>
            <p>Wie in <ref type="intern" target="#hd1">Abschnitt 1</ref> dargelegt, weist die
               Segmentierung von Rocaille-Elementen in den Augsburger Drucken mehrere signifikante
               Herausforderungen auf. Dadurch sind herkömmliche Machine-Learning-Methoden, wie
               z.&#160;B. <term type="dh">Random Forests</term>, sowie neuronale Netze wie <term
                  type="dh">DeepLabV3+</term><note type="footnote"> Vgl. <ref type="bibliography"
                     target="#chen_et_al_encoderdecoder_2018">Chen et&#160;al. 2018</ref>,
                  S.&#160;801–818.</note> oder auf Transformern basierende Segmentierungsnetze wie
                  <term type="dh">SETR</term><note type="footnote"> Vgl. <ref type="bibliography"
                     target="#zheng_et_al_rethinking_2021">Zheng et&#160;al. 2021</ref>,
                  S.&#160;6881–6890.</note> oder <term type="dh">Mask2Former</term><note type="footnote"> Vgl. <ref type="bibliography"
                     target="#cheng_et_al_maskedattention_2022">Cheng et&#160;al. 2022</ref>,
                  S.&#160;1290–1299.</note> ungeeignet. Diese fielen bereits wegen der hohen
               Komplexität der zu segmentierenden Elemente und der gleichzeitig geringen Datenmenge
               heraus.</p>
            <p>Gleichzeitig ist eine einfache Aneinanderkettung der grundlegendsten Basisblöcke
                  (<term type="dh">Multilayer Perceptrons</term>) aufgrund des Speicherbedarfs,
               bedingt durch die Parameteranzahl, ebenfalls nicht rentabel. Bereits die
               Entscheidung, das Problem als reine Segmentierungsaufgabe zu betrachten, stellt einen
               Kompromiss dar. Optimal wäre es, das Problem als <term type="dh">Instance
                  Segmentation</term> zu behandeln, bei der ein neuronales Netz nicht nur eine
               pixelweise Klassifizierung vornimmt, sondern jedem klassifizierten Pixel auch eine
               spezifische Instanz zuordnet. Hierfür wären Netzarchitekturen wie <term type="dh"
                  >Mask R-CNN</term><note type="footnote"> Vgl. <ref type="bibliography" target="#he_et_al_rcnn_2017">He
                     et&#160;al. 2017</ref>, S.&#160;2961–2969.</note> einsetzbar. Da jedoch
               Instance Segmentation eine schwierigere Aufgabenstellung als reine Segmentierung ist,
               stellt auch hier die geringe Datenmenge ein Problem dar. Der übliche Ansatz mit <term
                  type="dh">Transfer Learning</term>
               <hi rend="italic">, </hi>also ein vortrainiertes Netz auf einem üblichen Datensatz
               wie <term type="dh">ImageNet</term> zu verwenden, erweist sich ebenfalls als
               schwierig, da zum einen die Augsburger Drucke gegenüber Datensätzen wie ImageNet doch
               sehr unterschiedlich sind und zum anderen die <term type="dh">Latent Spaces</term>
               für die Untersuchung nicht weiter durch fremde Informationen an zusätzlicher
               Komplexität gewinnen sollen.</p>
            <p>Die gravierendste Herausforderung ist die geringe Datenmenge: Üblich sind mehrere
               Zehntausend bis Millionen Bilder bzw. Datenpunkte im Trainingsdatensatz, je nach
               Aufgabe und Anzahl der zu segmentierenden Klassen. Ein weiterer kritischer Faktor ist
               die fehlende semantische Invarianz der Segmentierungsobjekte, da der semantische
               Kontext der Umgebung, in die die Rocaille-Elemente im Bild eingebettet sind, die
               Klassifizierung beeinflusst. Zudem ist der Datensatz stark unausgewogen: Das
               Verhältnis von Nicht-Rocaille-Pixeln zu Rocaille-Pixeln beträgt etwa 31:1, was
               unbehandelt zu einem Bias führen und die Netze zu mehr <term type="dh">False
                  Negatives</term> bewegen würde. Darüber hinaus sollte die zu verwendende
               Architektur möglichst einfach und nachvollziehbar sein, um die Untersuchung von
               möglichen topologischen Mannigfaltigkeiten in der von dem Netz intern aufgebauten
               Wissensrepräsentation, dem <term type="dh">Latent Space</term> (vgl. <ref type="graphic"
                  target="#rocaillen_004">Abbildung 4</ref>), und möglicher Isomorphismen zwischen
               diesen Mannigfaltigkeiten und den Rocailles im Bildraum zu erleichtern.</p>
            <p>
               <term type="dh">U-Nets</term><note type="footnote"> Vgl. <ref type="bibliography"
                     target="#ronneberger_et_al_unet_2015">Ronneberger et&#160;al. 2015</ref>,
                  S.&#160;234–241.</note> sind eine neuronale Netzwerkarchitektur, die insbesondere
               für medizinische Bildverarbeitung und Segmentierungsaufgaben und deren oftmals
               ebenfalls relativ kleinen Datensätze (einige Tausend) entwickelt wurden. Diese bilden
               in der Kategorie der Encoder-Decoder-Netze eine eigene Unterart. Allgemein lässt sich
               die Encoder-Decoder-Architektur mit zwei Hauptkomponenten beschreiben: dem <term
                  type="dh">Encoder</term> und dem <term type="dh">Decoder</term>. Der Encoder nimmt
               die Eingabedaten, wie etwa ein Bild, auf und transformiert diese durch eine Serie von
               Schichten&#160;– typischerweise Faltungs- und Pooling-Schichten in der
               Bildverarbeitung&#160;– in eine zunehmend komprimierte, aber semantisch
               hochdimensionale Repräsentation, auch Wissensrepräsentation oder <hi rend="italic"
                  >Latent Space</hi> genannt. Diese stellt eine abstrakte und semantisch reiche
               Darstellung der ursprünglichen Daten dar, die wesentliche Merkmale und Informationen
               extrahiert hat. Der Decoder hat die Aufgabe, diese komprimierte Repräsentation wieder
               in eine Ausgabe zu transformieren, die eine ähnliche Struktur wie die ursprüngliche
               Eingabe hat, jedoch oft mit einer spezifischen Modifikation oder Anreicherung, wie
               etwa der Markierung bestimmter Bildbereiche. Bei der Bildsegmentierung hat der
               Decoder somit die Aufgabe, bestimmte Regionen oder Objekte innerhalb des Bildes klar
               und präzise zu identifizieren.</p>
            <p>
               <hi rend="italic">U-Nets</hi> erweitern die grundlegende Encoder-Decoder-Architektur
               durch den symmetrischen Aufbau von <hi rend="italic">Encoder</hi> und <hi
                  rend="italic">Decoder</hi> bezüglich der eingesetzten Schichten und deren
               Reihenfolge. Diese Schichten sind durch zusätzliche Verbindungen zwischen dem Encoder
               und dem Decoder, den sogenannten <term type="dh">Skip-Connections</term>, verbunden,
               die es dem Netzwerk ermöglichen, detaillierte Informationen aus den frühen Schichten
               der Enkodierung direkt in die entsprechenden Schichten der Dekodierung zu übertragen
               und dadurch mit weniger Trainingsdaten zurechtzukommen. Im Rahmen dieses Projekts
               wurden mehrere Variationen von U-Nets entwickelt, die sich durch den Aufbau und die
               Größe einzelner Schichten unterscheiden, um die Leistungsfähigkeit zu erhöhen.</p>
            <p>
               <hi rend="italic">U-Nets</hi> zählen auch zur Kategorie der <term type="dh"
                  >Convolutional Neural Networks (CNN)</term>, da einzelne Schichten auch
               Faltungsoperationen beinhalten. <ref type="graphic" target="#rocaillen_003">Abbildung 3</ref> stellt die grundlegende Funktionsweise
               von U-Nets und deren Aufbau des <hi rend="italic">Latent Space</hi> dar.</p>
            <figure>
               <graphic xml:id="rocaillen_003" url="Medien/rocaillen_003.png">
                  <desc>
                     <ref type="intern" target="#abb3">Abb.&#160;3</ref>: Modellarchitektur des
                     U-Net: Inspiriert vom biologischen visuellen Kortex ermöglicht der
                     hierarchische Aufbau von Faltungsschichten (Convolutional Layers), visuelle
                     Merkmale in unterschiedlicher semantischer Komplexität zu erfassen und zu
                     erlernen. [Grafik: Thomas Hudcovic 2026]</desc>
               </graphic>
            </figure>
            <p>Die vordersten Schichten lernen kleinste Bildelemente wie Linien und Kurven, während
               spätere Schichten Kompositionen von Elementen bzw. Primitiven aus vorherigen
               Schichten erlernen. Das Prinzip der hierarchischen Komposition von komplexeren
               Objekten&#160;/ Primitiven oder Motiven aus Objekten&#160;/ Primitiven aus vorigen
               Schichten zieht sich durch das ganze Netz und ist ein grundlegendes Merkmal von CNNs.
               Je tiefer man in das Netzwerk vordringt, desto komplexer und umfassender werden die
               erkannten Merkmale. Diese hierarchische Vorgehensweise entspricht dem <term type="dh"
                  >Perceptual Field</term> in einem CNN: Die frühen Schichten nehmen kleine, lokale
               Details wahr, während die späteren Schichten eine immer globalere und abstraktere
               Sichtweise entwickeln. Die räumliche Dimension der gesamten Schicht wird dabei immer
               komprimierter, während die Dimensionalität der Wissensrepräsentation immer weiter
               zunimmt.</p>
            <p>Im tiefsten Punkt im <term type="dh">U-Net</term> bzw. die innersten Schichten (<term
                  type="dh">Bottom Layer</term>) kodieren dabei semantisch das gesamte Gesehene und
               sind der Kern des <hi rend="italic">Latent Space</hi> bzw. der Wissensrepräsentation
               (vgl. <ref type="graphic" target="#rocaillen_004">Abbildung 4</ref>) und sind für die Morphologieuntersuchung der Rocailles am
               interessantesten.</p>
            <figure>
               <graphic xml:id="rocaillen_004" url="Medien/rocaillen_004.png">
                  <desc>
                     <ref type="intern" target="#abb4">Abb.&#160;4</ref>: 2D-Repräsentation eines
                     Latent Space: Encoder-Decoder-Modelle erlernen die (pixelweise) Klassifikation
                     visueller Elemente. Mathematisch entspricht dies der Platzierung nicht-linearer
                     Trenngrenzen (Decision Boundaries) innerhalb eines hochdimensionalen
                     Datensatzes. [Grafik: Thomas Hudcovic 2026]</desc>
               </graphic>
            </figure>
            <p>Dafür müssen sich zunächst Mannigfaltigkeiten identifizieren lassen, also topologisch
               greifbare Objekte bestehend aus Punktmengen, die in ihrer Konstellation und
               Ausprägung das Wissen repräsentieren. Falls dies möglich ist, so wäre der nächste
               Schritt, Korrespondenzen zwischen diesen Mannigfaltigkeiten und den Objekten im Bild
               zu finden, sodass beispielsweise die lokale Manipulation einer Mannigfaltigkeit, die
               eine Volute repräsentieren könnte, auch die Volute im Bild entsprechend manipuliert
               (zum Beispiel verformt). Dadurch ließen sich&#160;– so die Hoffnung&#160;–
               Morphologien zwischen Bildern und personalstilistischen Ausprägungen herstellen. Hier
               begründet sich auch die Wahl der <hi rend="italic">U-Nets</hi> als Netzarchitektur:
               Durch den einfachen Aufbau, aber die gleichzeitig relativ hohe
               Segmentierungsleistung, lassen sich Analysen im <hi rend="italic">Latent Space</hi>
               einfacher nachvollziehen. Gleichzeitig dienen die eigens entwickelten Varianten der
               U-Nets als guter Vergleich für die Analyse der Differenz zwischen den jeweiligen
               Latent Spaces der U-Nets, bedingt durch den Einsatz anderer Schichtkomponenten.</p>
            <p>Da selbst für <hi rend="italic">U-Nets</hi> der Trainingsdatensatz vergleichsweise
               klein ist, wurden dafür geeignete Methoden entwickelt. Diese geringe Menge hat oft
               zur Folge, dass wichtige Merkmale unzureichend identifiziert und erlernt werden und
               dass das Netz nur unzureichende Diskriminierungsleistung von Merkmalen oder
               Kompositionswissen aufbauen kann. Dies wird auf zwei Arten behandelt: Zum Ersten wird
               die Menge an Trainingsdaten durch <term type="dh">Augmentierung</term> vervielfacht.
               Dabei werden Teile von Bildern mit anderen Teilen algorithmisch und zufällig (aber
               semantisch sinnvoll) gemixt, z.&#160;B. mittels <term type="dh">CutMix</term>,<note
                  type="footnote"> Vgl. <ref type="bibliography" target="#yun_et_al_cutmix_2019">Yun
                     et&#160;al. 2019</ref>, S.&#160;6022–6031.</note> um so ein neues Bild zu
               erhalten. CutMix wurde für dieses Projekt speziell für Segmentierungsaufgaben und
               Bildkontexterhaltung modifiziert. Zum Zweiten wird für das Training eine sogenannte
                  <term type="dh">Loss</term>-Funktion angewandt, die sich als Komposition aus einem
               pixel- bzw. verteilungsbasierten <hi rend="italic">Loss</hi> (dem <term type="dh"
                  >Focal Loss</term>)<note type="footnote"> Vgl. <ref type="bibliography"
                     target="#lin_et_al_loss_2017">Lin et&#160;al. 2017</ref>,
                  S.&#160;2980–2988.</note> und einem regionsbasiertem <hi rend="italic">Loss</hi>
                  (<hi rend="italic">Dice Loss</hi>) zusammensetzt. Dadurch werden <hi rend="italic"
                  >False Negatives</hi>, aber auch <hi rend="italic">False Positives</hi> stärker im
               Trainingsprozess bestraft und gleichzeitig regionale Kohärenz gefördert. Die nicht
               vorhandene semantische Invarianz der Rocaille kann realistischerweise nur durch mehr
               Trainingsdaten effektiv behandelt werden, daher ist der größte direkte Schritt die
               Augmentierung des Datensatzes. Jedoch hilft die Loss-Funktion sowie das implizite
               Lernen der Umgebung der markierten Rocaille-Pixel in den Trainingsdaten,
               kontextbehaftete Diskriminatoren im Wissen aufzubauen. Ein weiterer, zukünftiger
               Untersuchungsgegenstand, ist demzufolge die Frage danach, ob man dieses mangelhafte
               oder gar fehlende Wissen im <hi rend="italic">Latent Space</hi> identifizieren
               kann.</p>
            <p>Eine weitere Maßnahme gegen die geringe Datenmenge ist das Vortraining der Netze ohne
               genaues Lernziel. Tatsächlich ist dies ein eigener Forschungszweig im Bereich des
                  <term type="dh">Deep Learnings</term>, bekannt als sogenanntes <term type="dh"
                  >Self-Supervised Learning</term>. Dieses basiert auf Theorien aus der
               Neurokognition (die Motivation lässt sich dabei vom realen Lernen eines Kleinkinds
                  ableiten),<note type="footnote"> Vgl. <ref type="bibliography"
                     target="#metaai_hg_yann_2023">Meta AI (Hg.) 2023</ref>.</note> aus denen im Rahmen dieses Projektes eine neuartige
               Vortrainingsmethode entwickelt wurde. Dafür werden die U-Nets als Teil von <term
                  type="dh">Denoising Diffusion Probabilistic Models (DDPM)</term> verwendet (also
               einer Architektur, in der ein <hi rend="italic">U-Net</hi> nur ein Baustein
                  ist),<note type="footnote"> Vgl. <ref type="bibliography"
                     target="#ho_et_al_denoising_2020">Ho et&#160;al. 2020</ref>,
                  S.&#160;6840–6851.</note> mit dem Ziel, Bilder zu generieren, wie es z.&#160;B.
               bei <term type="dh">Stable Diffusion</term><note type="footnote"> Vgl. <ref type="bibliography"
                     target="#rombach_et_al_image_2022">Rombach et&#160;al. 2022</ref>,
                  S.&#160;10674–10685.</note> genutzt wird. Das Generieren von Bildern muss einem
               DDPM ebenfalls antrainiert werden, benötigt aber in seiner Grundausführung keine
               Labels. Das Netz bekommt ein Bild, welches schrittweise mehr und mehr verrauscht
               wird. Als Aufgabe soll das Netz das Rauschen in jedem Schritt wieder entfernen und
               das Originalbild wiederherstellen. Das Rauschen wird dabei schrittweise bis zur
               vollständigen Unkenntlichkeit des Originalbildes gesteigert; die Aufgabe wird also
               sukzessive schwerer gestaltet. Dabei bildet das Netz visuelles Wissen der Bilder im
                  <hi rend="italic">Latent Space</hi> aus. Im Zuge dieses neuartigen Vortrainings
               werden auch verschiedene Varianten von U-Nets und anderen Encoder-Decoder-Netzen auf
               deren Qualität und Nutzbarkeit für DDPM evaluiert.</p>
            <p>Auf den gesamten, ungelabelten Rocaille-Bilddatensatz angewandt, kann somit ein Netz
               bereits Vorwissen aufbauen, bevor es gezielt für die Segmentierungsaufgabe auf den
               Bildern trainiert wird. Die Segmentierungsergebnisse zeigen eine signifikante Anzahl
               von <hi rend="italic">False Negatives</hi>, wobei eher wenige <hi rend="italic">False
                  Positives</hi> auftreten. Ohne Vortraining liegt der <term type="dh">Intersection
                  over Union</term>-Wert (IoU) bei etwa 0.5, während er mit Vortraining auf etwa 0.7
               steigt. Der IoU bezeichnet dabei die Überlappung der Segmentierungsausgabe des Netzes
               mit den tatsächlichen Segmentierungsmarkierungen in den Labels (vgl. <ref type="graphic" target="#rocaillen_005">Abbildung 5</ref>) und ist
               eine herkömmliche Qualitätsmetrik bei Segmentierungsaufgaben.</p>
            <figure>
               <graphic xml:id="rocaillen_005" url="Medien/rocaillen_005.png">
                  <desc>
                     <ref type="intern" target="#abb5">Abb.&#160;5</ref>: Die Metrik ›Intersection over Union‹ quantifiziert die Qualität der
                     Segmentierung. Sie bildet das Verhältnis der Abdeckung zwischen Vorhersagemaske
                     (Prediction Mask) und Referenzmaske (Ground Truth) auf einem geschlossenen
                     Intervall von 0 bis 1 ab. [Grafik: Thomas Hudcovic 2026]</desc>
               </graphic>
            </figure>
            <p>Diese Beobachtungen lassen sich durch die Eigenheiten kleiner und unausgewogener
               Datensätze sowie die Vorteile des Vortrainings erklären. Der IoU-Wert von 0.5 ohne
               Vortraining deutet darauf hin, dass das Modell Schwierigkeiten hat, die verschiedenen
               Klassen korrekt zu segmentieren. Dies ist insbesondere bei einem kleinen Datensatz
               verständlich, da das Modell nicht genügend Beispiele hat, um die Merkmale jeder
               Klasse zuverlässig zu lernen. Die hohe Anzahl von <hi rend="italic">False
                  Negatives</hi> weist darauf hin, dass das Modell viele relevante Objekte nicht
               erkennt, was typisch für unausgewogene Datensätze ist, in denen einige Klassen
               unterrepräsentiert sind. Die geringe Anzahl von <hi rend="italic">False
                  Positives</hi> in beiden Szenarien lässt darauf schließen, dass das Modell
               grundsätzlich gut darin ist, Bereiche zu identifizieren, die nicht zu den Zielklassen
               gehören.</p>
         </div>
         <div type="chapter">
            <head>6. Integration mit einer Datenbank und Nutzbarmachung</head>
            <p>Auch wenn durch die Klassen ›Volute‹ und ›Kamm‹ bereits eine Vergleichsbasis
               generiert werden kann, wird bei der Mikroanalyse von Details hinsichtlich der
               Morphologie (vor allem personalstilistische Aspekte) nicht nur auf bildliche, sondern
               auch auf die textuelle Ebene zurückgegriffen. Daher werden im Meta-Datensatz
               besonders die Beschreibungen aus der Sekundärliteratur berücksichtigt und als
               Textbasis genutzt. Ergänzt wurden diese durch eigene Beschreibungstexte. Diese
               textuelle Ebene lässt sich mit der Online-Datenbank an das Projektziel koppeln: So
               ist es Nutzer*innen möglich, Textsuchen zu tätigen und Informationen zu den Bildern
               im Datensatz zu bekommen. In einem zusätzlichen Ansatz wird daher auf <term type="dh"
                  >Large Language Models (LLMs)</term> wie OpenAIs ChatGPT<note type="footnote">
                  Vgl. <ref type="bibliography" target="#achiam_et_al_gpt4_2023">Achiam et&#160;al.
                     2023</ref>.</note> oder Metas Llama<note type="footnote"> Vgl. <ref
                     type="bibliography" target="#touvron_et_al_2023">Touvron et&#160;al.
                  2023</ref>.</note> zurückgegriffen, die sich in der sehr jungen Vergangenheit als
               Netzarchitekturen mit viel Potenzial herausgestellt haben. Basierend auf diesen LLMs
               hat sich ein weiterer, multimodaler Ansatz entwickelt, die sogenannten <term
                  type="dh">Vision Language Models</term> (VLMs),<note type="footnote"> Vgl. <ref
                     type="bibliography" target="#zhang_et_al_visionlanguage_2024">Zhang et&#160;al.
                     2024</ref>.</note> um die Fähigkeiten von LLMs nicht nur auf Text, sondern auch
               auf andere Modi, wie zum Beispiel Bilder, zu erweitern. Dabei werden
               LLM-Architekturen, oft bereits vortrainiert, herangezogen und anschließend mit
               passenden Text-Bild-Paaren weiter trainiert. Die primäre Herausforderung ist hier das
               Überführen von Text und Bild in eine gemeinsame Datenrepräsentation, die dann als
               Eingabe für ein LLM dienen kann. Dies ist auch der wesentlich diskriminierende Faktor
               von verschiedenen VLM-Architekturen: Das sogenannte <term type="dh">Embedding</term>
               von zusätzlichen Inputmodi (Text, Bild, etc.) zum bereits vorhandenen Modus.</p>
            <p>
               <term type="dh">VLMs</term> ermöglichen es, Text- und&#160;/ oder Bildfragen zu
               stellen und Text- und&#160;/ oder Bildantworten zu bekommen. Zum Beispiel könnte
               ein*e Nutzer*in bestimmte Merkmale in einer Rocaille als Textbeschreibung liefern und
               das VLM versucht dann, passende Bilder, die die Rocaille mit den beschriebenen
               Merkmalen enthalten, im Datensatz zu identifizieren.</p>
            <p>So erlaubt die digital zugängliche Datenbank Anfragen via Bildersuche: Beim Upload
               eines Fotos mit Rocaille kann eine Erkennung der Volutenspangen und Kämme so
               erfolgen, dass das Foto möglichst nah in den Stil der Augsburger Drucke mittels <term
                  type="dh">Style Transfer</term><note type="footnote"> Vgl. <ref type="bibliography" target="#gatys_et_al_image_2016"
                     >Gatys et&#160;al. 2016</ref>, S.&#160;2414–2423.</note> überführt wird. So
               werden etwa die Volutenspangen der Schnitzarbeit an der Türe der Neuen Residenz in
               Passau erkannt (vgl. <ref type="graphic" target="#rocaillen_006">Abbildung 6</ref>).</p>
            <figure>
               <graphic xml:id="rocaillen_006" url="Medien/rocaillen_006.png">
                  <desc>
                     <ref type="intern" target="#abb6">Abb.&#160;6</ref>: Fotografie einer
                     Schnitzarbeit an der Neuen Residenz in Passau (links), Volutenerkennung und
                     Styletransfer (rechts). [Grafik: Thomas Hudcovic 2026]</desc>
               </graphic>
            </figure>
            <p>Folglich bietet die Suchmaschine eine Volltextsuche mit <term type="dh"
                  >Fuzzy-Search</term> sowie eine semantische Suche auf Grundlage der hochgeladenen
               Bilder. Als Ergebnis werden ähnliche Augsburger Druckgrafiken präsentiert. Die
               inhaltlichen Bezüge können sich dabei auf Typ, Stil, Rocaille-Komposition, Figuren
               oder einzelne Motive beziehen.
            </p>
         </div>
      </body>
      <back>
         <div type="bibliography">
            <head>Bibliografie</head>
            <listBibl>
               <bibl xml:id="achiam_et_al_gpt4_2023">Josh Achiam&#160;/ Steven Adler&#160;/ Sandhini
                  Agarwal&#160;/ Lama Ahmad&#160;/ Ilge Akkaya&#160;/ Florencia Leoni Aleman&#160;/ Diogo Almeida&#160;/ Janko Altenschmidt&#160;/ Sam Altman&#160;/ Shyamal Anadkat&#160;/ Red Avila&#160;/ Igor Babuschkin&#160;/ Suchir Balaji&#160;/ Valerie Balcom&#160;/ Paul Baltescu&#160;/ Haiming Bao&#160;/ Mohammad Bavarian&#160;/ Jeff Belgum&#160;/ Irwan Bello&#160;/ Jake Berdine&#160;/ Gabriel Bernadett-Shapiro&#160;/ Christopher Berner&#160;/ Lenny Bogdonoff&#160;/ Oleg Boiko&#160;/ Madelaine Boyd&#160;/ Anna-Luisa Brakman&#160;/ Greg Brockman&#160;/ Tim Brooks&#160;/ Miles Brundage&#160;/ Kevin Button&#160;/ Trevor Cai&#160;/ Rosie Campbell&#160;/ Andrew Cann&#160;/ Brittany Carey&#160;/ Chelsea Carlson&#160;/ Rory Carmichael&#160;/ Brooke Chan&#160;/ Che Chang&#160;/ Fotis Chantzis&#160;/ Derek Chen&#160;/ Sully Chen&#160;/ Ruby Chen&#160;/ Jason Chen&#160;/ Mark Chen&#160;/ Ben Chess&#160;/ Chester Cho&#160;/ Casey Chu&#160;/ Hyung Won Chung&#160;/ Dave Cummings&#160;/ Jeremiah Currier&#160;/ Yunxing Dai&#160;/ Cory Decareaux&#160;/ Thomas Degry&#160;/ Noah Deutsch&#160;/ Damien Deville&#160;/ Arka Dhar&#160;/ David Dohan&#160;/ Steve Dowling&#160;/ Sheila Dunning&#160;/ Adrien Ecoffet&#160;/ Atty Eleti&#160;/ Tyna Eloundou&#160;/ David Farhi&#160;/ Liam Fedus&#160;/ Niko Felix&#160;/ Simón Posada Fishman&#160;/ Juston Forte&#160;/ Isabella Fulford&#160;/ Leo Gao&#160;/ Elie Georges&#160;/ Christian Gibson&#160;/ Vik Goel&#160;/ Tarun Gogineni&#160;/ Gabriel Goh&#160;/ Rapha Gontijo-Lopes&#160;/ Jonathan Gordon&#160;/ Morgan Grafstein&#160;/ Scott Gray&#160;/ Ryan Greene&#160;/ Joshua Gross&#160;/ Shixiang Shane Gu&#160;/ Yufei Guo&#160;/ Chris Hallacy&#160;/ Jesse Han&#160;/ Jeff Harris&#160;/ Yuchen He&#160;/ Mike Heaton&#160;/ Johannes Heidecke&#160;/ Chris Hesse&#160;/ Alan Hickey&#160;/ Wade Hickey&#160;/ Peter Hoeschele&#160;/ Brandon Houghton&#160;/ Kenny Hsu&#160;/ Shengli Hu&#160;/ Xin Hu&#160;/ Joost Huizinga&#160;/ Shantanu Jain&#160;/ Shawn Jain&#160;/ Joanne Jang&#160;/ Angela Jiang&#160;/ Roger Jiang&#160;/ Haozhun Jin&#160;/ Denny Jin&#160;/ Shino Jomoto&#160;/ Billie Jonn&#160;/ Heewoo Jun&#160;/ Tomer Kaftan&#160;/ Łukasz Kaiser&#160;/ Ali Kamali&#160;/ Ingmar Kanitscheider&#160;/ Nitish Shirish Keskar&#160;/ Tabarak Khan&#160;/ Logan Kilpatrick&#160;/ Jong Wook Kim&#160;/ Christina Kim&#160;/ Yongjik Kim&#160;/ Jan Hendrik Kirchner&#160;/ Jamie Kiros&#160;/ Matt Knight&#160;/ Daniel Kokotajlo&#160;/ Łukasz Kondraciuk&#160;/ Andrew Kondrich&#160;/ Aris Konstantinidis&#160;/ Kyle Kosic&#160;/ Gretchen Krueger&#160;/ Vishal Kuo&#160;/ Michael Lampe&#160;/ Ikai Lan&#160;/ Teddy Lee&#160;/ Jan Leike&#160;/ Jade Leung&#160;/ Daniel Levy&#160;/ Chak Ming Li&#160;/ Rachel Lim&#160;/ Molly Lin&#160;/ Stephanie Lin&#160;/ Mateusz Litwin&#160;/ Theresa Lopez&#160;/ Ryan Lowe&#160;/ Patricia Lue&#160;/ Anna Makanju&#160;/ Kim Malfacini&#160;/ Sam Manning&#160;/ Todor Markov&#160;/ Yaniv Markovski&#160;/ Bianca Martin&#160;/ Katie Mayer&#160;/ Andrew Mayne&#160;/ Bob McGrew&#160;/ Scott Mayer McKinney&#160;/ Christine McLeavey&#160;/ Paul McMillan&#160;/ Jake McNeil&#160;/ David Medina&#160;/ Aalok Mehta&#160;/ Jacob Menick&#160;/ Luke Metz&#160;/ Andrey Mishchenko&#160;/ Pamela Mishkin&#160;/ Vinnie Monaco&#160;/ Evan Morikawa&#160;/ Daniel Mossing&#160;/ Tong Mu, Mira Murati&#160;/ Oleg Murk&#160;/ David Mély&#160;/ Ashvin Nair&#160;/ Reiichiro Nakano&#160;/ Rajeev Nayak&#160;/ Arvind Neelakantan&#160;/ Richard Ngo&#160;/ Hyeonwoo Noh&#160;/ Long Ouyang&#160;/ Cullen O’Keefe&#160;/ Jakub Pachocki&#160;/ Alex Paino&#160;/ Joe Palermo&#160;/ Ashley Pantuliano&#160;/ Giambattista Parascandolo&#160;/ Joel Parish&#160;/ Emy Parparita&#160;/ Alex Passos&#160;/ Mikhail Pavlov&#160;/ Andrew Peng&#160;/ Adam Perelman&#160;/ Filipe de Avila Belbute Peres&#160;/ Michael Petrov&#160;/ Henrique Ponde de Oliveira Pinto&#160;/ Michael (Rai) Pokorny&#160;/ Michelle Pokrass&#160;/ Vitchyr H. Pong&#160;/ Tolly Powell&#160;/ Alethea Power&#160;/ Boris Power&#160;/ Elizabeth Proehl&#160;/ Raul Puri&#160;/ Alec Radford&#160;/ Jack Rae&#160;/ Aditya Ramesh&#160;/ Cameron Raymond&#160;/ Francis Real&#160;/ Kendra Rimbach&#160;/ Carl Ross&#160;/ Bob Rotsted&#160;/ Henri Roussez&#160;/ Nick Ryder&#160;/ Mario Saltarelli&#160;/ Ted Sanders&#160;/ Shibani Santurkar&#160;/ Girish Sastry&#160;/ Heather Schmidt&#160;/ David Schnurr&#160;/ John Schulman&#160;/ Daniel Selsam&#160;/ Kyla Sheppard&#160;/ Toki Sherbakov&#160;/ Jessica Shieh&#160;/ Sarah Shoker&#160;/ Pranav Shyam&#160;/ Szymon Sidor&#160;/ Eric Sigler&#160;/ Maddie Simens&#160;/ Jordan Sitkin&#160;/ Katarina Slama&#160;/ Ian Sohl&#160;/ Benjamin Sokolowsky&#160;/ Yang Song&#160;/ Natalie Staudacher&#160;/ Felipe Petroski Such&#160;/ Natalie Summers&#160;/ Ilya Sutskever&#160;/ Jie Tang&#160;/ Nikolas Tezak&#160;/ Madeleine B. Thompson&#160;/ Phil Tillet&#160;/ Amin Tootoonchian&#160;/ Elizabeth Tseng&#160;/ Preston Tuggle&#160;/ Nick Turley&#160;/ Jerry Tworek&#160;/ Juan Felipe Cerón Uribe&#160;/ Andrea Vallone&#160;/ Arun Vijayvergiya&#160;/ Chelsea Voss&#160;/ Carroll Wainwright&#160;/ Justin Jay Wang&#160;/ Alvin Wang&#160;/ Ben Wang&#160;/ Jonathan Ward&#160;/ Jason Wei&#160;/ CJ Weinmann&#160;/ Akila Welihinda&#160;/ Peter Welinder&#160;/ Jiayi Weng&#160;/ Lilian Weng&#160;/ Matt Wiethoff&#160;/ Dave Willner&#160;/ Clemens Winter&#160;/ Samuel Wolrich&#160;/ Hannah Wong&#160;/ Lauren Workman&#160;/ Sherwin Wu&#160;/ Jeff Wu&#160;/ Michael Wu&#160;/ Kai Xiao&#160;/ Tao Xu&#160;/ Sarah Yoo&#160;/ Kevin Yu&#160;/ Qiming Yuan&#160;/ Wojciech Zaremba&#160;/ Rowan Zellers&#160;/ Chong Zhang&#160;/ Marvin Zhang&#160;/ Shengjia Zhao&#160;/ Tianhao Zheng&#160;/ Juntang Zhuang&#160;/ William Zhuk&#160;/ Barret Zoph: Gpt-4 Technical Report. arXiv. 15.03.2023. Version 6 vom 04.03.2023. DOI: <ref target="https://doi.org/10.48550/arXiv.2303.08774">10.48550/arXiv.2303.08774</ref></bibl>
               <bibl xml:id="von_albrecht_hg_publius_2013">Michael von Albrecht (Hg.): Publius
                  Ovidius Naso. Metamorphoseon libri quindecim. Lateinisch&#160;/ Deutsch. Stuttgart
                  2013. <ptr type="gbv" cRef="741146037"/></bibl>
               <bibl xml:id="augustyn_buchillustration_1997">Wolfgang Augustyn: Augsburger
                  Buchillustration im 18. Jahrhundert. In: Helmut Gier&#160;/ Johannes Janota (Hg.):
                  Augsburger Buchdruck und Verlagswesen von den Anfängen bis zur Gegenwart.
                  Wiesbaden 1997, S.&#160;791–861. <ptr type="gbv" cRef="279473362"/></bibl>
               <bibl xml:id="bauer_rocaille_1962">Herrmann Bauer: Rocaille. Zur Herkunft und zum
                  Wesen eines Ornament-Motivs. Berlin 1962. <ptr type="gbv" cRef="1074940288"/></bibl>
               <bibl xml:id="brandt_ehlers_hg_apuleius_2012">Edward Brandt&#160;/ Wilhelm Ehlers
                  (Hg.): Apuleius. Der goldene Esel. Metamorphosen Libri XI. Lateinisch-deutsch. 6.,
                  überarbeitete Auflage. Berlin 2012. <ptr type="gbv" cRef="717628620"/></bibl>
               <bibl xml:id="chen_et_al_encoderdecoder_2018">Liang-Chieh Chen&#160;/ Yukun
                  Zhu&#160;/ George Papandreou&#160;/ Florian Schroff&#160;/ Hartwig Adam:
                  Encoder-decoder with Atrous Separable Convolution for Semantic Image Segmentation.
                  In: ECCV 2018. 15<hi rend="super">th</hi> European Conference on Computer Vision. Proceedings
                  (München, 08.09.–14.09.2018). München 2018, S.&#160;801–818. PDF. [<ref target="https://openaccess.thecvf.com/content_ECCV_2018/papers/Liang-Chieh_Chen_Encoder-Decoder_with_Atrous_ECCV_2018_paper.pdf">online</ref>]</bibl>
               <bibl xml:id="cheng_et_al_maskedattention_2022">Bowen Cheng&#160;/ Ishan Misra&#160;/
                  Alexander G. Schwing&#160;/ Alexander Kirillov&#160;/ Rohit Girdhar:
                  Masked-Attention Mask Transformer for Universal Image Segmentation. In:
                  IEEE&#160;/ CVPR 2022. Conference on Computer Vision and Pattern Recognition.
                  Proceedings (New Orleans, 18.06.–24.06.2022). New Orleans 2022,
                  S.&#160;1290–1299. PDF. [<ref target="https://openaccess.thecvf.com/content/CVPR2022/papers/Cheng_Masked-Attention_Mask_Transformer_for_Universal_Image_Segmentation_CVPR_2022_paper.pdf">online</ref>]</bibl>
               <bibl xml:id="gatys_et_al_image_2016">Leon A. Gatys&#160;/ Alexander
                  S.&#160;Ecker&#160;/ Matthias Bethge: Image Style Transfer Using Convolutional
                  Neural Networks. In: IEEE&#160;/ CVPR 2016. Conference on Computer Vision and
                  Pattern Recognition. Proceedings (Las Vegas, 27.06.–30.06.2016). Las Vegas 2016, S.&#160;2414–2423. PDF. [<ref target="https://www.cv-foundation.org/openaccess/content_cvpr_2016/papers/Gatys_Image_Style_Transfer_CVPR_2016_paper.pdf">online</ref>]</bibl>
               <bibl xml:id="gier_janota_hg_buchdruck_1997">Helmut Gier&#160;/ Johannes Janota
                  (Hg.): Augsburger Buchdruck und Verlagswesen. Von den Anfängen bis zur Gegenwart.
                  Wiesbaden 1997. <ptr type="gbv" cRef="279473362"/></bibl>
               <bibl xml:id="he_et_al_rcnn_2017">Kaiming He&#160;/ Georgia Gkioxari&#160;/ Piotr
                  Dollár&#160;/ Ross Girshick: Mask R-CNN. In: IEEE&#160;/ ICCV 2017. International
                  Conference on Computer Vision. Konferenzabstracts (Venedig, 22.10.–29.10.2017).
                  Venedig, IT 2017, S.&#160;2961–2969. PDF. DOI: 10.1109/ICCV.2017.322</bibl>
               <bibl xml:id="helke_johann_2005">Gun-Dagmar Helke: Johann Esaias Nilson (1721–1788).
                  Augsburger Miniaturmaler, Kupferstecher, Verleger und Kunstakademiedirektor.
                  München 2005. <ptr type="gbv" cRef="472673408"/></bibl>
               <bibl xml:id="ho_et_al_denoising_2020">Jonathan Ho&#160;/ Ajay Jain&#160;/ Pieter
                  Abbeel: Denoising Diffusion Probabilistic Models. In: Hugo Larochelle&#160;/ Marc’Aurelio
                  Ranzato&#160;/ Raia Hadsell&#160;/ Maria Floriana Balcan&#160;/ Hsuan-Tien Lin (Hg.): NeurIPS 2020. 34<hi rend="super">th</hi> Annual Conference on Neural Information Processing Systems. Proceedings
                  (Online, 06.12.–12.12.2020). Vancouver 2020, S.&#160;6840–6851. PDF. [<ref   target="https://proceedings.neurips.cc/paper/2020/file/4c5bcfec8584af0d967f1ab10179ca4b-Paper.pdf">online</ref>]</bibl>
               <bibl xml:id="irmscher_style_2009">Günter Irmscher: Style rocaille. In:
                  Barockberichte 51&#160;/ 52 (2009), S.&#160;339–414. <ptr type="gbv" cRef="825720257"/>
               </bibl>
               <bibl xml:id="irmscher_ornament_2005">Günter Irmscher: Ornament in Europa. 1450–200.
                  Eine Einführung. Köln 2005. <ptr type="gbv" cRef="487551974"/></bibl>
               <bibl xml:id="isphording_gottfried_1982">Eduard Isphording: Gottfried Bernhard Göz
                  1708–1774. 2 Bände. Weissenhorn 1982. Band 1: Ölgemälde und Zeichnungen
                  (Textband). <ptr type="gbv" cRef="124972764"/></bibl>
               <bibl xml:id="isphording_gottfried_1984">Eduard Isphording: Gottfried Bernhard Göz
                  1708–1774. 2 Bände. Weissenhorn 1984. Band 2: Ölgemälde und Zeichnungen
                  (Tafelband). <ptr type="gbv" cRef="073205478"/></bibl>
               <bibl xml:id="kimball_creation_1980">Fiske Kimball: The Creation of the Rococo
                  Decorative Style. New York 1980 [1943]. <ptr type="gbv" cRef="161416987X"/></bibl>
               <bibl xml:id="krause_theorie_2015">Katharina Krause: Sans théorie, sans raisonnement,
                  sans goût, sans invention. Ornamentstich als Medium von Erfindung und Verbreitung
                  von Ideen im Kunsthandwerk des 18. Jahrhunderts. In: Christof Jeggle (Hg.):
                  Luxusgegenstände und Kunstwerke vom Mittelalter bis zur Gegenwart.
                  Produktion&#160;– Handel&#160;– Formen der Aneignung. Konstanz 2015, S.&#160;185–199. <ptr type="gbv" cRef="783806019"/></bibl>
               <bibl xml:id="krubsacius_gedanken_1759">Friedrich August Krubsacius: Gedanken von dem
                  Ursprunge, Wachsthume und Verfalle der Verzierungen in den schönen Künsten, d. i.
                  Der Bau- Schnitz- Maler- und Kupferstecherkunst. Leipzig 1759. <ptr type="gbv"
                     cRef="146074556"/>
               </bibl>
               <bibl xml:id="krull_franz_1977">Ebba Krull: Franz Xaver Habermann (1721–1796). Ein
                  Augsburger Ornamentist des Rokoko. Augsburg 1977. <ptr type="gbv" cRef="1615545344"/>
               </bibl>
               <bibl xml:id="leonhard_ornament_2011">Karin Leonhard: Ornament und Zeitlichkeit.
                  Kartusche, Rocaille, Arabeske. In: Thomas Kisser (Hg.): Bild und Zeit.
                  Temporalität in der Kunst und Kunsttheorie seit 1800. München 2011, S.&#160;63–85.
                     <ptr type="gbv" cRef="626477247"/>
               </bibl>
               <bibl xml:id="lewis_et_al_generation_2020">Patrick Lewis&#160;/ Ethan Perez&#160;/
                  Aleksandra Piktus&#160;/ Fabio Petroni&#160;/ Vladimir Karpukhin&#160;/ Naman
                  Goyal&#160;/ Heinrich Küttler&#160;/ Mike Lewis&#160;/ Wen-tau Yih&#160;/ Tim
                  Rocktäschel&#160;/ Sebastian Riedel&#160;/ Douwe Kiela: Retrieval-Augmented
                  Generation for Knowledge-Intensive NLP Tasks. In: Hugo Larochelle&#160;/ Marc’Aurelio
                  Ranzato&#160;/ Raia Hadsell&#160;/ Maria Floriana Balcan&#160;/ Hsuan-Tien Lin (Hg.): NeurIPS 2020. 34<hi rend="super">th</hi> Annual Conference on Neural Information Processing Systems. Proceedings
                  (Online, 06.12.–12.12.2020). Vancouver, CA 2020, S.&#160;9459–9474. PDF. [<ref target="https://papers.nips.cc/paper_files/paper/2020/file/6b493230205f780e1bc26945df7481e5-Paper.pdf"
                     >online</ref>]
               </bibl>
               <bibl xml:id="lin_et_al_loss_2017">Tsung-Yi Lin&#160;/ Priya Goyal&#160;/ Ross
                  Girshick&#160;/ Kaiming He&#160;/ Piotr Dollár: Focal Loss for Dense Object
                  Detection. In: IEEE&#160;/ ICCV 2017. International Conference on Computer Vision.
                  Proceedings (Venedig, 22.10.–29.10.2017). Venedig 2017, S.&#160;2980–2988. PDF. [<ref            target="https://openaccess.thecvf.com/content_ICCV_2017/papers/Lin_Focal_Loss_for_ICCV_2017_paper.pdf"
                     >online</ref>]
               </bibl>
               <bibl xml:id="mandroux-frança_information-artistique_1973">Marie-Thérèse
                  Mandroux-França: Information artistique et ›masse-media‹ au 18 siècle. La
                  diffusion de l’ornement gravé rococo au Portugal. In: Bracara Augusta 27 (1973),
                  S.&#160;412-445. <ptr type="gbv" cRef="168319691"/>
               </bibl>
               <bibl xml:id="metaai_hg_yann_2023">Meta AI (Hg.): Yann LeCun on a Vision to Make AI
                  Systems Learn and Reason like Animals and Humans. Letzte Aktualisierung
                  23.02.2023. HTML. [<ref target="https://ai.meta.com/blog/yann-lecun-advances-in-ai-research/"
                     >online</ref>]</bibl>
               <bibl xml:id="paas_hg_augsburg_2001">John Roger Paas (Hg.): Augsburg, die
                  Bilderfabrik Europas. Essays zur Augsburger Druckgraphik der frühen Neuzeit.
                  Augsburg 2001. <ptr type="gbv" cRef="330620215"/>
               </bibl>
               <bibl xml:id="paas_et_al_hg_augsburg_2013">John Roger Paas&#160;/ Josef H.
                  Biller&#160;/ Marie-Luise Hopp-Gantner (Hg.): Gestochen in Augsburg. Forschungen
                  und Beiträge zur Geschichte der Augsburger Druckgrafik. Hommage à Wolfgang Seitz
                  zum 90. Geburtstag 2011 und Festgabe zum 40. Jahrestag des von ihm gegründeten
                  Augsburger Forscherkreises 1973–2013 (=&#160;Schwäbische Geschichtsquellen und
                  Forschungen, 29). Augsburg 2013. <ptr type="gbv" cRef="771354010"/>
               </bibl>
               <bibl xml:id="rombach_et_al_image_2022">Robin Rombach&#160;/ Andreas Blattmann&#160;/
                  Dominik Lorenz&#160;/ Patrick Esser&#160;/ Björn Ommer: High-resolution Image
                  Synthesis with Latent Diffusion Models. In: IEEE&#160;/ CVPR 2022. Conference on
                  Computer Vision and Pattern Recognition. Proceedings (New Orleans,
                  18.06.–24.06.2022). New Orleans, US-LA 2022, S.&#160;10674–10685. DOI:
                  10.1109/CVPR52688.2022.01042</bibl>
               <bibl xml:id="ronneberger_et_al_unet_2015">Olaf Ronneberger&#160;/ Philipp
                  Fischer&#160;/ Thomas Brox: U-Net: Convolutional Networks for Biomedical Image
                  Segmentation. In: Nassir Navab&#160;/ Joachim Hornegger&#160;/ William Wells&#160;/ Alejandro F. Frangi
                  (Hg.): MICCAI 2015. Medical Image Computing and Computer-Assisted Intervention.
                  Lecture Notes in Computer Science 9351 (2015), S.&#160;234–241. PDF. DOI:
                  10.1007/978-3-319-24574-4_28</bibl>
               <bibl xml:id="schmitz_katalog_1939">Hermann Schmitz: Katalog der
                  Ornamentstichsammlung der Staatlichen Kunstbibliothek Berlin. Berlin u.&#160;a.
                  1939. <ptr type="gbv" cRef="032867220"/>
               </bibl>
               <bibl xml:id="seeger_maria_2014">Ulrike Seeger: Abgekupfert, aufgefächert, angewandt:
                  Maria Philippina Küsels »gemalter Himmel«. Zur Rezeption französischer
                  Ornamentstiche via Augsburg. In: Sabine Frommel&#160;/ Eckhard Leuschner (Hg.):
                  Architektur- und Ornamentgraphik der Frühen Neuzeit. Migrationsprozesse in Europa.
                  Rom 2014, S.&#160;285–294. <ptr type="gbv" cRef="786941480"/>
               </bibl>
               <bibl xml:id="touvron_et_al_2023">Hugo Touvron&#160;/ Thibaut Lavril&#160;/ Gautier
                  Izacard&#160;/ Xavier Martinet&#160;/ Marie-Anne Lacaux&#160;/ Timothee
                  Lacroix&#160;/ Baptiste Rozière&#160;/ Naman Goyal&#160;/ Eric Hambro&#160;/
                  Faisal Azhar&#160;/ Aurelien Rodriguez&#160;/ Armand Joulin&#160;/ Edouard
                  Grave&#160;/ Guillaume Lample: LLaMA. Open and Efficient Foundation Language
                  Models. arXiv. 27.02.2023. DOI: <ref
                     target="https://doi.org/10.48550/arXiv.2302.13971"
                     >10.48550/arXiv.2302.13971</ref>
               </bibl>
               <bibl xml:id="wildmoser_gottfried_1984">Rudolf Wildmoser: Gottfried Bernhard Göz
                  (1708–1774) als ausführender Kupferstecher. Untersuchung und Katalog der Werke.
                  In: Jahrbuch des Vereins für Augsburger Bistumsgeschichte e.&#160;V. 18 (1984),
                  S.&#160;257–340. <ptr type="gbv" cRef="125374828"/>
               </bibl>
               <bibl xml:id="wildmoser_gottfried_1985">Rudolf Wildmoser: Gottfried Bernhard Göz
                  (1708–1774) als ausführender Kupferstecher. Untersuchung und Katalog der Werke.
                  Teil II: Katalog. In: Jahrbuch des Vereins für Augsburger Bistumsgeschichte e.V.
                  19 (1985), S.&#160;140–296. <ptr type="gbv" cRef="125374828"/>
               </bibl>    
               <bibl xml:id="yun_et_al_cutmix_2019">Sangdoo Yun&#160;/ Dongyoon Han&#160;/ Seong
                  Joon Oh&#160;/ Sanghyuk Chun&#160;/ Junsuk Choe&#160;/ Youngjoon Yoo: CutMix:
                  Regularization Strategy to Train Strong Classifiers with Localizable Features. In:
                  IEEE&#160;/ ICCV 2019. International Conference on Computer Vision.
                  Proceedings (Seoul, 27.10.–02.11.2019). Seoul 2019, S.&#160;6022–6031. PDF.
                  DOI: 10.1109/ICCV.2019.00612</bibl>
               <bibl xml:id="zhang_et_al_visionlanguage_2024">Jingyi Zhang&#160;/ Jiaxing
                  Huang&#160;/ Sheng Jin&#160;/ Shijian Lu: Vision-Language Models for Vision Tasks: A
                  Survey. In: IEEE Transactions on Pattern Analysis and Machine Intelligence 46
                  (2024), H.&#160;8, S.&#160;5625–5644. PDF. DOI: 10.1109/TPAMI.2024.3369699</bibl>
               <bibl xml:id="zheng_et_al_rethinking_2021">Sixiao Zheng&#160;/ Jiachen Lu&#160;/
                  Hengshuang Zhao&#160;/ Xiatian Zhu&#160;/ Zekun Luo&#160;/ Yabiao Wang&#160;/
                  Yanwei Fu&#160;/ Jianfeng Feng&#160;/ Tao Xiang&#160;/ Philip H.
                  S.&#160;Torr&#160;/ Li Zhang: Rethinking Semantic Segmentation from a
                  Sequence-to-sequence Perspective with Transformers. In: IEEE&#160;/ CVF 2021.
                  Conference on Computer Vision and Pattern Recognition. Proceedings
                  (Nashville, 20.06.–25.06.2021). Nashville 2021, S.&#160;6881–6890. PDF. [<ref target="https://openaccess.thecvf.com/content/CVPR2021/papers/Zheng_Rethinking_Semantic_Segmentation_From_a_Sequence-to-Sequence_Perspective_With_Transformers_CVPR_2021_paper.pdf"
                     >online</ref>] </bibl>
            </listBibl>
         </div>
      </back>
   </text>
</TEI>
