Anybody out there? Der Begriff der Masse im Crowdsourcing

Views
865
Downloads
3
Open Peer Review
Kategorie
Artikel
Version
1.1
Andrea Schilz Autoreninformationen

DOI: 10.17175/2022_003

Nachweis im OPAC der Herzog August Bibliothek: 1775144569

Erstveröffentlichung: 15.09.2022

Lizenz: Sofern nicht anders angegeben Creative Commons Lizenzvertrag

Medienlizenzen: Medienrechte liegen bei den Autor*innen.

Letzte Überprüfung aller Verweise: 07.09.2022

GND-Verschlagwortung: Crowdsourcing | Datenerhebung | Kulturwissenschaften | Masse | Schwarmintelligenz |

Empfohlene Zitierweise: Andrea Schilz: Anybody out there? Der Begriff der Masse im Crowdsourcing. In: Zeitschrift für digitale Geisteswissenschaften. Wolfenbüttel 2022. text/html Format. DOI: 10.17175/2022_003


Abstract

Der Artikel diskutiert kritisch den Begriff der ›Masse‹ unter der Perspektive von Crowdsourcing-Anwendungsfeldern. Es wird, auch unter historischer Rückbindung, ein Überblick zu spezifischen Methoden gegeben, die insbesondere im Feld der Citizen Science und in Projekten der Digital Humanities zum Einsatz kommen.

The article critically discusses the concept of ›the mass‹ from the perspective of crowdsourcing application fields. It provides, also considering historic aspects, an overview of specific methods used in the field of citizen science and in digital humanities projects.


Einleitung

[1]Das zielgerichtete Beschaffen von Informationen im digitalen Raum durch die ›Masse‹ wird aktiv betrieben über Crowdsourcing.[1] Im Bereich der Digital Humanities adressiert dies Aufgaben der Inhaltsgenerierung, Transkription und Annotation; sie werden an eine anonyme Menge interessierter Individuen delegiert, die auf diese Weise zu Projektbeiträgern werden.[2] Nicht zuletzt unter ökonomischen Gesichtspunkten erscheint dies zunehmend als Mittel der Wahl, verwertbare Daten zu generieren. Wie sieht es aber aus mit ›Verwertbarkeit‹ vor dem Frontend?

[2]Hinsichtlich des Begriffs ›Masse‹ wird dieser Beitrag, unter Betonung des Hs in den DH, Schlaglichter auf das Phänomen Crowdsourcing werfen. Dafür werden Fragenkomplexe zur kulturwissenschaftlichen Kontextualisierung des Crowdsourcings entwickelt: Inwiefern spiegeln sich geisteswissenschaftliche Konnotationen des Masse-Begriffs in Konzepten zum ›Gebrauch‹ der Crowd? Wie ist Crowdsourcing kulturhistorisch lesbar? Welche gesellschaftliche Relevanz hat Crowdsourcing und wie gestaltet die Scientific Community hier ihren Teil der Verantwortung? Was bedeutet dies bezüglich spezifischer Thematiken, Methoden und Techniken im Anwendungsfeld der DH?

[3]Vorbemerkung: Mitunter wird in diesem Artikel die rein männliche Sprachform verwendet, was allein der besseren Lesbarkeit dient und ausdrücklich alle Geschlechter in Sinnzusammenhänge mit einschließt.

1. Die Masse

1.1 Kritik der Masse

[4]Die ›Masse‹ umgibt eine Aura von Konnotationen, die bestimmten Bildern entstammt und in diese mündet: amorph und doch physisch wesenhaft. Unberechenbar, entindividualisiert und in dialektischer Weise lenkbar und zugleich unsteuerbar:

  • Wien, 15. März 1938 – die ›Anschluss‹-Rede Adolf Hitlers vor begeisterten Publikumsmassen auf dem Heldenplatz
  • Duisburg, 24. Juli 2010 – die medial öfters als ›Massenpanik‹ bezeichnete Katastrophe bei der 19. Loveparade.

[5]Die Masse suggeriert eine Homogenität, die entweder Täter oder Opfer abbildet – beide zeichnen sich jedoch gleichermaßen durch Fremdbestimmtheit aus.

[6]Die Masse als Negativ zur Selbstbestimmtheit ist, naheliegender Weise, historisch unterfüttert, nach Links wie nach Rechts. Das Zurückweisen der Masse als Identifikationsmoment im Hier und Heute wird, auch dies liegt nahe, bestimmt durch eine von räumlichen, zeitlichen und soziopolitischen Rahmenbedingungen bedingte Enkulturation. In Anlehnung an Sartre: Die Masse, das sind die anderen.[3] Das Stereotyp weist eine kulturgeschichtliche Dimension auf, die im Folgenden grob, und subjektiv abstrahierend sowie mit einem exkludierenden Fokus auf einer west- / mitteleuropäischen Perspektive, freigelegt werden soll.[4]

1.1.1 Die gefährliche Masse

[7]Auf der Makroebene ist ›Gefahr‹ eine bekannte Zuschreibung an die Masse. Es gibt begründete Argumente, diese Sicht zuzulassen (Stichwort Totalitarismus), doch es gibt auch eine wirksame a-historische Schicht dieses Deutungsmusters. »Das Zeitalter, in das wir eintreten, wird in Wahrheit das Zeitalter der Massen sein«,[5] prognostizierte um 1900 ein früher Vertreter der Massenpsychologie,[6] Gustave Le Bon. Für ihn ein beunruhigender Befund, denn: »Die Massen haben nur Kraft zur Zerstörung«[7] und sie richten diese Kraft auf die ›Kultur‹,[8] deren massenhaften Niedergangsprozess der Arzt Le Bon illustriert mit »Mikroben, welche die Auflösung geschwächter Körper oder Leichen beschleunigen«.[9] Als konstitutives Moment von ›Kultur‹ sieht Le Bon, zeittypisch, die ›Rasse‹,[10] welche »mit der Gesamtheit der Zellen, die ein lebendes Wesen bilden, verglichen werden (kann)«[11] und die, auch mittels Schädelvermessungen, hierarchisch klassifiziert wird (›primitiv‹, ›niedrig‹, ›mittel‹, ›höher‹).[12] Anhand der Überlegungen Le Bons in den Psychologischen Gesetzen der Völkerentwicklung[13] lässt sich exemplarisch dem wirkmächtigen Deutungsmuster Masse / Tief vs. Kultur / Hoch nachspüren.

[8]»Mit fortschreitender Zivilisation haben nicht nur die Rassen, sondern auch die Individuen jeder Rasse, wenigstens die der höheren Rassen, die Tendenz zu fortschreitender Differenzierung. Gerade entgegengesetzt unseren Gleichheitstheorien ist das Ergebnis der modernen Zivilisation nicht etwa das, die Menschen immer mehr einander intellektuell gleich zu machen, sondern immer verschiedenartiger.«[14]

[9]Ex negativo wird im obigen Zitat ein tiefes Misstrauen in die Masse erkennbar sowie eine daraus resultierende Angst vor ihrer nivellierenden Macht – Le Bon assoziierte hier insbesondere den Sozialismus.[15] Unter einer so gestalteten Perspektive lassen sich die rassistischen Implikationen einer ›kulturellen Hierarchie der Masse‹ abkoppeln, was in der Rezeption schon früh lesbar wird. Ein zeitgenössischer Blick auf Le Bons Werk fasst die dekonstruierend wirkende Figur einer ›Massenseele‹ als tragendes Moment der Kritik:

[10]»Nach L.[e Bon] sind die Massen keine Kulturerzeuger, sie wirken nur negativ, sind impulsiv, suggerierbar, intolerant, konservativ, unterliegen dem Einflusse ihrer Führer usw. [...] Das Instinktive, Triebartige, Unbewußte, Alogische kommt in jeder Massenseele zur Geltung; die Individualität der Mitglieder der Masse tritt zurück. Eine einheitliche, neue Psyche, die ›Massenseele‹, bildet sich (›loi de l’unité mentale des foules‹). ›Die bewußte Persönlichkeit schwindet, die Gefühle und Gedanken aller Einheiten sind nach derselben Richtung orientiert. Es bildet sich eine Kollektivseele.«[16]

[11]Der so abstrahierten ›Masse‹ werden quasi metaphysische Eigenschaften zugewiesen, woraus sich ein Negieren des Individuums ableiten lässt. Daraus resultierende Untiefen sollen anhand eines Schlaglichts auf den Überbevölkerungsdiskurs kurz skizziert werden: Verlief die Demarkationslinie im 19. Jahrhundert gesellschaftlich immanent – bedingt durch die Folgen der Industriellen Revolution –,[17] wurde die Diskussion in den 1970er Jahren global erneuert und erweiterte damit die bisher gesetzte Binarität Arm / Reich um Norden / Süden. In Reaktion auf breit wahrgenommene Warnungen vor den »Grenzen des Wachstums«[18] wurden Aussagen publiziert, in denen Abhilfe durch repressive Geburtenkontrolle propagiert wurde,[19] abzielend auf die so kategorisierten Länder der ›Dritten Welt‹.[20] Entgegnet wurde, dass hier faschistoide, eugenische und rassistische Argumentationsmuster vorlägen;[21] hierauf wurde wiederum geantwortet, dass das »(human)ökologische Konzept einer ultimativen ›Tragfähigkeit‹ der Erde insofern heikel (ist), als sich dessen mathematische und moralische Ökonomie dem Bereich des Politischen entzieht.«[22] Gerade dieses Entziehen kann meines Erachtens jedoch als dezidiert politisch kategorisiert werden – womit sich ein Bogen zurück zur »Le Bon’schen Linie der irrationalen, manipulierbaren, zu grenzenloser Gewalt fähigen Menge«[23] schlagen lässt.

1.1.2 Die dumme Masse

[12]Die Rezeptionsgeschichte von Le Bons Kritik der Masse reicht von Sigmund Freud (Massenpsychologie und Ich-Analyse, 1921) bis in die journalistische Diskurslandschaft.

[13]»Die Masse ist dumm – diese Weisheit klingt ziemlich undifferenziert [...], aber sie beschreibt tatsächlich recht genau die Grundlage der Massenpsychologie. Falls Le Bon recht hat, ist ein Soziologenkongress in seinem gemeinsamen Arbeitspapier weniger intelligent, als jeder einzelne Soziologe es wäre, wenn er alleine nachdenkt.«[24]

[14]Vor Le Bon gab es Stimmen, die andere Denkfiguren als die einer nivellierten Masse entwarfen. Bei Karl Marx (mit Friedrich Engels als gering beisteuerndem Co-Autor) sind Ansätze erkennbar, Lesarten des Masse-Begriffs als elitäres Produkt herauszuarbeiten. [25] Im marxistischen Modell wird die Masse als Negativ zum wertschöpfenden Proletariat verstanden, zu ihr gehört die Überbevölkerung. Diese ist unproduktiv und besitzlos; sie ist das machtlose Ex-Proletariat, dem das einzige Druckmittel gegen die kapitalistische Repression abhandengekommen ist, der Streik. Jedoch ist sie nicht degeneriert wie das Lumpenproletariat, jener von Marx und Engels rigide abgelehnte Teil der Masse, der außerhalb des Produktionsprozesses steht.

[15]Nicht zuletzt vor diesem Hintergrund ist die erste gemeinsame Publikation von Marx und Engels keineswegs als eine Art Proto-Bourdieu zu verstehen[26] – 135 Jahre später wird Pierre Bourdieu Muster der Distinktion in Abgrenzung zur Masse analysieren, das Affirmative des »Nicht-Massenmenschen« präzisieren und »Habitus und Reproduktion sozialer Ungleichheit (durch) (d)ie verborgenen Mechanismen der Macht« freilegen. [27] Die Schrift von Marx und Engels ist dagegen eine in der Frühphase des Dialektischen Materialmus formulierte intellektuelle Polemik gegen die Junghegelianer »Bruno Bauer & Consorten« als »Heilige Familie«. Diese, so der Anwurf sinngemäß, gingen irrig, mit der Theoretischen Kritik (Hirntätigkeit der kritischen Kritik, Marx) konkreten Einfluss auf die »Umgestaltung der Gesellschaft« (Marx) nehmen zu können.[28]

[16]»Es ist der kritischen Kritik nicht gelungen, sich als den wesentlichen Gegensatz und darum zugleich als den wesentlichen Gegenstand der Menschheit in Masse darzustellen. […] Überhaupt ist die Masse ein unbestimmter Gegenstand, der daher weder eine bestimmte Aktion ausüben noch auch in ein bestimmtes Verhältnis treten kann. Die Masse, wie sie der Gegenstand der kritischen Kritik ist, hat nichts gemein mit den wirklichen Massen, die wieder sehr massenhafte Gegensätze unter sich bilden.«[29]

[17]Massenhafte Gegensätze in der Masse, ›die Masse‹ als ein Konglomerat sozialer Gruppen – eine Auffassung von Partialkulturen deutet sich an. Fortgeführt könnte dieser Ansatz Konsequenzen hinsichtlich Zuschreibungen an das Pseudo-Individuum ›Masse‹ haben. Auf den ersten Blick schien hier der Zeitgenosse Charles Mackay ein Repräsentant des auf der psychosozialen Ebene gebräuchlichen Distinktionsmusters ›Dummheit‹ zu sein. Er thematisierte in Zeichen und Wunder: Aus den Analen des Wahns (1841) »populären Unsinn«, den er exemplifizierte mit den Kreuzzügen, Hexenwahn, ökonomischen Blasen (›Tulpenmanie‹), Prophezeiungen bzw. Wahrsagerei (z. B. Nostradamus). Er schrieb den Massen nicht weniger als die Fähigkeit zu blankem Wahnsinn zu, »Madness of Crowds«.

[18]»In reading the history of nations, we find that, like individuals, they have their whims and their peculiarities; their seasons of excitement and recklessness, when they care not what they do. We find that whole communities suddenly fix their minds upon one object, and go mad in its pursuit; that millions of people become simultaneously impressed with one delusion, and run after it, till their attention is caught by some new folly more captivating than the first.«[30]

[19]Mackay unterlässt zwei wesentliche Dinge: Er zielt nicht auf bestimmte, namentlich arme Schichten ab, und, daran anknüpfend, synthetisiert er keine ›Masse‹, sondern spricht von ›communities‹. Mackays ›Madness‹ deutet nicht in Richtung einer Abwertung der Masse als geringwertige Entität. Er ist nicht distinktiv, sondern dekonstruiert soziale Mechanismen bzw. Dynamiken, die dem Einzelnen Affirmation (›Herdendenken‹) bis zur Selbstverleugnung suggerieren, die aber das Individuum als solches – und nur als solches – wieder aufheben kann.[31] Damit sind zwei Pole des Narrativs von der Masse in der Moderne formuliert: Züge der Entmenschlichung und Potenziale der Selbstbehauptung. Zoomen wir nun unter dieser Perspektive den ›Massenmenschen‹ von der Makro- auf die Mikroebene heran.

1.2 Die moderne Masse

1.2.1 Der Flaneur in der Masse

[20]Die Masse ist ein Phänomen des Industriezeitalters bzw. der Moderne, in der sie zunehmend an Facetten gewinnt, die an das semantische Feld der Großstadt gekopppelt sind: Urbanität, Fortschritt, Geschichtslosigkeit, Auflösung. An diesem Punkt der Erzählung von der ›modernen Masse‹ stoßen wir auf eine Lesart, mit der ein ästhetisches Fassen des Massenmenschen einhergeht, das auf das Wesen der Popkultur verweisen wird. 1850 begegnet uns Edgar Allan Poes undefinierbares, ungreifbares, unberechenbares Individuum in der Masse: »He is the man of the crowd. It will be in vain to follow; for I shall learn no more of him, nor of his deeds.«[32]

[21]Hier setzt eine neuartige Spielart individueller Selbstdefinition ein, in der Singularisierung als Chance begriffen wird – als Möglichkeit, eine ›Heimat‹ im Urbanen zu finden und Selbstbewusstsein in der Anonymität der Menge auszubilden. Charles Baudelaire beschreibt dieses Ich-sein in der Masse als Option, die nicht jeder wahrzunehmen befähigt ist: »Wer es nicht versteht, sein Alleinsein zu bevölkern, der versteht es auch nicht, in einer geschäftigen Menge allein zu sein.«[33]

[22]Das Individuum kontrastiert seinen Identitätsentwurf vor der Folie der Masse und ist gleichzeitig bewusst ein Teil von ihr. Die Masse verlangt demnach dem Einzelnen, der sie positiv erfahren möchte, ein gewisses emanzipatorisches Moment der Selbstbehauptung ab. Idealtypisch ist jenes Individuum, das hierzu in der Lage ist, der Flaneur – der bohemistische Spaziergänger in der Großstadt. Ihn entwirft Baudelaire als leitbild-artige Figur der Moderne, die von Walter Benjamin rezipiert werden wird.

[23]Benjamin bewegte sich im realen Spannungsfeld der Moderne und erfuhr deren Untiefen unmittelbar. Die Masse sah er differenziert kritisch; er sprach der Massenkultur, etwa in seinen Thesen zum Kunstwerk im Zeitalter seiner technischen Reproduzierbarkeit,[34] durchaus auch emanzipatorisches Potenzial zu und war darin optimistischer als Max Horkheimer und Theodor W. Adorno mit ihrer Kulturindustrie-These. Doch auch Benjamin erkannte klar eine Gefahr in der Passivität gegenüber den (Massen-)Medien bzw. im unreflektierten Konsumieren von Zeichen. So deutete er die Figur des Flaneurs kritisch als Metapher für die Gefahr des Scheins, der vom Kollektiv ausgeht. Das folgende Zitat stammt aus der Zeit des Pariser Exils, dem eine weitere Flucht vor der Gestapo mit tödlichem Ausgang folgte. Es nimmt Bezug auf den NS-Staat als verheerendes Resultat der modernen Masse und dem Flaneur in ihr, der sich täuscht, wenn er glaubt, den Schein zu beherrschen.

[24]»Welche Bewandtnis es mit dem Neuen hat, das lehrt vielleicht der flaneur am besten. Der Schein einer in sich bewegten, in sich beseelten Menge ist es, an dem er seinen Durst nach dem Neuen löscht. In der Tat ist dieses Kollektiv durchaus nichts als Schein. Diese ›Menge‹, an der der flaneur sich weidet, ist die Hohlform, in die siebenzig Jahre später die Volksgemeinschaft gegossen wurde. Der flaneur, der sich auf seine Aufgewecktheit, auf seine Eigenbrötelei viel zu gute tut, war auch darin seinen Zeitgenossen vorangeeilt, daß er als erster einem Trugbild zum Opfer fiel, das seitdem viele Millionen geblendet hat.«[35]

1.2.2 Der Flaneur im WWW

[25]Das Misstrauen in die Befähigung der Masse, Schein zu erkennen, setzt sich fort in der Postmoderne. Jean Baudrillard sieht, in der Tradition der Kulturindustrie-These, die Gefahr absoluter Passivität gegenüber den (Massen-)Medien. Zeichen seien heute ›referenzlos‹ und erweckten nur noch den Schein von Information:

[26]»And I repeat: it is a question here of a completely new species of uncertainty, which results not from the lack of information but from information itself and even from an excess of information. It is information itself which produces uncertainty, and so this uncertainty, unlike the traditional uncertainty which could always be resolved, is irreparable.«[36]

[27]Dieses Argument einer systemisch unumkehrbaren Täuschung der Masse durch eine Flut von Schein-Information wurde vor dem Beginn des Internet-Zeitalters formuliert. In den 2010er Jahren lässt sich das Movens dieses Angstbefunds nun verifizieren, inhaltlich (Fake News)[37] wie strukturell (Filter Bubble)[38] – also doch ein ›Dislike‹ für die Masse? Nein. Denn der Flaneur, der sich im Informationszeitalter wiederfindet bei dem Vorgang bzw. der Tätigkeit des Browsens, hat Alternativen. Welchen Informationswert das Flanieren im World Wide Web hat, bestimmt der Flaneur selbst, seine Möglichkeiten und Grenzen kennend. Dabei ist der historische Flaneur in seiner Eigenschaft als maskulines Phänomen heute faktisch divers vertreten. Die Männlichkeit der Figur ist freilich grammatikalisch konserviert, weshalb der historisch bedingte Begriff hier im Maskulinum verbleibt. Empirisch sind die weltweiten Netze von Flaneur*innen bevölkert. In dieses zugleich diverse und individuelle Potenzial des Mediums und der Rezipienten vertraut Yochai Benkler: »On the Web, linking to original materials and references is considered a core characteristic of communication. The culture is oriented toward ›see for yourself‹.«[39]

[28]So entscheidet der Flaneur also, Teil einer konstruktiv wirksamen Masse im Sinne eines Gemeinnützigkeit-Gedankens im digitalen Raum zu sein und partizipiert auf dem Gebiet der Wissensallmende: gemeinsames Gut (Gemeingut) der modernen Informationsgesellschaft. Commons-based Peer Production (CBPP) wird in der Wikipedia übersetzt mit »Allmendefertigung durch Gleichberechtigte«.[40] In Anlehnung an diese mittelalterliche bzw. frühneuzeitliche Rechtsform von Gemeinschafts- oder Genossenschaftsbesitz, prägte Benkler 2006 den Begriff der CBPP:

[29]»[Free software] suggests that the networked environment makes possible a new modality of organizing production: radically decentralized, collaborative, and nonproprietary; based on sharing resources and outputs among widely distributed, loosely connected individuals who cooperate with each other without relying on either market signals or managerial commands. This is what I call ›commons-based peer production‹.«[41]

[30]Benkler knüpft an das Konzept der ›wisdom of crowds‹ an, in dem nach Surowiecki Dezentralisierung der Rahmenparameter für eine Crowd selbstbewusster (»self-interested«) und unabhängiger Individuen ist. CBPP kann sich nach Benkler auf viele Sektoren (z. B. Open Source Hard- und Software) und Projektarten beziehen. Internet-basierte Citizen Science gehört ebenso zur CBPP, wie Wiki-Projekte (Wikipedia, WikiCommons, Wikisource), Social Tagging bzw. Folksonomy, Social Cataloging, Open Courseware, P2P-Sharing Systeme (capacity oder file sharing) sowie Distributed / Volunteer Computing Projects, unter das er SETI@Home einordnet.[42]

[31]Das Wesen des Crowdsourcings kann aber auch anders interpretiert und, davon abgeleitet, mit anderen Zielhorizonten konzipiert werden: Die Ressource ›Masse‹ dient allein der Informationsbeschaffung – dies insinuierte Jeff Howe, als er Mitte der 2000er Jahre im Magazin Wire das Kofferwort ›Crowdsourcing‹ aus ›Crowd‹ und ›Outsourcing‹ kreierte: »the act of taking a job […] (out) to an undefined, [...] large group of people in the form of an open call.«[43] Die nach Howe »unbekannten Akteure« der Crowd sind typischerweise Internetnutzer und Internetnutzerinnen. Er unterscheidet vier Typen von Crowdsourcing zu unterschiedlichen Zwecken:[44]

  • Crowdfunding (Fördermittel akquirieren)
  • Crowdwisdom (Wissen nutzbar machen)
  • Crowdvoting (Inhalte ranken)
  • Crowdcreation (Inhalt generieren)

[32]Er zielt in seiner Entwicklung der Potenziale dieser Datengewinnungs-Methode klar auf deren ökonomischen Kernbereich ab.[45]

[33]Dagegen ist das quantitativ vergleichsweise marginale Feld des Crowdsourcings im Bereich der Digital Humanities oft in einer Schnittmenge mit Institutionen für Erhalt von Kulturerbe angesiedelt.[46] Das Prinzip unterscheidet sich dabei nicht vom kommerziellen Setting: Unterschiedliche Aufgaben werden über zielgruppengerechte Aufrufe an eine anonyme Menge interessierter Individuen delegiert, die akkumulativ Daten erzeugen. Doch Crowdsourcing wird hier nicht nur als Werkzeug bzw. Produktionsmittel gesehen, sondern auch als Diskursgegenstand. Die Literatur widmet sich Typologien, Modellen, Fallstudien, und auch ethischen Fragen. Dabei wird dazu tendiert, dem weichen Faktor einer Sensibilisierung für kulturelles Erbe hohen Stellenwert einzuräumen, gegenüber dem harten Faktor der Effizienz. Damit wird ein doppelter Zweck verfolgt: Datengenerierung sowie das Gewinnen von Stakeholdern für die eigenen Belange im jeweiligen Projektkontext.

2. Analoges Crowdsourcing

[34]Zwischen den Polen des Materiellen und Ideellen oszilliert Crowdsourcing im wissenschaftlichen Bereich schon lange. Unter diesem Aspekt beginnt die folgende Retrospektive – die auch als ein Stück Kultur- bzw. Ideengeschichte gelesen werden kann – im Analogen, während für das Crowdsourcing nach Howe der Rahmenparameter des digitalen Raums Internet grundlegend ist.

2.1 Die Crowd liefert direkt

[35]Der Weg der Daten verläuft in bestimmten Crowdsourcing-Modellen direkt vom erzeugenden Individuum zur Speicherung, ohne Vermittlungsinstanz bzw. Entlohnungsschleife. Voraussetzung für diese Konstellation sind Publikation (Aufruf) und Annahme eines unbezahlten Arbeitsangebots (Partizipation). Dies wiederum setzt erfolgreich erzeugtes individuelles Interesse bei den potenziell Beitragenden voraus – eine fundamentale Komponente des nicht-kommerziellen Crowdsourcings, sowohl im naturwissenschaftlich geprägten Bereich der Citizen Science als auch im Crowdsourcing mit geistes- bzw. kulturwissenschaftlicher Ausrichtung. Da auf beiden Seiten Aktivität motiviert ist durch das Verfolgen eines gemeinsamen Ziels, bilden im Idealfall Projekt und Crowd ein auf Selbstbestimmung basierendes produktives Integral. Die Anfänge hierfür liegen im anglo-amerikanischen Raum: In den USA nimmt die spätere Citizen Science ihren frühen Ausgang vor dem Hintergrund nationaler Identitätsentwürfe.

[36]»Following the American Revolution, historian Paul Semonin writes, ›natural history became a central metaphor for American nationalism‹ [...]. Thomas Jefferson’s Declaration of Independence spoke of the ›laws of nature and nature’s God‹ to justify the War of Independence and the creation of the United States, and his Notes on the State of Virginia (first published in 1785) was itself a sort of natural history that linked American nature and national identity.«[47]

[37]Naturromantische Strömungen, die sich in der zweiten Hälfte des 19. Jahrhunderts gleichzeitig als Indikatoren und Katalysatoren hierfür zeigten, waren auf philosophischem Gebiet der Transzendentalismus,[48] auf künstlerischem die Hudson River School[49] und auf ökologischem die Einrichtung von Schutzgebieten, später ›Nationalparks‹. Vor der Folie einer Naturidentität, die in komplexer Weise mit der territorialen, politischen und ideologischen Konstruktion der Vereinigten Staaten von Amerika zusammenhängt, spielen sich markante Ressourcenvernichtungen ab.[50] Eines der Phänomene ist das Ausrotten von Vogelarten zugunsten einer Damenhutmode.[51] Gegenbewusstsein kommt aus dem Bürgertum, zeitgleich mit der sich manifestierenden Emanzipationsbewegung. 1896 schaffen zwei Bostoner Frauen (Harriet Hemenway, Minna Hall) mit einem Boykottaufruf für Vogelfedern Öffentlichkeit für Artenschutzbelange.[52]

[38]Eine Reaktion: Der autodidaktische Ornithologe Frank Chapman begründet 1900 den Christmas Bird Count, kurz CBC, alternativ zur Jagdveranstaltung Christmas Side Hunt. Als Organ für den Aufruf zur Vogelzählung dient das Magazin der Audubon Societies.[53] Durch dieses Aufrufmedium wurde gezielt ein bürgerlicher Personenkreis mit prognostizierbaren soziokulturell geprägten Identifikationsansätzen adressiert, der im nicht-kommerziellen Kontext Daten liefern sollte. Prototypisch tritt hier das Leitbild einer selbstbestimmt handelnden Crowd interessierter Individuen hervor.

[39]Mit ähnlichem Hintergrund startete in England das erste Crowdsourcing-Projekt im geisteswissenschaftlichen Bereich, das bis heute fortgeführte Oxford English Dictionary, kurz OED – Motto: »The definitive record of the English language«.[54] Auch hier war das bürgerliche Milieu Zielgruppe des Aufrufs, auch hier erfolgte dieser über eine direkte Adressierung des Individuums in der spezifischen Crowd. Es begann 1857 mit dem Circular des ›Unregistered Words Committee‹ der Philological Society of London, das in etlichen Journalen veröffentlicht wurde und dazu aufrief, bis dato noch nicht registrierte Wörter und Idiome zu sammeln.[55] Ziel war vorerst die Komplettierung bestehender einschlägiger Werke, 1858 fiel aber schon der Beschluss für ein neues Wörterbuch. Es folgten Aufrufe verschiedener Herausgeber: 1859 adressierte George Perkins Marsh die Vereinigten Staaten von Amerika. 1879 wendete sich James Murray an den gesamten englischen Sprachraum, wobei sein Ziel auch darin lag, die Belegdichte für Gesammeltes über dichte Referenz-Nennungen zu erhöhen; die Aufgabe bestand darin, Bücher zu lesen und Auszüge zu markieren[56], wobei den Zuarbeitenden eine Bücherliste mit Publikationen vom 15. Jahrhundert bis zur damaligen Zeit an die Hand gegeben wurde. Hier gab es erstmals größere Rückläufe im vierstelligen Bereich. 1928 erschien die Erstauflage des OED (20 Bände), die zweite Auflage 1989.[57] In Abständen gab es weitere Aufrufe, darunter einer in Kooperation mit der BBC: Medium war die TV-Serie Balderdash & Piffle 2007.[58]

2.2 Die Crowd liefert indirekt

[40]Fragebogenaktionen sind methodisch nicht mit Crowdsourcing gleichzusetzen. Dennoch können die zwei im Folgenden skizzierten Projekte, die auf dieser Datenerhebungs-Strategie beruhen, unter der gesetzten Perspektive den Anfängen des Crowdsourcing zugeordnet werden. Ihnen ist gemeinsam, dass sie eine Crowd indirekt – mittelbar, über Korrespondierende – adressieren und qualitativ als ›Volk‹ identifizieren. Die Beitragenden stehen quasi pars pro toto als Exponenten einer Crowd, die als organische Einheit verstanden wird, als das hypothetische ›Deutsche Volk‹. Diese so vordefinierte Crowd ist als Datenlieferant elementares Mittel zum Zweck der Projektrealisierung.

[41]Im deutschsprachigen Raum erfolgt 1865 die erste große volkskundliche Fragebogenaktion, initiiert von Wilhelm Mannhardt (1831–1880). Er ist eine Schlüsselperson der Mythologischen Schule, die auf Jacob Grimms Deutscher Mythologie (1835) fußt, entstanden vor dem Hintergrund der Nationalromantik bzw. dem Entstehen der ›Volkskunde‹ als Disziplin.[59] Mannhardt bedient sich des Korrespondentenverfahrens sowie persönlicher Exploration – es wird also dezidiert kein direkter Aufruf angewandt. Mannhardts Ziel ist, zeittypisch, die Suche nach der ›Urform‹ bestimmter kultureller Phänomene in literarisch-erzählerischen Traditionen bzw. Bräuchen, immer mit der Bezugsgröße ›(deutsches) Volk‹. Theoretische Basis ist die Kontinuitätshypothese, die Methodik u. a. eine Datenerhebung über Fragebögen, bei der »alte agrarische Gebräuche und Erntesitten« fokussiert werden.

[42]1865 werden 150.000 Exemplare des Fragebogens verschickt, der zuerst 25 Fragen enthält und später auf 35 erweitert wird.[60] Der Charakter ist ähnlich dem eines themenzentrierten, leitfadengesteuerten Interviews.[61] Der Versandradius umfasst nicht nur alle deutschen Länder, sondern auch »Österreich-Ungarn, Polen, Litauen, Skandinavien, Holland, Frankreich und (die) Schweiz«[62]. Adressaten sind u. a. Lehrer, Pastoren, Gutsbesitzer und Personen aus Vereinsvorständen.[63] Werke, die insbesondere auf Basis des Rücklaufs von 2.500 Antworten entstehen, sind Roggenwolf und Roggenhund (Danzig 1865; darin abgedruckt: Die Bitte um Beantwortung von 35 Fragen), Die Korndämonen (Berlin 1868)[64] und Wald- und Feldkulte (zwei Bände, Berlin 1875–77)[65]. Ihnen ist ein durchaus progressiver Aspekt eigen, denn Mannhardt sieht modern den Wandel als konstitutiv und nicht als einen Störfaktor im ›Uralten‹. Seine Auffassung und sein methodisch vergleichendes Herangehen enthalten Ansätze, die für die Volkskunde von einiger Relevanz sind, wie Ingeborg Weber-Kellermann 1965 in ihrer Habilitation zeigte.[66]

[43]Von der ›Volks‹-Crowd gelieferte Daten können jedoch auch anders interpretiert werden. Dies wird deutlich am größten Projekt der Disziplin Volkskunde[67], dem Atlas der deutschen Volkskunde (ADV), bei dem unter anderem auf Erfahrungen aus dem Fragebogen-Projekt von Mannhardt 1865 zurückgegriffen wurde.[68] Gegenstand ist die Kulturraumforschung mit ihren Fragen nach Kulturphänomenen in raumzeitlichen Bezügen (Novation, Diffusion, Relikte), Basis der kartografischen Visualisierungen ist empirisch erhobenes Material. Nach einer »Probebefragung«[69] erfolgte 1930–35 die Datenerhebung; ihr zugrunde lagen fünf Fragebögen mit 930 Fragen (in 243 Hauptfragen gegliedert) zu 17 Bereichen, mit den inhaltlich-thematischen Schwerpunkten Brauchtum und Haus.[70] Der Rücklauf betrug 18.000 Antworten pro Frage; multipliziert mit der Anzahl an Hauptfragen sind dies ca. 4,5 Millionen Einzelbelege.[71]

[44]Das bereits 1928 begonnene, gut ausgestattete Projekt (Gründung der Berliner Zentralstelle sowie von 34 Landesstellen) wurde 1934 im Rahmen der Gleichschaltung dem ›Reichsbund Volkstum und Heimat‹ zugeordnet, bis 1937 unterstand es dem ›Amt Rosenberg‹ und wurde 1938 dem ›SS-Ahnenerbe‹ eingegliedert.[72] Obgleich die Nähe zur Blut-und-Boden-Ideologie damit strukturell manifest war – und manche Vertreter des Fachs Volkskunde sich dieser durchaus andienten[73] –, konnte Michael Simon »[d]en Vorwurf der nationalsozialistischen Vereinnahmung [...] aufgrund der Genese und der inhaltlichen Ausrichtung plausibel entkräfte[n].«[74] Dennoch kontrastiert die Ausrichtung des Projekts ADV gegen die der Mannhardt-Befragung, bei der ein Erkenntnisinteresse auf der Dynamik kultureller Prozesse gelegen hatte. Sowohl Mannhardts Forschungsdesign als auch das des ADV waren zwar gleichermaßen geprägt von der Grundannahme der romantischen, wirkmächtigen Figur der »Volksseele«,[75] doch

[45]»[d]ie objektivistischen Kartenbilder schufen die Utopie der ›Integrität nationaler Räume‹ (Schmoll 2005, 249). Ich wage die Behauptung, dass wir es hier im Grunde mit einer Renaissance der Idee einer ›Kulturnation‹ zu tun haben, die sich der Methode der kartographischen Darstellung bediente: es gehört dazu, wer auf der Karte repräsentiert ist«.[76]

[46]1945 bedeutete nicht das Ende für das Projekt, es wurde ab 1954 in Bonn unter Matthias Zender wiederaufgenommen. Die Mitarbeiter und Mitarbeiterinnen von Zender (u. a. Heinrich Cox und Günther Wiegelmann) widmeten sich, auch unter der Metaperspektive einer Neu-Konstituierung des Fachs, der kritischen Auf-, Nach- und Neubearbeitung des umfangreichen, in den 1930er Jahren erhobenen Datenmaterials. Der Einsatz computergestützter Methoden begann in den 2000er Jahren.[77] Der Konnex des ADV zum digitalen Zeitalter liegt jedoch nicht nur in dieser jüngeren wissenschaftlichen Rezeption begründet. Schon die Art der analogen Datenerhebung verweist auf eine markante Eigenschaft elektronischer Datenerzeugung. Methodisch kam keine Exploratorenbefragung zum Einsatz, die zu qualitativ hochwertigeren Daten hätte beitragen können, sondern ein Korrespondentenverfahren.

[47]»Ausschlaggebend war wohl die Tatsache, daß man glaubte, im Korrespondentenverfahren könne man die Befragung in einer verhältnismäßig kurzen Zeit zu einem Abschluß bringen und die Quantität der Fragebögen wiege die Qualität der von Exploratoren ausgefüllten Fragebögen auf oder übertreffe diese sogar.«[78]

[48]Entscheidend für das konzeptionelle Vorgehen war also die Datenmenge. Hier findet sich ein Merkmal heutiger Crowdsourcing-Projekte aus dem Bereich der Citizen Science, die gezielt auf große Mengen Datenmaterial zur Unterstützung von Prozessoptimierung setzen.

3. Ziele und Strategien

3.1 Datengenerierung

[49]Zieldefinitionen zur Nutzung generierter menschlicher Arbeitskraft verhalten sich im kommerziellen und nicht-kommerziellen Bereich konträr zueinander: Auf der einen Seite sind seriell arbeitende Crowdworker erwünscht (sowie der arbeitende Kunde, der als Prosument in einer Quasi-Crowd z. B. zu Prozessen der Qualitätssicherung beiträgt), auf der anderen Seite tragen Gedanken der Gemeinnützigkeit und weitere weiche Faktoren Projekte. Der quantifizierbare Nutzen von Crowdsourcing ist jedoch immer Datengenerierung. Diese kann unter verschiedenen Prämissen bezüglich des Werts crowd-erzeugter Information erfolgen – Akzente können auf dem Datum selbst liegen, der Datenmenge oder einem Hybrid dieser Schwerpunkte.

[50]Blicken wir zuerst auf die Citizen Science. Der Begriff wird vom Bundesministerium für Bildung und Forschung mit »Bürgerforschung« übersetzt, als paradigmatischer Hintergrund benannt wird ein partizipativer Bildungsgedanke.[79] Zu den großen Crowdsourcing-Projekten, die diesem Sektor zugerechnet werden, zählt der bereits erwähnte, als analoges Projekt gestartete Christmas Bird Count. Die Daten aus dem mittlerweile digital gestützten CBC[80] werden in die Online-Datenbank eBird der Audubon und Cornell University NY, Cornell Lab of Ornithology, eingespeist und in weitere Kontexte integriert.[81] Wie bei saisonalen Vogelzählungen in Deutschland (getragen vom Naturschutzbund Deutschland e. V., kurz NABU, und dem Landesbund für Vogelschutz in Bayern e. V., kurz LBV) besitzt die jeweilige Information, obgleich massenhaft seriell erhoben und potenziell fehlerbehaftet, gewissermaßen ihr individuelles Recht, um zur Organisation zeiträumlicher Daten von Vogelsichtungen beizutragen. Das Konzept: Nur die Crowd hat die benötigten Ressourcen zur Feldbeobachtung und damit unmittelbar zur Datengenerierung. Exemplarisch die Angabe des Nabu, »2017 haben insgesamt mehr als 120.000 Vogelfreundinnen und Vogelfreunde aus 82.000 Gärten rund 2,8 Millionen Vögel gemeldet.«[82]

[51]Den mittelbaren Wert crowd-erzeugter Daten, der aus dem Nutzen menschlicher Hilfe beim Thema Mustererkennung resultiert, macht – neben Aspekten der Partizipation – die US-amerikanische Organisation Citizen Science Alliance explizit (deren erste Plattform Galaxy Zoo wurde 2007 aufgesetzt, daraus entstand 2009 Zooniverse). Das Konzept hier: Laien liefern zwar potenziell fehlerbehaftete Daten, generieren aber große Datenmengen, die einer Verbesserung der Datenanalyse und damit verbesserten Automatisierungsprozessen dienen. Schließlich beruht der Einsatz der Methoden Transkription und Annotation unter Nutzung der Crowd – unter harten Gesichtspunkten – darauf, dass es bis dato noch keine tragfähigen Werkzeuge zur Automatisierung gibt.

[52]»Citizen science data sets naturally provide large and powerful training sets for machine learning approaches to classification problems. This is an essential part of our future; as data sets continue to grow we will need to hand off more and more of the routine tasks to machines; by doing citizen science today we can help train them.«[83]

[53]Das Zooniverse-Projekt Old Weather[84] zeigt eine Mischform der zwei oben formulierten Ansätze. Der Informationsgehalt des Datums ist qualitativ wertvoll, jedoch nicht als inhaltlicher Selbstzweck. Es zählt die in größeren Prozessen pragmatisch verwertbare Datenmasse, um Projektziele zu erreichen. Thematisch geht es um Klimaforschung, inhaltlich werden aus historischen Quellen mit meteorologischer Relevanz raumzeitliche Informationen zu Wetterlagen in der Vergangenheit extrapoliert, Ziel ist die Optimierung von Datenbanken zu Klimaforschung.[85] Methodisch ist das Vorgehen vergleichbar mit Projekten aus dem Feld der Digital Humanities; die Anlage der Projektseite ähnelt in Struktur und Nutzerführung einschlägigen Formaten für Transkription und Annotation. Auf der Projekt-Einstiegsseite sind historische Fahrten von Schiffen selektierbar; über deren Auswahl gelangt man zum jeweiligen Logbuch, das in ein Bearbeitungs-Interface eingebettet ist. Anleitungen und Aufgaben werden linear gestaffelt in kurzen Einheiten gegeben, um sowohl Nutzungsabbruch als auch Fehlern durch Überforderung vorzubeugen. Dies ist nicht die einzige Parallele zu DH-Projekten, die die Masse einbinden.

[54]Crowdsourcing im Feld der Digital Humanities unterliegt hinsichtlich des Zielfaktors Quantität prinzipiell keinen anderen Prämissen, als es bei der Cititzen Science der Fall ist – ›size matters‹, verkürzt gesprochen. Verkürzt, weil weder der naturwissenschaftliche Trend innerhalb der Citizen Science noch ihr Fokus auf Quantität feststehend sind. Das Zooniverse-Projekt Operation War Diary[86] (durchgeführt vom Nationalarchiv der Vereinigten Staaten ›National Archives and Records Administration‹, kurz NARA, mit dem englischen Museumsverbund Imperial War Museums) passt ins Format qualitativ ausgerichteter Digital-Humanities-Projekte. Dementsprechend wird methodisch-konzeptionell so gearbeitet, wie es im Spektrum einschlägiger DH-Projekte der Fall ist. Ein hier feststellbarer Schwerpunkt ist dem Hintergrund der Geistes- und Kulturwissenschaften bzw. dem Impetus des Kulturerbe-Gedankens geschuldet: Man orientiert sich tendenziell eher am Gegenstand der Quelle als solcher, ihrer Anreicherung durch Inhaltserschließung bzw. Metadaten-Generierung, weniger an einem Blick auf sie als Medium zur Rohdatengewinnung für intentional andere Ziele.

3.2 Methoden

[55]Transkription und Annotation sind Kernmethoden des in unserem Kontext relevanten Crowdsourcings. Die Citizen-Science-Projekte Old Weather und War Diary bedienen sich ihrer mittels wählbarer Transkriptions- oder Markup-Funktion, auch für Projekte aus dem DH-Bereich ist dies Standard.

[56]Das Transkribieren von Handschriften richtet sich zuerst auf den Zweck einer Tiefenerschließung durch manuelle Übertragung, mangels hinreichend funktionierender automatischer Texterkennung. In Kombination mit Markup und Annotation können weitere Nutzaspekte hinzugewonnen werden – allerdings ist der Aufwand dafür anbieter- wie beiträgerseitig erheblich und muss, je nach Projekt, abgewogen werden.[87] Eingesetzt wird Transkription in der Genealogieforschung (z. B. Compgen, Verein für Computergenealogie e. V.), im Bibliothekssektor (Emigrant City, What’s on the Menu? / New York Public Library; DIY History project / University of Iowa Libraries), in den Bereichen Archiv (Crowdsourcing Transcription Project / Public Record Office Victoria PROV; Citizen Archivist / NARA) und Museum (Transcripition Center / Smithsonian) sowie in Kooperationen (Field Book Project / Smithsonian Institution Archives, National Museum of Natural History).[88]

[57]Die genannten Projekte verwenden konventionelle Lösungen, um Teilnehmenden Transkriptions-Funktionen zugänglich zu machen. Einen alternativen Ansatz zeigt das abgeschlossene, grafisch aufwändig gestaltete Projekt DigiTalkoot der finnischen Nationalbibliothek mit der Firma Microtask. Es verbindet die Methode der Transkription mit dem Konzept von Gamification[89] und war von Februar 2011 bis November 2012 aktiv. Zweck war das Optimieren von Resultaten aus Optical Character Recognition (OCR), generiert von Digitalisaten aus Zeitungsarchiven[90]; 110.000 Teilnehmende erfüllten 8 Millionen Tasks.[91] Nach Chrons und Sundell (2011)[92] benutzt das System den bibliothekarischen Metadatenstandard METS / ALTO und liest über OCR Wörter in Scans von Zeitungsseiten aus, unter Sicherung der Koordinaten. In der Spielvariante ›Mole Hunt‹ geht es um das Verifizieren von OCR-Resultaten durch Vergleich mit dem Original anhand kleiner Aufgaben (Microtasks); das Ergebnis sind, nach Chrons und Sundell, Bool’sche Werte. Bei ›Mole Bridge‹ gilt es, die als falsch bewerteten Ergebnisse vom Originaldigitalisat zu transkribieren. Im Ergebnis werden valide Daten generiert. Effektiv werden dadurch nach Chrons und Sundell 99% Genauigkeit erreicht, auch vor dem Hintergrund einer OCR-Ergebnisoptimierung durch Postprocessing mit CAPTCHA bzw. reCAPTCHA.[93] Louis von Ahns reCAPTCHA-System, adaptiert von Google, verfolgt das Ziel, das Lösen von CAPTCHAS zur Bot-Abwehr zielgerichtet einzusetzen, sozusagen für gute Zwecke: »I call this Human Computation, but others sometimes call it Crowdsourcing.«[94]

[58]Annotation durch Tagging dient dem Information Retrieval (z. B. PROV, ein semantisches Wiki), die Annotation verteilter Informationen einer systematischen tabellarischen Erfassung (z. B. DigiVol / Australian Museum), Markup der Strukturierung (z. B. Transcribe Bentham / UCL[95]). Letzteres Projekt wird in der Digital-Humanities-Literatur zum Thema häufig referenziert,[96] es ist prominentes Beispiel für einen Methoden-Mix. Quelle ist das Werk des ersten Vertreters des Klassischen Utilitarismus, Jeremy Bentham (1748–1832). Ziel ist eine neue Werkedition mit diplomatischer Transkription, umgesetzt wird dies unter zusätzlicher Kodierung nach TEI-Standard über ein entsprechendes Interface. Aufgaben des Annotierens sind über konventionelle Interfaces, wie bei Transcribe Bentham, zu handhaben, die Methode bietet aber auch ein weites Feld zur Gamifizierung.

[59]Ein Beispiel aus Deutschland ist das DFG-geförderte Projekt ARTigo (LMU München, Kunstgeschichts-Lehrstuhl und Informatik-Lehrstühle sowie weitere Partner); es zählt zu »Sozialer Software vom Typ ›games with a purpose‹«,[97] kurz GWAP. Quellen sind Bilddatenbanken (u. a. die Diathek des Kunstgeschichts-Lehrstuhls), das Ziel ist eine Verschlagwortung von Bildinhalten. Dazu wurden acht Spiele entworfen, z. B. ARTigo Taboo, in dem unter Zeitdruck gegen einen Mitspieler getaggt wird: »Schlagworte können beschreiben, was das Kunstwerk darstellt, aber auch Stilrichtung, Qualität oder Gefühle ausdrücken, die es wiedergibt. Pro Kunstwerk stehen Ihnen 60 Sekunden zur Verfügung.«[98] Offensichtliche Begriffe sind verboten!

[60]Das Konzept der ›Taboo Words‹ geht auf Louis von Ahn zurück. Auf dem Gebiet der GWAP leistete er mit dem ESP Game Pionierarbeit.[99] Die Abkürzung ESP kann mit Equal String Play(ing) aufgelöst werden, von Ahn und Laura Dabbish machen dies aber in ihrer Publikation zum ESP Game nicht wörtlich explizit. Das Prinzip: Zwei Spieler verschlagworten zeitgleich dasselbe Bild, Wortgleichheit (Equal String) verifiziert den Tag. Wird das Bild über ein Java Applet, das den Game-Server anspricht, wieder aufgerufen, ist das bereits hinterlegte Wort tabu und die Herausforderung steigt – bis zu sechs Mal (diese Funktion dient auch dem möglichen Single Player-Modus).[100]

[61]Konzeptionelle Bezüge dazu sind deutlich erkennbar bei der National Standard Open Source Crowdsourcing Game Platform Metadata Games aus dem Bibliotheksbereich. Diese greift auf Material aus über 45 Sammlungen von elf Institutionen zu (British Library, Boston Public Library, The Open Parks Network, Digital Public Library of America, American Antiquarian Society u. a.). Die Metadata Games Platform stellt unter der CC-0 Public Domain-Lizenz zwei Multiplayer-fähige Web-Anwendungen als Open Source zur Verfügung, die Game-Web-App (mg-game) und die Content-Web-App (mg-content).[101] Der Kerngedanke: »Folksonomies can augment controlled vocabularies«.[102] Vielfältige Game-generierte Tags, entstanden unter dem Parameter heterogener Userprofile, optimieren die Suchmaschinen-Funktionalität und ermöglichen Repräsentationen bis hin zu kontrollierten Vokabularien.[103]

[62]Flanagan und Carini (2012) beschreiben die System-Architektur von Metadata Games als iterativ designtes Proof-of-Concept-System[104]; zwischen Nutzerschnittstelle (mit API zur Game Engine) und Backend (in dem Bilder, Tags und Dictionaries administriert sowie Rechte verwaltet werden) liegt die Datenbank.[105] In einem größeren Autorenteam[106] wird wenig später herausgearbeitet, auf was das Konzept zur Generierung hochwertiger Metadaten über Gamification abzielt – auf den »›Holy Grail‹ of metadata«, eine Art Idealbereich der Metadatenoptimierung: »Accurate, Not Obvious Tags«.[107] Metadatenqualität und -akquise sind dabei verschränkte Parameter. Standard-Methoden im Crowdsourcing zu Metadaten lieferten hier eher suboptimale Resultate. Naheliegende, einfache Tags tauchen häufig auf und sind vom System leicht als passend zu qualifizieren. Spezifischere passende Tags sind seltener und stellen das System vor die Herausforderung, sie von unpassenden Tags zu trennen. Um das System entsprechend zu trainieren, sollte die Menge spezifischer und passender Tags die der unpassenden übersteigen. Das Niveau jener ›heiligen‹ Zone wird nun durch das spielerische Forcieren von Input und Vielfalt beträchtlich angehoben. Die Optimierung greift über ein Belohnungs- und Sanktionssystem – offensichtliche und falsche Tags werden ›bestraft‹, die anderen belohnt –, so füllt sich die Zone des ›Heiligen Grals‹ der Metadaten.[108]

3.3 Ordnungen

[63]Praktisch kann eine grobe Checkliste nach Ben Brumfield und seinen Co-Autor*innen[109] beim Einstieg in die Entwicklung von Strategien bzw. bei der Wahl von Methoden helfen:

  • Zuerst erfolgt die Beurteilung der Quellenlage (homogen oder heterogen?)
  • Dieser Beurteilung folgt die methodische Ausrichtung; z. B. bei einem Transkriptionsprojekt: Wie sind die Quantität an Seiten und die Qualität, die Tiefe, zu gewichten? Für die Wahl der Werkzeuge ist die Datenbeschaffenheit wichtig (strukturiert, semi-strukturiert?)
  • Für die Infrastruktur ist die Projektausrichtung zu beachten (gibt es ein Content Management System – wenn ja, welches CMS? Stand-alone? Hosting?)
  • Welche Zielgruppe spricht das Projekt an und wie ist der Aufruf gestaltet (wen und wie viele muss man erreichen, wie?)

[64]Unumgänglich ist jedem Anwendungsfall eine Spezifikation der Aufgaben, die an die Crowd herangetragen werden. Die zwei Extreme an Aufgabenhorizonten im Crowdsourcing sind als ›diskret‹ und ›offen‹ zu benennen, wobei diese binäre Unterscheidung nichts über den für die Zielerreichung erforderlichen Schwierigkeitsgrad des Projekts aussagt. Nach Brandon Walsh et al. sind Transkriptions-Projekte – ein anspruchsvoller Projektbereich – einem diskreten Aufgabenhorizont zuzuordnen; für einen offenen Aufgabenhorizont sind Crowdwisdom-Projekte typisch.[110]

3.3.1 Tasks

[65]Eine grobe Kategorisierung von Aufgaben im Crowdsourcing verläuft zwischen einfachen Aufgaben (z. B. Maßnahmen zur Suchmaschinenoptimierung (SEO), Taggen), komplexen Aufgaben (Transkription, Übersetzung, Inhaltsgenerierung) und kreativen Aufgaben (das Suchen von Lösungen und Ideen im Bereich der Open Innovation).

[66]Für den Bereich des Aufgabenspektrums, der für die Digital Humanities relevant ist, stellen Johan Oomen und Lora Aroyo eine fünfstufige Klassifikation einschlägiger Crowdsourcing-Initiativen auf:[111] Gegenstand von Aufgaben des Typs (1) Korrigieren und Transkribieren ist es, Text-Digitalisate entsprechend anzureichern. (2) Klassifiziert wird über das Anreichern von Objekten mit deskriptiven Metadaten (Social Tagging), (3) kontextualisiert z. B. über das Anreichern von Objekt-Digitalisaten durch Narrationen. Crowdgestütztes (4) Komplettieren findet durch das Beitragen von Objekten zu einer (Web-)Ausstellung bzw. -Sammlung statt; hier grenzt das (5) Ko-Kuratieren an, bei dem Ideen und Wissen von Nicht-Experten zur Kuration genutzt werden.

[67]Laura Carletti et. al.[112] geben die Aufstellung von Oomen und Aroyo wieder und abstrahieren ergänzend das von Nina Simon[113] gegebene vierstufige Modell von Public Participation in Scientific Research (PPSR), welches das Verhältnis zwischen Institutionen des kulturellen Gedächtnisses und öffentlicher Partizipation anhand von Projektklassen fokussiert: »1. Contributory projects, 2. Collaborative projects, 3. Co-creative projects, 4. Hosted projects.«[114] Carletti et al. betonen, in ihrer eigenen Studie auf der Basis von 36 Crowdsourcing-Projekten aus dem GLAM-Bereich (Galleries, Libraries, Archives, Museums – hier ergänzt um »education institutions«) Tasks als Ausgangspunkt für Einordnungen in den Blick genommen zu haben.

[68]»As the analysis of the thirty-six initiatives progressed, two main trends emerged:
1. Crowdsourcing projects that require the ›crowd‹ to integrate/enrich/reconfigure existing institutional resources
2. Crowdsourcing projects that ask the ›crowd‹ to create/contribute novel resources«[115]

[69]Zur Differenzierung von Aufgabenstellungen identifizieren Enrique Estelles Arolas und Fernando González-Ladrón-De-Guevara[116] drei Elemente (Crowd, Initiatoren, Prozess), die konstitutiv sind für acht Charakteristika des Crowdsourcings – hier angegeben mit (a) bis (h).

[70]Zum ersten Element, der Crowd, gehören drei Charakteristika:

  1. (a) Wer formt sie (Zusammensetzung, erforderliche Skills)? (b) Was ist ihre Aufgabe (Zielformulierung, Arbeitspakete)? (c) Was ist die Kompensation (materiell, immateriell)? Bezüglich der Crowd sollten folgende Kriterien erfüllt sein: »a) […] a clearly defined crowd, b) […] a task with a clear goal, c) […] recompense received by the crowd is clear.«[117]
  2. An Charakteristika der Initiatoren sind zu untersuchen: (d) Wer sind diese (kommerziell, unkommerziell)? (e) Was bekommen sie als Resultat von der Crowd (sind dies Lösungen spezifischer Aufgaben, wie ist die Qualitätssicherung gestaltet)? Bezüglich des Initiators sind diese Kriterien förderlich: »d) The crowdsourcer is clearly identified, e) The compensation received is clearly identified.«[118]
  3. Letztes Element ist der Prozess: (f) Welcher Prozesstyp liegt vor (Microwork, Common Based Peer Production)? (g) Welcher Aufruftyp ergeht (gerichtet an eine potenzielle Gesamtheit, oder ein spezifischer Aufruf für begrenzte Gruppen unter Einforderung von Teilnahme-Spezifika)? (h) In welchem Medium erfolgt der Aufruf (Internet, evtl. parallel: Print, Funk)? Kriterien für den Aufruf: »f) […] an online assigned process of participative type, g) It uses an open call of variable extent, h) It uses the internet.«[119]

[71]In einer Matrix werden diese Elemente mit ihren Spezifika anhand von kommerziellen und unkommerzielllen Projekten – z. B. Wikipedia, AMT, Flickr – auf das Matchen von Kriterien hin von den Autoren überprüft.[120]

3.3.2 Microtasking, Macrotasking

[72]Um Tasks pragmatisch zu operationalisieren, werden sie zwei Sektionen zugeordnet, Micro- und Macrotasking. Die Begriffe sind älter als das Feld digitalen Crowdsourcings, sie kommen aus dem Parallelrechnen (Multitasking, unterteilt in Micro-, Macro- und Autotasking) und wurden neu belegt.[121]

[73]Microtasking basiert auf einfachen Problemstellungen, die effizienter durch Menschen – Crowdworker – als mit Maschinen gelöst werden, da technische Lösungen (noch) als zu teuer und / oder kompliziert erscheinen. Nach Polly Duxfield, die sich bei der Darstellung des Transkriptionsprojekts Estoria de Espanna explizit auch auf Erfahrungen aus dem Projekt Transcribe Bentham[122] bezieht, sind – nach Brandon Walsh et al. – für Microtasking umfangreiche Aufgaben charakteristisch, die in Arbeitspakete mit diskreten Aufgaben gesplittet werden können.[123] Die Ergebnisse sind leicht interpretierbar und aggregierbar, erledigte Aufgaben werden direkt kollektiviert. Im DH-Bereich fallen die oben gezeigten gamifizierten Projekte mit Tagging und OCR-Korrektur unter Microtasking.

[74]Macrotasking ist skizzierbar als Microtasking mit Spezialisierungsbedarf seitens der Crowd[124] – ein im Feld der Digital Humanities häufiges Desideratsprofil, etwa bei Transkription und zu annotierenden Korpora. Konzepte variieren je nach Zielsetzung und Bereich, was Auswirkungen auf Projektspezifikationen hat. Aspekte sind dabei Formatierung, Annotation sowie das strukturierte Akkumulieren verteilter Daten: »Unlike microtasking projects, macrotasking projects often do not produce aggregated or easily interpretable results.«[125]

[75]Im Ergebnis entstehen neue Informationen. Statt Aggregation steht Akkumulation im Vordergrund, Kontrollmechanismen sind aufwändig – kurz, es zählt Qualität statt Quantität.

[76]Brandon Walsh et al. diskutieren Schnittmengen und Übergänge zwischen Micro- und Macrotasking anhand des Lehrprojekts Prism an der University of Virginia Library.[126] Hier spielen interpretative Aufgabenhorizonte eine Rolle, es geht um Taggen bzw. Bewerten nach subjektiven Kriterien. Diskrete Aufgaben, die das Projekt einfordert, sind das Hochladen literarischer Texte, Anlegen sogenannter ›facets‹ (kategoriale Bezeichnungen), Lesen von Texten und das Anbringen von Markierungen (›highlights‹). Der Arbeitsaufwand beträgt 2,5 bis 4 Minuten für interpretative Aufgaben ( »to distinguish between literary categories or to critique a statement of beliefs«)[127] – es handelt sich gemäß des Autorenteams also dezidiert nicht um annotationsbasiertes Macrotasking mit offenem Ende. Vielmehr ist ein Task »constrained enough to prove productive« und gleichzeitig »open enough for engagement with a text in socially negotiated human terms«.[128] Daraus resultierende Ergebnisse sind aggregierbar und maschinenlesbar.

3.4 Motive

[77]Wenn Projektziele definiert sind und Konzepte dafür stehen, kann das pozentiell teilnehmende Individuum in der Crowd über die Motive ›Teilen‹, ›Bindung‹, ›Spielen‹ und ›Bezahlung‹ zur Teilnahme animiert werden. Oomen und Aroyo ordnen exemplarisch Crowdsourcing-Projekte, auch aus dem Bereich der Digital Humanities, den sozialen Motiven ›Bindung‹ (»Connectedness and membership«) und ›Teilen‹ im Sinne gemeinnützigen Handelns zu (»Sharing and Generosity«).[129]

[78]In Anlehnung daran, bzw. in einer Weiterführung, lässt sich ein Schema für Motive im Crowdsourcing formulieren, das auch Bezug nimmt auf Abraham Maslovs ›Theory of Human Motivation‹, in der fünf basale Bedürfnisse benannt werden:

[79]»There are at least five sets of goals, which we may call basic needs. These are briefly physiological, safety, love, esteem, and self-actualization. In addition, we are motivated by the desire to achieve or maintain the various conditions upon which these basic satisfactions rest and by certain more intellectual desires.«[130]

[80]Die themenspezifisch ergänzte ›Maslovsche Bedürfnispyramide‹[131] unten hat – als pragmatisch angepasste Visualisierung – gewissermaßen Tradition: Die ›Bedürfnishierarchie‹ in Pyramidenform beruht allein auf späteren Interpretationen von Maslovs Setzungen. Todd Bridgman, Stephen Cummings und John Ballard gingen der (auch ideengeschichtlich interessanten) Frage nach, wer Maslovs Pyramide gebaut hat – »Management Studies’ most famous Symbol«.[132] Sie untersuchten auch Auswirkungen der durch diverse Missinterpretationen charakterisierten Rezeptionsgeschichte auf heutige Lehren im Managementbereich. Die ›Urform‹ der ikonisch gewordenen Pyramide fanden die Autoren in einer Publikation von 1960.[133]

Abb. 1: Motive für Teilnahme im Crowdsourcing. [Schilz 2022]
Abb. 1: Motive für Teilnahme im Crowdsourcing. [Schilz 2022]

3.4.1 Teilen und Bindung

[81]Dem intrinsisch motivierten Beweggrund des Teilens liegen im Crowdsourcing anonyme Strukturen zugrunde. Eine unmittelbare soziale Anerkennung scheidet als Belohnungsfaktor aus – von gruppendynamisch angeregten Wettbewerbs-Mechanismen abgesehen. Unter Bezugnahme auf Clay Shirky unterstreichen Oomen und Aroyo die Basis der intrinsischen Motivation bei Amateuren: »The essence of amateurism is intrinsic motivation: to be an amateur is to do something for the love of it.«[134]

[82]Es kommen weitgehend soziopolitische Implikationen zum Tragen: Teilnehmende entscheiden frei, konstruktiv zu diskursrelevanten, gesamtgesellschaftlichen Konstellationen beizutragen, die von ihnen unter ethischen, moralischen und / oder politischen Gesichtspunkten als wertvoll erachtet werden. Dies können z. B. partizipatives Forschen, demokratisiertes Wissen und Umwelt-, Arten- oder Klimaschutz sein – typisch für das Feld der Citizen Science, deren Anfänge im Shared-Capacity-Konzept des SETI-Projekts[135] gesehen werden können.

[83]Teilen als Motiv ist im Bereich der Selbstverwirklichung anzusiedeln, einem Bedürfnis, das gemäß der ›Bedürfnishierarchie‹ nur vor dem Hintergrund wirksam werden kann, dass ›niedrigere‹ Bedürfnisse (Grund- und Sicherheitsbedürfnisse, soziale und Wertschätzungsbedürfnisse) bereits sämtlich befriedigt sind. Geteilt in diesem Sinne wird also, wo infrastrukturelle, ökonomische, politische und soziale Rahmenbedingungen das Freisetzen solcher Potenziale überhaupt erst möglich machen. Dadurch sind Crowdsourcing-Konzepte, die auf das Motiv Teilen bauen, von Haus aus beschränkt – die Pyramidenspitze macht sich gewissermaßen auch quantitativ bemerkbar.

[84]Dazu nur drei Schlaglichter: Der seit 1990 vom United Nations Development Programme (UNDP) im Jahresturnus publizierte Human Development Report gibt für 2016 den Anteil der Menschen mit Zugang zum worldwide network mit 43,7 Prozent an.[136] Zur Milleniumswende besaß ein Prozent der Menschheit knapp ein Drittel des globalen Vermögens, gut zehn Jahre später waren es 46 Prozent.[137] In 155 von 173 Ländern werden Frauen gesetzlich eingeschränkt, ihnen werden in 100 Ländern bestimmte Berufe verwehrt.[138] Die Aufzählung könnte weiter fortgeführt werden, doch schon diese genannten restriktiven Parameter lassen auf die global wirksame Begrenzung einer teilenden Crowd schließen.

[85]Die Bedürfnisse Anerkennung und Wertschätzung sind hierarchisch unter dem Bedürfnis der Selbstverwirklichung angesetzt; diesem Bereich kann das Motiv der Bindung zugeordnet werden. Es unterscheidet sich vom Motiv des Teilens insofern, als das es von Projektbetreibenden weniger Distanz und mehr aktive Zuwendung zur Crowd verlangt, da personalisierte Strukturen (keine anonymen) und soziale Implikationen (weniger soziopolitische) vorliegen. Sicherlich darf hier bezüglich des Motivs ein breiter Übergangsbereich angenommen werden, der dem Amalgam soziokultureller Rahmenbedingungen mit individuellen Identitätskonstrukten geschuldet ist. Das Motiv Bindung greift aber vornehmlich in Strukturen, die eine gewisse kommunikative, möglicherweise sogar physische Nähe zu Teilnehmenden ermöglichen.[139] Das Belohnungssystem kann mit dem von Museums-Förderkreisen verglichen werden: Personalisiertes Feedback bzw. Lob, positive Bestärkung in der Arbeit und vor der Gruppe, unter Umständen selektive Geschenke (›nur für Mitglieder‹). Intrinsisch motivierte Bindung kann zur Erfüllung komplexer Aufgaben anregen, die Ausdauer verlangen und denen ein hohes Maß an Identifikation mit einer Sache zugrunde liegt. So motivierte Crowds finden sich im Aufgabenbereich Transkription, der, so empirische Beobachtungen, immer wieder stark getragen wird von Schlüsselpersonen, die überdurchschnittlich viel Leistung einbringen.[140]

3.4.2 Spielen

[86]Ins Feld intrinsischer Motive gehört auch das Spielen, das, wie oben gezeigt wurde, besonders geeignet ist für Microtasks im Bereich Annotation und OCR-Korrektur. Vorzufinden sind hier anonyme bzw. semi-personalisierte Strukturen, aus Gründen des vergleichenden Wettbewerbs (Scores) bzw. gegnerischer Konkurrenz (Multiplayer). Die Belohnung des Spiels liegt im Spiel selbst begründet – diese psychosoziale Implikation ist fundamental für das Funktionieren gamifizierten, nicht-kommerziellen Crowdsourcings.

[87]Johan Huizinga, der 1938 den Homo Ludens spezifizierte, sieht im Spielen »[e]ine freiwillige Handlung oder Beschäftigung, die innerhalb gewisser festgesetzter Grenzen von Zeit und Raum nach freiwillig angenommenen, aber unbedingt bindenden Regeln verrichtet wird, ihr Ziel in sich selber hat und begleitet wird von einem Gefühl der Spannung und Freude und einem Bewusstsein des ›Andersseins‹ als das ›gewöhnliche Leben‹.«[141] Marshall McLuhan sah Spiele als »Erweiterungen des Menschen« ( »Games – The Extensions of Man«): »Games are popular art, collective, social reactions to the main drive or action of any culture. Games, like institutions, are extensions of social man and of the body politic, as technologies are extensions of the animal organism. Both games and technologies are counter-irritants or ways of adjusting to the stress of the specialized actions that occur in any social group. As extensions of the popular response to the workaday stress, games become faithful models of a culture. They incorporate both the action and the reaction of whole populations in a single dynamic image.«[142]

[88]Die ein Vierteljahrhundert auseinanderliegenden Sichtweisen auf das Phänomen Spielen benennen beide gleichermaßen wesentliche Aspekte für Gamification: Freiwillig wird aus Gründen des Selbstzwecks konstitutiven Regeln gefolgt, die unter Einwirkung gesellschaftlicher Impulse entstanden und diese zeit-, raum- und gruppengebunden spiegeln. Dies verweist darauf, warum ›biglou‹, so das Eigenkürzel Louis von Ahns, in den frühen 2000er Jahren im String-Vergleichs-Spiel ESP ausdrücklich das Potenzial sah, die meisten Bilder im Web innerhalb weniger Monate zu labeln: »[W]e encourage people to do the work by taking advantage of their desire to be entertained.«[143]

3.4.3 Bezahlung

[89]Am Fuß der Bedürfnispyramide ist die extrinsisch motivierte ökonomische Entlohnung angesiedelt. Ihr zugrunde liegen existenzielle Implikationen wie das Sozialbedürfnis (ex negativo: Angst vor Armut), daran gekoppelt: das Bedürfnis nach Sicherheit sowie Grund- und Existenzbedürfnisse. Manifest wird dieser Bereich im Crowdwork, dem Hauptsegment des Crowdsourcings als Arbeitsmodell. Das bezahlte Bearbeiten von Microtasks wird als Microworking bezeichnet.[144] Es wird gezielt vermittelt auf Crowdsourcing-Plattformen, die als Systeme für Microworking-Tasks mit Auswahl-, Bearbeitungs- und Lohnoptionen den Microtask-Markt bedienen.

[90]Eine Sicht auf dieses neuartige Setting in der Arbeitswelt ist die einer »Evolution of work organization«.[145] Sie basiert auf zwei Komponenten: Zum einen auf der durch Microtasks konstituierten, hohen Granularität von Aufgaben, zum anderen auf maximaler Distanz zwischen Arbeitgeber und -nehmer. Die (Höher-)Entwicklung beginnt unter dieser Perspektive vom konservativen Modell direkter Interaktion zwischen (Projekt-)Arbeitgeber und (Vollzeit-)Angestellten. Ihm folgt – in dieser Lesart: fortschrittlich – eine Aufteilung in Subprojekte, die Outsourcing ermöglicht und in der Arbeitgeber und Outsourcing-Firma interagieren. Bei einer Auflösung von Aufgaben in Tasks wird eine Plattform als Drehscheibe zu Freelancern eingeschaltet. In letzter Konsequenz, dem Crowdsourcing, fehlt beim Prozess von Arbeitsverteilung und -aufnahme durch die Crowd jede Verbindung zum Auftraggeber.

[91]Genau diese verflochtene Kausalitätskette verweist auf die Kernprobleme im kommerziellen Microtask-Markt: Unter ethischen Gesichtspunkten auf Ausbeutung, unter ökonomischem auf Lohndumping und Preisverfall. Wo nun aber die einen das völlige Nivellieren sozialer Verantwortung von Auftraggebern gegenüber Auftragnehmern wahrnehmen, sehen andere neue Freiheiten für die Lohnarbeit: »Want to make money in your spare time? […] start applying your skills to the thousands of available tasks«,[146] wirbt die prominente Plattform Amazon’s Mechanical Turk (AMT).[147] Auftraggebern wird Zugriff auf eine globale »on-demand 24 x 7 workforce« angeboten, die tausende »Human Intelligence Tasks (HITs)« binnen Minuten abarbeitet und nur bezahlt werden muss, falls die Ergebnisse zufriedenstellen.[148]

[92]Das standardisierte Vorgehen bei der Nutzung des AMT beginnt seitens der ›Requester‹ mit dem Hochladen von Aufgaben, ›Provider‹ wählen und bearbeiten sodann diese HITs.[149] Das Spektrum reicht von Micro- bis Macrotasks. Abgedeckt werden die Bereiche Datenbereinigung (verifizieren, Redundanz beseitigen, Daten eingeben, Algorithmen trainieren), Kategorisierung (Produkt- bzw. Bild-Klassifikation), Evaluierung (Suchmaschinen-Optimierung, Usability-Tests, Recherchen), Inhaltserzeugung und -erschließung ( »Moderate photos & content. Content creation & editing. Transcription«).[150]

[93]Wie wird das Phänomen AMT in der Literatur rezipiert? Soziologische Perspektiven haben die Crowdworker im Blick, ›Turker‹ sind Gegenstand etlicher Untersuchungen. Daten und Interpretationen zum Profil der ›Turker Nation‹ sind dabei unterschiedlich bzw. widersprüchlich, woraus verschiedene Schlüsse bezüglich des Arbeitsmodells hervorgehen. Fort et al. sehen 2011 Stundenlöhne unter zwei US-Dollar, Silberman et al. stellen 2015 dagegen fest, dass die Entlohnung einer Verteilung nach dem Potenzgesetz folgt (»wages follow a power law distribution«). Auch Aussagen zur Herkunft von Turkern differieren: Ipeirotis stellt 2010 einen Anstieg indischer Turker fest, Silberman identifiziert überwiegend US-Amerikaner*innen.[151]

[94]Eine kritisch-evaluierende Sicht setzt sich mit der konzeptionellen Basis des AMT auseinander. Diese ist, verweisend auf den ›Schachtürken‹ als historischen Bezug des Namens, ›Artificial Artificial Intelligence‹:[152] Die Maschine ist nur Schau, Probleme werden inwendig von Menschen gelöst. Dieser Sachverhalt verursachte eine Resonanz, die im Diskurs Anlass zu Kritik gab. Eytan Adar erklärte Anfang der 2010er Jahre, warum er – in Verbindung mit einer von ihm wahrgenommenen gewissen Euphorie für das Werkzeug – ›Mechanical Turk Research‹ hasst: »Showing that humans can do human work is not a contribution.«[153] Summarisch, das Belohnen rascher Nützlichkeits-Demonstrationen würde tieferen Analysen im Weg stehen und den Blick auf das Wesentliche bzw. Begrenzungen behindern.[154] Jene bestünden etwa in der Schwierigkeit, anspruchsvolle Probleme auf Subtasks herunter zu brechen. Mankos lägen aber auch im Potenzial der Crowd begründet, die gegebenenfalls selektiert werden sollte, »poor worker quality will likely drive tools to include features for tracking identity and reputations.«[155] Dies könnte zu erhöhten Preisen führen, diese wiederum zum Forcieren automatisierter Alternativen sowie zur Notwendigkeit, qualifiziert zu entscheiden, wann »human oracle(s)« sinnvoll einsetzbar sind.[156]

[95]Die Nutzung des AMT auf dem Gebiet der Digital Humanities und angrenzender Bereiche ist kein Tabu. Schon zu Beginn der 2010er Jahre erkennen Karën Fort et al. einen markanten Anstieg für den methodischen Einsatz des AMT anhand von Publikationen auf dem Feld des Natural Language Processing.[157] Sie setzen dem von ihnen beobachteten Trend die Warnung entgegen, hier entstehe ein »de facto standard for the development of linguistic resources that may have long-term funding consequences«[158] und untermauern 2014 ihren Befund.[159]

[96]Doch das Spiel mit dem Schachtürken hat eben seine Reize. Matthew L. Jockers stellt 2015 in seinem Blog das Projekt That Sentimental Feeling vor, unter der Archiv-Kategorie Text-Mining.[160] Jockers hatte das experimentelle Analyse-Tool Syuzhet R entwickelt, »sentiment analysis as a proxy for plot movement«. Kollegen reagierten:

[97]»David Bamann hired five Mechanical Turks to code the sentiment in each scene of Shakespeare’s Romeo and Juliet. David posted his results online and then Ted Underwood[161] compared the trajectory produced by David’s turks to the machine values produced by the Syuzhet R package I had developed.«[162]

[98]Hier soll es nun nicht um eine Evaluation der Evaluation gehen, vielmehr ist das Herangehen als solches von Interesse. Melissa Terras meint – unabhängig von dem hier skizzierten Kasus – »[e]thical issues come sharply into focus when projects start to pay (usually very little) for the labour involved, particularly when using online crowdsourcing labour brokers such as Amazon’s Mechanical Turk […]«.[163]

[99]Angemerkt sei, dass im Feld nicht-kommerziellen Crowdsourcings strukturell weitere kommerzielle Aspekte feststellbar sind. So oszilliert die Citizen Science zwischen (bildungs)politischen und (semi)kommerziellen Hintergründen, benötigt Drittmittel und ist in gewisser Hinsicht auch ein Produkt mit konkurrierenden Marken. In den USA gründete sich neben der Citizen Science Alliance[164] – die CSA verantwortet die Plattform Zooniverse ( »The world’s largest and most popular platform for people-powered research«[165]) – 2012 die Citizen Science Association Inc.[166] Ihre Tagung CitSci2019 wirbt für Sponsoring mit den Argumenten,

[100]»opportunity to make face-to-face CONNECTIONS with leaders in areas of science, policy, conservation, science education and practice. You’ll have ACCESS to people who need your products and services and the EXPOSURE will reinforce your brand awareness and maximize visibility in the field of citizen science.«[167]

[101]Auch im deutschsprachigen Raum ist eine Verquickung von Citizen Science und Wirtschaft ablesbar. Beispiel Schweiz: Die Citizen-Science-Plattform schweizforscht.ch (mit den Sparten ›Bio‹, ›Technik‹, ›Sprache‹) hat ihre Geschäftsstelle bei der Stiftung Science et Cité (gegründet 1998, mit Sitz in Bern). Diese versteht sich als »Kompetenzzentrum für den Bereich Dialog mit den Akademien der Wissenschaften Schweiz« und ist »keine Vergabestiftung, sondern selbst operativ tätig«, die »Finanzierung [erfolgt] über Leistungsvereinbarungen und Projektpartnerschaften«.[168] Die Sicht auf die Crowd betreffend ist solchen Konstellationen eine gewisse Gratwanderung immanent, assoziiert man die Kant’sche Selbstzweckformel:

[102]»Der praktische Imperativ wird also folgender sein: Handle so, daß du die Menschheit sowohl in deiner Person, als in der Person eines jeden andern jederzeit zugleich als Zweck, niemals bloß als Mittel brauchst.«[169]

3.5 Qualitätssicherung

[103]Allein nur Daten erzeugen zu lassen, genügt nicht – sie müssen, um zum Erfüllen von Projektzielen beizutragen, einem definierten Maß an Qualität genügen. Eine Möglichkeit, diese herzustellen, bieten Redaktionen – ausgeführt durch die Crowd selbst oder extern. In früheren Projektabschnitten kamen bei Old Weather (RN WW1 oldWeather logbooks) zwar 1,6 Millionen Daten zu Wetterbeobachtungen zusammen, die in standardisierte Klima-Datenbanken übernommen wurden. Die Daten wiesen teils jedoch erhebliche Mängel auf, wichtige Angaben fehlten oder waren fehlerhaft:

[104]»These issues did not damage climate products using the observations, but they did restrict them. […] about 500,000 of them have received a big [sic] upgrade in their quality, and this will feed through to substantial improvements in the climate products we derive from them.«[170]

[105]Die angesprochene Qualitätssteigerung für eine halbe Millionen Einträge war einer wiederum crowd-basierten, nachgeschalteten Redaktion im Peer Review-Verfahren geschuldet. Diese Kontrollmethode kann alternativ in systematischen Schleifen begleitend zur primären Datensammlung verlaufen. Das Pendant zu Peer Review stellt eine permanente Fachredaktion dar.[171] Transcribe Bentham greift auf dieses etablierte Mittel zur Qualitätssicherung zurück, wobei das Ziel den Aufwand an Ressourcen rechtfertigt: Ein Editionsprojekt benötigt eine qualitativ absolut valide Datengrundlage, Nutzaspekte quantitativer Art scheiden als Argument letztlich aus.

[106]Automatisierung ist ein weiterer Ansatz, um Fehler zu vermeiden – über eine präventive strukturelle Optimierung – bzw. auszufiltern, über Plausibilitäts- und Qualitätskontrollen. Exemplarisch wird hier der Gamification-Bereich benannt, da in diesem regulär schnell viele Daten unter Konkurrenzbedingungen generiert werden. Luis von Ahn und Laura Dabbish sehen für das Design von den im Abschnitt 3.2 Methoden bereits erwähnten ›Games with a purpose‹ die Notwendigkeit verschiedener ineinander greifender Mechanismen: »Additional mechanisms must be added to GWAPs beyond the basic template structure to ensure output correctness and counter player collusion.«[172]

[107]Zum Einsatz kommen Random Matching (anonyme Spieler werden zufällig zusammengeführt, um gemeinsamem Schummeln vorzubeugen), Player Testing (korrekte Outputs werden Spielern als Inputs angezeigt; werden sie markant falsifiziert, gelten die Spieler als unglaubwürdig), Repetition (Wahrscheinlichkeit durch übereinstimmenden Output mehrerer Spieler) und die bereits erwähnten Taboo outputs (korrekte Outputs werden tabuisiert, um ein breiteres Spektrum an Metadaten zu erhalten).[173]

[108]Die unmittelbarste Qualitätskontrolle im Sinne des Crowdsourcings stellen binäre Bewertungen dar, welche die Crowd hinsichtlich ihrer eigenen Erzeugnisse selbst vornimmt, über ›Likes‹ und ›Dislikes‹. Das Konzept lehnt sich an das der Prognostik unter Nutzung von Crowd Intelligence an, bei der anhand individueller Schätzungen eine gewichtete Gesamtprognose berechnet wird.[174] Dabei wird auf die ›Wise Crowd‹ vertraut, unter der Prämisse, sie sei unter gewissen Rahmenbedingungen fähig, so genaue Urteile zu fällen wie Experten.

[109]James Surowiecki benennt diese Bedingungen für »The Wisdom of Crowds«[175] mit Meinungsvielfalt, Unabhängigkeit, Dezentralität und dem Potenzial zur Kollektiventscheidung (›Aggregation‹). Anhand von Negativbeispielen bzw. Unglücken (z. B. das des Space Shuttles Columbia) illustriert er, welche Faktoren dem entgegenstehen: Homogenität, Zentralismus, Verbindungslosigkeit (›Division‹), Imitation, Emotionalität. Surowiecki spielt in seinem Buch in doppelter Hinsicht an auf kulturhistorische Zuweisungen an die Masse: Zum einen nimmt er inhaltlich Bezug auf Francis Galton, der in seinem Kurzartikel Vox Populi[176] ein damals aktuelles Beispiel für die statistisch valide Schätzung (einleitend: »In these democratic days any investigation in the trustworthiness and peculiarities of popular judgements is of interest«) eines Ochsen durch eine Menge schildert bzw. ausrechnet – wohlgemerkt als Wissenschaftler, der als »einer der Väter der Eugenik« ins digitale Kollektivgedächtnis Wikipedia einging.[177] Zum anderen referenziert Surowiecki, interpretierbar als doppelte ironische Brechung, den von Charles Makay 1841 diagnostizierten »Wahnsinn der Massen«.

4. Verfügungsmasse?

[110]Crowdsourcing basiert auf der Nutzbarmachung der Masse, die damit erst einmal per se aus dem Abyss der reinen Dummheit emporgehoben wird. Über die Haltung, die dieser nützlichen Masse entgegengebracht wird, sagt dieser Akt der Utilitarisierung nichts aus. Doch sind hier überhaupt Aussagen nötig? Hat nicht jedes Crowdsourcing-Projekt die Masse, die es verdient – in Anlehnung an bzw. Ableitung von Adam Smiths unsichtbarer Hand? In der Verantwortung der Senderseite liegt es schließlich erst einmal nur, aus Selbstinteresse Projekte mit präzisen Tasks über zielgruppengerechte Aufrufe an eine adäquat motivierte Crowd zu bringen. AMT lädt ein: »Access a global, on-demand, 24x7 workforce« und schlägt potenziellen Auftraggebern vor, »Optimize efficiency. Increase flexibility. Reduce cost«.[178] Neuen Turkern wird angeboten: »[m]ake money in your spare time. Get paid for completing simple tasks«.[179] Inwiefern sind hier nicht nur die gegebenen Suggestionen ›Freizeit‹ und ›geringe Anforderungen‹ zu hinterfragen? Ist es der Senderseite überhaupt aufzuerlegen, ethische Implikationen gegen ökonomische Werte abzuwiegen?

[111]Schon vor Längerem wurde festgestellt, dass »[…] die Bedingung des Kapitals die Lohnarbeit [ist]. Die Lohnarbeit beruht ausschließlich auf der Konkurrenz der Arbeiter unter sich«.[180] Woraus folgt, dass Organisation, Solidarisierung und Streik Mittel der Wahl zur Selbstermächtigung der Arbeiter im Kampf um angemessene Löhne sind. Die atomisierte, prekäre Crowd der Microworker dagegen ist per se nichts anderes als eine machtlose Masse, mit Parallelen zur marxistischen Überbevölkerung.

[112]Nun arbeitet Crowdsourcing im DH-Bereich nolens volens unter denselben gesellschaftlichen Rahmenparametern wie AMT. Doch auf Freiwilligkeit abzielende Projekte können sich einer ausreichenden Zahl an unbezahlten Beiträgern nur sicher sein, wenn der ›Masse‹ stetig ein quantitativ wie qualitativ verlässliches Mindestmaß an Freiheit zur Selbstbestimmtheit innewohnt. Ausdrücklich nur in dieser Masse ist der Flaneur in der Lage, selbstbewusst transparente Angebote anzunehmen, die zu seinem Identitätsentwurf passen, um sodann mit einer Masse anderer Flaneure daran zu arbeiten, das Netz mit gesicherten Informationen anzureichern, von denen er und andere profitieren. Im Sinne digitaler Allmende steht die interessierte, kommunizierende, multiplikatorisch wirkende Masse mindestens genauso im Mittelpunkt des jeweiligen Projektinteresses, wie die durch sie generierten Daten.


Fußnoten


Quellenverzeichnis

  • Gustave Le Bon. Nach: Rudolf Eisler: Philosophen-Lexikon. Berlin 1912, S. 390–391. In: Zeno.org. Hg. von Henricus – Edition Deutsche Klassik GmbH. 2022. [online] [Nachweis im GVK]

  • Charles Baudelaire: Les Foules. Nach: Charles Baudelaire: Œuvres complètes de Charles Baudelaire. Michel Lévy frères. IV (1869): Petits Poëmes en prose, S. 31–32. Wikisource.org. 2022. [online] [Nachweis im GVK]

  • Walter Benjamin: Das Passagen-Werk. Aufzeichnungen und Materialien. Nach: Walter Benjamin: Gesammelte Schriften V-I. Hg. von Rolf Tiedemann. Frankfurt / Main 1991. S. 436. In: Archive.org. 2022. PDF. [online] [Nachweis im GVK]

  • Walter Benjamin: Das Kunstwerk im Zeitalter seiner technischen Reproduzierbarkeit. Nach: Rolf Tiedemann, Hermann Schweppenhäuser (Hg.): Gesammelte Schriften. Frankfurt / Main 1980, S. 471–508. In: Wikisource.org. 23.03.2016. [online] [Nachweis im GVK]

  • Pierre Bourdieu: La distinction. Critique sociale du jugement. Paris 1979. [Nachweis im GVK]

  • Pierre Bourdieu: Ökonomisches, kulturelles und soziales Kapital. In: Die verborgenen Mechanismen der Macht. Hamburg 1992, S. 49–75. [Nachweis im GVK]

  • Jürgen Dinkel: »Dritte Welt« – Geschichte und Semantiken. In: Docupedia-Zeitgeschichte (2014). Version 1.0 vom 06.10.2014. DOI: 10.14765/zzf.dok.2.596.v1

  • Édouard Adolphe Drumont: Das verjudete Frankreich. Berlin 1886. In: Deutsche Digitale Bibliothek. Hg. von Stiftung Preußischer Kulturbesitz. 11.04.2018. [online] [Nachweis im GVK]

  • Paul Ralph Ehrlich: The Population Bomb. New York, NY 1968. In: Archive.org. 28.01.2010 [online] [Nachweis im GVK]

  • Francis Galton: Vox Populi. In: Nature 75. 1907, S. 450–451. DOI: 10.1038/075450a0 [Nachweis im GVK]

  • Garrett Hardin: Lifeboat Ethics: The Case Against Helping the Poor. In: Psychology Today 8 (1974). In: Garretthardinsociety.org. 24.11.2015. [online] [Nachweis im GVK]

  • Johan Huizinga: Homo ludens. Vom Ursprung der Kultur im Spiel. Reinbek 1991. [Nachweis im GVK]

  • Selim Jahan: Human Development Report 2016. Human Development for Everyone. Hg. von United Nations Development Programme. 2022. PDF. [online]

  • Immanuel Kant: AA IV, Grundlegung zur Metaphysik der Sitten. Riga 1785, S. 429. In: Korpora.org. 2022. [online] [Nachweis im GVK]

  • Gustave Le Bon: Lois psychologiques de l’évolution des peuples. Paris 1894. In: Archive.org. 15.09.2008. [online] [Nachweis im GVK]

  • Gustave Le Bon: Psychologie du socialisme. Paris 1898. In: Archive.org. 16.06.2009. [online] [Nachweis im GVK]

  • Gustave Le Bon: Psychologie der Massen. Leipzig 1908. In: MDZ – Münchner Digitalisierungszentrum, Digitale Bibliothek. 14.03.2014. [online] [Nachweis im GVK]

  • Gustave Le Bon: Psychologische Grundgesetze in der Völkerentwicklung. Leipzig 1922. [Nachweis im GVK]

  • Charles Mackay: Memoirs of Extraordinary Popular Delusions and the Madness of Crowds. 2 Bde., London 1852. In: Google Books. 2022. [online] [Nachweis im GVK]

  • Thomas Malthus: An Essay on the Principle of Population. An Essay on the Principle of Population, as it Affects the Future Improvement of Society with Remarks on the Speculations of Mr. Godwin, M. Condorcet, and Other Writer. London 1798. In: ESP – Electronic Scholarly Publishing Project. 2022. PDF. [online]

  • Wilhelm Mannhardt: Roggenwolf und Roggenhund: Beitrag zur germanischen Sittenkunde. 2. Auflage. Danzig 1866. In: MDZ – Münchner Digitalisierungszentrum, Digitale Bibliothek. 08.02.2010. [online] [Nachweis im GVK]

  • Wilhelm Mannhardt: Die Korndämonen: Beitrag zur germanischen Sittenkunde. Berlin 1868. In: MDZ – Münchener Digitalisierungszentrum, Digitale Bibliothek. 08.02.2010. [online] [Nachweis im GVK]

  • Wilhelm Mannhardt: Wald- und Feldkulte. 1, Der Baumkultus der Germanen und ihrer Nachbarstämme: mythologische Untersuchungen. Berlin 1875. In: MDZ – Münchener Digitalisierungszentrum, Digitale Bibliothek. 29.01.2016. [online] [Nachweis im GVK]

  • Wilhelm Mannhardt: Wald- und Feldkulte. 2, Antike Wald- und Feldkulte aus nordeuropäischer Überlieferung. Berlin 1877. In: MDZ – Münchener Digitalisierungszentrum, Digitale Bibliothek. 20.12.2017. [online] [Nachweis im GVK]

  • Karl Marx / Friedrich Engels (1972a): Werke. MEW. Hg. von Institut für Marxismus-Leninismus beim ZK der SED. 44 Bde. Bd. 2: 1844 bis 1846. 7. Auflage. Berlin 1972, S. 164–171. In: www.mlwerke.de: Stimmen der proletarischen Revolution. Hg. von Lüko Willms. 2022. [online] [Nachweis im GVK]

  • Karl Marx / Friedrich Engels (1972b): Manifest der kommunistischen Partei; I. Bourgeois und Proletarier. In: MEW. Hg. von Institut für Marxismus-Leninismus beim ZK der SED. 44 Bde. Bd. 4: Mai 1846 bis März 1848. 6. Auflage. Berlin 1972, S. 461–474. In: www.mlwerke.de: Stimmen der proletarischen Revolution. Hg. von Lüko Willms. 2022. [online] [Nachweis im GVK]

  • Abraham H. Maslov: A Theory of Human Motivation. In: Psychological Review 50 (1943), H. 4, S. 370–396. In: Classics in the History of Psychology. Hg. von Christopher D. Green. August 2000. [online] [Nachweis im GVK]

  • Marshall McLuhan: Understanding Media. The Extensions of Man. New York 1964. [Nachweis im GVK]

  • Dennis Meadows: Die Grenzen des Wachstums. Bericht des Club of Rome zur Lage der Menschheit. Stuttgart 1972. [Nachweis im GVK]

  • James Murray: Appeal to the English-speaking and English-reading public. In: OED.com. Hg. von Oxford University Press. 2022. [online]

  • Edgar Allan Poe: The Man of the Crowd. In: American Studies at the University of Virginia. Hypertext Projects: Edgar Allan Poe. 09.01.2009. [online]

  • Jean-Paul Sartre: Huis Clos. Paris 2000, S. 92. In: Wikiquote.org. 2022. [online]

Bibliographische Angaben

  • Eytan Adar: Why I Hate Mechanical Turk Research (and Workshops). In: CHI 2011 Workshop on Crowdsourcing and Human. System, Studies and Platforms. (CHI’11 Vancouver, 08.05.2011) New York, NY 2011. [online]

  • Eytan Adar: Why I Hate Mechanical Turk Research. In: medium.com/@eytanadar. Blogbeitrag vom 27.04.2015. [online]

  • Hojjat Adeli / Amgad Saleh: Control, Optimization, and Smart Structures: High-Performance Bridges and Buildings of the Future. New York, NY u. a. 1999. [Nachweis im GVK]

  • Luis von Ahn / Laura Dabbish: Labeling Images with a Computer Game. In: CHI 2004 connect: Conference on Human Factors in Computing Systems. (CHI’04, Wien 24.–29.04.2004), New York, NY 2004, S. 319–326. [Nachweis im GVK]

  • Luis von Ahn / Laura Dabbish: Designing games with a purpose. In: Communications of the ACM 51 (2008), H. 8, S. 58–67. DOI: 10.1145/1378704.1378719 [Nachweis im GVK]

  • Enrique Estelles Arolas / Fernando González-Ladrón-De-Guevara: Towards an integrated crowdsourcing definition. In: Journal of Information Science. 32 (2012), H. 2, S. 189–200. [Nachweis im GVK]

  • Mark V. Barrow: A Passion for Birds: American Ornithology After Audubon. Princeton, NJ 1998. [Nachweis im GVK]

  • Jean Baudrillard: The Masses. The Implosion of the Social in the Media. In: Selected Writings. Hg. von Mark Poster. Stanford, CA 1988, S. 207–219. [Nachweis im GVK]

  • Yochai Benkler: The Wealth of Networks. How Social Production Transforms Markets and Freedom. New Haven 2006. [ online] [Nachweis im GVK]

  • Yochai Benkler / Helen Nissenbaum: Commons-based Peer Production and Virtue. In: The Journal of Political Philosophy 14 (2006), H. 4, S. 94–419. [online] [Nachweis im GVK]

  • Ted Binnema: »Most Fruitful Results«: Transborder Approaches to Canadian-American Environmental History. In: A Companion to American Environmental History. Hg. von Douglas Cazaux Sackman. Malden, MA u. a. 2010, S. 615–634. [Nachweis im GVK]

  • Todd Bridgman / Stephen Cummings / John Ballard: Who Built Maslow’s Pyramid? A History of the Creation of Management Studies’ Most Famous Symbol and Its Implications for Management Education. In: Academy of Management Learning & Education (2019), H. 1, S. 81–98. DOI: 10.5465/amle.2017.0351 [Nachweis im GVK]

  • Ben W. Brumfield / Anna Agbe-Davies: Encoding Account Books Relating to Slavery in the U. South at MEDEA Regensburg. In: http://manuscripttranscription.blogspot.com. Blogbeitrag vom 25.10.2015. [online]

  • Ben W. Brumfield / Perian Sully: Crowdsourcing Transcription. Who, Why, What, and How. Presentation, MCN 2011. 18.11.2011. [online]

  • Laura Carletti / Derek McAuley / Dominic Price / Gabriella Giannachi / Steve Benford: Digital Humanities and Crowdsourcing. An Exploration. In: MW2013: Museums and the Web 2013. (Conference, Portland, OR, 17.–20.04.2013) Silver Spring, MD. Beitrag vom 05.02.2013. [online]

  • Tim Causer / Justin Tonra / Valerie Wallace: Transcription maximized; expense minimized? Crowdsourcing and editing The Collected Works of Jeremy Bentham. In: Literary and Linguistic Computing 27 (2012), H. 2, S. 119–137. DOI: 10.1093/llc/fqs004 [Nachweis im GVK]

  • Otto Chrons / Sami Sundell: Digitalkoot. Making Old Archives Accessible Using Crowdsourcing. In: Human Computation: Papers from the 2011 AAAI Workshop (WS-11-11) (Conference, San Francisco, CA, 08.08.2011) Menlo Park 2011, S. 20–25. [online] [Nachweis im GVK]

  • Arthur Depner: Das Potential des Diskurses. Ein systemtheoretischer und diskursanalytischer Zugang zur Wissenschaftsgeschichte der Volkskunde am Beispiel der Mannhardt-Befragung und deren Neuauswertung durch Ingeborg Weber-Kellermann. (= Bamberger Beiträge zur europäischen Ethnologie, 5) Bamberg 2011. [Nachweis im GVK]

  • Polly Duxfield: Transcribing the »Estoria de Espanna« using crowdsourcing: Strategies and aspiration. In: Magnificat Cultura i Literatura Medievals 2 (2015), S. 129–148. DOI: 10.7203/MCLM.2.4977

  • Mary Flanagan / Peter Carini: How Games Can Help Us Access and Understand Archival Image. In: The American Archivist 75 (2012) H. 2, S. 514–537. DOI: 10.17723/aarc.75.2.b424537w27970gu4 [Nachweis im GVK]

  • Mary Flanagan / Sukdith Punjasthitkul / Max Seidman / Geoff Kaufman / Peter Carini: Citizen Archivists at Play: Game Design for Gathering Metadata for Cultural Heritage Institutions. In: DiGRA ’13 – Proceedings of the 2013 DiGRA International Conference: DeFragging Game Studies. (DiGRA ’13, Atlanta, GA, 26.–29.08.2013) Atlanta, GA 2014. [online]

  • Karen Fort / Gilles Adda / Kevin Bretonnel Cohen: Amazon Mechanical Turk: Gold Mine or Coal Mine? In: Computational Linguistics 37 (2011), H. 2, S. 413–420. DOI: 10.1162/COLI_a_00057 [Nachweis im GVK]

  • Karen Fort / Gilles Adda / Benoît Sagot / Joseph Mariani / Alain Couillault: Crowdsourcing for Language Resource Development: Criticisms About Amazon Mechanical Turk Overpowering Use. In: Human language technology challenges for computer science and linguistics. Hg. von Zygmunt Vetulani / Joseph Mariani. (LTC 2011: 5, Poznań, 25.-27.11.2011) Cham u. a. 2014, S. 303–314. (= Lecture Notes in Computer Science, 8387) [Nachweis im GVK]

  • Peter Gilliver: »Your dictionary needs you«: a brief history of the OED’s appeals to the public. In: public.oed.com/history. Beitrag vom 04.10.2012. [online]

  • Helmut Groschwitz: Rewriting »Atlas der deutschen Volkskunde« postkolonial. In: Objekt, Bild und Performance. Repräsentationen ethnographischen Wissens. Hg. von Beatrix Hoffmann / Steffen Mayer. Berlin 2014, S. 29–40. (= Berliner Blätter, 67) [Nachweis im GVK]

  • Matthias Johannes Wilhelm Hirth: Modeling Crowdsourcing Platforms – A Use-Case Driven Approach. Würzburg 2016. (= Würzburger Beiträge zur Leistungsbewertung verteilter Systeme / Bericht, 2) DOI: 10.25972/OPUS-14072 [Nachweis im GVK]

  • Sabine Höhler: Die Wissenschaft von der »Überbevölkerung«. Paul Ehrlichs »Bevölkerungsbombe« als Fanal für die 1970er Jahre. In: Zeithistorische Forschungen – Studies in Contemporary History 3 (2006), H. 3, S. 460–464. DOI: 10.14765/zzf.dok-1934 [Nachweis im GVK]

  • Tobias Hoßfeld / Matthias Hirth / Phuoc Tran-Gia: Crowdsourcing. In: Informatik Spektrum 35 (2012), S. 204–208. [Nachweis im GVK]

  • Jeff Howe: The Rise of Crowdsourcing. In: wired.com. Artikel vom 06.01.2006. [online]

  • Jeff Howe: Crowdsourcing. Why the Power of the Crowd is Driving the Future of Business. New York, NY 2008. [Nachweis im GVK]

  • David Igler: The Northeastern Pacific Basin: An Environmental Approach to Seascapes and Littoral Place. In: A Companion to American Environmental History. Hg. von Douglas Cazaux Sackman. Malden, MA u. a. 2010, S. 579–594. [Nachweis im GVK]

  • Heinz Jansohn: Zur Kritik der unkritischen Kritik. Ein Vergleich zwischen T.W. Adorno und K.H. Popper. In: Zeitschrift für philosophische Forschung 29, H. 4 (1975), H. 4, S. 544–561. [Nachweis im GVK]

  • Matthew Lee Jockers: That Sentimental Feeling. In: matthewjockers.net. Hg. von Matthew Jockers. Blogbeitrag vom 20.12.2015. [online]

  • Wolfgang Kaschuba: Einführung in die europäische Ethnologie. 4., aktualisierte Auflage. München 2012. [Nachweis im GVK]

  • Nicole Kearney / Elycia Wallis: Transcribing between the lines: Crowd-sourcing historic data collection. In: MWA 2015: Museums and the Web Asia 2015. (Conference,Melbourne, 05.–08.10.2015) Beitrag vom 14.08.2015. Silver Spring, MD 2015. [online]

  • Jan Marco Leimeister: Crowdsourcing: Crowdfunding, Crowdvoting, Crowdcreation. In: Controlling & Management review 56 (2012), H. 6, S. 388–392. 361169140. PDF. [online]

  • The Delphi Method: Techniques and Application. Hg. von Harold A. Linstone / Murray Turoff. First Edition 1975, electronic Version 2002. PDF. [online] [Nachweis im GVK]

  • Helmut E. Lück: Geschichte der Psychologie. Strömungen, Schulen, Entwicklungen. 4., überarbeitete Auflage. Stuttgart 2009. [Nachweis im GVK]

  • Kaspar Maase: Massenkultur, Demokratie und verordnete Verwestlichung. Bundesdeutsche und amerikanische Kulturdiagnosen der 1950er Jahre. In: Modernisierung als Amerikanisierung? Entwicklungslinien der westdeutschen Kultur 1945–1960. Hg. von Lars Koch. Bielefeld 2007, S. 277–318. [Nachweis im GVK]

  • Martin Moyle / Justin Tonra / Valerie Wallace: Manuscript transcription by crowdsourcing: Transcribe Bentham. In: LIBER Quarterly 20 (2011), H. 3–4, S. 347–356. DOI: 10.18352/lq.7999 [online]

  • History of Audubon and Science-based Bird Conservation. Hg. von National Audubon Society. In: audubon.org. New York, NY 2015. [online]

  • Britta Neitzel: Spielerische Aspekte digitaler Medien. Rollen, Regeln, Interaktionen. In: Das Spiel. Muster und Metapher der Mediengesellschaft. Hg. von Caja Thimm. Wiesbaden 2010, S. 107–126. [Nachweis im GVK]

  • Johan Oomen / Lora Aroyo: Crowdsourcing in the Cultural Heritage Domain: Opportunities and Challenge. In: Proceedings of 5th International Conference on Communities and Technologie (C&T: 5, Brisbane, 29.06.–02.07.2011) New York, NY 2011. PDF. [online] [Nachweis im GVK]

  • Walter Pötzl: Der Atlas der deutschen Volkskunde als regional- und lokalgeschichtliche Quelle. In: Volksleben im 19. Jahrhundert. Studien zu den bayerischen Physikatsberichten und verwandten Quellen. Veröffentlichungen der Schwäbischen Forschungsgemeinschaft, Schwäbische Forschungsstelle Augsburg der Kommission für Bayerische Landesgeschichte. Hg. von Peter Fassl. (Wissenschaftliche Tagung der Heimatpflege des Bezirks Schwaben und der Schwäbischen Forschungsgemeinschaft, Irsee, 16.–17.03.2001) Augsburg 2003, S. 183–197. (= Veröffentlichungen der Schwäbischen Forschungsgemeinschaft, Schwäbische Forschungsstelle Augsburg der Kommission für Bayerische Landesgeschichte / Reihe 10, Quellen zur historischen Volks- und Landeskunde, 2) [Nachweis im GVK]

  • Aaron Sachs: Cultures of Nature: Nineteenth Century. In: A Companion to American Environmental History. Hg. von Douglas Cazaux Sackman. Malden, MA 2010, S. 246–265. [Nachweis im GVK]

  • Michael Simon: »Volksmedizin« im frühen 20. Jahrhundert. Zum Quellenwert des Atlas der deutschen Volkskunde. In: Volkskunde in Rheinland-Pfalz 18 (2003), H. 1, S. 141–154. [Nachweis im GVK]

  • Nina Simon: The Participatory Museum. In: participatorymuseum.org. Museum 2.0. Santa Cruz, CA 2010. [online]

  • M. Six Silberman / Kristy Milland / Rochelle LaPlante / Joel Ross / Lilly Irani: Stop citing Ross et al. 2010, »Who are the crowdworkers?«. In: medium.com. Blogbeitrag vom 16.03.2015. [online]

  • Bruce Sterling: Digitalkoot, a game-ified social Finnish cultural endeavor. In: wired.com. Artikel vom 03.17.2011. [online]

  • James Surowiecki: The Wisdom of Crowds. New York 2005. [Nachweis im GVK]

  • Melissa Terras: Crowdsourcing in the Digital Humanities. In: A New Companion to Digital Humanities. Hg. von Susan Schreibman, Ray Siemens, and John Unsworth. Chichester u. a. 2016, S. 420–439. [online] [Nachweis im GVK]

  • Ted Underwood: Free research question about plot. In: tedunderwood.com. Blogbeitrag vom 01.04.2015. [online]

  • Brandon Walsh / Claire Maiers / Gwen Nally / Jeremy Boggs: Crowdsourcing individual interpretations: Between microtasking and macrotasking. In: Literary and Linguistic Computing 29 (2014), H. 3, S. 379–386. DOI: 10.1093/llc/fqu030 [Nachweis im GVK]

  • Louis S. Warren: Paths Toward Home: Landmarks of the Field in Environmental History. In: A Companion to American Environmental History. Hg. von Douglas Cazaux Sackman. Malden, MA u. a. 2010, S. 3–32. [Nachweis im GVK]

  • Ingeborg Weber-Kellermann: Erntebrauch in der ländlichen Arbeitswelt des 19. Jahrhunderts auf Grund der Mannhardtbefragung in Deutschland von 1865. Marburg 1965. [Nachweis im GVK]

Webseiten

  • Bundesministerium für Bildung und Forschung BMBF: Richtlinie zur Förderung von bürgerwissenschaftlichen Vorhaben (Citizen Science) vom 14.07.2016. BAnz AT 01.08.2016 B6. Aktuelle Fassung: Richtlinie zur Förderung von bürgerwissenschaftlichen Vorhaben, Bundesanzeiger vom 17.10.2019 vom 14. Oktober 2019. [online]

  • Amazon Mechanical Turk (MTurk) Worker. [online]

  • ARTigo. Hg. von Play4Science-Projekt (Ludwig-Maximilians-Universität München, IT-Gruppe Geisteswissenschaften). [online]

  • Bundesministerium für Bildung und Forschung (Deutschland): Pressemitteilung 033/2014 vom 22.04.2014: Bürger schaffen Wissen. [online]

  • Bürger schaffen Wissen. Plattform; gemeinsames Projekt von Wissenschaft im Dialog gGmbH und dem Museum für Naturkunde Berlin – Leibniz-Institut für Evolutions- und Biodiversitätsforschung. Hg. von Wissenschaft im Dialog gGmbH. [online]

  • Schweizforscht.ch: Startseite. Hg. von Science et Cité. 2022. [online]

  • Science et Cité: Profil und Strategie. Hg. von Science et Cité. 2022. [online]

  • Citizen Science Alliance: Philosophy. [online]

  • Citizen Science Association: About. [online]

  • Commons-based Peer Production. In: Wikipedia. 13.10.2020. [online]

  • Digitalkoot, National Library of Finland: Spielanleitungen. Mole Bridge [online], Mole Hunt [online]

  • eBird: An online database of bird distribution and abundance. eBird, Cornell Lab of Ornithology, Ithaca, New York. [online]

  • Google – Developers: reCAPTCHA. [online]

  • Legett, Sarah: Operation War Diary – your archive needs you! The National Archives UK, Blog, 14. Jan 2014 [online]

  • Louis von Ahn: Luis von Ahn. In: Carnegie Mellon’s School of Computer Science. 2022. [online]

  • Martenstein, Harald: Mainstream. Der Sog der Masse. In: DIE ZEIT Nr. 46/2011, 10.11.2011. [online]

  • National Audubon Society: Audubon Christmas Bird Count. [online]

  • Naturschutzbund Deutschland e.V. (NABU): Stunde der Wintervögel. Vögel beobachten und melden. [online]

  • Neuschwabenland-Archiv. Internet Archive – Wayback Machine, capture 05.06.2016 [online]

  • Metadata Games. Hg. von Dartmouth College (Tiltfactor Laboratory / Rauner Library). [online]

  • Old Weather. Hg. von Zooniverse. 2022. [online]

  • Blog. There’s a green one and a pink one and a blue one and a yellow one. In: Old Weather. 05.09.2012. [online]

  • Whaling. In: Old Weather. 2022 [online]

  • Operation War Diary (Archived Zooniverse Project: Operation War Diary). [online]

  • Österreich forscht, www.citizen-science.at. Universität für Bodenkultur Wien. [online]

  • Play4Science – Kooperation von Geisteswissenschaftlern, Informatikern und Computerlinguisten. Ludwig-Maximilians-Universität München, IT-Gruppe Geisteswissenschaften. [online]

  • Prism. A Tool for Collaborative Interpretation of Texts. Hg. von Scholars’ Lab. University of Virginia Library. 2013. [online]

  • Psychologie der Massen. In: Wikipedia. 2022. [online]

  • Search for Extraterrestrial Intelligence (SETI): SETI@Home. Berkeley University of California. [online]

  • Transcribe Bentham. University College London. [online]

  • Antti Vilpponen: Microtask Launches Digitalkoot, A Service To Correct Digitized Finnish National Library Archives. February 8, 2011.

  • Einfache Bedürfnishierarchie nach Maslow. In: Wikimedia Commons 2012. [online]

  • Bedürfnishierarchie nach Maslow. In: Wikimedia Commons 2017. [online]

  • Wissenschaft im Dialog gGmbH: Bürger schaffen Wissen. Die Citizen Science Plattform. [online]

Weiterführende Literatur

  • Yochai Benkler: Common Wisdom. Peer Production of Educational Material. Stanford, CA 2005. [online]

  • Pierre Bourdieu: Die feinen Unterschiede. Kritik der gesellschaftlichen Urteilskraft. Frankfurt 1982. [Nachweis im GVK]

  • Matthew Dennis: Cultures of Nature: To ca. 1810. In: A Companion to American Environmental History. Hg. von Douglas Cazaux Sackman. Malden, MA u. a. 2010, S. 214–245. [Nachweis im GVK]

  • Stuart Dunn / Mark Hedges: Crowd-Sourcing Scoping Study. Engaging the Crowd with Humanities Research. Hg. von Arts & Humanities Research Council. Swindon 2012. PDF. [online]

  • Heidi Gansohr-Meinel: »Fragen an das Volk«. Der Atlas der deutschen Volkskunde 1928–1945. Ein Beitrag zur Geschichte einer Institution. Würzburg 1993. [Nachweis im GVK]

  • Volkskunde und Nationalsozialismus. Referate und Diskussionen einer Tagung der Deutschen Gesellschaft für Volkskunde. Hg. von Helge Gerndt. (Tagung, München, 23.–25.10.1986) München 1987. [Nachweis im GVK]

  • Andreas Großmann: Volksgeist – Grund einer praktischen Welt oder metaphysische Spukgestalt? Anmerkungen zur Problemgeschichte eines nicht nur Hegelschen Theorems. In: Metaphysik der praktischen Welt. Perspektiven im Anschluß an Hegel und Heidegger. Hg. von Andreas Großmann / Christoph Jamme. Amsterdam u. a. 2000, S. 60–77. [online] [Nachweis im GVK]

  • Panos Ipeirotis: The New Demographics of Mechanical Turk. In: behind-the-enemy-lines.com. Hg. von Panos Ipeirotis. Blogbeitrag vom 09.03.2010. [online]

  • Eli Pariser: The Filter Bubble. What the internet is hiding from you. New York, NY 2011. [Nachweis im GVK]

  • Uwe Puschner / G. Ulrich Großmann: Völkisch und national – Der »Beitrag« der Hausforschung. Zum Wiederaufleben der Runenkunde des SS-Ahnenerbes. In: Völkisch und national. Zur Aktualität alter Denkmuster im 21. Jahrhundert. Hg. von Uwe Puschner / G. Ulrich Großmann. Darmstadt 2009, S. 31–64. DOI: 10.11588/artdok.00002688 [Nachweis im GVK]

  • Crowdsourcing our Cultural Heritage. Hg. von Mia Ridge. Farnham u. a. 2014. [Nachweis im GVK]

  • Joel Ross / Lilly Irani / M. Six Silberman / Andrew Zaldivar / Bill Tomlinson: Who are the Crowdworkers? Shifting Demographics in Amazon Mechanical Turk. In: CHI 2010 – we are CHI. Conference proceeding (CHI: 28, Atlanta, GA., 10.–15.04.2010) New York, NY. 2010. [Nachweis im GVK]

  • A Companion to American Environmental History. Hg. von Douglas Cazaux Sackman. Malden, MA. u. a. 2010. [Nachweis im GVK]

  • Friedemann Schmoll: Wie kommt das Volk in die Karte? Zur Visualisierung volkskundlichen Wissens im ›Atlas der Deutschen Volkskunde‹. In: Der Bilderalltag. Perspektiven einer volkskundlichen Bildwissenschaft. Hg. von Helge Gerndt / Michaela Haibl. Münster 2005, S. 233–250. [Nachweis im GVK]

  • Clay Shirky: Cognitive surplus: Creativity and Generosity in a Connected Age. New York, NY u. a. 2010. [Nachweis im GVK]

  • Thomas Vander Wal: Folksonomy Coinage and Definition. In: vanderwal.net. Bethesda, MD 2007. [online]

  • Ethan Zuckerman: Mistrust, efficacy and the new civics: Understanding the deep roots of the crisis of faith in journalism. Knight Commission Workshop on Trust, Media and American Democracy. The Aspen Institute. Washington, DC 2017. [online]


Abbildungsverzeichnis

  • Abb. 1: Motive für Teilnahme im Crowdsourcing. [Schilz 2022]