“Realismus”, KI und Kitsch - Empowerment und die Wiederversinnlichung der Welt
Ein Text, entstanden infolge einer kurzen Diskusion bei Bluesky zum Thema Künstliche Intelligenz mit Robert Meyer und Jacob Birken
BILDER?
Was zeigen Bilder? Schon diese Frage ist tricky, weil "zeigen" in seiner häufigsten Verwendung eine Handlung ist - auf etwas zeigen. "Siehste, da hat wieder jemand in die Einfahrt gepinkelt", "Ich zeige Dir jetzt das Stadion des FC St. Pauli". Der Zeiger zeigt die Uhrzeit an im Falle analoger Uhren - hier wird "zeigen" buchstäblich verwendet und bewegt sich doch im Symbolischen, im Reich der Zahlen. Auch in Formulierungen wie "In diesem Bild zeigt sich, wie perfide die AfD arbeitet" ist "zeigen" gar nicht so einfach zu fassen. Man spricht oder schreibt dann nicht nur über den, ja, was denn, Inhalt des Bildes, sondern das, was mit ihm gemacht wird. "Das Bild zeigt den Mord an J.F. Kennedy" scheint zunächst eindeutiger; wir alle wissen jedoch, dass seit Jahrzehnten darüber diskutiert wird, was die Filme des Atentats denn nun wirklich zeigen.
Klar, hier sind auch einfacher aufzulösende Morde im Bild denkbar. Aber man sieht nicht den Mord. Mord ist ein Begriff, der auf eine bestimmte Variante eines unter anderem juristischen Sachverhalts verweist, innersprachlich - weil Mord da so oder so definiert ist. Was man sieht, ist im Falle einer Fotografie z.B. einen Menschen, der einen Schuss auf einen anderen abgibt; vielleicht ist die Aufnahme auch so präzise, dass man bei Vergrößerung die Kugel erkennen kann auf dem Weg zum Opfer - da ist er im Falle der Fotografie zu dem Zeitpunkt aber noch nicht tot, und über die Intention des Schützen wissen wir auch nichts, wenn wir das sehen.
Im Falle filmischer Bilder sehen wir einen Prozess, keinen vor Gericht, sondern: der Schütze greift zur Waffe, drückt ab, es knallt und das Gegenüber fällt zu Boden, greift sich an die Brust, ein Blutfleck erscheint auf einem Hemd, wird größer, er röchelt, die Bewegung setzt aus, tot. Wahrscheinlich. Genaueres weiß der Gerichtsmediziner, der in jedem Krimi dann sagt, was eigentlich passiert ist: nicht der Schuss war tödlich, in Wirklichkeit erlitt der Betroffene eine Herzattacke beim Anblick des Revolvers.
Man versteht hier bereits, wieso man in der Analyse von Bildern zwischen bewegten und unbewegten unterscheiden sollte. Gilles Deleuze schrub so von Bewegungsbildern und verglich sie mit Henri Bergsons berühmten Beispiel des sich in einem Glas auflösenden Zuckers. Wir sehen die Bewegungen, nicht die einzelnen Frames, stattdessen Zeitabschnitte von einer gewissen Dauer im Film. Abläufe eben - im Falle von gemalten Historien- oder Prozessionsbildern, Jesus trägt das Kreuz oder steht an der Geißelsäule, denken wir uns die Story hinzu.
Man kann auch sagen "Das Bild oder der Film bildet ab". Das ist ein Satz wie "das ist ein unverheirateter Junggeselle". Abbild, sich ein Bild von etwas machen usw. macht ja nicht verständlich, was man macht, wenn man abbildet, sondern es das ist einfach eine Verdoppelung von "Bild".
Der frühe Wittgenstein ging dennoch von solchen ja immer auch seltsam statischen Vorstellungen von Welt aus. Die Welt sei alles, was der Fall ist, so schreibt er im Tractatus - ein Werden gibt es da gar nicht. Und:
"3. Das logische Bild der Tatsachen ist der Gedanke.
3.1 Im Satz drückt sich der Gedanke sinnlich wahrnehmbar aus.
4.01 Der Satz ist ein Bild der Wirklichkeit.
4.03 [...]Der Satz sagt nur insoweit etwas aus, als er ein Bild ist."
Sätze - "Da vorne steht ein rotes Haus" - denkt Wittgenstein hier noch, später gab er das auf, als Bilder, ohne auszuformulieren, was denn nun ein Bild sei. In deutschen Wörterbüchern taucht "Bild" als "Darstellung von:
"etwas od. jmdm. auf einer Fläche, z.B. Gemälde, Zeichnung, Druck, Fotografie [...], od. plastisch; <Opt.>=Abbildung; Darstellung einer Sache durch eine andere, Zeichen, Symbol (Sinn~); Erscheinungsform (Krankheits~); Ebenbild; Anblick; Vorstellung von etwas"
auf. Hier bewegt sich die Aufzählung ziemlich fix von einer Bild-Objekt-Relation zu metaphorischen Verwendungen, und was meint "Darstellung"?
AUFNAHMEN UND MÖGLICHKEITEN DER VERIFIKATION
Ich will das hier gar nicht weiter vertiefen, man kann sich ja darauf beschränken, "okay, das hier, das z.B. ist ein Bild" - was dann sowohl ein Foto des Strands von Sylt sein kann oder das schwarze Quadrat von Malewitsch - und "das da ist eine symbolisierte Darstellung der chemischen Reaktion von Brom am Benzolring", und es wird schon jeder verstehen, was gemeint ist.
Wenn auch der chemische Prozess am Benzolring eines gewissen Vorwissens bedarf. Ich hatte das Thema in meiner Abiturprüfung und fand mich als einziger Chemie-Kandidat in einem Raum von Biologieschülern wieder. Brom stinkt fürchterlich, wenn man es in ein Reagenzglas mit Benzol gibt. Mein Lehrer, Hoffmann hieß er, hätte drum nie gedacht, dass dieses Thema von einer übergeordneten Instanz aus zweien ausgewählt würde. Es tat sich etwas in dem Reagenzglas, und ich führte aus, was ich aus dem schloss, das ich da sah. Bezogen auf meine Beobachtung wertete ich den Prozess auch sinnvoll und schlüssig aus in dem, was ich dazu schrub. Es war aber etwas schief gelaufen; was ich sah, hätte gar nicht sein dürfen. Meine Ergebnisse waren falsch. Sie wussten nicht, wie sie das bewerten sollten. Lauter Unsinn, aber in sich schlüssig. Ich bekam 8 Punkte. Weil ich hätte merken müssen, dass meine Beobachtung falsch war, ich aber das Falsche klug herleitete.
Das sind die Tücken nicht nur, wenn es um Bilder geht, sondern auch Beobachtungen. Dass die Sinne trügen können wissen wir nun auch seit Platon und Descartes, also so what. So einfach ist es aber auch nicht. Mit Bildern, seien es Bewegungsbilder oder Fotografien, wird immerhin Politik gemacht. Ist das nun Hamas-Propaganda oder etwas, was wirklich passiert ist in Gaza? Stammen die Bilder überhaupt von dort? Auch unterhalb der KI-Schwelle verhält es sich durchaus kompliziert mit der Bildproduktion. Ich kenne Bilder, die als reale Dokumente in diverse gründlich recherchierten Dokumentationen über die Judenverfolgung im 3. Reich hineingeschnitten wurden, die aus Spielfilmen stammen. Was viele Produzierende aber gar nicht wissen, weil sie immer wieder auf bereits fertige Produktionen zurückgreifen, in denen die Sequenz als "reales" Footage ausgewiesen ist.
Insofern habe ich oben einen schon einen anderen Begriff eingeschmuggelt, der eine Art Schlüssel enthält: Aufnahme. Rein innersprachlich landet man auch bei kuriosen Ergebnissen, analysiert man den. Pragmatisch und tatsächlich verweist er auf wie auch immer gestaltete Geräte und Apparaturen: Tonbandgeräte, iPhone, 35mm-Film. Für Gerüche sind mir keine Aufzeichnungsmethoden bekannt oder für den Tastsinn; man kann aber Schrift ertasten. Aufnahmen sind das, was man mit einer Maschine aufzeichnet und was eine Reproduktion dessen enthält, was sich in deren Fokus befand. Sie kann verzerrt, klar, verwackelt und unscharf sein, aber das, was sich in ihr zeigt, steht in einem realen physikalischen Verhältnis zu dem, was sich im Bereich der Mikrophone und Kameras bewegte. Um zu wissen, was daran nun wahr ist, muss man die Produktionsbedingungen nachvollziehen können. Man verfügt so auch über ein Unterscheidungskriterium zwischen Gemälden - kein Bild der Kreuzigung wurde von jemandem gestaltet, der dabei war - und Film und Fotografie. Gemälde interpretieren immer, auch dann, wenn sie mit optischen Hilfsmitteln hergestellt wurden und eine reale Person darauf zu sehen ist.
Man ist beim Nachvollziehen der Produktionsbedingungen darauf angewiesen, dass z.B. die Angaben auf der Videocassette oder Speicherkarte tatsächlich Geschehen vor der Kamera "einfangen" und muss ggf. andere Aufnahmen hinzuziehen, um sich ein bereits interpretatives "Gesamtbild der Situation" machen zu können. Z.B. die Vorgänge des School-Shootings an der Columbine High School wurden so in Kombination mit Augenzeugenberichten rekonstruiert; ob sich die Täter selbst erschossen haben oder erschossen wurden, das weiß aber niemand so genau. Jeder, der Krimis guckt, weiß, wie so was untersucht werden könnte. Zumindest gibt es prinzipiell im Falle von Aufnahmen, anders als bei Gemälden oder Schriftstücken, Verifikationsmethoden. Okay, Schriftstücke kann man auch datieren und z.B. die Handschrift analysieren.
Dass es etwas wahr sei, das weiß man aber nicht, wenn man ein Bild anguckt, sondern dann, wenn man sagt "Ich habe es überprüft, die Aufnahme stammt wirklich aus Gaza, wurde dort an folgendem Datum vom folgenden Fotografen aufgenommen, der, wie diverse Quellen bestätigen, auch tatsächlich anwesend war." Die Wahrheit steckt nicht im Bild, das ist allenfalls die Wirklichkeit, sondern in Aussagen, die man über es macht. Das ist Peter F. Strawson, variiert.
KÜNSTLICHE INTELLIGENZ - LÜGE, PROPAGANDA ODER IMAGINATION?
Rund um das Thema "Künstliche Intelligenz" sind das alles meines Erachtens zentrale Gedanken. Meistens gucken Interpreten da einfach nur drauf und ziehen daraus ihre Schlüsse. Eine Lüge ist KI offenkundig dann, wenn im Computer Generiertes als real behauptet wird. Trotzdem bekommen wir kaum noch unbearbeitete Aufnahmen zu sehen. Die Verifikation kann sich zumeist nur auf den semantischen Gehalt des Bildes als Aussage beziehen. Denn meistens liegt zumindest irgendein Filter darauf, bei komplexeren Produktionen kommen Colour Grading, Schnitt, ggf. Animation und ähnliche Praxen hinzu im Falle des Bewegtbildes. Photoshop und analoge Tools sind rund um die Fotografie schon länger im Einsatz. Einst spielte man mit Doppelbelichtungen und Ähnlichem, der Übergang ins "Artifizielle" ist häufig fließend auch im Dokumentarischen. Man muss diese Tools und deren Funktionsweise, auch, wo und wie sie situiert sind, schon kennen, um sinnvolle Aussagen über Aufnahmen versus Computersimulation treffen zu können.
Anders als in manchen Zweigen der Malerei kommt es beim KI-Einsatz rund um Fotos und Film zumeist zu Idealisierungen. Es wird auf einen Pool oft längst in Vergessenheit geratener Aufnahmen zurückgegriffen, die dann in diversen Kombinationen von Software-Presets und dem, was aus dem Netz gesaugt werden kann, zu etwas Neuem kombiniert werden.
Diese Idealisierung ist es meines Erachtens, die den Einsatz in rechter Propaganda von Riefenstahl bis AfD so attraktiv macht. Die in der Tat eindrucksvollen skulpturalen, klassisch formschönen Körper in Action im "Olympia"-Film haben dem vorgegriffen, was nun an blonden, gut gebauten Arier-Familien in völkischer Propaganda zu sehen ist.
Es sei daran erinnert, dass z.B. Clement Greenberg, einst mächtiger Kunstkritiker, im berühmten Aufsatz "Kitsch und Avantgarde" eben deshalb für abstrakte Kunst plädierte - er war sich schlicht gewahr, wie im Sozialistischen Realismus und auch in der Nazi-Kunst solche vermeintlichen "Aufnahmen" genutzt wurden, zumeist schlicht inszeniert, und stellte dem die mit Spontanität gesättigte Selbstreferenz des Materials entgegen im Falle der Bilder Pollocks, die zudem noch ihre eigene Prozessualität ausstellten. Sie könnten die propagandistische Wirkung unterlaufen. Bei Adornos Feiern des Fragments, das sich dem identifizierenden Denken und im Material dem falschen Ganzen zumindest insofern entzöge, dass es ihm Wunden schlüge, mal sehr frei interpretiert, tauchen ähnliche Motive auf. Es gibt mittlerweile auch KI-Tools, die so was simulieren; irgendwie Kunst. Tatsächlich werden die in AfD-Propaganda eher nicht auftauchen.
KI ALS EMPOWERMENT FÜR MARGINALSIERTE?
Auf diesen ganzen Text komme ich aufgrund eines sehr guten Threads von Roland Meyer bei Bluesky (Öffnet in neuem Fenster). Er analysiert dort lesenswert, was der so genannte "Plattform-Realismus" hervorbrächte und landet bei ähnlichen Ergebnissen wie ich hier. In einem anderen, auf Meyer Bezug nehmenden Thread, in dem ich kurz mitdiskutierte, verknüpfte Jacob Birken die KI-Frage mit jener nach Empowerment (Öffnet in neuem Fenster), explizit auf "Identifikation und Empowerment" von Wolfgang Ullrich (Öffnet in neuem Fenster) verweisend. Über das Buch habe ich hier bereits zwei Texte verfasst. Die Frage rückte in den Mittelpunkt, wie und ob denn KI im Falle des Empowerments gesellschaftlich Marginalisierter Einsatz finden könne.
Ich habe dann etwas leichtfertig behauptet, dass das schon deshalb gar nicht möglich sei, weil KI nur aus dem Mainstream aufsauge und deshalb Marginalisierte da sowieso verschwänden. Dann fiel mir jedoch ein, dass das so nicht stimmt. Es stimmt z.B. im Fall der Kunst eines Jean-Michel Basquiat, aber in schwuler Ästhetik gerade nicht. Bei Instagram veröffentlich ein Fotograf namens Thomas Synnamon regelmäßig KI-generierte Fotos, die teilweise sehr queer sind, teilweise, wie in schwulen Ästhetiken üblich, Idealisierungen noch übertreiben: Die Lippen sind voller, die Wangenknochen markanter, die Muskeln überdimensioniert.
Das findet sich schon in den Zeichnungen z.B. von Tom of Finland und ist es auch, was es Kritiker*innen so leicht macht, schwule Ästhetiken als prinzipiell faschistoid zu behaupten - alles oberflächlicher Körperkult-Kitsch, und deshalb seien die Nazis ja sowieso alle heimlich schwul gewesen und hätten am liebsten ihre HJ-Jungs gefickt. Noch die frühen Rammstein spielen genau damit, mit der Kombination von Homoerotik und Anspielungen auf faschistoide Ästhetiken und das so, dass die Musik problemlos in Gay-Lederbars hätte gespielt werden können. Und vielleicht auch wurde.
Meines Erachtens übersehen aber diese auch auf der Linken lange üblichen Klischees von den "schwulen Nazis", dass dann, wenn Männer sich nicht gegeneinander totschlagen oder Kriege führen und dabei Frauen vergewaltigen, sondern sich wechselseitig begehren, sich schon etwas verändert in der Welt.
ARTIFIZELLES IN DER QUEEREN KUNSTGESCHICHTE
Zudem die meiste queere Kunst von Leonardo da Vinci über Michelangelo und Caravaggio bis hin zu Pierre & Gilles dem Ganzen einen ziemlich deutlichen Twist verpasst. Bei Leonardo sind es die fließenden Grenzen im Sfumato, einer Lasurtechnik, die Konturen verschwimmen lässt; zudem die ziemlich androgynen Züge seiner Modelle, die es bis heute möglich erscheinen lassen, dass sein Liebhaber für die Mona Lisa Modell stand. Michelangelo wählte für manche der Frauenfiguren in der Sixtinischen Kapelle mutmaßlich ebenfalls männliche "Models" als Vorbild, die überzeichnet muskulöse Rücken zeigen, und platzierte das Ganze auch noch mitten im Vatikan. Caravaggio malte mutmaßlich Stricher und platzierte sie in Kirchen. Pierre und Gilles (Öffnet in neuem Fenster) - großer Zeitsprung - knüpften direkt an Ikonographien in Katholischen Kirchen an und postierten darin Entrücktes, das sie aus Popstars zauberten, aber auch Bondage- und andere BDSM-Praxen. Sie arbeiteten bereits mit einer Kombination aus Fotografie und Computer, seitdem das möglich war - eine Vorstufe von KI. Da knüpft auch Thomas Synnamon recht explizit an. Dadurch, dass ein männlicher Blick hier die Welt homoerotisch verzaubert - "verzaubert" war einst ein Begriff für schwul -, entsteht eine Gegensimulation zum Familianismus des aktuellen Neofaschismus, die tatsächlich empowern kann.
Ich bin durch so etwas sozialisiert. Es gibt gerade in schwulen und queeren Ästhetiken massenhaft Kitsch und Camp, aber als Mittel, die heteronormative Welt zu sprengen. Jede CSD-Demo ist voll davon.
Über solche Prozesse schreibt Wolfgang Ullrich treffsicher in "Identifkikation und Empowerment". "Aufnahmen" von der Welt würden als Alternative eher die Tristesse Marginalisierter zeigen. Das waren durchaus Stilmittel von Teilen des frühen New Queer Cinema, zum Beispiel in "The Living End" von Gregg Araki (zwei mit AIDS Infizierte werden zu Outlaws und Copkillern) und "My own private Idaho" von Gus van Sant (zwei männliche Prostituierte, gespielt von Keanu Reeves und River Phoenix, bewegen sich in einer Art Road Movie inmitten des Stricher-Elends). Beide Filme changieren zwischen teils überdeutlichem "Realismus" und Stilisierung; im Film von Gus van Sant unterhalten sich plötzlich die Coverboys auf Porno-Magazinen an einem Zeitschriften-Stand miteinander.
Schwule im Elend und getrieben von schweren Konflikten gucken sich dann auch Heteros ganz gerne an. Zu Zeiten des "New Queer Cinema" ging es jedoch eher darum, auch queere Outsider jenseits bürgerlicher Moral zu inszenieren, um so diesem absurden Zwang, unbedingt gute und heldenhafte Identifikationsfiguren zu schaffen, aufzulösen. Dieses sind zwei empowernde Methoden - sich der bürgerlichen Moral entziehen oder aber artifizielle Gegenwelten zur tristen Realität zu schaffen.
Für beides bietet sich KI natürlich an. Man muss nur lange genug damit rumspielen, dann bekommt man das schon hin.
FÜR DIE PARTIELLE WIEDERVERSINNLICHUNG VON WELT
Nur soll die Schattenseite nicht unerwähnt bleiben. Sie zeigt sich z.B. in Fake-Profilbildern in Dating-Apps. Diese Wirklichkeitssimulationen als wiederverzauberte, erotisierte Gegenwelt zu jener der Heteros können auch in tiefe Frustration münden. Über Körperkult und Jugendwahn in schwulen Subkulturen will ich hier gar nicht lange schreiben. Mir geht es um die Entsinnlichung des Produktionsprozesses.
Ich selbst habe summiert Jahrzehnte in digitalen Schnittsystemen verbracht und unzählige Stunden schreibend am Computer verbracht. Es begann mich zu nerven. Klar gibt es auch sonst sinnliche Erfahrungen im Leben, auch in meinem. Aber kreative Prozesse sind mir schon Lebenselixier. Nach besonders intensiven Produktionen begann ich einst damit, statt in den Urlaub zu fliegen mit Ölfarben zu experimentieren. Das wurde ähnlich teuer. Ich erfuhr neu, nicht auf Bildschirme zu starren und Knöpfe zu drücken, sondern zu riechen (Lösungs- und Malmittel, Ölfarbe), Haptik, situierte Leiblichkeit und direkt IM Material sein, um so wieder den kreativen Prozess zu genießen. Ein Jahrzehnt später packte es mich, den vergebenen Saxophonunterricht meiner Jugend, kam nicht viel bei raus, wiederzubeleben. Letztlich führte das sogar zum Ausstieg aus der von mir mitgegründeten Firma, als ich wieder zu spielen begann. Saxofon ist ein Instrument, das man mit dem ganzen Körper spielen muss, nicht nur mit dem Mund oder der Kenntnis von Tonleitern. Verspannungen hört man sofort, gerade, wenn man gut klingen will. Der buddhistisch inspirierte Jazz-Virtuose Kenny Werner empfiehlt drum, auf dieses Anliegen des "Schönspielens" zu verzichten und den Körper einfach machen zu lassen.
Ich habe mal ein Video gebastelt zu dieser Art "Wiederversinnlichung der Welt":
https://www.youtube.com/watch?v=ROU620N7xio (Öffnet in neuem Fenster)Ich habe zur App iRealPro den Jazzstandard "You don't know what love is" gespielt, in der Mitte improvisiert, und ein altes Mundstück ausgebuddelt, auf dem ich lange nicht gespielt habe. Ein Otto Link; das ist insofern relevant, dass ihm der typische "Vintage Sound" nachgesagt wird - viele der großen Jazzer spielten auf diesen Kautschuk- und Metallgebilden Soli, die per KI nicht programmierbar wären- bisher. Ich habe auch darauf verzichtet, meinen Sound zu beurteilen; das ist etwas weg von dem, wie ich klingen möchte. Aber es ist ein unredigierter 1 zu 1-Durchlauf. Man hört auch die Klappengeräusche des Saxofons und den etwas metallischen Sound meines Wohnzimmers. Klar, es liegt digital Hall und ein Kompressor darauf. Die Cartoon-Sequenzen sind aus dem Prelinger-Archiv. Man sieht ihnen den Produktionsprozess an, das "Handgemalte", durchaus in Kommunikation mit der bildenden Kunst. Die Physis und Sinnlichkeit der Herstellung bleibt spür- und sichtbar. Das alles ist potenziell auch mit KI reproduzierbar. Aber dann verweist die auf etwas außerhalb ihrer selbst.
FAZIT
Mein Fazit ist: es gibt Fälle von Bildern, in deren Fall die Entstehung notwendig Verifikationsprozessen unterliegen müssen. Es wäre jedoch naiv anzunehmen, dass die Welt 1 zu 1 abbildbar wäre, und zwischen Fotografie und Bewegungsbildern zu unterscheiden hilft, auch KI zu verstehen. Verifikation steckt nicht im Bild, sondern in Aussagen über dieses.
Ansonsten konkurrieren Künstlichkeiten miteinander, die durch inszenierte Realismen zwar gebrochen werden können - ob dieses Artifzielle nun gut oder schädlich sind, dazu Kriterien zu entwickeln muss die soziale und politische Situiertheit des Herstellungsprozesses berücksichtigen und kann nicht einfach nur auf das Bild gucken und es wie einen Text lesen.
Im Falle von KI ersetzt der Produktionsprozess im Falle von KI situierte Leiblichkeit und somit auch Teilnehmendenperspektiven. Er tendiert dazu, diese durch die Sicht der anonymen 3. Person zu ersetzen. Das kann nicht nur Empowerment in neue Frustration kippen lassen, sondern auch entmenschlichen. Menschen sind nun mal leibgedungen sinnliche Wesen in der Welt.
Die Ignoranz der Position der Produzierenden kann sich in wissenschaftlichen Thematisierungen reproduzieren. Man muss schon in die Prozesse hineingehen, will man zu Aufnahmen, Bildern und Simulationen forschen. Meines Erachtens geschieht das jedoch zu selten.
(Mitgliedschaften und Newsletter-Abonnenemts helfen mir dabei, diese Seite zu pflegen. Herzlichen Dank!)