Mit KI im Writers’ Room: Über Kunst und Klischees, Sinn und Simulation
Was passiert, wenn Mensch und Maschine künstlerisch zusammenarbeiten, zum Beispiel an einem gemeinsamen Drehbuch? Tobias Frühmorgen hat sich diese Frage gestellt, und zwar bevor der Hype um KI losbrach und die Arbeitsprozesse der Kreativbranche in Frage stellte. Der Filmemacher und Filmdozent beginnt 2021 zu KI und Film zu forschen und an seiner wissenschaftlich-künstlerischen Dissertation zu arbeiten. Er schreibt dabei ein Drehbuch zusammen mit KI und untersucht gleichzeitig, wie die Zusammenarbeit zwischen Mensch und Maschine funktioniert und was sie für das Kunstschaffen bedeutet. Dann wird ChatGPT für alle zugänglich und das Nischenthema rückt in den Fokus. Tobias Frühmorgen wird innerhalb kurzer Zeit zu einem Redner und Experten, der sich vor Anfragen kaum retten kann.
Wir kommen trotz seines vollen Kalenders schnell in Kontakt. Ich habe wie Tobias an der Filmuni Babelsberg promoviert, das hat wohl geholfen. Zu unserem Zoom-Call bin ich eine Stunde zu früh. Tobias Frühmorgen schaltet sich aus Lissabon zu, wo er an der Lusófona Universität unterrichtet. In Portugal ist es erst 9, wenn es bei uns 10 Uhr ist, ich habe das WET für West European Timezone nicht beachtet, also nutze ich die Zeit, meinen Gesprächspartner im Internet zu stalken. Auf seiner Website entdecke ich seine alternativen Lebensläufe (Opens in a new window), der er mit StableDiffusion und GPT-4 erstellt hat. Sehr cool! Ich freue mich auf ein tiefgründiges und unterhaltsames Gespräch über Kunst und Klischees, Sinn und Simulation.
Tanja Deuerling: Tobias, du bist im Moment ziemlich viel unterwegs mit Deinem Promotionsthema. Das ist ungewöhnlich, denn Du bist noch nicht einmal fertig mit Deiner Doktorarbeit.
Tobias Frühmorgen: Ja. Als ich vor anderthalb Jahren die Promotion angefangen habe, da war dieses ganze Thema GPT und Sprachmodelle noch nicht massentauglich. Das kannten ein paar zehntausend Leute, die an den Unis geforscht oder in Silicon Valley diese Modelle entwickelt haben. Als dann im November 2022 OpenAI dieses GPT-3 veröffentlicht hat, ging es los. Seitdem fragen mich tausend Leute: Du bist ja da Pionier, wie ist das eigentlich, und was kann man damit eigentlich alles machen? Das ist natürlich toll, dass ich weit vor Promotionsende ein Pionier bin und in einem sehr speziellen Bereich gefragt werde, nämlich in diesem künstlerischen Bereich, wo darüber noch wenig geforscht wird.
Tanja: Du bist Filmemacher. Wie kamst Du so früh auf das Thema KI?
Tobias: Ich habe es durch Ross Goodwin entdeckt, einem ehemaliger Redenschreiber von Obama. Der ist mit einer Kamera auf dem Autodach durch Amerika gefahren und hat die Fotos, die diese Kamera gemacht hat, in Texte verwandelt. Daraus hat er einen Roman geschrieben, der heißt „1 on the Road“. Er hat keine stringente Handlung und erzählt keine neuartige Geschichte über Amerika, aber er hat diese Maschinenpoesie, und die hat mich total fasziniert. Wie man von der einen Ebene in die andere Ebene kommen kann, also von Bild zu Text. So ging das los, und ich habe geforscht. Anfangs hatte ich noch überlegt, etwas mit automatisierter Montage zu machen. Aber dann habe ich mich auf den Text konzentriert, weil das greifbarer ist.
Tanja: Deine Promotion an der Filmuni Babelsberg ist eine wissenschaftlich-künstlerische Promotion. Was genau untersuchst du?
Welche Beziehung haben der Mensch und die Maschine? Wie sind die Hierarchien?
Tobias: Meine Fragestellung ist: Was ist die Beziehung zwischen Mensch und Maschine in einer künstlerischen Zusammenarbeit? Und weitergehend die Fragen: wie verändert sich das Kunstschaffen, wenn man das zusammen mit einer Maschine macht? Welche Beziehung haben der Mensch und die Maschine? Wie sind die Hierarchien? Und was kann eine Maschine leisten, was der Mensch nicht leisten kann? Was kann der Mensch leisten, was die Maschine nicht leisten kann?
Tanja: Und wie sind die Hierarchien?
Tobias: Für das Überleben der Menschheit sollte der Mensch eigentlich noch die Kontrolle behalten. Jetzt haben wir schon sehr viele Modelle auf der Welt, wo der Mensch die Kontrolle längst abgegeben hat. Aber künstlerisch gesehen ist es notwendig, dass der Mensch die Kontrolle behält. Als ich angefangen habe, wollte ich eigentlich eine Kooperation auf Augenhöhe mit KI, eine Art Writers' Room-Situation. Wenn heutzutage Drehbücher, vor allem TV-Serien geschrieben werden, setzt man ein paar Leute an einen Tisch, der eine wirft Ideen rein, die andere schreibt die Dialoge, und so weiter. In so einer Situation habe ich mich mit der Maschine gesehen. Im Laufe der Arbeit habe ich gemerkt, dass die Maschine einige Dinge extrem gut kann, zum Beispiel Schnelligkeit. Die Texte, die die Maschine produziert, sind ungefähr doppelt oder dreifach so schnell fertig, wie ich sie überhaupt lesen kann. Und sie hat ein enormes Wissen, was ich nicht habe.
Tanja: Was kann die Maschine nicht?
Was Sinn ist, können am Ende dann doch nur Menschen entscheiden oder definieren. Und was künstlerisch interessant ist oder „wertvoll“, das ist Menschensache.
Tobias: Was die Maschine überhaupt nicht hat, ist ein Verständnis für Sinn. Weder für künstlerischen Sinn noch für allgemein gültigen Sinn, also Common Sense. Je neuer die Modelle werden, je leistungsfähiger sie werden, desto mehr scheint es einen Sinn zu geben. Aber das ist nur eine Simulation von Sinn und kein echter Sinn. Die Maschine bleibt eine Maschine, die durch immer größere Trainingsdaten trainiert ist. Aber was Sinn ist, können am Ende dann doch nur Menschen entscheiden oder definieren. Und was künstlerisch interessant ist oder „wertvoll“, das ist Menschensache. Für die Maschine ist ein Bild von Van Gogh am Ende nur Pixel. Sie hat nur die Farbwerte, die Größe des Bildes, das Entstehungsjahr, den Maler, den Titel, vielleicht in welchem Museum es hängt. Wir Menschen haben in einem Museum im Extremfall den Geruch der Farbe. Wir können näher ran und weiter weggehen. Wir sehen, wie dick die Farbe aufgetragen wurde und noch vieles andere mehr. Wir sehen, wie andere Menschen auf dieses Bild reagieren. Wir können das Bild mit einem Auge anschauen, da wir Menschen – im Gegensatz zur Maschine – einen biologischen Körper haben. Wir haben also einen ganz anderen „Sinn“ für Sinn. Die Maschine kann Sinn nur simulierend erzeugen, aber sie kann ihn nicht eigentlich erkennen.
Tanja: Hat diese Simulation von Sinn einen künstlerischen Wert? Braucht Kunst Originalität, wie argumentierst du das?
Tobias: Der Originalitätsbegriff ist schon seit Walter Benjamin und früher hinterfragt. Was GPT macht, ist Remixen. Das hat Frank Castorf an der Volksbühne gemacht, oder Helene Hegemann mit Axolotl Roadkill. Das ist künstlerisch total interessant. Nur die Entscheidung, was denn eigentlich eine künstlerische Relevanz hat, die, glaube ich, kann die Maschine nicht treffen.
Tanja: Lass uns bei den Grenzen von KI bleiben. Wo stößt Du beim Drehbuchschreiben mit KI an Grenzen?
Diese One World Solutions sind extrem seltsam für uns als Europäer, weil sie das Weltbild des Silicon Valley als Maßstab für den Rest der Welt nehmen.
Tobias: Die kommerziellen und die freien Sprachmodelle sind alle so konfiguriert, dass sie für den ganzen Planet funktionieren, aber diese One World Solutions sind extrem seltsam für uns als Europäer, weil sie das Weltbild des Silicon Valley als Maßstab für den Rest der Welt nehmen. Dabei ist es total unterschiedlich, was in welchem Land geht oder nicht geht. Pornografie, Selbstverletzung, rechtsextreme Sprüche – das sind hoch sensible Themen. Ich habe in meiner Arbeit Testfragen entwickelt, um herauszufinden, welche Fragen erlaubt sind und welche nicht. Ein Beispiel: Schreibt mir eine schwule Sexszene. Kann ich nicht! Stell Dir vor, Du bist in dieser Writers‘ Room-Situation, und Du hast jemanden gegenübersitzen, der sagt, hey sorry, kann ich nicht. Das ist total gaga!
Tanja: Woran merkt man noch, dass die Systeme im Silicon Valley gefüttert werden?
Tobias: Wenn man anfängt zu prompten und fragt: schreib mir bitte fünf Filmideen für einen Spielfilm. Da kommen in erster Linie Geschichten über Silicon Valley oder über Amerika. Dann geht man weiter und sagt: die Geschichte spielt in Europa. Ok, dann kommt Berlin und Venedig und Paris. “The bustling city of Berlin, your protagonist is a graffiti artist and she goes clubbing every night”. Du hast nur diese Klischees!!! Dann sagt man: ich will irgendwie eine andere Geschichte! Sie spielt nicht in Berlin! OK, dann spielt sie auf dem Fjord in Norwegen. Das sind alles so Stereotypen, die kann ich echt selber schreiben! Interessant wird es ja erst, wenn eine Figur Schwächen, innere Konflikte und Überraschungen hat. Es ist wirklich sehr schwer, unstereotypische Geschichten mit KI zu bekommen.
Tanja: Das ist künstlerisch uninteressant, aber gibt es nicht Kontexte, wo genau das Klischee interessant ist?
Tobias: Ja, klar, es gibt die Kontexte, in denen Überraschung nicht gewünscht ist, wo die Figuren ein bisschen eindimensional bleiben müssen, weil das Format genau das will. Soaps oder Internet-Content, der gar nicht künstlerisch oder innovativ sein will, sondern etwas auf einer Konsumebene bedient, was total ok ist.
Tanja: Zurück zu Deinem Drehbuch. Wie weit bist Du?
Tobias: Ich fange immer wieder neu an, je nachdem, welches Modell rauskommt. Aber das ist auch normal. Jeder Drehbuchautor, jede Drehbuchautorin hat 27 Entwürfe von nicht zu Ende geschriebenen Drehbüchern in der Schublade liegen. Man merkt irgendwann, es ist nicht das, mit dem man sich ein, zwei Jahre beschäftigen will. Ich habe von meinem Drehbuch die ganze Struktur fertig, aber ich überarbeite es ständig, weil irgendwie diese Modelle immer besser werden. Dann denke ich mir doch wieder, ach, geh doch noch mal zu der Ausgangsidee zurück, vielleicht kannst du ja irgendwie ein paar Schritte überspringen. Oder vielleicht kannst du ja doch irgendwie eine Kurve kriegen, wo das Ganze schräg wird, also künstlerisch schräg.
Tanja: Ich habe selbst meine Dissertation geschrieben, und ich fand es schwierig, dass man während der Arbeit immer mit neuen Forschungsergebnissen konfrontiert wird, die man irgendwie noch mit aufnehmen muss. In Deinem Fall passiert das in einem Tempo, bei dem man fast nicht mithalten kann. Stresst Dich das?
Als der Sprung von GPT-3.5 auf 4 kam, dachte ich mir, das packe ich jetzt nicht mehr, weil dieses Modell so gut ist.
Tobias: Total! Als der Sprung von GPT-3.5 auf 4 kam, dachte ich mir, das packe ich jetzt nicht mehr, weil dieses Modell so gut ist. Und das Neueste mit diesen ganzen GPT-Assistants , das ist noch mal eine Stufe krasser. Das Tempo ist echt gefährlich, aber ich fange ja nicht jedes Mal wieder von Null an.
Tanja: Welche Tools außer GPT-4 nutzt Du noch?
Tobias: Perplexity, Midjourney, StableDiffusion und gpt4all.
Tanja: Wann möchtest Du die erste Fassung haben?
Tobias: Die letzte Fassung hätte ich gerne 2024, aber ich weiß, dass es nicht klappen wird. Na gut, ich hoffe, ist ja auch ein gewisser Druck dahinter.
Tanja: Wird das Drehbuch ein Film?
Tobias: Nein, ich habe noch ein anderes Projekt. Da probieren wir, Filme zu automatisieren, also von der Idee bis zu den KI generierten bewegten Bildern. Das ist natürlich künstlerisch superspannend, aber man muss auch aufpassen, dass man jetzt nicht alles ausprobiert.
Tanja: Wirst Du Deine weiteren Projekte wieder mit KI machen oder oldschool?
Tobias: Nee nee, da gibt es jetzt keinen Weg mehr nach hinten. Wenn, dann wäre es eine bewusste künstlerische Entscheidung, so wie auf 16 Millimeter zu drehen.
Tanja: Wenn Du an Deine Partnerin KI im Writers‘ Room denkst, hast Du eine persönliche Beziehung zu ihr oder zu ihnen?
Tobias: Ich warte darauf. Ross Goodwin, mit dem ich angefangen habe, der hat irgendwann die KI Benjamin genannt: „Benjamin wrote this and this“. Vielleicht passiert es wie bei Freundschaften. Erst redet man immer über das Wetter und über Immobilienpreise in London, eine total langweilige Freundschaft. Erst wenn in dieser Freundschaft plötzlich jemand etwas Persönliches oder Überraschendes sagt, dann wird die Freundschaft interessant. Ich glaube, auf so einen Moment warte ich noch. Ein Überraschungsmoment, den ich nicht selbst gepromptet habe.
Tanja: Tobias, das ist der schönste Schlusssatz. Er schlägt den Bogen vom Anfang bis zum Ende unseres Gesprächs.
Tobias: Klar, danke. Meine menschliche Content Length war ausreichend, um den Bogen bis zum Anfang zu bauen. Hat mich gefreut, mit Dir zu sprechen.
Tobias Frühmorgen ist Filmemacher, Wissenschaftler und Filmdozent. Seine künstlerischen Arbeiten als Regisseur und Cutter umfassen Spielfilme, Kurzfilme, Fernseh-, Kunst- und Musikvideos. Sein Film Menschenkörper (2004) wurde auf mehr als 25 Festivals weltweit gezeigt. Zu seinen Schnittarbeiten gehört die Restaurierung und Neubearbeitung von Yilmaz Güneys YOL - The Full Version (2017), der bei den Filmfestspielen in Cannes 2017 uraufgeführt wurde. Weiterhin arbeitet Tobias arbeitet als Story-Analyst für internationale Drehbücher und ist zertifizierter Green Consultant für Filmproduktionen.Als Filmdozent unterrichtet Tobias Frühmorgen Kreative Produktion und Europäisches Filmerbe an der Lusófona Universität Lissabon. Er arbeitet an verschiedenen internationalen wissenschaftlichen Austauschprogrammen und Projekten zum Thema KI, Green Production, Pädagogik und Entrepreneurship. Seit 2021 forscht er im Rahmen seiner künstlerisch orientierten Promotion an der Filmuniversität Babelsberg zum Thema "AI and Screenwriting – Exploring Storytelling with GPT".