Zum Hauptinhalt springen

#031 Bundesagentur für Sprunginnovation

Heute zu Gast im CM MAGAZIN: Holger Klein 

⬇️ Die 🎧-Podcast-Version zum Hören unten am Ende des Artikels ⬇️

Die Themen:

  • Bundesagentur für Sprunginnovation #news #tech #mobilität #ki
  • Stable Diffusion (and so it begins) #fotografie #ki
  • Sind Ludditen anwesend? #fotografie
  • Dürfen die das?! #fotografie #ki

## Die Hausmeisterei

Servus!

Ich hoffe euer Sommer ist halbwegs relaxed. Hier kehrt ganz langsam wieder Normalität ein. Ich bin ganz langsam und sehr glücklicherweise über meine Bindehautentzündung hinweg, die ich mir auf der Rückfahrt von Transsilvanien geholt habe und kann wieder halbwegs normal aus dem rechten Auge schauen. Augen. So wichtig. Merkt man erst, wenn mal eins fehlt.

Man sagt, die meisten Bands, die als over-night-success gefühlt aus dem Nichts plötzlich in den Top-10 erscheinen, hätten 10 Jahre harte Arbeit hinter sich. Wir sehen genau das gerade in der K.I.. 2012 rollte AlexNet mit einer neuen Netzwerkarchitektur das zu dem Zeitpunkt eher tot geglaubte Feld der KI neu auf. Damals waren das Deep Convoluntional Networks, die z.B. auch schon 2014 bei Flickr die Suche in Bildern nach Begriffen ermöglicht haben. Eine Sache, die heute jedes Smartphone kann.

Seither ist viel geschehen und die Bildgeneratoren, die jetzt auch in der Open Source angekommen sind, sind sicher nur ein Vorgeschmack von dem, was da noch so kommen wird.

Und ich glaube selbst Holgi sieht gaaanz langsam, was sich da abzeichnet.

Heute im Magazin reden wir über Disruption, die Ludditen und die rechtlichen Seiten unserer neuen Kreativ-Maschinen.

Bevor ich wieder ins Studio zurück gebe, hier noch zwei ganz wichtige Links für euch. Und zwar damit ich hier nicht immer nur in die große weite Leere des Internet rufe: 

ERSTENS: Der Discord. Ja, es gibt einen Discord. Ich habe den hier vor einigen Wochen mal ganz zart beworben. Und ursprünglich war der mal separat fürs CM MAGAZIN ganz alleine, aber ich denke mittlerweile, dass das auf meinem Chris Marquardt Discord besser aufgehoben ist. Und zwar in einem eigenen Channel. So für Themenvorschläge, Diskussionen usw. Das Invite  dazu steht auf tfttf.com/cmd 

Und ZWEITENS gibt's seit heute noch den offiziellen Feedback-Loop fürs Magazin. Sei es zu einem bestimmten Thema, was ich hier behandelt habe, oder allgemein, oder ein Themenvorschlag. Auf hi.cmmagazin.com könnt ihr direkt hier in die Sendung funken.

Beide Links stehen in den Shownote.

Und jetzt los.

## Bundesagentur für Sprunginnovation

(Quelle: https://techcrunch.com/2022/08/12/a-startup-wants-to-democratize-the-tech-behind-dall-e-2-consequences-be-damned/?guccounter=1)

Kommentar:

Im Amtsdeutsch heißt Disruption Sprunginnovation. Disruption (siehe Wikipedia "Disruptive Technologie") ist die gefühlt schnelle Verdrängung alter Technologien durch neue. Die Geschichte des Fortschritts ist eine Geschichte der Disruption.

Dampfschiff > Segelschiff Digitalfotografie > Film LED > Glühbirne iPhone > Nokia & Blackberry

Die Disruption geschieht für manche gefühlt schlagartig, was oft Folge ihrer exponentiellen Entwicklung ist. Der hat-ja-niemand-damit-rechnen-können-Effekt. Siehe auch die Diskussion mit Holgi in Ausgabe 29 

Allem Anschein nach ist StableDiffusion der Disruptor im Feld der Bildgeneratoren (und da besonders für OpenAI), noch bevor sich das Feld so richtig etablieren konnte. Wuuuuschhhhh 💨

Ach ja, wo wir beim Wind sind, da war auch noch der Flettner-Rotor - Nicht ganz so disruptiv, aber trotzdem ein Schritt in die richtige Richtung.

## Stable Diffusion (and so it begins)

Kommentar:

Es begann mit DALL-E von OpenAi. Bilder aus Textprompts generieren. Nach der öffentlichen Beta kam dann, dem Businessmodell von OpenAI gemäß, die kommerzielle Beta. Jedes Bild kostet Tokens und Tokens kosten Geld. Siehe Ausgabe 27 "Bezahl-DALL-E" 

Und noch bevor das alles so richtig öffentlich läuft taucht plötzlich Stability.ai auf und wirft StableDiffusion in den Ring. Vom Prinzip her DALL-E sehr ähnlich, mit einem großen Unterschied: Die trainierten neuronalen Netze (aka "Modelle") stellen sie open source zur Verfügung.

Wer eine entsprechende GPU sein Eigen nennt, kann jetzt ab ca. 5GB VRAM  die Modelle zuhause nutzen. Gratis. So oft man möchte. Ansonsten auch auf Online-Leih-GPUs von Google und Konsorten. Und auch die Forschung bekommt Zugang

Seit dem 22. August 2022 sind die Modelle öffentlich und die Community hat sich bereits in der ersten Woche mehr als überschlagen, basierend auf StableDiffusion neues in die Welt zu setzen. Die Rede ist von einer "Cambrian Explosion" und das halte ich nicht für übertrieben.

Nur ein paar kleine Beispiele davon, was in kürzester Zeit entstanden ist: Dream Studio Beta (die offizielle Website), ein Fork mit Apple-Slicon-Kompatbilität, image2image (simple Zeichnungen in Kunstwerke übersetzen), Discord-Bots für StableDiffusion, SD-Animations, SD-Prompt-Builder und -Suchmaschinen, diverse GUIs, die Ankündigung von Alpaca (ein Photoshop-Plugin), ein AMD-GPU-Hack für Kompatibilität (SD erwartet eigentlich Nvidia GPUs), GIMP-Integration, Blender-Integration, usw.

Das war sicher kein erschöpfender Überblick, sollte aber zumindest veranschaulichen, was in dem Bereich gerade alles so geht.

So viel Enthusiasmus habe ich schon lange nicht mehr gesehen. Ich sag mal: Anschnallen, da kommt noch mehr.

## Sind Ludditen anwesend?

(Quelle: https://reddit.com/r/StableDiffusion/comments/wory1z/life_comes_at_you_fast/)

Kommentar:

Langsam versteht auch die Kunstwelt, was uns da mit DALL-E und StableDiffusion plötzlich für Möglichkeiten offen stehen. Und erwartungsgemäß passiert das, was immer passiert, wenn sich ganze Gesellschaftsbereiche bedroht fühlen: Es wird FUD (Fear, Uncertainty, Doubt) gestreut.

Da werden dann Bildstil-Suchmaschinen zu Diebstahlmaschinen diskreditiert  und ich fühle mich ein klein Wenig an die Ludditen von 1811 erinnert.

Die Industrialisierung hat damals den Textilarbeitern so sehr zugesetzt, dass sie irgendwann (angeblich unter Anführung von Ned Ludd) Spinnereien und Webereien und vor allem deren Maschinen zerstörten. Der Luddismus ging bis hin zu Schlachten gegen das Militär aber auch er hat es nicht geschafft, den Fortschritt aufzuhalten.

Zur sinnolosen Zerstörung von KI-fähigen-Computern wird es vermutlich nicht kommen, aber zumindest hört man aus der Kunstszene eine Menge an Gegrummel. Da hilft es dann auch nicht wirklich, dass auf der Colorado State Fair gerade jemand mit einem KI-generierten Kunstwerk den ersten Platz abgeräumt hat https://www.vice.com/en/article/bvmvqm/an-ai-generated-artwork-won-first-place-at-a-state-fair-fine-arts-competition-and-artists-are-pissed

## Dürfen die das?!

(Quelle: https://www.technollama.co.uk/copyright-infringement-in-artificial-intelligence-art)

Kommentar:

Spätestens seit DALL-E, Midjourney oder StableDiffusion die Stile existierender Kunst täuschend echt nachahmen können, stellt sich bei Künstlerinnen und Künstlern immer öfter die Frage nach der Legalität. Dürfen die das?

Nehmen wir z.B. den Schrei von Edvard Munch. Es ist mit den heutigen Systemen kein Problem, dort z.B. Mickey Mouse einzbauen, den Grundstil dabei aber beizubehalten. Das geht aber natürlich auch bei Künstlern, die noch leben. Und die sind nun besorgt um ihren Stil. Nehmen wir zum Beispiel Simon Stålenhag. Der schwedische Künstler, von dem in meinem Regal mehrere Bücher stehen, ist sehr aktiv und seine Kunst ist einzigartig. Um das Titelbild zur Story zu erzeugen, das dem Stil von Stålenhag zumindest ähnelt, habe ich im Lauf von ca. 10 Minuten etwa 30 Prompt-Iterationen benötigt, über die ich mich langsam an das gewünschte Ergebnis herangetastet habe. Dafür habe ich in StableDiffusion 134 Tokens verbraucht, die Kosten dafür liegen bei ca. 1,50 €. Das Prompt lautete übrigens "a futuristic concrete city. a mickey mouse statue made of concrete. power lines. misty weather. highly deatiled, by simon stålenhag"

Rein rechtlich bin ich damit vermutlich sauber. Ich behaupte nicht, das Werk sei von Simon Stålenhag, sondern habe es ihm nur nachempfunden. Und das hätte ich auch mit anderen Mitteln tun können, vorausgesetzt ich hätte die Skills. StableDiffusion ist ein Werkzeug, wenn auch ein sehr mächtiges.

Was ich mit den Bildgeneratoren so schnell nicht hinbekommen werde, sind die Geschichten, die Stålenhag in seinen Büchern nur mit Bildern erzählt. Die Gefühle, die er hervorruft, von einer Vergangenheit in den 1980ern, die irgendwo in der Zukunft liegt. Das schafft die Kiste noch nicht ohne den Menschen und das wird auch erst mal noch dauern.

Übrigens: Kauft seine Bücher. Ich kann z.B. Tales from the Loop  nur wärmstens empfehlen.

## Und Tschüs

Wann habe ich eigentlich das letzte mal erwähnt, das ich das unglaublich toll finde, dass ihr mich hier unterstützt. Also nicht nur so pro forma ein Danke, sondern das ist echt der Hammer.. weil ich ja früher eigentlich immer nur mit Fotografie sichtbar war und das CM MAGAZIN ist tatsächlich das erste mal, dass ich mich mit diesen wirklich nerdigen Themen offensiv an die Öffentlichkeit begebe.

31 Ausgaben in 32 Wochen... also dieses Jahr fast jede Woche ein Magazin. Da bin ich ganz schön stolz drauf. Ohne eure Unterstützung wäre das nicht möglich. Also dafür ein echtes ganz tiefes Danke.

Und zum Schluss nochmal kurz die Erinnerung an die zwei Links:

Der Discord auf tfttf.com/cmd 

Und der Feedback-Loop auf hi.cmmagazin.com 

Ich freue mich auf euch!

PS: Du kannst dieses Magazin gratis lesen, aber gerne auch finanziell unterstützen. Dafür bekommst Du einen persönlichen Feed für Deinen Podcast-Player.

Das war's erst mal!

Den Podcast kannst Du mit einer Mitgliedschaft im eigenen Player hören. Deine Unterstützung finanziert dieses Projekt ❤️ 🙏

Zu den Paketen

Nur Mitglieder, die Zugang zu diesem Post haben, können Kommentare lesen und schreiben.