Künstliche Intelligenz am Limit

Wer in diesen Tagen Künstliche Intelligenz benutzt, erhält das Bild einer Technik am Limit. OpenAI schickt im Minutenabstand Mails über Ausfälle, Grok verweigert schon mal eine Viertelstunde lang den Dienst.
Die Betreiber haben zuletzt immer wieder mächtige neue Funktionen installiert. Sie bringen die Systeme an die Grenzen. OpenAI hat in der vergangenen Woche die Bildgenerierung auf einen neuen Level gehoben. Und den probieren offenbar nicht mehr nur Enthusiasten massiv aus.
Wer etwa den Statusdienst von OpenI abonniert hat, der Auskunft über die Systemstabilität der KI-Werkzeuge gibt, erhielt am Wochenende im Minutentakt Fehlermeldungen per Mail. ChatGPT, die Videoplattform Sora, ein „Playground“ auf der Webseite und eine Laborplattform waren teils massiv gestört. Mal scheiterten die Neuanmeldungen, mal ließen sich keine Dateien hochladen. Chats wurden nicht bedient, und die Techniker beschränkten die offensichtliche Ursache für die Fehler: die neue rechenaufwändige Erstellung von Bildern.

Da hat etwa die Nasa einen Wettbewerb für ein neues Maskottchen ausgeschrieben. Bei einem der nächsten Weltraumflüge soll eine kleine Puppe die Astronauten begleiten. Sie zeigt ihnen dann den Zustand der Schwerelosigkeit, sobald sie nicht mehr an einem Seil baumelt, sondern in der Luft schwebt. Die einfache Technik ist seit Jahr und Tag ein übliches Mittel für Astronauten. Dutzende solcher Puppen waren an Bord von Raumschiffen. Zuletzt beispielsweise die Comicfigur Snoopy als Plüschpuppe. Für den nächsten Flug sucht (Abre numa nova janela) die Nasa nach einer neuen Puppe.

Ich habe das mal mit einer weiblichen Figur durchgespielt, mithilfe von ChatGPT-4o. Die KI machte mir die nötigen Darstellungen von Lucy, der meinungsstarken, rechthaberischen und spöttischen Figur aus dem Comic „Peanuts“. Auf der Webseite der Nasa zum Wettbewerb sind sehr genaue Vorgaben für die Größe, das Gewicht und die zu verwendenden Materialien nachzulesen. Die KI kann das berücksichtigen. Und die gewünschten Darstellungen der Puppe von vorne, der Rückseite und der Seite erstellen.


Das alles ist mit KI-Hilfe in einer halben Stunde erledigt (auch wenn im Detail manche Darstellungen inkonsistent sind). Doch merkt man, welche Rechenkraft dafür nötig ist. Ein einzelnes Bild braucht schon mal zwei oder drei Minuten. Und immer wieder kommt eine neue Warnung: Sinngemäß ist das System ausgelastet, man solle es bitte in fünf, sechs oder 18 Minuten wieder probieren. „Könnt ihr bitte mal aufhören, Bilder, zu generieren, das ist unglaublich, unser Team braucht Schlaf“, schrieb OpenAI-Chef Sam Altman. Er habe noch nie eine vergleichbare Entwicklung gesehen.

Angefeuert wurde die massive KI-Nutzung tagelang durch Ghibli, eine Darstellungsform von Bildern im Stil eines japanischen Zeichentrickfilmstudios. Dabei werden Personen mit simpel erscheinenden Pinselstrichen in niedliche Figuren verwandelt. So gut wie jedes Meme (Internet-Phänomem) wurde von Fans mittlerweile ghiblisiert und auf Social Media veröffentlicht. Das Besondere daran ist, dass die Bilder-KI auch den Kontext zu einem Bild als Vorlage besser versteht. So kann die KI das berühmte „Distracted Boyfriend“-Meme im Ghibli-Stil darstellen. Auf dem Bild schaut ein untreuer Mann beim Bummeln mit seiner Freundin entzückt einer anderen Frau nach. Selbst wenn man das Originalbild der gestellten Aufnahme nicht hochlädt, kennt ChatGPT-4o die Darstellung – und generiert ein ähnliches Bild im Zeichentrickmodus.

Die Funktion zur Bildgenerierung geht über Spielereien hinaus. Mit den richtigen Prompts generiert die KI Benutzeroberflächen für Webseiten, etwa für eine Musikabspielseite (Abre numa nova janela), eine persönliche Finanzverwaltung (Abre numa nova janela) oder eine Kleider-Verkaufsplattform (Abre numa nova janela). Freilich sind das zunächst nur Bilder ohne Funktion. Doch kann KI im nächsten Schritt, so die Verheißung, daraus echte Webseiten mit Funktionen programmieren (Abre numa nova janela). Versuche zur Programmierung per KI laufen, einzelne Anwendungen dafür erscheinen vielversprechend. Ob sie nötige Sicherheitsaspekte berücksichtigen, steht auf einem anderen Blatt. Programmierlaien können den entstehenden Code kaum einschätzen. Auch Infografiken sind auf diese Weise möglich – wenngleich sie im Detail immer mal wieder Fehler produzieren. Was es damit auf sich hat, beschreibe ich in einem weiteren Beitrag, der in Kürze im F.A.Z.-PRO-Digitalwirtschaft-Briefing (Abre numa nova janela) erscheint.

Voraussetzung ist allerdings, die Rechenkraft reicht dafür aus. OpenAI hat zuletzt die Generierung von Videos auf der Plattform Sora eingeschränkt (Abre numa nova janela). „Wir erleben schweren Traffic und haben daher die Videofunktion für neue Konten eingeschränkt“, teilte OpenAI mit. Es sei für Neulinge nur möglich, Bilder zu generieren. „Unsere Grafikkarten schmilzen“, schrieb Altman. Die Bildergenerierung für Kostenlos-Nutzer wurde daraufhin verschoben. „Mangel an Grafikprozessoren, Kumpel“, begründete er gegenüber einem X-Nutzer, warum zudem die KI 4o und nicht die aufwendigere Version 4.5 ein Update bekommen habe.

Einen ähnlichen Ansturm erlebt offenbar auch Grok, die KI von Milliardär Elon Musk auf der Plattform X, vormals Twitter. Es gab auch hier in den letzten Tagen zunehmend Aussetzer, mal antwortete der Dienst nicht oder bat darum, es später erneut zu versuchen. Mehr und mehr Menschen nutzen diese KI offenbar, um sich bestimmte Sachverhalte oder Tweets erklären zu lassen. Oder ebenfalls, um Bilder zu generieren.
Erst kam die Menschheit mit den Möglichkeiten der Technik nicht mehr mit, nun scheint es umgekehrt. Das Tempo der KI-Entwicklung ist immens. Viele Kritiker haben die KI vor Wochen und Monaten ausprobiert und wegen mangelhafter Ergebnisse ihr Urteil gebildet. Doch sind die Iterationen Woche um Woche massiv. Wer auf der Höhe bleiben will, kommt um immer wieder neues Ausprobieren nicht herum.