#062 BurdaGPT

0 high-fives

00 comments

Send as email

Ein Roboter hebt einen Pinsel in die Höhe

Heute zu Gast im CM MAGAZIN: Holger Klein https://wrint.de/ (Opens in a new window)

⬇️ Die 🎧-Podcast-Version zum Hören unten am Ende des Artikels ⬇️

Die Themen:

Gratis Stimmen-Isolation #ki
CharmeGPT #ki
Nützliche KI: Langweilige News #ki
Kommt SiriGPT? #news #ki
BurdaGPT #ki
Heuristischer Imperativ: GATO ist live #ki
1100 Sprachen. Hallelujah!! #ki

❤️ Unterstützen ❤️ (Opens in a new window)

## Die Hausmeisterei

Moin zum neuen CM-Magazin. Heute nutze ich mal eine Ladepause, um den schriftlichen Teil fertig zu machen. Gut genutzte Zeit.

Ich habe am Ende noch eine wichtige Frage an euch, vor allem die unter euch, die für das Magazin bezahlen. Aber zuerst mal die Themen: Holgi ist wieder da und wir reden über: einen beleidigten Herrn Altmann, langweilige Nachrichten, Siri, Burda, GATO, BLIP und über was die Bibel mit Large Language Models zu tun hat.

Auf auf!

❤️ Unterstützen ❤️ (Opens in a new window)

## Gratis Stimmen-Isolation

(Quelle: https://sendegate.de/t/neues-plugin-von-apple-ausoundisolation/16194 (Opens in a new window))

Kommentar:

Seit kurzem kann macOS bei Facetime, Zoom usw. auf Wunsch die Stimme gegen laute Hintergrundgeräusche isolieren. Steckt natürlich KI dahinter. Apple hat da gerade klammheimlich und ohne Extrakosten ins Betriebssystem intergriert etwas neues released.

Die Audio Unit AUSoundisolation lässt sich als Plugins in der üblichen Audio-Bearbeitungs-Software wie Reaper verwenden und hat, ganz Appletypisch, fast keine einstellbaren Parameter. Nur der Mix zwischen Original und verändertem Signal kann angepasst werden. Unter „Sound to isolate“ gibt es aktuell nur „Voice“ auszuwählen. Die Tatsache, dass es hier eine Auswahl gibt, lässt zumindest darauf schließen, dass da noch weitere isolierbare Quellen geplant sind.

## CharmeGPT

(Quelle: https://gizmodo.com/sam-altman-openai-gpt-chatbot-chatgpt-gpt4-1850471865 (Opens in a new window))

Kommentar:

Sam Altman, der OpenAI-CEO, ist auf einer Charmeoffensive, um OpenAI und KI-freundliche Regulierung zu promoten. Statt nur den US-Kongress zu umwerben, droht er, seine großen KI-Spielzeuge einzupacken und sich aus dem Sandkasten zu verabschieden, falls die EU nicht mitspielen möchte. Obwohl der AI Act der EU dazu da ist, gegen potentielle Missbräuche wie Chinas Sozialkreditsystem oder Gesichtserkennung vorzugehen, könnten GPT-4 und ChatGPT unter den aktuellen Gesetzen als "hochriskante" KI eingestuft werden. Und Sam sieht dem EU-Regulatorium recht skeptisch entgegen und betont, dass man versuchen werde, sich anzupassen, es aber technische Grenzen gebe. Müsste man das Gesetzbuch in Sam Altman's Welt wohl noch mal umschreiben.

Ironischerweise betont er auch, dass er Regulationen befürworte, die KI-Technologien und Open-Source-Bewegungen nicht einschränken oder schaden. Interessant, denn wie wir wissen, ist OpenAI inzwischen alles andere als "offen". Aber hey, wer will schon kleinkariert sein? Schließlich geht es hier um den globalen AI Wettkampf, in dem Sam Altman und OpenAI gerne ganz oben auf dem Siegertreppchen stehen würden. Alles für die KI, oder?

Update: Altman rudert zurück (Opens in a new window)

## Nützliche KI: Langweilige News

(Quelle: https://apps.apple.com/de/app/boring-report-news-by-ai/id6446786839?l=en (Opens in a new window))

Kommentar:

Boring Report nutzt KI, um aus den Nachrichten den Sensationalismus zu entfernen. Auf einmal sehen die ganzen laut kreischenden Headlines mancher Publikationen wieder völlig normal und zahm aus. Sehr erfrischend.

## Kommt SiriGPT?

(Quelle: https://www.laptopmag.com/news/sirigpt-apple-is-working-on-a-chatgpt-rival-for-iphone-everything-we-know-report (Opens in a new window))

Kommentar:

Spekulationszeit! Am 5.6. ist Apples WWDC, die große Developer-Konferenz, auf der auch immer neue (und manchmal große) Dinge angekündigt werden. Dieses Jahr wetten viele auf das neue AR-Headset und selbstverständlich auf KI. Apple ist nämlich der einzige große Spieler, der sich bisher noch nicht mit einem Large Language Model an die Öffentlichkeit gewagt hat. SiriGPT? Spekulationen gehen davon aus, dass Siri in 2 Wochen eine große Generalüberholung bekommt und dann hoffentlich Holgi auch endlich wieder komplikationsfrei zuhause den Deutschlandfunk hören kann.

## BurdaGPT

(Quelle: https://www.heise.de/news/Bisschen-ratlos-Kritik-an-Kochmagazin-mit-Inhalten-von-ChatGPT-und-Midjourney-9057001.html (Opens in a new window))

Kommentar:

Der Burda-Verlag hat eine Extraausgabe des Rezeptemagazins Lisa Kochen & Backen komplett mit Inhalten von Text- und Bildgeneratoren füllen lassen. Burda hatte das aber leider nicht transparent gemacht. Der Bayerische Journalisten-Verband kritisiert das Vorgehen als "fahrlässigen" Umgang mit der journalistischen Glaubwürdigkeit, da das Vertrauen in die Publikation unterhöhlt werde, wenn Leserinnen und Leser getäuscht würden. Die Kritik bezieht sich auch auf die fehlende Kennzeichnung der KI-generierten Inhalte. Das betroffene Magazin "99 Pasta-Rezepte" wurde größtenteils mit ChatGPT- und Midjourney-KI-Technik erstellt. Es ist zwar im Handel erhältlich, jedoch ist die KI-Erstellung der Inhalte im Heft nicht sichtbar. Der Verlag hat bestätigt, dass das Heft getestet werden sollte, wie KI-Tools Arbeitsabläufe unterstützen können und die Kennzeichnung wohl bewusst weggelassen wurde. Der Journalisten-Verband erinnert an das Wahrheitsgebot und die Sorgfaltspflicht, die im Pressekodex vorgeschrieben sind, auch wenn KI eingesetzt wird, und fordert den Burda-Verlag auf, die Punkte aus einem Positionspapier des Deutschen Journalisten-Verbands zu KI im Journalismus umzusetzen.

## Heuristischer Imperativ: GATO ist live

Ein Mensch steht vor einem großen Dokument

(Quelle: https://reddit.com/r/HeuristicImperatives/comments/13m6e2g/gato_framework_is_live/ (Opens in a new window))

Kommentar:

Steigen wir nochmal tief ins Thema "alignment" - das ist der Themenkomplex, in dem geforscht wird, wie wir die KI so gestalten können, das sie für und nicht gegen uns arbeitet. Hier noch ein kleines Follow-Up zu David Shapiros Heuristic Imperatives. Das GATO-Framework ist jetzt live.

Das GATO-Framework (Global Alignment Taxonomy Omnibus) legt hehre Ziele fest: Axiomatische Ausrichtung, utopische Anziehungszustände und heuristische Imperative. Wie schon letzte Woche erklärt, will GATO KI-Systeme dazu bringen, das Leiden zu reduzieren, Wohlstand zu erhöhen und Verständnis zu fördern. GATO liefert dazu auch eine umfassende Methode, um dies zu erreichen: Lokale "GATO-Zellen", sieben layers und sogenannte "Traditionen" (Denkt exponentiell, vertraut dem Prozess, ...). Klingt nach einer größeren Herausforderung, aber schön zu sehen, dass das Gebilde wächst. GATO ist "in it to win it". Also alles in allem eine gute Sache, denke ich, die uns der KI-freundlichen Utopie hoffentlich etwas näher bringt.

## BLIP

Ein Roboter malt ein Bild auf einer Leinwand

(Quelle: https://arxiv.org/abs/2305.14720 (Opens in a new window))

Kommentar:

AB-GE-FAH-REN. Salesforce AI Research stellt ein neues Modell namens BLIP-Diffusion vor. Ein Bild, ein Prompt, ein Ergebnis. Den Rucksack mal eben in den Grand Canyon stellen? Den Hund auf einen Barhocker setzen, oder in die Tiki-Bar? BLIP verpasst dem Generierungsprozess deutlich mehr Kontrolle mit weniger Aufwand. Das Modell zeichnet sich durch hohe Treue zum Gegenstand aus. Damit ist Produktfotografie tatsächlich in Gefahr. Ein gutes Bild des Produkts reicht aus. Beliebig viele Sets lassen sich auf Knopfdruck generieren. Das Modell beherrscht auch Bildmanipulationen, einschließlich Subjekt-getriebener Stilübertragung und -Interpolation. Bis jetzt noch Forschung, aber wir mittlerweile wissen, kann sowas flott in Produkte wandern.

## 1100 Sprachen. Hallelujah!!

(Quelle: https://twitter.com/ylecun/status/1660732998155640833?s=12&t=33atk6Cg2oPBY0NR34IlGA (Opens in a new window))

Kommentar:

Facebook, bzw. Meta hat MMS (Massively Multilingual Speech) vorgestellt, und bringt Spracherkennung und -generierung damit wieder einen Schritt weiter. Und das alles mit Hilfe... der Bibel! 🤯 Stellt sich arus, dass da Trainingsdaten in allen Sprachen der Welt zur Verfügung stehen. Über 500.000 Stunden insgesamt, pro Sprache um Durchschnitt 32h. Das MMS-Projekt von Meta unterstützt Spracherkennung, Sprachidentifikation und Text-to-Speech für sagenhafte 1.107 Sprachen! Und es erkennt sogar über 4.000 Sprachen und Dialekte.

Das ganze läuft unter einer CC-Non-Commercial-Lizenz, damit ist die Nutzung etwas eingeschränkt.

## Und Tschüs

PS: Du kannst dieses Magazin gratis lesen, aber gerne auch finanziell unterstützen. Dafür bekommst Du einen persönlichen Feed für Deinen Podcast-Player und die Podcastfolgen vor allen anderen.

❤️ Unterstützen ❤️ (Opens in a new window)

Der Podcast zum Hören. In dieser Folge zu Gast bei Chris Marquardt: Holger Klein

Mit Mitgliedschaft den Podcast sofort im eigenen Player hören, sonst ein paar Tage später hier. Deine Unterstützung finanziert dieses Projekt ❤️ 🙏

Zu den Paketen (Opens in a new window)

Already a member? Log in (Opens in a new window)

Date May 27, 2023

0 high-fives

00 comments