Wetter und Verkehr übernimmt die KI
Durch KI-Tools können Arbeitsschritte automatisiert werden. Welche Einsatzfelder und Grenzen es dabei gibt, habe ich mit Caspar von Allwörden von Radio Bremen besprochen.

Willkommen bei ➡️Workflow Shortcuts! Der Newsletter für einen reibungslosen Podcast-Workflow und mehr Zeit für das Wesentliche - deine Inhalte.
Wer meinen Newsletter zum ersten Mal liest und in Zukunft keine Ausgabe mehr verpassen willl, kann hier abonnieren:
Wer schon länger dabei ist, erinnert sich: Auf der So Many Voices Podcastkonferenz im November 2024 habe ich ein Panel zum Thema “KI-Tools in der Podcast-Produktion” moderiert. Zu Gast auf der Bühne waren Caspar von Allwörden (Si apre in una nuova finestra) und Marie Luise Nolte (Si apre in una nuova finestra).
Marie und Nina Elisabeth Glaser sind die Gründerinnen des RETELL Podcast Hubs (Si apre in una nuova finestra), mit dem sie Podcaster*innen ermöglichen wollen, ihre Formate oder Inhalte auch in andere Sprachen und Länder zu lizenzieren. Caspar ist Tech-Journalist und arbeitet als Redakteur bei Radio Bremen im Team ProMPT (Programm-Metadaten, -Prozesse, -Technik) mit Schwerpunkt Hörfunk und KI in der redaktionellen Arbeit.
Was Caspar beim Panel über Automatisierung und den Einsatz von KI-Tools in der redaktionellen Arbeit erzählt hat, fand ich sehr spannend. Deshalb habe ich ihn direkt zu einem Interview für den Newsletter eingeladen, um das auch mit euch zu teilen.

Im Gespräch habe ich mich auf das Thema Automatisierung durch KI konzentriert. Ich wollte von Caspar wissen, welche Möglichkeiten Nutzer*innen bereits haben, sich automatisiert Podcasts erstellen zu lassen, welche Tools wir als Medienschaffende nutzen können und für welche Inhalte sich das eignet und für welche nicht.
Interview mit Caspar von Allwörden
Niklas: Podcast wurde immer als ein Medium beschrieben, das sehr niedrigschwellig ist. Alles was man braucht sind zwei Mikrofone, ein RSS-Feed und los geht’s. Wenn wir ehrlich sind, hat das nie ganz gestimmt, man musste sich immer etwas in die Materie einarbeiten. Wenn wir jetzt auf die neuen KI-Tools blicken, sorgen die jetzt dafür, dass wirklich alle Podcasten können?
Caspar: Ich würde sagen, Podcasting ist noch einfacher geworden. Die Audioqualität war damals vielleicht nicht so wichtig wie heute, aber ich fand sie immer schon wichtig. Mit den neuen KI-Tools kann man die Audioqualität deutlich verbessern und den Schnitt vereinfachen. Früher hat man oft viel Zeit verbracht, lange Pausen oder "Ähs" rauszuschneiden. Heute geht das viel einfacher und schneller. Trotzdem muss man immer noch viel Zeit in die inhaltliche Arbeit stecken, damit so ein Format auch gut ankommt.
Mit den Tools NotebookLM und Eleven Labs Reader kann man sogar jeglichen Text in einen Podcast verwandeln lassen, in dem zwei künstliche Stimmen den Inhalt diskutieren. Ich finde das faszinierend, warum wird das Ergebnis als Podcast und nicht zum Beispiel als Hörbuch ausgeliefert? Was denkst du, warum haben die Entwickler*innen das so konzipiert?
Ich glaube, das Medium Podcast ist im Laufe der Zeit für viele immer mehr zu einem Wissensmedium geworden. Podcasts bieten die Möglichkeit, sich intensiv mit einem Thema oder einer Nische auseinanderzusetzen. Das fand ich schon immer das Charmante an dem Format, dass du dich in der Nische bewegst und nicht wie das Radio versuchst, möglichst viele Menschen abzuholen. Wir können auf TikTok den Trend beobachten, dass Creators in ihren Videos ein Podcastmikrofon aufstellen und so tun, als ob sie einen Podcast aufzeichnen würden, um so ein gewisses Qualitätssiegel zu bekommen. Als ich das gesehen habe, war mir klar, dass Podcasts ein gewisses Standing erreicht haben. Darauf haben die Entwickler wahrscheinlich abgezielt. Außerdem entsteht durch zwei Sprecher ein dynamischeres Gespräch, das unterhaltsamer ist als ein reines Audio.
Wer ist die Zielgruppe für solche Tools?
Ich habe mich selbst dabei erwischt, dass ich diese Tools dafür nutze große Dokumente, die ich nicht durcharbeiten möchte, als Podcast auf dem Nachhauseweg zu hören. Das finde ich super praktisch. Ich glaube, die Zielgruppe sind Leute, die oft viele Informationen verarbeiten müssen. So können sie schon mal in Dokumente rein hören und auch vorab entscheiden, ob diese Dokumente oder die darin enthaltenen Informationen für sie relevant sind oder nicht, bevor sie sich damit tiefer befassen.
Du sprichst von modernen Wissensarbeiter*innen, aber ist diese Zielgruppe nicht etwas zu klein? Was könnten abseits davon noch Anwendungsfälle oder Zielgruppen sein?
Es muss nicht immer das wissenschaftliche Paper sein und es muss auch nicht NotebookLM sein. Um im journalistischen Bereich zu bleiben: Ich kann mir eine ähnliche Funktion in einer News-App vorstellen, die mir die aktuellen und für mich relevanten Nachrichten in einem künstlich erzeugten Podcast vorliest, auf dem Weg zur Arbeit. Da wäre die Zielgruppe natürlich deutlich größer.
In meiner Brust schlagen immer zwei Herzen: Ein Herz für den Journalismus und ein Herz für das Thema Künstliche Intelligenz. Bei diesem Beispiel wäre der Vorteil der KI-Lösung, dass sie eine extrem individualisierte Nachrichtenauswahl bereit stellen könnte, zur der eine menschliche Redaktion nicht fähig wäre. Die Frage ist, ob wir wirklich wollen, dass die KI die Nachrichtenauswahl trifft. In so einem kleinen Format wäre das denkbar.
Wie siehst du die Qualität der Ergebnisse bisher?
Es schwankt zwischen wirklich gut und generisch. Man hört, dass die Trainingsdaten aus stundenlangem Material aus US-amerikanischen Podcasts stammen. Das merkt man, wenn generische Formulierungen aus anderen Podcast wiederholt werden, manchmal sind aber die Metaphern so gut, da bin ich dann verblüfft. Dann gibt es Ergebnisse, in denen Störgeräusche oder abgehackte Sätze zu hören sind. Oft sind die Ergebnisse aber wirklich einwandfrei.
Bisher haben wir vor allem über die Seite der Nutzer*innen gesprochen. Wenn wir jetzt über unsere Möglichkeiten als Medienschaffende sprechen, wie wir mit diesen neuen Werkzeugen Inhalte generieren oder Prozesse automatisieren können, was gibt es da für Einsatzfelder?
Ein Beispiel haben wir bereits besprochen, die Erstellung von individuell zugeschneiderten Inhalten. Hier haben wir aber das Problem mit Halluzinationen, die immer noch auftreten. Solange das so ist, sollten wir zwar weiterhin mit diesen Systemen experimentieren, aber wir müssen immer ein Auge auf die Qualität der Ergebnisse haben und uns fragen, ob die Ergebnisse oder Produkte glaubwürdig sind.
Für mich ist es wichtig, dass die KI-Werkzeuge einen Mehrwert schaffen können. Zum Beispiel in dem sie eine individuelle Nachrichtenauswahl liefern können. Wenn wir aber anfangen, alle Podcasts nur noch mit diesen Tools zu produzieren, dann nehmen wir uns selber die Arbeitsgrundlage weg. Ich persönlich höre mir gerne künstlich erzeugte Formate an, die der reinen Wissensvermittlung dienen, aber ich würde nie aufhören, von Menschen gemachte Podcasts zu hören, weil die eben doch was anderes sind.
Ein gewisser Grad an Automatisierung ist in Redaktionen bereits Alltag. Zum Beispiel werden Meldungen von Nachrichtenagenturen automatisch auf News-Websiten veröffentlicht. Welche Anwendungsmöglichkeiten siehst du beim Thema Automatisierung im Podcastbereich?
ARD-weit gibt es gerade eine Testphase auf den sogenannten Pop-Wellen. Dort werden nachts automatisch generierte und von künstlichen Stimmen eingesprochene Verkehrs- und Wettermeldungen ausgestrahlt. Das ist dann keine geklonte Stimme einer Moderatorin und es wird auch vorher gesagt, dass die Stimme künstlich ist. Aber das sind Inhalte, die es so bisher noch nicht gab; nachts gab es diese Meldungen einfach nicht. Das ist auch generell unser Denkansatz beim Thema KI, dass wir mit diesen Tools ein zusätzliches Angebot schaffen wollen.
Ganz generell ist KI praktisch, wenn sie uns in der Redaktion lästige Aufgaben abnimmt. Bei uns bei Radio Bremen ist es aber so, dass die KI nur Vorschläge macht und die Redaktion immer entscheidet, was veröffentlicht wird und dafür die Verantwortung hat. Human in the Loop ist hier das Stichwort. Aber KI kann zum Beispiel bei investigativen Recherchen helfen, einen Berg an Dokumenten zu durchsuchen und zu analysieren. Aber die eigentliche Geschichte zu schreiben und die Schlüsse daraus zu ziehen, das wird immer eine menschliche Aufgabe bleiben.
Denkst du, dass automatisch generierte Podcasts jemals gleichwertig sein könnten wie andere erfolgreiche Podcasts?
Ich hab vor drei Jahren eine Kollegin interviewt, die bei n-tv und RTL ein KI-Projekt verantwortet hat. Damals ging es darum, die Stimme zweier Moderator*innen zu klonen, um Nachrichten auf der Website automatisiert vorlesen zu lassen. Damals, im Jahr 2022, bedeutete das noch wochenlange Arbeit und war eine echte Innovation. Heute ist das in kürzester Zeit möglich und erscheint uns schon nicht mehr so spektakulär. Deshalb bin ich im Bereich KI immer vorsichtiger geworden, etwas vorschnell auszuschließen. Ich kann mir durchaus vorstellen, dass wir in zwei Jahren bereits erste erfolgreiche KI-Formate haben.
Außerdem ist es so, dass es vielen Menschen auch egal ist, ob eine Stimme echt oder künstlich ist. Wir sehen das in unseren Ergebnissen zu den künstlich eingesprochenen Wetter- und Verkehrsmeldungen, dass es für die meisten Menschen kein Problem darstellt, denn es geht ihnen um die Information. Wie dann diese KI-Podcastformate in Zukunft aussehen werden, das bleibt spannend. Vielleicht werden wir irgendwann tatsächlich künstlich erzeugte Laberpodcasts anhören.
++++++++++ Seminare, Seminare, Seminare ++++++++++
Was ihr im Newsletter lest, geht euch nicht tief genug? Ihr fragt euch, welche der vorgestellten Lösungen wirklich zu eurem Projekt passen? Dann kommt zu meinen Seminaren und Workshops!
Dieses Jahr gebe ich mein Wissen an folgenden Terminen weiter:
Kurs “KI-Tools fürs Podcasten” (Si apre in una nuova finestra) bei der Berliner Journalistenschule
Aufbaukurs (vorwiegend in Präsenz) für alle, die ihre Podcast-Skills erweitern und ihre Projekte effizienter gestalten wollen
Termine:
18. März 2025 (Präsenz)
15. Mai 2025 (Online)
12. Juni 2025 (Präsenz)
20. Oktober 2025 (Präsenz)
12. Dezember 2025 (Präsenz
Kurs “Ohne Audio-Know-how, mit GenAI und Automatisierung: Professionell podcasten” (Si apre in una nuova finestra) bei der Journalist:innen-Akademie der FES
2-tägiges Onlineseminar über KI-Tools, auch für Podcast-Anfänger*innen geeignet
Termin: 7.-8. Mai 2025 (Online)
Kurs “Gutes Material aber schlechter Ton? Dein Kick-Start in die Audioproduktion” (Si apre in una nuova finestra) bei der LiMA
Onlineworkshop für alle Neulinge in der Audio-Welt
Termin: 14. Mai 2025 (Online)
Wenn euch diese Seminare ansprechen, dann freue ich mich euch dort zu sehen. Wenn nicht, dann teilt gerne die Termine mit Kolleg*innen und eurem Netzwerk.
++++++++++ Seminare, Seminare, Seminare ++++++++++
Bevor ich euch entlasse noch zwei Nachklapps:
In der letzten Ausgabe “Droht uns eine Spaltung der Podcast-Branche?” (Si apre in una nuova finestra) habe ich euch meine Sicht auf den Video-Podcast-Trend geschildert. Die Diskussion in der Branche dauert an und kurze Zeit nach Erscheinen meines Newsletters haben sich große deutsche Publisher und Hoster mit einem White Paper (Si apre in una nuova finestra) sehr eindeutig positioniert - für Audio und gegen Video.
Im Dezember habe ich von meinem Besuch auf der So Many Voices (Si apre in una nuova finestra) Podcastkonferenz berichtet. Ein paar der Talks und Panels werden jetzt nach und nach im hauseins Podcast Feed (Si apre in una nuova finestra) veröffentlicht. Empfehlung!
Wie immer könnt ihr diese Ausgabe im zugehörigen LinkedIn Post (Si apre in una nuova finestra) diskutieren. Ich freue mich auf eure Kommentare!
Hat euch diese Ausgabe gefallen? Dann schickt sie doch einem Kollegen oder einer Kollegin weiter! Ich möchte noch mehr Menschen mit diesem Newsletter erreichen. Und wie ihr alle wisst: Mund-zu-Mund-Propaganda funktioniert am besten. Ich danke euch!
Bis bald in eurem Postfach
Niklas

Für mehr Informationen:
Meine Website (Si apre in una nuova finestra)
Folge mir auf LinkedIn (Si apre in una nuova finestra)