Künstliche Stimmen in Produktionen sinnvoll einsetzen
Mit künstlichen und geklonten Stimmen können wir uns die Podcastproduktion sehr erleichtern. Vier Tipps, wie ihr die Technik sofort einsetzen könnt.
Willkommen zu Workflow Shortcuts! Der Newsletter für einen reibungslosen Podcast-Workflow und mehr Zeit für das Wesentliche - deine Inhalte.
Wir sind bei der zweiten Ausgabe angekommen und wieder geht es um generative KI. Eigentlich wollte ich keinen Newsletter machen, der euch jede Woche mit KI-Tools zuspammt. Sorry schonmal, die Themen werden vielfältiger werden. Aber es gibt auch einen terminlichen Grund für mich, über dieses Thema zu sprechen: Am 1. März ist die aktuelle Ausgabe des medium magazins erschienen und Tobias Hausdorf und ich haben uns darin in einem Artikel mit dem Einsatz von künstlichen Stimmen in Podcasts beschäftigt. Dazu später mehr.
Jetzt aber zum Thema: Es geht um KI-Tools, die künstliche Stimmen “aus dem Nichts” erzeugen und menschliche Stimmen klonen können. Die Qualität der Ergebnisse ist dabei so gut, dass wir diese KI-Tools schon heute in unsere Arbeitsprozesse integrieren können. Trotzdem stehen wir erst am Anfang dieser Entwicklung und ich bin ehrlich: Bisher habe ich solche Tools in wenigen Projekten eingesetzt. Aber ich möchte euch in dieser Ausgabe mit potentiellen Anwendungsfällen inspirieren, mit diesen Tools selber rumzuspielen.
Voiceover und Übersetzung
Kommen wir zu einem ziemlich offensichtlichen und dann zu einem sehr mächtigen Anwendungsfall. Für Voiceovers funktionieren anonyme KI-Stimmen natürlich perfekt, denn hier steht die Vermittlung der Information im Vordergrund, für den persönlichen Touch hören wir die richtigen Sprecher*innen im Hintergrund. Die Berliner Podcastproduktion BosePark hat das bereits einen Schritt weiter getrieben. Für eine Folge des Podcasts “Dichtung & Wahrheit” haben sie ein auf Englisch geführtes Gespräch übersetzen und dann von Voice-Klonen der Sprecher*innen wieder einsprechen lassen. Es ist ein bisschen gruselig, aber auch schon recht gut. Die zwei Geschäftsführer*innen Chris Guse und Su Holder sprechen über den Prozess in der vierten Folge ihres Podcasts “Übers Podcasten” (Öffnet in neuem Fenster).
Anonyme Texte einsprechen lassen
Das war für mich ein echter “Warum haben wir nicht früher daran gedacht?!” Moment in der letzten Zeit: Wie einige wissen habe ich mit meinem Kollegen und Freund Tobias Hausdorf bis Januar 2024 den Podcast “Hinter den Zeilen” gemacht. Unsere allerletzte Folge (Öffnet in neuem Fenster) war ein “Survival Guide” für Redaktionen, in dieser haben viele Kolleg*innen Tipps und Erfahrungen aus dem Berufsalltag geteilt. Eine Einsenderin wollte anonym bleiben und hat uns nur den Text geschickt. Das heißt, wir mussten das von einer dritten Person einsprechen lassen. Es war zwar nur eine kurze Passage, aber wie das so ist, haben wir dieses To Do schön vor uns hergeschoben, bis es schon wieder knapp wurde. Später hab ich mir gedacht: Genau eine solche anonyme Einsendung sollte eine ebenso anonyme künstliche Stimme einsprechen. Das funktioniert natürlich auch super, um E-Mails, Nachrichten oder jeglichen “unpersönlichen” Text vorlesen zu lassen.
Fehler ausbessern und Ergänzungen machen
Jetzt wirds meiner Meinung nach richtig spannend. Ihr kennt alle die Situation, wenn die Aufnahme beendet ist und die Hosts schon aus der Tür und euch auffällt: Fuck, wir wollten noch etwas für den Trailer einsprechen oder der Teaser auf die nächste Folge fehlt, und und und. Bei regelmäßig erscheinenden Podcasts können wir dazu in Zukunft die Voice-Klone der festen Hosts benutzen. Mit diesen Klonen können wir auch nur einzelne Wörter austauschen, die komisch eingesprochen wurden, ohne dass die Hosts dafür extra ins Studio kommen müssen. Gerade wenn ihr mit vielbeschäftigten Menschen zusammenarbeitet, ist das Gold wert. Vorausgesetzt, ihr nehmt immer in den gleichen Studiobedingungen auf und die Person ist stimmlich konstant. Vorausgesetzt, die Person ist auch damit einverstanden, einen solchen Stimmklon zu erstellen. Hier müssen wir als Branche noch Best Practices entwickeln, vor allem was Vertragssachen angeht.
WERBUNG
An dieser Stelle schreien alle Hosts vor Freude auf: Nie mehr vor dem Mikrofon lügen, dass AG1 schon längst fester Bestandteil der Morgenroutine ist. Die nervigen Host Reads werden einfach vom Voice-Klon übernommen und der Text darf von einer Redakteurin geschrieben werden. Hier kommen wir aber schon in einen ethischen Grenzbereich. Bei den Host Reads ging es anfangs darum, dass der Host, zu dem ich eine parasoziale Beziehung aufgebaut habe, mir Produkte empfiehlt, hinter denen er wirklich steht. Wenn wir ehrlich sind, ist das schon lange nicht mehr der Fall (oder war es nie?). Trotzdem: Was sind Host Reads noch wert, wenn sie nicht mehr von generischer Werbung zu unterscheiden sind? Manche sehen das vielleicht einfach pragmatisch: Werbung nervt, in der Produktion und im Konsum, konzentrieren wir uns lieber darauf, dass die Inhalte authentisch sind.
Das sind vier Anwendungsfälle, die mir in letzter Zeit eingefallen sind, aber natürlich kratze ich damit nur an der Oberfläche. Ich bin sehr gespannt, wohin sich der Einsatz von künstlichen und geklonten Stimmen entwickeln wird. Teilt gerne eure Erfahrungen mit mir! Wie habt ihr die Technik bisher eingesetzt? Wo seid ihr auf Probleme bei der Umsetzung gestoßen? Was sind eure Bedenken?
Wenn euch das Thema besonders interessiert, empfehle ich euch in den eingangs erwähnten Artikel von Tobi und mir in der aktuellen Ausgabe des medium magazins (Öffnet in neuem Fenster). In diesem berichten zum Beispiel Lara Thiele von der HNA und Hendrik Efert von der Podcastproduktion 4000 Hertz, wie sie Podcastprojekte mit KI-Tools generieren, komplett ohne menschliche Sprecher*innen. Außerdem haben wir auch mit Christina Elmer, Professorin an der TU Dortmund für Digitaljournalismus, über die ethischen Fragestellungen der Technik gesprochen.
Achja, ich habe übrigens absichtlich kein Tool empfohlen. Es gibt mittlerweile so viele und ich hab bisher nur eines ausprobiert, ich habe keine Ahnung, ob es das Beste ist. Ich gebe euch nur den Tipp, auch immer genau darauf zu achten, ob das Tool, das ihr nutzen wollt, auch die deutsche Sprache kann.
Das war die zweite Ausgabe von Workflow Shortcuts! Auch diesmal bitte ich euch um ein Feedback. Ich bin immer noch in der Entwicklung dieses Formats. Welche Themen wünscht ihr euch? Wie muss dieser Newsletter aussehen, dass er für euch funktioniert. Bitte füllt dazu diese wirklich sehr kurze Umfrage (Öffnet in neuem Fenster) aus. Ihr müsst da nur Sachen ankreuzen! 🙃
Wenn ihr mich unterstützen möchtet, dann empfehlt meinen Newsletter und schickt ihn an Bekannte und Arbeitskolleg*innen weiter, für die er interessant sein könnte.
Bis bald in eurem Postfach
Niklas
Für mehr Informationen:
Meine Website (Öffnet in neuem Fenster)
Folge mir auf LinkedIn (Öffnet in neuem Fenster)