Schlechte Aufnahmen retten – mit KI

0 high-fives

00 comments

Neue KI-Tools versprechen schlechte Aufnahmen auf magische Weise zu retten. Ich habe sie getestet und möchte in manchen Anwendungsfällen nicht mehr auf sie verzichten.

Ein beispielhaftes Bild von einer Schnittsoftware.

Willkommen zur ersten Ausgabe von Workflow Shortcuts! Der Newsletter für einen reibungslosen Podcast-Workflow und mehr Zeit für das Wesentliche - deine Inhalte.

Newsletter abonnieren (Opens in a new window)

Zu Beginn einen Dank an alle, die meinen Newsletter bereits abonniert haben - noch vor Erscheinen einer ersten regulären Ausgabe! In die starten wir jetzt rein.

Wir waren wahrscheinlich alle schon mal an diesem Punkt: Die Aufnahme ist im Kasten und beim Probehören fällt auf: Scheiße, der Laptoplüfter im Hintergrund ist viel zu laut. Oder der Gast hat sich selbst aufgenommen und es hallt, als ob er in einer Kirche sitzen würde. Nun gibt es sogenannte De-Noiser, die vor allem Hintergrundgeräusche entfernen, und ähnliche Software schon länger.

Die neue Generation solcher Anwendungen verspricht jetzt aber mithilfe von Künstlicher Intelligenz (meistens wohl eher Machine Learning) eine nie dagewesene Qualität zu liefern und das mit nur einem Klick. Letzteres ist wichtig, bei der bisherigen Software mussten Anwender*innen zumindest ein grundlegendes Verständnis von Audioproduktion mitbringen.

Mein erstes Aha-Erlebnis hatte ich letztes Frühjahr, als ich mit „Adobe Enhance Speech“ rumprobiert habe. Ich war bei meiner alten Podcastproduktionsfirma Auf die Ohren zuständig für die Audioproduktion eines Museumspodcasts. Teil des Formats war es, dass Expert*innen in einer kurzen Rubrik ein Kunstwerk vorstellten. Dies wurde nicht in unserem Studio aufgenommen, sondern das Museum sorgte für die Aufnahmen. Mikrofonierung, Raum und Hintergrundgeräusche sorgten für gemischte bis schlechte Ergebnisse.

Normalerweise hätte ich mit meinen Profi-Plugins versucht, die Aufnahmen aufzupolieren. Also erstmal De-Noiser für die Hintergrundgeräusche, dann mit De-Reverb den Hall raus, mit Equalizer die Stimme verständlicher machen, usw. Doch diesmal wollte ich etwas anderes ausprobieren. Ich habe die Aufnahme stattdessen bei “Adobe Enhance Speech” hochgeladen und hatte ohne Voreinstellungen ein paar Minuten später eine aufpolierte Version.

Das Ergebnis war phänomenal. Es klang wie in einem Studio aufgenommen. Ich versuchte daraufhin dasselbe Ergebnis mit meinen teuren Tools zu erreichen und scheiterte daran.

Während dieses erste Ergebnis mich überzeugte, stieß ich bei weiteren Versuchen aber schnell an die Grenzen des Tools. In den Anfangstagen und heute in der kostenlosen Version lässt sich nämlich nichts einstellen. Ein Segen, für alle die es unkompliziert haben wollen, aber ein Fluch, wenn ihr euch etwas Differenzierung im Ergebnis wünscht. Das Tool kennt so nur volle Pulle.

Das ist meine Erfahrung mit den meisten KI-Tools, die ich getestet habe: Ja, die Ergebnisse sind zum Teil wirklich wie Magie und ja, die Bedienung ist super einfach. Immer öfter aber klingen die Aufnahmen danach einfach sehr künstlich – und damit nicht unbedingt besser.

Trotzdem will ich nicht mehr auf diese Tools verzichten, weil sie dann doch öfters sehr viel Zeit sparen. Ich kann sie euch vor allem empfehlen, wenn kurze Segmente „gerettet“ werden müssen. Also kurze Sprachnachrichten, Anrufaufzeichnungen, etc. Wenn solche Aufnahmen etwas künstlich klingen, ist das nicht schlimm, da sie nur kurz sind.

Hier sind einige Tools, die ich getestet habe und meine Erfahrungen:

Adobe Enhance Speech (Opens in a new window)

simpler gehts kaum: die betreffende Audiodatei hochladen, warten, fertig
in der free Version könnt ihr bis zu einer Stunde Material pro Tag hochladen; die Audiodateien dürfen max 30min lang und 500MB groß sein (nicht jedes Dateiformat wird anerkannt)
in der Zahlversion kann die Stärke des Tools eingestellt werden, außerdem kann mehr pro Tag prozessiert werden
kann, wenn mit dem richtigen Ausgangsmaterial gepaart, außerordentliche Ergebnisse erzielen, oft klingt es aber schnell künstlich

Supertone Clear (Opens in a new window)

kein Standalone, sondern ein Plugin für eine DAW (also für Programme wie Reaper, DigAS, Audition)
drei Knöpfe, das wars: einer regelt Hintergrundgeräusche, einer die Stimme, einer den Hall
es gibt eine Testversion, die ist aber wirklich nur zum Testen geeignet (es wird alle 60s ein Störgeräusch produziert)
schöner Kompromiss, da die Oberfläche mit den drei Knöpfen sehr einfach ist, trotzdem besteht eine gewisse Kontrolle über das Ergebnis

Accentize dxRevive (Opens in a new window)

ebenfalls ein Plugin
mit einem Knopf kann die Stärke des Tools eingestellt werden
7 Tage Testversion verfügbar
wie bei Adobe Enhance Speech neigen die Ergebnisse zu einer gewissen Künstlichkeit, trotzdem sehr erstaunliches Tool

Auphonic (Opens in a new window)

kein Plugin für eine DAW, Auphonic ist als Anwendung im Browser und als Desktop Client verfügbar
vereint mehrere Funktionen in einer Anwendung: Hintergrundgeräusche und Hall werden reduziert, Lautstärken angepasst, Stimmen aufpoliert; das alles automatisch
2 Stunden Audio können monatlich kostenlos prozessiert werden
bei unserem Podcast „Hinter den Zeilen“ haben wir Auphonic am Anfang genutzt, weil es einfach zu bedienen war und sehr gute Ergebnisse lieferte; später haben wir Plugins beim Schneiden genutzt, um mehr Kontrolle zu haben
perfektes Gesamtpaket für Einsteiger*innen!

iZotope Elements (Opens in a new window)

iZotope ist Hersteller von recht teuren aber sehr mächtigen Audio-Plugins
das Einsteigermodell „Elements“ ist verhältnismäßig billig und vereint ein paar nützliche Funktionen: Entfernen von Hintergrundgeräuschen, Hall, Übersteuerung, Klicken, starke S-Laute
ein Repair Assistent scannt die vorliegende Audiodatei und verbessert automatisch die Qualität, dabei kann die Stärke eingestellt werden – auch von den einzelnen Funktionen
kann das meiste, was ihr im Alltag so braucht für wenig Geld (außerdem oft im Angebot)

Newsletter abonnieren (Opens in a new window)

Das war die erste Ausgabe von Workflow Shortcuts! Wie hat sie euch gefallen? War sie zu lang? Das Thema zu technisch? Schreibt es mir! Dieser Newsletter ist auf euer Feedback angewiesen, vor allem in der Anfangsphase. Deshalb bitte ich euch, zwei Minuten eurer Zeit in diese sehr kurze Umfrage (Opens in a new window) zu stecken.

Wenn ihr mich unterstützen möchtet, dann empfehlt meinen Newsletter und schickt ihn an Bekannte und Arbeitskolleg*innen weiter, für die er interessant sein könnte.

Bis bald in eurem Postfach
Niklas

Für mehr Informationen:
Meine Website (Opens in a new window)
Folge mir auf LinkedIn (Opens in a new window)

Date February 27, 2024

Topic Audioproduktion

0 high-fives

00 comments