#017 Roboter, Bananen und Würfel
Heute zu Gast im CM MAGAZIN: Holger Klein & Thomas Brandt
Die Themen heute:
Roboter, Bananen und Würfel #tech
MuZero und die Videokompression #fotografie
Synchro in gut #fotografie
Aber zuerst: Wir haben einen Igel.
Er hat sich in einen Laubhaufen unter einem Busch in unserem Garten eingenistet. Vor ein paar Tagen saß er tagsüber in der prallen Sonne lethargisch auf dem Rasen. Ich habe ihn dann mit einer Schaufel vorsichtig in den Schatten bugsiert und ihm Wasser gegeben. Darauf ging er in seine Laubhöhle zurück. Seither habe ich viel über Igel gelernt. Sie haben meist Parasiten, Flöhe, Bandwürmer, sind kleine Ferkel und essen gerne gekochte Eier. Als er gestern wieder tagsüber auf dem Rasen saß, hatten wir ein gekochtes Ei parat. Er hat sich schmatzend drüber her gemacht. https://twitter.com/chrismarquardt/status/1525405782774370305 Er scheint etwas zu leicht für die Jahreszeit und wird jetzt von uns mit Futter erst mal etwas aufgepäppelt. Falls er innerhalb der nächsten Wochen nicht wieder nachtaktiver wird, werden wir ihn wohl mal zum Entwurmen bringen. Ich werde berichten.
Hausmeisterei: Das Projekt wächst zwar, aber leider viel zu langsam. Immerhin unterstützen mich hier mittlerweile 18 phantastische Menschen, aber damit ich das zum Mindestlohn leisten kann, müssten es halt deutlich mehr werden. Ich habe die letzten Wochen viel hin und her gedacht und bin jetzt bei einem leicht abgewandelten Modell gelandet. Und dazu hätte ich gerne mal euer Feedback. Über die letzten Monate hat sich herausgestellt, dass der Podcast-Teil das attraktivste Element ist. Das Magazin leidet aber unter einem Henne-Ei-Problem, denn wer nicht unterstützt, kann auch schlecht rausfinden, warum sie oder er vielleicht unterstützen sollte. Deshalb möchte ich den Podcast-Teil jetzt allen zugänglich machen, also auch denen, die das CM MAGAZIN gratis bekommen. ABER: Um trotzdem einen Anreiz für das Abo zu schaffen, ist der Podacst-Teil in der Gratisversion NUR auf der Website im eingebauten Player zu hören. D.h. alle, die unterstützen, bekommen weiterhin ihren persönlichen Feed im Podcatcher, alle anderen können den Podcast-Teil auf der Website hören. Und mit der aktuellen Ausgabe probiere ich das jetzt einfach mal aus. Ich freue mich über euer Feedback dazu, z.B. auf Twitter an @dascmmagazin
Die heutige Ausgabe bleibt selbstverständlich auf Nerd-Niveau. Die Themen drehen sich um Entwicklungen in der Automatisierung.. nach dem, was ich da sehe, prophezeie ich, dass wir in spätestens 5 Jahren Roboter haben, die uns die Spülmaschine einräumen und den Kinderzimmerfußboden von Lego befreien. Dann rede ich mit Thomas über eine KI, die mal eben einen der besten Videokompressionsalgorithmen nochmal deutlich besser gemacht hat und mit Holgi über ein Thema, über das er mal so richtig abgehen kann... nämlich über Synchronisation von Filmen.
Haut rein!
Der ungekürzte Podcast zum im-Web-Browser-hören:
Unterstützer:innen bekommen den Podcast automatisch und regelmäßig in ihren Podcast-Player geliefert.
## Roboter, Bananen und Würfel
"26th March 2022 Robot peels banana with deep learning Researchers at the University of Tokyo have developed a new machine learning system for a two-armed robot – enabling it to identify, pick up, and peel a banana. "
Kommentar:
Roboter sind starr. Sie können nur vorgeschriebene Dinge tun und mit Gegenständen interagieren, die klar definiert sind. Dafür haben Roboter entsprechende Greifer, die mit dem zu manipulierenden Gut kompatibel sind. So zumindest waren bisher die meisten Industrieroboter in meiner Wahrnehmung verankert.
Hier zwei jüngere Beispiele, die kräftig an dieser Einordnung rütteln. Der eine davon schält eine Banane, https://www.youtube.com/watch?v=x4O8pojMF0w der andere löst einen Rubiks Cube. Einhändig. Mit einer Roboterhand.
Interessant daran finde ich, dass das Training dafür in einer Simulation stattgefunden hat. Virtuell, im Rechner. Das finden wir gerade in vielen anderen Bereichen auch, zum Beispiel beim autonomen Fahren. Wer es schafft, echte Situationen so zu simulieren, dass sie für den Rechner von Realität nicht mehr zu unterscheiden sind, kann damit quasi jede gewünschte Extremsituation simulieren.
In diesem Zusammenhang weise ich nochmal auf Ausgabe #007 hin, Titel "High-Speed Salamiwürstchen". Die Automatisierung in der Industrie und auch in unserem Leben verändert sich gerade weg vom starren Roboter hin zu deutlich universaleren Helfern. Ein Roboter, der einhändig einen Cube manipuliert, kann demnächst auch die Geschirrspülmaschine einräumen, das Lego vom Boden einsammeln oder im Garten Blumen gießen und Igel füttern.
## MuZero und die Videokompression
"Let's imagine that video compression is a video game"
(Quelle: https://m.youtube.com/watch?v=zxyZSxnTrZs&feature=youtu.be (S'ouvre dans une nouvelle fenêtre))
Kommentar:
DeepMinds MuZero lernt Computerspiele und schlägt seine menschlichen Gegner. Das hat die Forscher:innen-Gemeinde nicht daran gehindert, MuZero auf ein ganz anderes Problem anzusetzen, nämlich die Videokompression.
MuZero hat dann innerhalb kurzer Zeit die Parameter für die VP9-Videokompression (die wird z.B. von YouTube verwendet) um über 4% verbessert. Das bedeutet, dass mit MuZero VP9-komprimiertes Video bei identischer Qualität 4% weniger Platz belegt. Das klingt jetzt nicht nach viel, ist aber enorm, wenn man bedenkt, wieviel Forschungsarbeit in diesen Algorithmen steckt.
Die haben also für das neuronale Netz einen Videokomprimierungsprozess als Computerspiel deklariert und das Ergebnis kann sich mehr als sehen lassen.
What next?
## Synchro in gut
"This is basically the first movie to use AI to visually re-dub the entire film into a new language"
(Quelle: https://youtu.be/bUu-44nw3eQ?t=600 (S'ouvre dans une nouvelle fenêtre))
Kommentar:
Ok, das hier ist komplett abgefahren. Ich oute mich mal eben als Synchro-Hasser und zwar aus tiefem Herzen. Bei der Synchronisation in andere Sprachen geht bei Filmen und Serien unglaublich viel verloren, die Stimmen passen selten gut und um alles lippensynchron hinzubekommen, müssen die Übersetzungen schon mal etwas holpriger ausfallen.
Hier versucht schon seit einiger Zeit die KI Abhilfe zu schaffen. Den Mund einer Schauspielerin basierend auf dem Ton einer anderen Sprache neu zu animieren ist möglich, nur halt nicht wirklich gut genug, um der näheren Betrachtung auf der Kinoleinwand standzuhalten. Außerdem wird bei solchen Systemen oft der Rest des Gesichtes nicht entsprechend angepasst, war dann wieder unnatürlich wirkt.
Im Film "The Champion" kommt jetzt zum ersten Mal eine Technik zum Einsatz, bei dem die Synchronisation Lippen, Gesicht und Ausdruck anpasst. Und das in verdammt gut.
Meine utopische Seite sagt: wow, das ist genial. Meine dystopische Seite möchte sich angesichts des Potenzials einer ganz neuen Fake-News-Qualität verkriechen.
Im Bereich Film prophezeie ich zumindest mal eine Welle neuer Synchronisationen älterer Filme, genauso, wie auch viele ältere Filme nachträglich in 3D umgewandelt wurden, obwohl sie nicht so gedreht wurden.
Sodele, das war's für diese Woche. Wieviel würdet ihr für einen Roboter bezahlen, der euch die Wohnung aufräumt und die Wäsche faltet?
Ich bin jetzt erst mal raus und genieße noch den Rest vom Wochenende. Euch ne schöne Woche. Falls ihr Inputs habt, immer her damit, wie gesagt auf Twitter @dascmmagazin oder per E-Mail an chris@cmmagazin.com
Bis die Tage!
Chris
Um den 🎧-Podcast in Deinem Podcast-Client zu hören, benötigst Du eine Mitgliedschaft. Deine Unterstützung finanziert dieses Projekt ❤️🙏
Zu den Paketen (S'ouvre dans une nouvelle fenêtre)
Déjà membre ? Connexion (S'ouvre dans une nouvelle fenêtre)