Neuer Google KI-Videogenerator übertrifft Sora von OpenAI

December 17, 2024 Jannik

Kaum zu glauben, aber wahr: Google DeepMind hat mit Veo 2 ein neues KI-Videotool vorgestellt, das OpenAIs Sora gehörig unter Druck setzt. Veo 2 verspricht Videos von nie dagewesener Länge und Auflösung – satte 4K und über zwei Minuten Laufzeit! Doch was steckt wirklich hinter diesen ambitionierten Versprechungen? Ist Veo 2 nur ein Hype oder ein echter Gamechanger?

Bildquelle: Techcrunch

Was macht Veo 2 besser als Sora?

Es klingt wie ein ungleicher Kampf: OpenAIs Sora schafft „nur“ 20-Sekunden-Clips in 1080p, während Veo 2 mit Videos in 4K und mehr als zwei Minuten beeindruckt. Klingt großartig – wäre da nicht der Haken. Aktuell ist Veo 2 im Experimentierstadium und lediglich in Googles VideoFX-Tool zugänglich. Dort beschränkt sich die Ausgabe auf 720p und gerade mal acht Sekunden Länge. Ein klares Beispiel dafür, dass die Technik zwar auf dem Papier überlegen sein mag, aber noch in der Entwicklungsphase steckt. Doch bereits das jetzt verfügbar Veo 2 Modell ist meistens besser, als das vor kurzem vorgestellte Sora Modell von OpenAI.

Laut Eli Collins, Produkt-Vizepräsident bei DeepMind, wird Veo 2 zukünftig über die Google Cloud-Plattform Vertex AI verfügbar sein. Der Schritt ist entscheidend, denn dort können Entwickler das Modell umfassender nutzen. Spannend bleibt es allemal.

See this form in the original post

Die neuen Fähigkeiten von Veo 2

Veo 2 bleibt seinem Ursprung treu und generiert Videos basierend auf Texteingaben oder kombiniertem Text- und Bildinput. Doch DeepMind hat ordentlich geschraubt:

Besseres Verständnis für Physik: Bewegungen wirken realer, Flüssigkeiten fließen natürlicher – das Gießen von Kaffee oder der Glanz von Wasseroberflächen sehen erstaunlich echt aus.
Verbesserte Kamerasteuerung: Die virtuelle Kamera lässt sich präziser bewegen, wodurch dynamischere Perspektiven und Aufnahmen entstehen. Ein Auto „rast“ jetzt nicht nur, sondern die Kamera verfolgt es aus Hollywood-reifer Szenerie.
Scharf wie nie: Texturen, Bewegungen und Details wirken klarer. Besonders bei schnellen Actionszenen zeigt Veo 2 eine saubere Qualität.

Einige von DeepMind geteilte Videos beeindrucken. Ein Pixar-ähnliches animiertes Tier? Ein realistisches Fließen von Ahornsirup? Alles kein Problem. Dennoch bleibt das Ergebnis nicht perfekt: Charaktere wirken manchmal leblos, Straßen seltsam glatt – und hin und wieder scheint die KI noch durch die Uncanny Valley zu stolpern.

Collins gibt offen zu: „Kohärenz und Konsistenz sind Herausforderungen, an denen wir arbeiten.“ Besonders bei längeren oder komplexeren Videos muss Veo 2 noch nachlegen.

Kontroversen um Trainingsdaten und Kreativität

Hier wird es brisant: Veo 2 wurde mit zahllosen Videos trainiert, doch DeepMind hüllt sich in Schweigen, wenn es um die genaue Herkunft der Daten geht. YouTube liegt als potenzielle sehr Quelle nahe, schließlich gehört die Plattform Google und es gab bereits einige Medienberichte darüber, dass YouTube-Daten zum Training verwendet wurden. Kritische Stimmen aus der Kreativszene werfen DeepMind und anderen KI-Entwicklern vor, Inhalte ohne Zustimmung für das Training zu nutzen.

Während Google Werkzeuge anbietet, um das Scrapen von Websites zu verhindern, existiert bislang keine Möglichkeit, eigene Werke nachträglich aus den KI-Datensätzen zu entfernen. Das schafft Unsicherheit – besonders für Künstler und Filmemacher, die ihre Jobs durch KI bedroht sehen.

DeepMind und die „Kollaboration mit Kreativen“

DeepMind betont, dass Veo 2 mit Hilfe von Künstlern und Produzenten weiterentwickelt wird. Kreative wie Donald Glover und The Weeknd haben demnach von Anfang an Feedback geliefert. Dennoch bleibt die Skepsis: Kann die KI wirklich ein kreatives Werkzeug sein oder verdrängt sie menschliche Kunstschaffende?

Wasserzeichen und Sicherheit bei Deepfakes

Ein großes Problem generativer KI-Modelle ist der Missbrauch. DeepMind setzt deshalb auf das hauseigene Wasserzeichen-Tool SynthID, das unsichtbare Marker in die Videoframes einbettet. Doch seien wir ehrlich: Auch SynthID ist nicht unknackbar. Deepfakes und Copyright-Fragen werden die KI-Community also noch lange beschäftigen.

Imagen 3: Googles Antwort auf Midjourney

Neben Veo 2 präsentierte DeepMind ein Update für Imagen 3, Googles KI für Bildgenerierung. Imagen 3 sorgt für lebendigere Bilder mit verbesserter Detailtiefe. Gleichzeitig erhielt die Nutzeroberfläche von Googles ImageFX-Tool ein Upgrade: Prompts werden jetzt durch Vorschläge ergänzt, was die Bildgestaltung intuitiver macht.

Bildquelle: Google

Übrigens: Imagen 3 ist bereits in der EU verfügbar, während Veo 2 noch auf sich warten lässt.

Fazit: Veo 2 – Ein Schritt nach vorne, aber nicht das Ende der Reise

Veo 2 beeindruckt mit technischer Innovation und neuen Möglichkeiten, die die Konkurrenz alt aussehen lassen. Doch die Schwächen sind nicht zu übersehen. Charakterkonsistenz, realistische Details und eine klarere Ethik bei der Nutzung von Trainingsdaten bleiben Baustellen.

Ob Veo 2 das Zeug hat, den Videomarkt nachhaltig zu verändern, wird sich zeigen. Eines steht jedoch fest: Die Konkurrenz zwischen Google und OpenAI treibt die KI-Entwicklung in einem atemberaubenden Tempo voran. Für uns Nutzer heißt das: Noch mehr beeindruckende Tools – und viele offene Fragen.

FAQ – Häufige Fragen zu Veo 2

1. Was ist Veo 2 von Google DeepMind?

Veo 2 ist ein KI-Video-Generator von Google DeepMind, der Videos von bis zu zwei Minuten Länge in 4K-Qualität erstellen kann.

2. Ist Veo 2 besser als OpenAIs Sora?

Auf dem Papier ja: Veo 2 bietet längere Videos und höhere Auflösungen. Allerdings sind die Ergebnisse aktuell noch auf 720p und acht Sekunden beschränkt.

3. Woher stammen die Trainingsdaten für Veo 2?

DeepMind gibt die genauen Quellen nicht bekannt, doch YouTube wird als mögliche Datenquelle vermutet.

4. Kann ich Veo 2 bereits nutzen?

Veo 2 ist derzeit nur über eine Warteliste im Google-Tool VideoFX verfügbar. Eine breitere Freigabe soll in den kommenden Monaten folgen.

5. Wie sicher ist Veo 2 gegen Missbrauch?

DeepMind nutzt SynthID, um unsichtbare Wasserzeichen in Videos einzubetten. Dennoch ist das System nicht vollkommen sicher gegen Manipulation.

6. Wird Veo 2 in Europa verfügbar sein?

Aktuell gibt es keine Angaben zur Freigabe in Europa. Imagen 3 hingegen ist bereits in der EU verfügbar.