Was ist das Problem?
Bisher hatten KI-Videos ein großes Problem: Der gleiche Charakter sah in jeder Szene anders aus.
Ein Beispiel
Du bittest die KI, ein Video zu erstellen:
"Eine Frau mit roten Haaren und Brille sitzt in einem Café."
Szene 1: Die Frau hat rote Haare, Brille, grünes Shirt.
Szene 2: Plötzlich hat sie blonde Haare, keine Brille, blaues Shirt.
Szene 3: Wieder anders.
Das nennt man "Identity Drift" – der Charakter verliert seine Identität.
Das Problem: Für professionelle Videos (Werbung, Filme) ist das unbrauchbar. Man braucht denselben Charakter über alle Szenen hinweg.
Googles Lösung: "Ingredients to Video"
Google Veo 3.1 hat eine neue Funktion: "Ingredients" (Zutaten).
Die Idee: Statt alles in Text zu beschreiben, lädst du drei Bilder hoch:
Bild 1: Der Charakter
Ein Foto von der Person, die im Video vorkommen soll. Google merkt sich das Gesicht.
Bild 2: Die Szene
Ein Foto von der Umgebung. Zum Beispiel ein Café, ein Büro, eine Straße.
Bild 3: Der Stil
Ein Foto, das zeigt, wie das Video aussehen soll. Zum Beispiel: 80er-Jahre-Look, düstere Beleuchtung, Aquarell-Stil.
Dann schreibst du: "Die Person geht durchs Café, setzt sich, steht wieder auf."
Ergebnis: Das Video zeigt dieselbe Person in allen drei Szenen – im richtigen Café, im gewählten Stil.
Warum funktioniert das?
Früher musste die KI aus einem Text-Prompt raten, was wichtig ist:
- Ist "rotes Haar" wichtig?
- Ist die Brille wichtig?
- Ist die Hemdfarbe wichtig?
Die KI wusste es nicht – und hat alles durcheinandergebracht.
Jetzt: Durch die drei getrennten Bilder weiß die KI genau:
- Bild 1 = Identität (muss immer gleich bleiben)
- Bild 2 = Umgebung (kann sich ändern)
- Bild 3 = Look (bleibt konstant)
Vorher: Identity Drift Problem. Nachher: Ingredients lösen es mit getrennten Referenzbildern
Für wen ist das wichtig?
Diese Funktion ist vor allem für professionelle Nutzer gedacht:
- Werbeagenturen: Brauchen denselben Charakter in allen Szenen eines Werbespots
- Filmemacher: Wollen konsistente Charaktere für Kurzfilme
- Marketing-Teams: Erstellen Produktvideos mit wiederkehrenden Personen
Google will nicht primär "virale TikTok-Videos" ermöglichen – sondern professionelle Produktionen.
Wo kann man es nutzen?
Veo 3.1 ist verfügbar in:
- Gemini App: Für normale Nutzer (kostenlos testbar)
- Flow-Plattform: Googles Profi-Tool für Filmemacher
- APIs: Für Entwickler, die Veo in eigene Apps einbauen wollen
Was bedeutet das für die Zukunft?
Mit diesem Update setzt Google einen neuen Standard:
- Text allein reicht nicht mehr: Professionelle KI-Videos brauchen Text + Bilder
- Konkurrenz muss nachziehen: OpenAI (Sora) und andere müssen ähnliche Funktionen entwickeln
- KI-Videos werden produktionsreif: Nicht mehr nur Spielerei, sondern echtes Werkzeug
Das Wichtigste
Google hat das größte Problem von KI-Videos gelöst: Charaktere bleiben konsistent. Das macht KI-Videos zum ersten Mal wirklich brauchbar für professionelle Zwecke – Werbung, Filme, Marketing. Andere Anbieter werden nachziehen müssen.