In einem Deep Dive mit Michael Schirnhofer stand das Thema AI-Video-Produktion im Fokus. Die zentrale These des Vortrags lautete: „Vorstellungskraft ist heutzutage wichtiger als technisches Verständnis.“ Dies markiert einen Wandel in der Content-Produktion, bei dem sich die Rolle des Creators vom rein technischen Anwender hin zum kuratierenden „Creative Director“ entwickelt.
Ich habe meine Mitschriften aus der Session strukturiert und möchte die wichtigsten Erkenntnisse hier teilen.
Das Upgrade zum Creative Director
KI Tools (Midjourney, Freepik oder Suno) liefern uns auf Wunsch fast unbegrenztes Material – sei es der perfekte Beat, ein fotorealistisches Bild oder eine komplexe Animation.
Das bedeutet einen Wandel: Wir wechseln vom reinen “Ausführer” in die Rolle des Regisseurs. Wir orchestrieren Tools wie ChatGPT, Freepik und Suno, um genau das zu erschaffen, was wir im Kopf haben. Die KI ist dabei unser Sparringspartner, der uns Ideen liefert und die Fleißarbeit übernimmt.
Die Magie passiert aber immer noch im Editing. Tools wie CapCut sind der Ort, an dem wir als Menschen den Unterschied machen. Wir bestimmen das Framing, das Timing und das Gefühl. Die KI ist der Praktikant, der die Pixel liefert – wir führen die Regie.

Workflow-Hacks: Music First & Morphing
Besonders spannend waren die konkreten Workflows, die zeigen, dass professionelle AI-Videos nicht per “Knopfdruck” in 5 Minuten entstehen (ein High-End Clip dauert gut und gerne 30 Stunden!).
- Der Music-First Ansatz: Alles beginnt mit dem Ton. Erst generieren wir den Song (z.B. mit Suno), dann lassen wir Charaktere via Lip-Sync (Higgsfield) dazu singen. Der Audio-Beat diktiert den Schnitt.
- Die Start- & Endframe Methode: Wir geben das Startbild und das Endbild vor. Tools wie Kling oder Google Veo berechnet die Transformation (Morphing) dazwischen. Das Ergebnis: Butterweiche Übergänge!
Das Tool-Kit (Kurzfassung)
Wenn ihr euch fragt, was aktuell in die Toolbox gehört – hier ist der Stack, der sich herauskristallisiert hat:
- Das Gehirn: ChatGPT (für Konzepte und Lyrics)
- Der Editor: CapCut
- Die Visuals: Freepik, Google Veo, Midjourney, etc.
- Die Motion: Google Veo & Kling 2.0.
- Der Sound: Suno.
Konsolidierung der Plattformen
Ein deutlicher Trend ist die Entwicklung hin zu „Suiten“. Anstatt isolierte Einzellösungen zu nutzen, bündeln Plattformen wie Freepik, Adobe Firefly oder Open Art zunehmend verschiedene Modelle (Bild, Video, Vektor) an einem Ort. Dies reduziert die Notwendigkeit, zwischen verschiedenen Anwendungen zu wechseln, und vereinfacht den Arbeitsprozess.
Fazit: Mut zur Unperfektheit
Eine wichtige Erkenntnis zum Schluss: Reine, glattgebügelte “Flashy” KI-Videos performen oft schlecht. Ihnen fehlt die Seele. Ein Video darf Ecken und Kanten haben, solange die Story stimmt.
Also: Keine Angst vor der Technik. Nutzt die Tools, um eure Vorstellungskraft zu erweitern, aber verlasst euch auf euer handwerkliches Gespür. Am besten startet man einfach: Ein Tool aussuchen, ausprobieren, scheitern, weitermachen.
Happy Creating! 🎬















