Branche

Wir haben über 40.000 AI Video Aufforderungen analysiert — Hier ist, was die Leute tatsächlich erstellen

23. Februar 2026
14 Min. Lesezeit
Teilen:
Wir haben über 40.000 AI Video Aufforderungen analysiert — Hier ist, was die Leute tatsächlich erstellen

Wichtigste Erkenntnisse

  • 1Text-zu-Video dominiert mit 65,7% aller Bestellungen, während Bild-zu-Video 32,6% ausmacht
  • 288,2% der AI Videos sind generierte Szenen — keine Avatare, keine Animationen, sondern vollständig imaginierte Welten aus Text
  • 3Die AI Video Erstellung ist wirklich global: Aufforderungen kommen in über 24 Sprachen, wobei Englisch nur 47,3% ausmacht
  • 4Veo 3.1 befehligt 96,4% der Modellenutzung, was einen klaren Gewinner im Rennen um das AI Video Modell signalisiert
  • 516:9 Landschaft (52,8%) übertrifft leicht 9:16 vertikal (43,7%), was die TikTok-vs-YouTube-Spaltung in Echtzeit zeigt
Geschrieben von

Vivideo-Team

Das Vivideo-Team setzt sich leidenschaftlich dafür ein, die Videoerstellung mithilfe von AI für alle zugänglich zu machen. Wir testen und bewerten die neuesten Tools und teilen unser Wissen, damit Sie erfolgreich sind.

Wir haben über 40.000 AI-Video-Prompts analysiert

Jeder hat eine Meinung zu AI-Videos. Experten sagen voraus, wohin es geht. Twitter diskutiert, ob es "schon gut genug ist." YouTube-Thumbnails schreien über das neueste Modell-Update.

Aber fast niemand spricht darüber, was die Leute tatsächlich mit diesen Werkzeugen gerade machen.

Also haben wir beschlossen, es herauszufinden.

Wir haben Daten von über 120.000 AI-generierten Videos gesammelt, die auf Vivideo erstellt wurden, eine Stichprobe von 40.000+ Prompts mit GPT-4o-mini klassifiziert und die Zahlen ausgewertet. Was dabei herauskam, ist ein überraschend detailliertes Bild davon, wie echte Menschen — keine Influencer, keine Forscher, sondern alltägliche Kreatoren und Unternehmen — AI-Video im Jahr 2025 nutzen.

Hier ist alles, was wir gefunden haben.

Datenanalyse-Dashboard mit bunten Diagrammen und Grafiken

Der Datensatz: Wie wir zu diesen Zahlen kamen

Lasst uns die Methodik klären, damit ihr genau wisst, was ihr seht.

Unser vollständiger Datensatz umfasst 120.000+ Videos, die über die Plattform von Vivideo generiert wurden. Für die detaillierte Prompt-Analyse haben wir eine stratifizierte Stichprobe von 915 Prompts genommen und sie durch GPT-4o-mini zur Klassifizierung in Anwendungsfallkategorien laufen lassen. Die breiteren Statistiken — Modellnutzung, Seitenverhältnisse, Dauer, Sprachen und Eingabetypen — stammen aus dem vollständigen Datensatz.

Wir haben nicht selektiv ausgewählt. Wir haben nicht nach "beeindruckenden" Ergebnissen gefiltert. Dies sind rohe, ungefilterte Daten von echten Nutzern, die echte Arbeit leisten (und ja, einige davon sind Leute, die Geburtstagsvideos für ihre Mutter machen — und das ist großartig).

Ein paar Vorbehalte: Die Klassifizierung von Prompts durch AI ist nicht perfekt. Einige Prompts sind mehrdeutig. Ein "Produktvideo mit einer sprechenden Person" könnte entweder als Produktdemonstration oder als Avatar-Video gekennzeichnet werden. Wir haben für die wahrscheinlichste Absicht optimiert und Hunderte von Klassifizierungen manuell überprüft.

Das gesagt, lasst uns eintauchen.

Das große Bild: Text-zu-Video vs. Bild-zu-Video

Die erste Frage, die wir gestellt haben, war einfach: Wie beginnen die Leute ihre Videos?

Tippen sie einen Prompt von Grund auf ein? Oder laden sie ein Bild hoch und erwecken es zum Leben?

65,7% aller Videoaufträge sind Text-zu-Video. 32,6% sind Bild-zu-Video. Die verbleibenden ~1,7% verwenden andere Methoden wie Avatar-Generierung.

Das war etwas überraschend. Wir hatten erwartet, dass Bild-zu-Video höher ist — schließlich ist es "einfacher", da man der AI einen visuellen Ausgangspunkt gibt. Aber die Daten erzählen eine andere Geschichte: Zwei Drittel der Nutzer ziehen es vor, ihre Vision in Worten zu beschreiben und lassen die AI die visuellen Elemente herausfinden.

Warum? Einige Theorien:

  • Niedrigere Einstiegshürde. Man muss nicht das richtige Bild haben oder finden. Man tippt einfach, was man möchte. Text-zu-Video ist die ultimative leere Leinwand.
  • Mehr kreative Kontrolle. Text-Prompts ermöglichen es, Stimmung, Kamerabewegung, Beleuchtung und Stil zu spezifizieren — Dinge, die schwieriger durch ein statisches Bild zu kommunizieren sind.
  • Die "Vorstellungslücke." Viele Nutzer erstellen Szenen, die es noch nicht gibt — Fantasiewelten, Produktkonzepte, narrative Sequenzen. Man kann kein Foto von etwas hochladen, das noch nicht gebaut wurde.

Das gesagt, Bild-zu-Video hat sein eigenes treues Publikum. Es ist besonders beliebt für E-Commerce-Produktanimationen, Immobilienführungen (beginnen Sie mit einem Foto der Immobilie) und um Kunstwerke zum Leben zu erwecken.

Professionelles Video-Produktionssetup mit Kamera und kreativer Beleuchtung

Was die Leute tatsächlich erstellen (Die Anwendungsfall-Aufschlüsselung)

Das ist der Abschnitt, auf den wir uns am meisten gefreut haben. Als wir alle 915 Stichproben-Prompts nach Anwendungsfall klassifizierten, dominierte eine Kategorie absolut.

AnwendungsfallProzentsatz
AI-generierte Videoszenen88,2%
Avatar / Talking Head Videos7,1%
Bildanimation4,7%

Lasst das sacken. Fast 9 von 10 AI-Videos sind vollständig generierte Szenen — nicht das Gesicht von jemandem, das zur Kamera spricht, nicht ein Ken-Burns-Effekt auf einem Foto, sondern vollständige visuelle Szenen, die aus Textbeschreibungen heraufbeschworen werden.

Das ist die wahre Geschichte von AI-Video im Jahr 2025: Die Leute nutzen es als visuelle Vorstellungskraftmaschine.

Wie diese Szenen tatsächlich aussehen

Wir haben tiefer in die 88,2% eingetaucht, um zu verstehen, welche Arten von Szenen die Leute generieren. Während die Kategorien sich überschneiden (ein Werbevideo kann auch eine Erzählung sein), hier sind die Hauptmuster, die wir beobachtet haben:

  • Werbevideos — Unternehmen, die Anzeigen, Markenvideos und Marketinginhalte erstellen. Alles von lokalen Restaurant-Promos bis hin zu SaaS-Produktlaunches.
  • Bildungsinhalte — Erklärvideos, Tutorials und "wie es funktioniert"-Sequenzen. Lehrer, Kursanbieter und Unternehmensschulungen sind frühe Power-User.
  • Inhalte für soziale Medien — Kurze, prägnante Clips, die für TikTok, Instagram Reels und YouTube Shorts konzipiert sind. Oft trendgetrieben und für maximalen Scroll-Stopp-Effekt gestaltet.
  • Geschichten erzählen und Narrative — Kurzfilme, Musikvideo-Konzepte und narrative Sequenzen. Hier leben die kreativsten Prompts — Menschen bauen ganze Welten in 4-12 Sekunden.
  • Produktdemonstrationen — E-Commerce-Verkäufer, die Produkte in Lifestyle-Kontexten präsentieren. "Zeige meinen Sneaker, der von einem Läufer auf einem Bergpfad bei Sonnenuntergang getragen wird" — so etwas.
  • Persönliche Grüße und Feiern — Geburtstagsnachrichten, Feiertagskarten, Jubiläumsüberraschungen. AI-Video als die neue Hallmark-Karte.
  • Immobilienführungen — Virtuelle Immobilienführungen, Nachbarschaftspräsentationen und architektonische Visualisierungen.
  • E-Commerce-Produktpräsentationen — Produktaufnahmen, 360°-Stilenthüllungen und Lifestyle-Kontextvideos, die Produkte hochwertig erscheinen lassen.

Die Kategorie Avatar/Talking Head (7,1%) ist kleiner als man erwarten könnte, angesichts des ganzen Buzz um AI-Avatare. Das liegt teilweise daran, dass die Avatar-Generierung ein spezialisiertes Anwendungsfeld ist — es erfordert einen anderen Workflow und spricht ein engeres Publikum an (hauptsächlich Unternehmensschulungen und personalisierte Verkaufsansprache).

Bildanimation mit 4,7% repräsentiert Nutzer, die ein Standbild hochladen und Bewegung hinzufügen — eine beliebte Wahl, um Kunstwerke, alte Fotos oder Produktbilder zum Leben zu erwecken.

Die Sprache von AI-Video: Ein 24-Sprachen-Phänomen

Hier ist etwas, das uns wirklich überrascht hat. Wenn du angenommen hast, dass die Erstellung von AI-Videos hauptsächlich eine englischsprachige Aktivität ist, sagen die Daten etwas anderes.

Englisch macht nur 47,3% aller Prompts aus. Das bedeutet, dass mehr als die Hälfte aller AI-Video-Prompts auf Vivideo in nicht-englischen Sprachen verfasst sind.

Das ist nicht nur "ein bisschen international." Das ist ein globales Phänomen, mit bedeutender Akzeptanz auf jedem Kontinent.

Globale Netzwerkverbindungen auf einer Weltkarte dargestellt
Sprache% der Prompts
Englisch47,3%
Vietnamesisch23,1%
Arabisch11,4%
Russisch3,2%
Türkisch2,7%
Deutsch2,2%
Ukrainisch1,9%
Indonesisch1,7%
Spanisch1,3%
Niederländisch0,9%
Hebräisch0,7%
Polnisch0,7%
Chinesisch0,6%
Portugiesisch0,6%
Schwedisch0,5%
Griechisch0,4%

Ein paar Dinge stechen hervor:

Vietnamesisch mit 23,1% ist riesig. Fast ein Viertel aller Prompts sind auf Vietnamesisch. Dies spiegelt die boomende digitale Kreatorenwirtschaft Vietnams und die frühe Akzeptanz von AI-Tools zur Inhaltserstellung wider. Vietnamesische Kreatoren nutzen AI-Video für alles, von E-Commerce-Produktvideos bis hin zu sozialen Medieninhalten in großem Maßstab.

Arabisch mit 11,4% macht die MENA-Region zu einem der aktivsten AI-Video-Märkte. Angesichts der rasanten digitalen Transformation, die in den Golfstaaten stattfindet, und der massiven Investitionen in die AI-Infrastruktur, passt das.

Der lange Schwanz ist real. Über die Top-Sprachen hinaus gibt es bedeutende Aktivitäten in Russisch, Türkisch, Deutsch, Ukrainisch, Indonesisch und vielen mehr. AI-Video ist kein Spielzeug aus dem Silicon Valley — es ist ein globales kreatives Werkzeug.

Das hat enorme Auswirkungen für jeden, der in diesem Bereich aufbaut: Wenn dein AI-Video-Tool nur gut mit englischen Prompts funktioniert, ignorierst du mehr als die Hälfte deiner potenziellen Nutzer.

Formatpräferenzen: Seitenverhältnisse und Dauer

Wie die Leute ihre Videos formatieren, sagt dir viel darüber, wo diese Videos landen werden.

Seitenverhältnisse

SeitenverhältnisProzentsatz
16:9 (Querformat)52,8%
9:16 (Hochformat/Vertikal)43,7%
1:1 (Quadrat)~0%

Die Aufteilung zwischen Quer- und Hochformat ist bemerkenswert nah — 52,8% zu 43,7% — was uns etwas Wichtiges sagt: Der Kampf zwischen horizontalem und vertikalem Video ist im Grunde ein Münzwurf.

Querformat führt immer noch, wahrscheinlich angetrieben durch YouTube, Website-Einbettungen, Präsentationen und traditionelle Marketinginhalte. Aber vertikal ist dicht auf den Fersen, angeheizt durch TikTok, Instagram Reels und YouTube Shorts.

Die echte Überraschung? Quadratvideo (1:1) ist praktisch tot. Mit ungefähr 0% erstellt niemand mehr quadratische Videos. Das alte quadratische Format von Instagram, das einst der Standard für soziale Medien war, wurde in der AI-Video-Ära vollständig aufgegeben.

Inhaltserstellung für soziale Medien auf mehreren Geräten mit unterschiedlichen Seitenverhältnissen

Videodauern

DauerProzentsatz
12 Sekunden30,1%
4 Sekunden29,2%
8 Sekunden23,3%
6 Sekunden6,6%

Dauerpräferenzen zeigen eine faszinierende Zweiteilung:

Camp 1: Die 12-Sekunden-Crew (30,1%). Diese Nutzer wollen die maximal verfügbare Dauer. Sie erstellen narrative Inhalte, Produktdemonstrationen und Werbevideos, bei denen jede zusätzliche Sekunde zählt. Zwölf Sekunden reichen aus, um eine Mini-Geschichte zu erzählen: Aufbau, Enthüllung, Auszahlung.

Camp 2: Die 4-Sekunden-Crew (29,2%). Diese Nutzer wollen schnelle, prägnante Clips — perfekt für soziale Medien-Hooks, Werbekreative oder um mehrere Clips in längere Bearbeitungen zu stapeln. Vier Sekunden sind im Grunde ein starkes visuelles Moment.

Der 8-Sekunden-Mittelweg (23,3%) erfasst Nutzer, die etwas mehr Atemraum als 4 Sekunden wollen, aber nicht die vollen 12 benötigen. Die relativ geringe Beliebtheit von 6-Sekunden-Videos (6,6%) ist interessant — es scheint, dass die Leute lieber entweder "kurz" oder "lang" wählen, anstatt einen Mittelweg zu finden.

Das Modellrennen: Veo 3.1 läuft davon

Wenn es eine Überschrift aus dieser gesamten Analyse gibt, könnte es diese hier sein:

Veo 3.1 treibt 96,4% aller AI-Video-Generierung auf Vivideo an.

Das ist kein Tippfehler. Das Veo 3.1-Modell von Google ist die überwältigende Wahl für die Erstellung von AI-Videos.

Modell% der Nutzung
Veo 3.196,4%
Sora 22,0%
HeyGen (Avatare)10,5% aller Aufträge

Hinweis: Die Avatar-Generierung von HeyGen wird separat gezählt, da sie eine andere Funktion erfüllt (digitale Avatare vs. Szenengenerierung). Ihr Anteil von 10,5% überschneidet sich mit der Avatar-Kategorie in unserer Anwendungsfallanalyse.

Warum dominiert Veo 3.1 so vollständig? Basierend auf Nutzerfeedback und unseren eigenen Tests:

  • Visuelle Qualität. Veo 3.1 produziert konsequent die fotorealistischsten und visuell kohärentesten Ausgaben.
  • Prompt-Einhaltung. Es folgt komplexen Prompts treuer — Kamerabewegungen, Beleuchtungsspezifikationen, Stilrichtlinien.
  • Geschwindigkeit. Die Generierungszeiten sind wettbewerbsfähig, und das Verhältnis von Qualität zu Geschwindigkeit ist erstklassig.
  • Konsistenz. Weniger "seltsame AI-Artefakte" — weniger schmelzende Hände, unmögliche Physik und Momente im unheimlichen Tal.

Sora 2 mit 2,0% hat immer noch seine Fans, insbesondere für künstlerischere und stilisierte Inhalte. Aber der Markt hat gesprochen, zumindest vorerst: Wenn die Leute zuverlässige, hochwertige AI-Videos wollen, wählen sie Veo 3.1.

Visualisierung künstlicher Intelligenz mit Mustern neuronaler Netzwerke

Überraschende Erkenntnisse

Jede gute Datenanalyse bringt Dinge ans Licht, die man nicht erwartet hat. Hier sind die Muster, die uns zum Staunen gebracht haben.

1. Die 9% Inhaltsmoderationsrate

Ungefähr 9% aller Prompts wurden von Inhaltsmoderationssystemen als erwachsen oder unangemessen gekennzeichnet. Das ist tatsächlich niedriger als viele in der Branche erwartet hatten — einige Schätzungen setzen die Rate für den Versuch, erwachsenen Inhalt bei AI-Bildgeneratoren zu erstellen, auf 15-20%.

Was bedeutet das? Die Erstellung von AI-Videos ist professioneller und zielgerichteter als die Erstellung von AI-Bildern. Wenn man für die Videoerstellung bezahlt (im Gegensatz zu einem kostenlosen Bild-Tool zu spielen), ist die Absicht ernster und die Anwendungsfälle geschäftsorientierter.

2. Der Geburtstagskarten-Effekt

Persönliche Grüße — Geburtstage, Feiertage, Jubiläen — tauchten viel häufiger auf, als wir erwartet hatten. Das sind nicht die auffälligen Anwendungsfälle, die in AI-Demo-Reels vorgestellt werden, aber sie repräsentieren eine wirklich herzerwärmende Anwendung der Technologie. Die Leute erstellen personalisierte Videobotschaften, die vor zwei Jahren unmöglich (oder prohibitively teuer) gewesen wären.

3. Der Tod des Quadratvideos

Wir haben das bereits erwähnt, aber es ist erwähnenswert: 1:1 Quadratvideo ist effektiv bei 0%. Das Format, das Instagram von 2012-2019 dominiert hat, wurde vollständig aufgegeben. Wenn dein Video-Tool immer noch standardmäßig auf Quadrat eingestellt ist, löst du das Problem von gestern.

4. Die vietnamesische Kreatorenwirtschaft

Mit 23,1% aller Prompts ist Vietnamesisch nicht nur vertreten — es ist die zweitbeliebteste Sprache mit einem riesigen Abstand, mehr als doppelt so viel wie das drittplatzierte Arabisch mit 11,4%. Die Kreatorenwirtschaft Vietnams befindet sich eindeutig an einem Wendepunkt, und AI-Video-Tools sind ein wichtiger Beschleuniger.

5. Niemand will 6-Sekunden-Videos

Mit nur 6,6% der Aufträge ist das 6-Sekunden-Format die am wenigsten beliebte Dauer. Nutzer ziehen stark entweder kurze und prägnante (4s) oder längere Formate (12s) vor. Der Mittelweg scheint einfach nicht zu ziehen. Das spiegelt wider, was wir in sozialen Medien-Trends gesehen haben — Inhalte sind entweder ein schneller Hook oder eine Mini-Erzählung, mit wenig Raum dazwischen.

Was das für Kreatoren bedeutet

Also, ihr habt die Daten gesehen. Was solltet ihr tatsächlich damit tun?

Egal, ob ihr Marketer, Inhaltsanbieter, Geschäftsinhaber oder einfach nur jemand seid, der sich für AI-Video interessiert, hier sind die umsetzbaren Erkenntnisse:

1. Beginnt mit Text-zu-Video

Wenn ihr AI-Video noch nicht ausprobiert habt, Text-zu-Video ist der Ort, an dem die Action ist. Zwei Drittel der Nutzer beginnen hier, und das aus gutem Grund — ihr braucht keine Assets, nur Ideen. Beschreibt, was ihr sehen wollt, und die AI baut es.

2. Denkt in 4s oder 12s

Bei der Planung eurer AI-Videos denkt in Bezug auf 4-Sekunden-Hooks oder 12-Sekunden-Geschichten. Die Daten zeigen, dass dies die Dauer ist, die ankommt. Für soziale Medien-Hooks und Werbekreative wählt 4 Sekunden. Für Produktdemonstrationen, Erklärvideos und narrative Inhalte nutzt die vollen 12.

3. Wählt eure Ausrichtung bewusst

Geht nicht standardmäßig auf Querformat. Wenn euer Inhalt für TikTok, Reels oder Shorts gedacht ist, wählt 9:16 vertikal. Wenn es für YouTube, eure Website oder Präsentationen gedacht ist, wählt 16:9. Und vergesst das Quadrat — der Markt hat sich weiterentwickelt.

4. Ignoriert nicht die nicht-englischen Märkte

Wenn ihr ein Geschäft rund um AI-Video-Inhalte aufbaut, zeigen die Daten eine massive Nachfrage aus vietnamesischen, arabischen, russischen und türkischsprachigen Märkten. Das sind keine Nischenpublikum — sie repräsentieren Hunderte Millionen potenzieller Zuschauer.

5. Nutzt Bild-zu-Video für Produktinhalte

Während Text-zu-Video insgesamt dominiert, ist Bild-zu-Video die Geheimwaffe für E-Commerce und Produktmarketing. Ladet euer Produktfoto hoch und fügt Bewegung, Kontext und Leben hinzu. Es ist schneller als ein Fotoshooting und unendlich skalierbarer.

Kreatives Team, das an der Inhaltsstrategie mit Laptops und Notizen zusammenarbeitet

6. Veo 3.1 ist die sichere Wahl

Wenn ihr euch fragt, welches Modell ihr verwenden sollt, sind die Daten klar: 96,4% der Nutzer wählen Veo 3.1. Es bietet die beste Kombination aus Qualität, Geschwindigkeit und Prompt-Einhaltung. Fangt dort an und experimentiert mit Alternativen wie Sora 2 für spezifische kreative Stile.

Das Fazit: AI-Video ist kein Novum mehr. Mit über 120.000 generierten Videos, Prompts in über 24 Sprachen und Anwendungsfällen, die von Geburtstagskarten bis zu Immobilienführungen reichen, ist es ein kreatives Werkzeug im Mainstream. Die Frage ist nicht, ob man es nutzen sollte — sondern wie man es besser nutzt als alle anderen.

Bereit zu sehen, was ihr erstellen könnt? Probiert Vivideo kostenlos aus und fügt eure Prompts dem nächsten Datensatz hinzu.

Mehr entdecken

Diese Tools ausprobieren

Bereit, Ihre eigenen AI-Videos zu erstellen?

Probieren Sie Vivideo noch heute kostenlos aus – keine Kreditkarte erforderlich. Erstellen Sie professionelle Videos in wenigen Minuten.

Kostenlos loslegen