Belangrijkste punten
- 1Tekst-naar-video domineert met 65,7% van alle bestellingen, terwijl afbeelding-naar-video goed is voor 32,6%
- 288,2% van de AI video's zijn gegenereerde scènes — geen avatars, geen animaties, maar volledig geïmagineerde werelden vanuit tekst
- 3AI video creatie is echt wereldwijd: prompts komen in 24+ talen, met Engels op slechts 47,3%
- 4Veo 3.1 beheert 96,4% van het modelgebruik, wat een duidelijke winnaar aangeeft in de race om het AI video model
- 516:9 landschap (52,8%) heeft net iets de overhand op 9:16 verticaal (43,7%), wat de TikTok-vs-YouTube splitsing in real-time laat zien
Vivideo Team
Het Vivideo-team is gepassioneerd over het toegankelijk maken van videoproductie voor iedereen met behulp van AI. We testen en beoordelen de nieuwste tools en delen onze kennis om jou te helpen slagen.
We Hebben 40.000+ AI Video Prompts Geanalyseerd
Iedereen heeft een mening over AI-video. Deskundigen voorspellen waar het naartoe gaat. Twitter debatteert of het "goed genoeg is". YouTube-thumbnails schreeuwen over de laatste modelupdate.
Maar bijna niemand praat over wat mensen eigenlijk maken met deze tools op dit moment.
Dus besloten we het uit te zoeken.
We hebben gegevens verzameld van meer dan 120.000 AI-gegenerateerde video's gemaakt op Vivideo, een steekproef van 40.000+ prompts geclassificeerd met GPT-4o-mini, en de cijfers geanalyseerd. Wat naar voren kwam is een verrassend gedetailleerd portret van hoe echte mensen — niet influencers, niet onderzoekers, maar alledaagse makers en bedrijven — AI-video gebruiken in 2025.
Hier is alles wat we hebben gevonden.
De Dataset: Hoe We Deze Cijfers Hebben Verkregen
Laten we de methodologie uit de weg ruimen, zodat je precies weet waar je naar kijkt.
Onze volledige dataset beslaat 120.000+ video's die zijn gegenereerd via het platform van Vivideo. Voor de gedetailleerde promptanalyse hebben we een gestratificeerde steekproef van 915 prompts genomen en deze door GPT-4o-mini gehaald voor classificatie in gebruikscategorieën. De bredere statistieken — modelgebruik, beeldverhoudingen, duur, talen en invoertypes — komen uit de complete dataset.
We hebben niet geselecteerd. We hebben niet gefilterd op "indrukwekkende" outputs. Dit zijn ruwe, ongefilterde gegevens van echte gebruikers die echt werk doen (en ja, sommige daarvan zijn mensen die verjaardagsvideo's voor hun moeder maken — en dat is geweldig).
Een paar kanttekeningen: promptclassificatie door AI is niet perfect. Sommige prompts zijn ambigu. Een "productvideo met een persoon die praat" kan worden geclassificeerd als een productdemonstratie of een avatarvideo. We hebben geoptimaliseerd voor de meest waarschijnlijke intentie en honderden classificaties handmatig gecontroleerd.
Dat gezegd hebbende, laten we erin duiken.
Het Grote Geheel: Tekst-naar-Video vs. Afbeelding-naar-Video
De eerste vraag die we stelden was simpel: Hoe beginnen mensen hun video's?
Typen ze een prompt vanaf nul? Of uploaden ze een afbeelding en brengen deze tot leven?
65,7% van alle video-opdrachten zijn tekst-naar-video. 32,6% zijn afbeelding-naar-video. De resterende ~1,7% gebruikt andere methoden zoals avatar-generatie.
Dit was enigszins verrassend. We verwachtten dat afbeelding-naar-video hoger zou zijn — tenslotte is het "gemakkelijker" omdat je de AI een visueel startpunt geeft. Maar de gegevens vertellen een ander verhaal: twee derde van de gebruikers geeft de voorkeur aan het beschrijven van hun visie in woorden en laat de AI de visuals uitzoeken.
Waarom? Een paar theorieën:
- Lagere drempel voor toegang. Je hoeft niet de juiste afbeelding te hebben of te vinden. Je typt gewoon wat je wilt. Tekst-naar-video is het ultieme lege canvas.
- Meer creatieve controle. Tekstprompts laten je sfeer, camerabeweging, verlichting en stijl specificeren — dingen die moeilijker te communiceren zijn via een statische afbeelding.
- De "verbeeldingskloof." Veel gebruikers creëren scènes die nog niet bestaan — fantasiewerelden, productconcepten, narratieve sequenties. Je kunt geen foto uploaden van iets dat nog niet is gebouwd.
Dat gezegd hebbende, afbeelding-naar-video heeft zijn eigen loyale publiek. Het is bijzonder populair voor e-commerce productanimaties, vastgoed rondleidingen (begin met een foto van het pand) en het tot leven brengen van kunstwerken.
Wat Mensen Eigenlijk Creëren (De Gebruikscategorie Verdeling)
Dit is de sectie waar we het meest enthousiast over waren. Toen we alle 915 steekproefprompts classificeerden op gebruikscategorie, domineerde één categorie absoluut.
| Gebruikscategorie | Percentage |
|---|---|
| AI-gegenerateerde video scènes | 88,2% |
| Avatar / pratende hoofdvideo's | 7,1% |
| Afbeeldingsanimatie | 4,7% |
Laat dat even doordringen. Bijna 9 op de 10 AI-video's zijn volledig gegenereerde scènes — niet iemands gezicht dat tegen de camera praat, niet een Ken Burns-effect op een foto, maar complete visuele scènes opgeroepen uit tekstbeschrijvingen.
Dit is het echte verhaal van AI-video in 2025: mensen gebruiken het als een visuele verbeeldingsmotor.
Hoe Die Scènes Er Eigenlijk Uitzien
We hebben dieper gegraven in de 88,2% om te begrijpen welke soorten scènes mensen genereren. Hoewel de categorieën overlappen (een promotievideo kan ook een narratief zijn), zijn hier de primaire patronen die we hebben waargenomen:
- Promotievideo's — Bedrijven die advertenties, merkvideo's en marketinginhoud maken. Alles van lokale restaurantpromoties tot SaaS-productlanceringen.
- Onderwijsinhoud — Uitlegvideo's, tutorials en "hoe het werkt" sequenties. Leraren, cursusmakers en bedrijfsopleiders zijn vroege krachtige gebruikers.
- Social media-inhoud — Korte, krachtige clips ontworpen voor TikTok, Instagram Reels en YouTube Shorts. Vaak trendgedreven en ontworpen voor maximale scroll-stopping impact.
- Verhalen vertellen en narratief — Korte films, muziekvideo-concepten en narratieve sequenties. Dit is waar de meest creatieve prompts zich bevinden — mensen bouwen hele werelden in 4-12 seconden.
- Productdemonstraties — E-commerce verkopers die producten in lifestyle-contexten tonen. "Laat mijn sneaker zien die gedragen wordt door een hardloper op een bergpad bij zonsondergang" — dat soort dingen.
- Persoonlijke begroetingen en vieringen — Verjaardagsberichten, feestkaarten, jubileum verrassingen. AI-video als de nieuwe Hallmark-kaart.
- Vastgoed rondleidingen — Virtuele rondleidingen door eigendommen, buurtpresentaties en architectonische visualisaties.
- E-commerce productpresentaties — Product beauty shots, 360° stijl onthullingen en lifestyle contextvideo's die producten premium laten lijken.
De avatar/pratende hoofdcategorie (7,1%) is kleiner dan je zou verwachten gezien alle buzz rond AI-avatar. Dit komt deels omdat avatar-generatie een gespecialiseerde gebruikscategorie is — het vereist een andere workflow en spreekt een smaller publiek aan (voornamelijk bedrijfsopleiding en gepersonaliseerde verkoop outreach).
Afbeeldingsanimatie van 4,7% vertegenwoordigt gebruikers die een stilstaande foto uploaden en beweging toevoegen — een populaire keuze om kunstwerken, oude foto's of productafbeeldingen tot leven te brengen.
De Taal van AI Video: Een 24-Talen Fenomeen
Hier is iets dat ons echt verraste. Als je aannam dat AI-video creatie voornamelijk een Engelstalige activiteit is, zeggen de gegevens anders.
Engels is goed voor slechts 47,3% van alle prompts. Dat betekent meer dan de helft van alle AI-video prompts op Vivideo zijn geschreven in niet-Engelse talen.
Dit is niet zomaar "een beetje internationaal." Dit is een wereldwijd fenomeen, met betekenisvolle adoptie op elk continent.
| Taal | % van Prompts |
|---|---|
| Engels | 47,3% |
| Vietnamees | 23,1% |
| Arabisch | 11,4% |
| Russisch | 3,2% |
| Turks | 2,7% |
| Duits | 2,2% |
| Oekraïens | 1,9% |
| Indonesisch | 1,7% |
| Spaans | 1,3% |
| Nederlands | 0,9% |
| Hebreeuws | 0,7% |
| Pools | 0,7% |
| Chinees | 0,6% |
| Portugees | 0,6% |
| Zweeds | 0,5% |
| Grieks | 0,4% |
Een paar dingen springen eruit:
Vietnamees met 23,1% is enorm. Bijna een kwart van alle prompts is in het Vietnamees. Dit weerspiegelt de bloeiende digitale creator economie van Vietnam en de vroege adoptie van AI-tools voor contentcreatie. Vietnamees creators gebruiken AI-video voor alles, van e-commerce productvideo's tot social media-inhoud op grote schaal.
Arabisch met 11,4% maakt de MENA-regio een van de meest actieve AI-video markten. Gezien de snelle digitale transformatie die plaatsvindt in de Golfstaten en de enorme investeringen in AI-infrastructuur, klopt dit.
De lange staart is echt. Buiten de top talen is er betekenisvolle activiteit in het Russisch, Turks, Duits, Oekraïens, Indonesisch en vele anderen. AI-video is geen speeltje uit Silicon Valley — het is een wereldwijd creatief hulpmiddel.
Dit heeft enorme implicaties voor iedereen die in deze ruimte bouwt: als jouw AI-video tool alleen goed werkt met Engelse prompts, negeer je meer dan de helft van je potentiële gebruikers.
Formaatvoorkeuren: Beeldverhoudingen en Duur
Hoe mensen hun video's formatteren vertelt je veel over waar die video's zullen eindigen.
Beeldverhoudingen
| Beeldverhouding | Percentage |
|---|---|
| 16:9 (Landschap) | 52,8% |
| 9:16 (Portret/Verticaal) | 43,7% |
| 1:1 (Vierkant) | ~0% |
De verdeling tussen landschap en portret is opmerkelijk dicht — 52,8% tegen 43,7% — wat ons iets belangrijks vertelt: de strijd tussen horizontale en verticale video is in wezen een toss-up.
Landschap leidt nog steeds, waarschijnlijk aangedreven door YouTube, website-embed, presentaties en traditionele marketinginhoud. Maar verticaal is vlak achterop, aangedreven door TikTok, Instagram Reels en YouTube Shorts.
De echte schok? Vierkante video (1:1) is in wezen dood. Met ongeveer 0% maakt niemand meer vierkante video's. Het oude vierkante formaat van Instagram, ooit de standaard voor sociale media, is volledig verlaten in het AI-video tijdperk.
Videoduren
| Duur | Percentage |
|---|---|
| 12 seconden | 30,1% |
| 4 seconden | 29,2% |
| 8 seconden | 23,3% |
| 6 seconden | 6,6% |
Duurvoorkeuren onthullen een fascinerende splitsing in twee kampen:
Kamp 1: De 12-seconden crew (30,1%). Deze gebruikers willen de maximale beschikbare duur. Ze creëren narratieve inhoud, productdemonstraties en promotievideo's waarbij elke extra seconde telt. Twaalf seconden is genoeg om een mini-verhaal te vertellen: opzet, onthulling, beloning.
Kamp 2: De 4-seconden crew (29,2%). Deze gebruikers willen snelle, krachtige clips — perfect voor sociale media hooks, advertentiecreaties, of het stapelen van meerdere clips in langere bewerkingen. Vier seconden is in wezen één sterke visuele moment.
De 8-seconden middenweg (23,3%) vangt gebruikers die iets meer ademruimte willen dan 4 seconden, maar niet de volledige 12 nodig hebben. De relatief lage populariteit van 6-seconden video's (6,6%) is interessant — het lijkt erop dat mensen liever kiezen voor "kort" of "lang" dan de gulden middenweg.
De Modelrace: Veo 3.1 Rent Ermee Weg
Als er een kopstatistiek uit deze hele analyse komt, kan het deze zijn:
Veo 3.1 is verantwoordelijk voor 96,4% van alle AI-video generatie op Vivideo.
Dat is geen typfout. Google's Veo 3.1 model is de overweldigende keuze voor AI-video creatie.
| Model | % van Gebruik |
|---|---|
| Veo 3.1 | 96,4% |
| Sora 2 | 2,0% |
| HeyGen (Avatars) | 10,5% van alle bestellingen |
Opmerking: HeyGen avatar-generatie wordt apart geteld omdat het een andere functie vervult (digitale avatars versus scène generatie). Het aandeel van 10,5% overlapt met de avatarcategorie in onze gebruikscategorie-analyse.
Waarom domineert Veo 3.1 zo volledig? Gebaseerd op gebruikersfeedback en onze eigen tests:
- Visuele kwaliteit. Veo 3.1 produceert consequent de meest fotorealistische en visueel coherente output.
- Prompt-naleving. Het volgt complexe prompts nauwkeuriger — camerabewegingen, verlichtingsspecificaties, stijlrichtlijnen.
- Snelheid. Generatietijden zijn concurrerend, en de kwaliteit-tot-snelheid verhouding is de beste in zijn klasse.
- Consistentie. Minder "vreemde AI-artifacten" — minder smeltende handen, onmogelijke fysica en uncanny valley-momenten.
Sora 2 met 2,0% heeft nog steeds zijn fans, vooral voor meer artistieke en gestileerde inhoud. Maar de markt heeft gesproken, althans voor nu: wanneer mensen betrouwbare, hoogwaardige AI-video willen, kiezen ze voor Veo 3.1.
Verrassende Bevindingen
Elke goede data-analyse onthult dingen die je niet verwachtte. Hier zijn de patronen die ons deden dubbel kijken.
1. De 9% Inhoud Moderatie Rate
Ongeveer 9% van alle prompts werden gemarkeerd door inhoud moderatiesystemen als volwassen of ongepaste inhoud. Dit is eigenlijk lager dan wat velen in de industrie verwachtten — sommige schattingen plaatsen het percentage van volwassen inhoud pogingen voor AI-afbeelding generators op 15-20%.
Wat betekent dit? AI-video creatie is professioneler en doelgerichter dan AI-afbeelding generatie. Wanneer je betaalt voor video generatie (in tegenstelling tot spelen met een gratis afbeeldings tool), is de intentie serieuzer en zijn de gebruikscategorieën meer businessgericht.
2. Het Verjaardagskaart Effect
Persoonlijke begroetingen — verjaardagen, feestdagen, jubilea — kwamen veel vaker voor dan we verwachtten. Dit zijn niet de flashy gebruikscategorieën die in AI-demo reels worden getoond, maar ze vertegenwoordigen een oprecht hartverwarmende toepassing van de technologie. Mensen creëren gepersonaliseerde videoberichten die onmogelijk (of prohibitief duur) zouden zijn geweest slechts twee jaar geleden.
3. De Dood van Vierkante Video
We hebben dit al genoemd, maar het is het herhalen waard: 1:1 vierkante video is effectief op 0%. Het formaat dat Instagram domineerde van 2012-2019 is volledig verlaten. Als jouw video tool nog steeds standaard op vierkant staat, los je het probleem van gisteren op.
4. De Vietnamees Creator Economie
Met 23,1% van alle prompts is Vietnamees niet alleen vertegenwoordigd — het is de tweede meest populaire taal met een enorme marge, meer dan het dubbele van het Arabisch op de derde plaats met 11,4%. De creator economie van Vietnam bevindt zich duidelijk op een keerpunt, en AI-video tools zijn een belangrijke versneller.
5. Niemand Wil 6-Seconden Video's
Met slechts 6,6% van de bestellingen is het 6-seconden formaat de minst populaire duur. Gebruikers geven sterk de voorkeur aan ofwel kort en krachtig (4s) of langer (12s). De middenweg resoneert gewoon niet. Dit weerspiegelt wat we hebben gezien in sociale media trends — inhoud is ofwel een snelle hook of een mini-narratief, met weinig ruimte voor ertussenin.
Wat Dit Betekent voor Makers
Dus je hebt de gegevens gezien. Wat moet je er eigenlijk mee doen?
Of je nu een marketeer, contentmaker, bedrijfseigenaar bent, of gewoon iemand die nieuwsgierig is naar AI-video, hier zijn de actiegerichte inzichten:
1. Begin met Tekst-naar-Video
Als je AI-video nog niet hebt geprobeerd, tekst-naar-video is waar de actie is. Twee derde van de gebruikers begint hier, en met goede reden — je hebt geen middelen nodig, alleen ideeën. Beschrijf wat je wilt zien, en de AI bouwt het.
2. Denk in 4s of 12s
Bij het plannen van je AI-video's, denk in termen van 4-seconden punches of 12-seconden verhalen. De gegevens tonen aan dat dit de duur is die resoneert. Voor sociale media hooks en advertentiecreaties, ga met 4 seconden. Voor productdemonstraties, uitlegvideo's en narratieve inhoud, gebruik de volledige 12.
3. Kies Je Oriëntatie Bewust
Ga niet standaard naar landschap. Als je inhoud naar TikTok, Reels of Shorts gaat, ga dan 9:16 verticaal. Als het voor YouTube, je website of presentaties is, ga dan 16:9. En vergeet vierkant — de markt is verder gegaan.
4. Negeer Niet de Niet-Engelstalige Markten
Als je een bedrijf bouwt rond AI-video-inhoud, tonen de gegevens een enorme vraag vanuit Vietnamees, Arabisch, Russisch en Turks sprekende markten. Dit zijn geen nichepublieken — ze vertegenwoordigen honderden miljoenen potentiële kijkers.
5. Gebruik Afbeelding-naar-Video voor Productinhoud
Hoewel tekst-naar-video over het algemeen domineert, is afbeelding-naar-video het geheime wapen voor e-commerce en productmarketing. Upload je productfoto en voeg beweging, context en leven toe. Het is sneller dan een fotoshoot en oneindig schaalbaarder.
6. Veo 3.1 Is de Veilige Keuze
Als je je afvraagt welk model je moet gebruiken, zijn de gegevens duidelijk: 96,4% van de gebruikers kiest Veo 3.1. Het biedt de beste combinatie van kwaliteit, snelheid en prompt-naleving. Begin daar, en experimenteer met alternatieven zoals Sora 2 voor specifieke creatieve stijlen.
De conclusie: AI-video is geen noviteit meer. Met 120.000+ video's gegenereerd, prompts in 24+ talen, en gebruikscategorieën variërend van verjaardagskaarten tot vastgoed rondleidingen, is het een mainstream creatief hulpmiddel. De vraag is niet of je het moet gebruiken — het is hoe je het beter kunt gebruiken dan iedereen.
Klaar om te zien wat je kunt creëren? Probeer Vivideo gratis en voeg je prompts toe aan de volgende dataset.
Ontdek meer
Gerelateerde vergelijkingen
Probeer deze tools
Klaar om je eigen AI-video's te maken?
Probeer Vivideo vandaag gratis - geen creditcard vereist. Maak professionele video's binnen enkele minuten.
Begin gratis