Hovedpunkter
- 1Tekst-til-video dominerer med 65,7% av alle bestillinger, mens bilde-til-video står for 32,6%
- 288,2% av AI-videoene er genererte scener — ikke avatarer, ikke animasjoner, men fullt forestilte verdener fra tekst
- 3AI videoproduksjon er virkelig global: prompter kommer på 24+ språk, med engelsk på bare 47,3%
- 4Veo 3.1 står for 96,4% av modellbruken, noe som signaliserer en klar vinner i AI videomodellkappløpet
- 516:9 landskap (52,8%) overgår litt 9:16 vertikal (43,7%), noe som viser TikTok-vs-YouTube-splittelsen i sanntid
Vivideo Team
Vivideo-teamet brenner for å gjøre videoproduksjon tilgjengelig for alle gjennom AI. Vi tester og vurderer de nyeste verktøyene og deler vår kunnskap for å hjelpe deg å lykkes.
Vi Analyserte 40 000+ AI Videoprompter
Alle har meninger om AI-video. Eksperter spår hvor det er på vei. Twitter debatterer om det er "godt nok ennå." YouTube-miniatyrbilder skriker om den nyeste modelloppdateringen.
Men nesten ingen snakker om hva folk faktisk lager med disse verktøyene akkurat nå.
Så vi bestemte oss for å finne ut av det.
Vi hentet data fra over 120 000 AI-genererte videoer laget på Vivideo, klassifiserte et utvalg av 40 000+ prompter ved hjelp av GPT-4o-mini, og bearbeidet tallene. Det som kom frem er et overraskende detaljert portrett av hvordan ekte mennesker — ikke influensere, ikke forskere, men hverdagskreatører og bedrifter — bruker AI-video i 2025.
Her er alt vi fant.
Datasettet: Hvordan Vi Fikk Disse Tallene
La oss få metodologien ut av veien så du vet nøyaktig hva du ser på.
Vårt komplette datasett spenner over 120 000+ videoer generert gjennom Vivideos plattform. For den detaljerte promptanalysen tok vi et stratified utvalg av 915 prompter og kjørte dem gjennom GPT-4o-mini for klassifisering i bruksområder. De bredere statistikkene — modellbruk, bildestørrelser, varigheter, språk og inputtyper — kommer fra det komplette datasettet.
Vi plukket ikke ut det beste. Vi filtrerte ikke for "imponerende" resultater. Dette er rå, ufiltrert data fra ekte brukere som gjør ekte arbeid (og ja, noe av det er folk som lager bursdagsvideoer til moren sin — og det er flott).
Noen forbehold: klassifisering av prompter av AI er ikke perfekt. Noen prompter er tvetydige. En "produktvideo med en person som snakker" kan merkes som enten en produktdemonstrasjon eller en avatarvideo. Vi optimaliserte for den mest sannsynlige intensjonen, og sjekket hundrevis av klassifiseringer manuelt.
Med det sagt, la oss dykke inn.
Det Store Bildet: Tekst-til-Video vs. Bilde-til-Video
Det første spørsmålet vi stilte var enkelt: Hvordan starter folk videoene sine?
Er de skriver en prompt fra bunnen av? Eller laster de opp et bilde og gir det liv?
65.7% av alle videoordrer er tekst-til-video. 32.6% er bilde-til-video. De resterende ~1.7% bruker andre metoder som avatar-generering.
Dette var noe overraskende. Vi forventet at bilde-til-video skulle være høyere — tross alt, det er kanskje "enklere" siden du gir AI et visuelt utgangspunkt. Men dataene forteller en annen historie: to tredjedeler av brukerne foretrekker å beskrive visjonen sin med ord og la AI finne ut av bildene.
Hvorfor? Noen teorier:
- Lavere inngangsbarriere. Du trenger ikke å ha eller finne det riktige bildet. Du skriver bare hva du vil ha. Tekst-til-video er det ultimate blanke lerretet.
- Mer kreativ kontroll. Tekstprompter lar deg spesifisere stemning, kamerabevegelse, belysning og stil — ting som er vanskeligere å kommunisere gjennom et statisk bilde.
- "Fantasi-gapet." Mange brukere lager scener som ikke eksisterer ennå — fantasiverdener, produktkonsepter, narrative sekvenser. Du kan ikke laste opp et bilde av noe som ikke er bygget.
Når det er sagt, har bilde-til-video sin egen lojale publikum. Det er spesielt populært for e-handels produktanimasjoner, eiendomsgjennomganger (start med et bilde av eiendommen), og å gi kunstverk liv.
Hva Folk Faktisk Lager (Bruksområdeanalyse)
Dette er seksjonen vi var mest spente på. Når vi klassifiserte alle 915 utvalgsprompter etter bruksområde, dominerte en kategori absolutt.
| Bruksområde | Prosent |
|---|---|
| AI-genererte videoscener | 88.2% |
| Avatar / snakkende hode videoer | 7.1% |
| Bildeanimasjon | 4.7% |
La det synke inn. Nesten 9 av 10 AI-videoer er fullt genererte scener — ikke noens ansikt som snakker til kamera, ikke en Ken Burns-effekt på et bilde, men komplette visuelle scener fremkalt fra tekstbeskrivelser.
Dette er den virkelige historien om AI-video i 2025: folk bruker det som en visuell fantasimotor.
Hvordan De Scenene Faktisk Ser Ut
Vi gravde dypere inn i de 88.2% for å forstå hvilke typer scener folk genererer. Selv om kategoriene overlapper (en reklamevideo kan også være en narrativ), her er de primære mønstrene vi observerte:
- Reklamevideoer — Bedrifter som lager annonser, merkevarevideoer og markedsføringsinnhold. Alt fra lokale restaurantreklamer til SaaS-produktlanseringer.
- Utdanningsinnhold — Forklaringsvideoer, opplæringsprogrammer og "hvordan det fungerer" sekvenser. Lærere, kursprodusenter og bedriftsinstruktører er tidlige kraftbrukere.
- Sosiale medier innhold — Korte, slagkraftige klipp designet for TikTok, Instagram Reels og YouTube Shorts. Ofte trenddrevet og designet for maksimal scroll-stoppende effekt.
- Fortelling og narrativ — Korte filmer, musikkvideokonsepter og narrative sekvenser. Dette er hvor de mest kreative prompter bor — folk bygger hele verdener på 4-12 sekunder.
- Produktdemonstrasjoner — E-handels selgere som viser produkter i livsstilskontekster. "Vis min sneaker som blir brukt av en løper på en fjellsti ved solnedgang" — den typen ting.
- Personlige hilsener og feiringer — Bursdagsmeldinger, julekort, jubileumsoverraskelser. AI-video som det nye Hallmark-kortet.
- Eiendomsturer — Virtuelle eiendomsgjennomganger, nabolagsvisninger og arkitektoniske visualiseringer.
- E-handels produktvisninger — Produktbilder, 360° stilavsløringer, og livsstilskontekstvideor som får produkter til å se premium ut.
Avatar/snakkende hode-kategorien (7.1%) er mindre enn du kanskje forventer gitt all oppmerksomheten rundt AI-avatarer. Dette er delvis fordi avatar-generering er et spesialisert bruksområde — det krever en annen arbeidsflyt og appellerer til et smalere publikum (for det meste bedriftsopplæring og personlig salg).
Bildeanimasjon på 4.7% representerer brukere som laster opp et stillbilde og legger til bevegelse — et populært valg for å gi kunstverk, gamle bilder eller produktbilder liv.
Språket til AI-video: Et 24-språklig Fenomen
Her er noe som virkelig overrasket oss. Hvis du antok at AI videoproduksjon primært er en engelsktalende aktivitet, sier dataene noe annet.
Engelsk utgjør bare 47.3% av alle prompter. Det betyr mer enn halvparten av alle AI videoprompter på Vivideo er skrevet på ikke-engelske språk.
Dette er ikke bare "litt internasjonalt." Dette er et globalt fenomen, med betydelig adopsjon på alle kontinenter.
| Språk | % av Prompter |
|---|---|
| Engelsk | 47.3% |
| Vietnamesisk | 23.1% |
| Arabisk | 11.4% |
| Russisk | 3.2% |
| Tykkisk | 2.7% |
| Tysk | 2.2% |
| Ukrainsk | 1.9% |
| Indonesisk | 1.7% |
| Spansk | 1.3% |
| Nederlandsk | 0.9% |
| Hebraisk | 0.7% |
| Polsk | 0.7% |
| Kinesisk | 0.6% |
| Portugisisk | 0.6% |
| Svensk | 0.5% |
| Gresk | 0.4% |
Noen ting skiller seg ut:
Vietnamesisk på 23.1% er enormt. Nesten en fjerdedel av alle prompter er på vietnamesisk. Dette reflekterer Vietnams blomstrende digitale skaperøkonomi og tidlig adopsjon av AI-verktøy for innholdsproduksjon. Vietnamesiske skapere bruker AI-video for alt fra e-handels produktvideoer til sosiale medier innhold i stor skala.
Arabisk på 11.4% gjør MENA-regionen til et av de mest aktive AI video-markedene. Gitt den raske digitale transformasjonen som skjer i Gulfstatene og den massive investeringen i AI-infrastruktur, stemmer dette.
Den lange halen er reell. Utover de toppspråkene, er det betydelig aktivitet på russisk, tyrkisk, tysk, ukrainsk, indonesisk, og mange flere. AI-video er ikke et leketøy fra Silicon Valley — det er et globalt kreativt verktøy.
Dette har enorme implikasjoner for alle som bygger i dette rommet: hvis AI video-verktøyet ditt bare fungerer godt med engelske prompter, ignorerer du mer enn halvparten av potensielle brukere.
Formatpreferanser: Bildestørrelser og Varigheter
Hvordan folk formaterer videoene sine forteller deg mye om hvor disse videoene kommer til å ende opp.
Bildestørrelser
| Bildestørrelse | Prosent |
|---|---|
| 16:9 (Landskap) | 52.8% |
| 9:16 (Portrett/Vertikal) | 43.7% |
| 1:1 (Firkantet) | ~0% |
Splitten mellom landskap og portrett er bemerkelsesverdig nær — 52.8% til 43.7% — noe som forteller oss noe viktig: kampen mellom horisontal og vertikal video er i hovedsak en myntkast.
Landskap leder fortsatt, sannsynligvis drevet av YouTube, nettsideinnbygginger, presentasjoner og tradisjonelt markedsføringsinnhold. Men vertikal er rett bak, drevet av TikTok, Instagram Reels og YouTube Shorts.
Den virkelige sjokkerende? Firkantet video (1:1) er i praksis død. Med omtrent 0% lager ingen firkantede videoer lenger. Instagrams gamle firkantformat, som en gang var standard for sosiale medier, har blitt fullstendig forlatt i AI-videoens tidsalder.
Videovarigheter
| Varighet | Prosent |
|---|---|
| 12 sekunder | 30.1% |
| 4 sekunder | 29.2% |
| 8 sekunder | 23.3% |
| 6 sekunder | 6.6% |
Varighetspreferanser avslører et fascinerende to-leir split:
Leir 1: 12-sekundersgruppen (30.1%). Disse brukerne ønsker maksimal tilgjengelig varighet. De lager narrativt innhold, produktdemonstrasjoner og reklamevideoer hvor hvert ekstra sekund teller. Tolv sekunder er nok til å fortelle en mini-historie: oppsett, avsløring, utbetaling.
Leir 2: 4-sekundersgruppen (29.2%). Disse brukerne ønsker raske, slagkraftige klipp — perfekte for sosiale medier kroker, annonsekreativer, eller å stable flere klipp inn i lengre redigeringer. Fire sekunder er i hovedsak ett sterkt visuelt øyeblikk.
Den 8-sekunders mellomgrunnen (23.3%) fanger brukere som ønsker litt mer pusterom enn 4 sekunder, men ikke trenger de fulle 12. Den relativt lave populariteten til 6-sekunders videoer (6.6%) er interessant — det ser ut til at folk foretrekker å forplikte seg til enten "kort" eller "langt" i stedet for å dele forskjellen.
Modellkappløpet: Veo 3.1 Løper Av Med Det
Hvis det er en overskriftsstatistikk fra hele denne analysen, kan det være denne:
Veo 3.1 driver 96.4% av all AI videoproduksjon på Vivideo.
Det er ikke en skrivefeil. Googles Veo 3.1-modell er det overveldende valget for AI videoproduksjon.
| Modell | % av Bruk |
|---|---|
| Veo 3.1 | 96.4% |
| Sora 2 | 2.0% |
| HeyGen (Avatars) | 10.5% av alle bestillinger |
Merk: HeyGen avatar-generering telles separat da det tjener en annen funksjon (digitale avatarer vs. scene-generering). Dens 10.5% andel overlapper med avatar-kategorien i vår bruksområdeanalyse.
Hvorfor dominerer Veo 3.1 så fullstendig? Basert på tilbakemeldinger fra brukere og vår egen testing:
- Visuell kvalitet. Veo 3.1 produserer konsekvent det mest fotorealistiske og visuelt sammenhengende resultatet.
- Prompt-etterlevelse. Den følger komplekse prompter mer trofast — kamerabevegelser, belysningsspesifikasjoner, stilretninger.
- Hastighet. Genereringstider er konkurransedyktige, og kvalitet-til-hastighet-forholdet er best-i-klassen.
- Konsistens. Mindre "merkelige AI artefakter" — færre smeltende hender, umulig fysikk, og uncanny valley-øyeblikk.
Sora 2 på 2.0% har fortsatt sine fans, spesielt for mer kunstnerisk og stilisert innhold. Men markedet har talt, i det minste for nå: når folk ønsker pålitelig, høy-kvalitets AI-video, velger de Veo 3.1.
Overraskende Funn
Hver god dataanalyse avdekker ting du ikke forventet. Her er mønstrene som fikk oss til å se to ganger.
1. 9% Innholdsmoderering Rate
Omtrent 9% av alle prompter ble flagget av innholdsmoderering systemer som voksen eller upassende innhold. Dette er faktisk lavere enn hva mange i bransjen forventet — noen estimater setter forsøksraten for vokseninnhold for AI-bildegeneratorer til 15-20%.
Hva betyr dette? AI videoproduksjon er mer profesjonell og målrettet enn AI bildeproduksjon. Når du betaler for videoproduksjon (i motsetning til å leke med et gratis bildeverktøy), er intensjonen mer seriøs og bruksområdene er mer forretningsorienterte.
2. Bursdagskort Effekten
Personlige hilsener — bursdager, høytider, jubileer — dukket opp langt mer enn vi forventet. Dette er ikke de flashy bruksområdene som blir vist i AI-demoer, men de representerer en genuint hjertevarmende anvendelse av teknologien. Folk lager personlige videomeldinger som ville vært umulige (eller prohibitively dyre) for bare to år siden.
3. Døden av Firkantet Video
Vi har allerede nevnt dette, men det er verdt å gjenta: 1:1 firkantet video er effektivt på 0%. Formatet som dominerte Instagram fra 2012-2019 har blitt fullstendig forlatt. Hvis videoverktøyet ditt fortsatt standardiserer til firkant, løser du gårsdagens problem.
4. Den Vietnamesiske Skaperøkonomien
Med 23.1% av alle prompter, er vietnamesisk ikke bare representert — det er det andre mest populære språket med en massiv margin, mer enn dobler tredjeplassen arabisk på 11.4%. Vietnams skaperøkonomi er tydelig på et vendepunkt, og AI video-verktøy er en nøkkelakselerator.
5. Ingen Vil Ha 6-Sekunders Videoer
Med bare 6.6% av bestillingene, er 6-sekunders formatet den minst populære varigheten. Brukere foretrekker sterkt enten kort-og-slagkraftig (4s) eller lengre form (12s). Mellomgrunnen resonnerer bare ikke. Dette speiler det vi har sett i sosiale medier trender — innhold er enten en rask krok eller en mini-narrativ, med lite rom for mellomting.
Hva Dette Betyr for Skapere
Så du har sett dataene. Hva bør du faktisk gjøre med det?
Enten du er en markedsfører, innholdsskaper, bedriftseier, eller bare noen som er nysgjerrig på AI-video, her er de handlingsbare konklusjonene:
1. Start med Tekst-til-Video
Hvis du ikke har prøvd AI-video ennå, tekst-til-video er hvor handlingen skjer. To tredjedeler av brukerne starter her, og med god grunn — du trenger ikke noen eiendeler, bare ideer. Beskriv hva du vil se, og AI bygger det.
2. Tenk i 4s eller 12s
Når du planlegger AI-videoene dine, tenk i termer av 4-sekunders slag eller 12-sekunders historier. Dataene viser at dette er varighetene som resonnerer. For sosiale medier kroker og annonsekreativer, gå med 4 sekunder. For produktdemonstrasjoner, forklaringer, og narrativt innhold, bruk de fulle 12.
3. Velg Din Orientering Bevisst
Ikke standardiser til landskap. Hvis innholdet ditt skal til TikTok, Reels, eller Shorts, gå 9:16 vertikalt. Hvis det er for YouTube, nettsiden din, eller presentasjoner, gå 16:9. Og glem firkantet — markedet har gått videre.
4. Ikke Sov På Ikke-Engelske Markeder
Hvis du bygger en virksomhet rundt AI video-innhold, viser dataene massiv etterspørsel fra vietnamesiske, arabiske, russiske, og tyrkisk talende markeder. Dette er ikke nisje-publikum — de representerer hundrevis av millioner av potensielle seere.
5. Bruk Bilde-til-Video for Produktinnhold
Mens tekst-til-video dominerer totalt, er bilde-til-video det hemmelige våpenet for e-handel og produktmarkedsføring. Last opp produktbildet ditt og legg til bevegelse, kontekst, og liv. Det er raskere enn en fotoshoot og uendelig mer skalerbart.
6. Veo 3.1 Er Det Sikker Valget
Hvis du lurer på hvilken modell du skal bruke, er dataene klare: 96.4% av brukerne velger Veo 3.1. Det tilbyr den beste kombinasjonen av kvalitet, hastighet, og prompt-etterlevelse. Start der, og eksperimenter med alternativer som Sora 2 for spesifikke kreative stiler.
Konklusjonen: AI-video er ikke lenger en nyhet. Med 120 000+ videoer generert, prompter på 24+ språk, og bruksområder som spenner fra bursdagskort til eiendomsturer, er det et mainstream kreativt verktøy. Spørsmålet er ikke om å bruke det — men hvordan å bruke det bedre enn alle andre.
Klar til å se hva du kan lage? Prøv Vivideo gratis og legg til prompene dine i neste datasett.
Utforsk mer
Relaterte sammenligninger
Prøv disse verktøyene
Klar til å lage dine egne AI-videoer?
Prøv Vivideo gratis i dag - ingen kredittkort kreves. Lag profesjonelle videoer på få minutter.
Start gratis