Pramonė

Išnagrinėjome 40,000+ AI Vaizdo Paskatų — Štai Ką Žmonės Iš Tikrųjų Kuria

2026 m. vasario 23 d.
14 min skaitymo
Dalintis:
Išnagrinėjome 40,000+ AI Vaizdo Paskatų — Štai Ką Žmonės Iš Tikrųjų Kuria

Pagrindinės išvados

  • 1Teksto į vaizdo įrašą dominavimas sudaro 65.7% visų užsakymų, o vaizdo įrašas iš vaizdų sudaro 32.6%
  • 288.2% AI vaizdo įrašų yra generuoti scenos — ne avatarai, ne animacijos, o visiškai įsivaizduoti pasauliai iš teksto
  • 3AI vaizdo kūrimas yra tikrai globalus: paskatos pateikiamos 24+ kalbomis, o anglų kalba sudaro tik 47.3%
  • 4Veo 3.1 užima 96.4% modelio naudojimo, signalizuodamas aiškų laimėtoją AI vaizdo modelių lenktynėse
  • 516:9 kraštovaizdis (52.8%) šiek tiek lenkia 9:16 vertikalų (43.7%), rodydamas TikTok ir YouTube skirtumą realiu laiku
Parašė

Vivideo komanda

Vivideo komanda siekia, kad AI vaizdo kūrimas būtų prieinamas visiems. Mes išbandome ir apžvelgiame naujausius įrankius bei dalijamės savo žiniomis, kad padėtume jums pasiekti sėkmę.

Mes analizavome 40,000+ AI vaizdo užklausų

Visi turi nuomonių apie AI vaizdo įrašus. Ekspertai spėja, kur tai juda. Twitter diskutuoja, ar tai "pakankamai gerai". YouTube miniatiūros šaukia apie naujausią modelio atnaujinimą.

Bet beveik niekas nekalba apie tai, ką žmonės iš tikrųjų kuria su šiais įrankiais dabar.

Todėl nusprendėme sužinoti.

Mes surinkome duomenis iš daugiau nei 120,000 AI sugeneruotų vaizdo įrašų, sukurtų Vivideo, klasifikavome 40,000+ užklausų pavyzdį naudodami GPT-4o-mini ir apdorojome skaičius. Tai, kas išryškėjo, yra stebėtinai išsamus tikrų žmonių — ne įtakotojų, ne tyrėjų, o kasdienių kūrėjų ir verslų — naudojimo AI vaizdo įrašams 2025 metais portretas.

Štai viskas, ką radome.

Duomenų analizės skydelis, rodantis spalvingus grafikus ir diagramas

Duomenų rinkinys: Kaip gavome šiuos skaičius

Pirmiausia išsiaiškinkime metodologiją, kad žinotumėte, ką tiksliai žiūrite.

Mūsų pilnas duomenų rinkinys apima 120,000+ vaizdo įrašų, sukurtų per Vivideo platformą. Išsamiai analizuojant užklausas, paėmėme stratifikuotą 915 užklausų pavyzdį ir pervedėme jas per GPT-4o-mini klasifikavimui į naudojimo atvejų kategorijas. Platesnė statistika — modelio naudojimas, vaizdo formatų santykiai, trukmės, kalbos ir įvesties tipai — gaunami iš viso duomenų rinkinio.

Mes nesirinkome geriausių pavyzdžių. Mes nefiltrovojome "įspūdingų" rezultatų. Tai yra žali, nefiltruoti duomenys iš tikrų vartotojų, dirbančių tikrą darbą (ir taip, kai kurie iš jų yra žmonės, kuriantys gimtadienio vaizdo įrašus savo mamai — ir tai puiku).

Keli įspėjimai: AI klasifikacija nėra tobula. Kai kurios užklausos yra dviprasmiškos. "Produkto vaizdo įrašas su kalbančiu žmogumi" gali būti pažymėtas kaip produkto demonstracija arba avataro vaizdo įrašas. Mes optimizavome pagal labiausiai tikėtiną ketinimą ir rankiniu būdu patikrinome šimtus klasifikacijų.

Turint tai omenyje, panagrinėkime.

Didysis vaizdas: Tekstas į vaizdo įrašą vs. Vaizdas į vaizdo įrašą

Pirmas klausimas, kurį uždavėme, buvo paprastas: Kaip žmonės pradeda savo vaizdo įrašus?

Ar jie rašo užklausą nuo nulio? Arba įkelia vaizdą ir prikelia jį gyvybei?

65.7% visų vaizdo įrašų užsakymų yra tekstas į vaizdo įrašą. 32.6% yra vaizdas į vaizdo įrašą. Likę ~1.7% naudoja kitas metodikas, tokias kaip avatarų generavimas.

Tai buvo šiek tiek nustebinanti. Tikėjomės, kad vaizdas į vaizdo įrašą bus populiaresnis — galų gale, tai yra "lengviau", nes jūs suteikiate AI vizualinį pradžios tašką. Bet duomenys pasakoja kitokią istoriją: du trečdaliai vartotojų renkasi apibūdinti savo viziją žodžiais ir leidžia AI išsiaiškinti vizualus.

Kodėl? Keletas teorijų:

  • Mažesnė įėjimo riba. Jums nereikia turėti ar rasti tinkamo vaizdo. Jūs tiesiog rašote, ko norite. Tekstas į vaizdo įrašą yra galutinis tuščias drobė.
  • Didesnė kūrybinė kontrolė. Teksto užklausos leidžia jums nurodyti nuotaiką, kameros judėjimą, apšvietimą ir stilių — dalykus, kuriuos sunkiau perteikti per statišką vaizdą.
  • "Vaizduotės spraga." Daugelis vartotojų kuria scenas, kurių dar nėra — fantazijos pasaulius, produktų koncepcijas, naratyvines sekas. Jūs negalite įkelti nuotraukos to, kas dar nebuvo pastatyta.

Vis dėlto, vaizdas į vaizdo įrašą turi savo ištikimą auditoriją. Jis ypač populiarus e. prekybos produktų animacijoms, nekilnojamojo turto peržiūroms (pradėkite nuo nuotraukos apie turtą) ir meno kūrinių prikelimui gyvybei.

Profesionali vaizdo gamybos įranga su kamera ir kūrybiniu apšvietimu

Ką žmonės iš tikrųjų kuria (Naudojimo atvejų analizė)

Ši dalis mus labiausiai džiugino. Kai klasifikavome visus 915 pavyzdinių užklausų pagal naudojimo atvejį, viena kategorija visiškai dominuoja.

Naudojimo atvejisProcentas
AI sugeneruoti vaizdo scenos88.2%
Avatarai / kalbantys vaizdai7.1%
Vaizdo animacija4.7%

Leiskite tai suprasti. Beveik 9 iš 10 AI vaizdo įrašų yra visiškai sugeneruotos scenos — ne kieno nors veidas kalbantis į kamerą, ne Ken Burns efektas nuotraukoje, o visiškai vizualios scenos, sukurtos iš teksto aprašymų.

Tai tikroji AI vaizdo istorija 2025 metais: žmonės naudoja jį kaip vizualinės vaizduotės variklį.

Ką tos scenos iš tikrųjų atrodo

Mes gilinamės į 88.2%, kad suprastume, kokias scenas žmonės generuoja. Nors kategorijos persidengia (reklaminis vaizdo įrašas taip pat gali būti naratyvinis), čia yra pagrindiniai modeliai, kuriuos stebėjome:

  • Reklaminiai vaizdo įrašai — Įmonės kuria reklaminius, prekės ženklų vaizdo įrašus ir rinkodaros turinį. Viskas nuo vietinių restoranų reklamų iki SaaS produktų pristatymų.
  • Švietimo turinys — Aiškinamieji vaizdo įrašai, pamokos ir "kaip tai veikia" sekos. Mokytojai, kursų kūrėjai ir įmonių treneriai yra ankstyvieji galingi naudotojai.
  • Socialinės žiniasklaidos turinys — Trumpi, įtaigūs klipai, skirti TikTok, Instagram Reels ir YouTube Shorts. Dažnai tendencijų varomi ir sukurti maksimaliam sustabdymo poveikiui.
  • Pasakojimas ir naratyvas — Trumpi filmai, muzikinių vaizdo įrašų koncepcijos ir naratyvinės sekos. Čia gyvena kūrybiškiausi užklausos — žmonės kuria visą pasaulį per 4-12 sekundžių.
  • Produkto demonstracijos — E-komercijos pardavėjai demonstruoja produktus gyvenimo kontekstuose. "Parodykite mano sportinius batelius, kuriuos dėvi bėgikas kalnų takelyje saulėlydyje" — tokio tipo dalykai.
  • Asmeniniai sveikinimai ir šventės — Gimimo dienos žinutės, šventiniai atvirukai, sukaktuvių staigmenos. AI vaizdo įrašas kaip naujas Hallmark atvirukas.
  • Nekilnojamojo turto turai — Virtualūs nekilnojamojo turto apžvalgos, kaimynystės pristatymai ir architektūrinės vizualizacijos.
  • E-komercijos produktų pristatymai — Produktų grožio kadrai, 360° stiliaus atskleidimai ir gyvenimo konteksto vaizdo įrašai, kurie padaro produktus atrodančius prabangiai.

Avatarų/kalbantys vaizdai kategorija (7.1%) yra mažesnė, nei galite tikėtis, atsižvelgiant į visą triukšmą apie AI avatarus. Tai iš dalies todėl, kad avatarų generavimas yra specializuotas naudojimo atvejis — jis reikalauja kito darbo proceso ir patraukia siauresnę auditoriją (daugiausia įmonių mokymams ir personalizuotam pardavimų pasiekimui).

Vaizdo animacija, sudaranti 4.7%, atspindi vartotojus, kurie įkelia statinę nuotrauką ir prideda judesį — populiarus pasirinkimas, norint prikelti meno kūrinius, senas nuotraukas ar produktų vaizdus.

AI Vaizdo Kalba: 24 Kalbų Fenomenas

Štai kažkas, kas mus tikrai nustebino. Jei manėte, kad AI vaizdo kūrimas yra daugiausia anglų kalbos veikla, duomenys sako kitaip.

Anglų kalba sudaro tik 47.3% visų užklausų. Tai reiškia kad daugiau nei pusė visų AI vaizdo užklausų Vivideo yra parašytos ne anglų kalba.

Tai nėra tik "šiek tiek tarptautinis." Tai pasaulinis fenomenas, turintis reikšmingą priėmimą kiekviename žemyne.

Pasauliniai tinklo ryšiai iliustruoti pasaulio žemėlapyje
Kalba% užklausų
Anglų47.3%
Vietnamiečių23.1%
Arabų11.4%
Rusų3.2%
Turkų2.7%
Vokiečių2.2%
Ukrainiečių1.9%
Indoneziečių1.7%
Ispanų1.3%
Nyderlandų0.9%
Hebrajų0.7%
Lenkų0.7%
Kinų0.6%
Portugalų0.6%
Švedų0.5%
Graikų0.4%

Keli dalykai išsiskiria:

Vietnamiečių kalba 23.1% yra milžiniška. Beveik ketvirtadalis visų užklausų yra vietnamiečių kalba. Tai atspindi Vietnamo klestinčią skaitmeninę kūrėjų ekonomiką ir ankstyvą AI įrankių priėmimą turinio kūrimui. Vietnamiečių kūrėjai naudoja AI vaizdo įrašus viskam, pradedant e. prekybos produktų vaizdo įrašais ir baigiant socialinės žiniasklaidos turiniu dideliu mastu.

Arabų kalba 11.4% daro MENA regioną vienu aktyviausių AI vaizdo rinkų. Atsižvelgiant į greitą skaitmeninę transformaciją, vykstančią Persijos įlankos valstybėse, ir didžiules investicijas į AI infrastruktūrą, tai yra logiška.

Ilgas uodegos efektas yra realus. Be pagrindinių kalbų, yra reikšminga veikla rusų, turkų, vokiečių, ukrainiečių, indoneziečių ir daugelyje kitų kalbų. AI vaizdo įrašai nėra Silicio slėnio žaislas — tai pasaulinis kūrybinis įrankis.

Tai turi didžiulį poveikį visiems, kurie dirba šioje srityje: jei jūsų AI vaizdo įrankis gerai veikia tik su anglų kalbos užklausomis, jūs ignoruojate daugiau nei pusę savo potencialių vartotojų.

Formatų pageidavimai: aspektų santykiai ir trukmės

Kaip žmonės formatuoja savo vaizdo įrašus, daug pasako apie tai, kur tie vaizdo įrašai galiausiai atsidurs.

Aspektų santykiai

Aspektų santykisProcentas
16:9 (Peizažas)52.8%
9:16 (Portretas/Vertikalus)43.7%
1:1 (Kvadratas)~0%

Peizažo ir portreto pasiskirstymas yra stebėtinai artimas — 52.8% prieš 43.7% — kas mums sako kažką svarbaus: kova tarp horizontalaus ir vertikalaus vaizdo įrašo iš esmės yra monetos metimas.

Peizažas vis dar pirmauja, greičiausiai dėl YouTube, svetainių įterpimų, pristatymų ir tradicinio rinkodaros turinio. Tačiau vertikalus vaizdas yra ant kulnų, kurį skatina TikTok, Instagram Reels ir YouTube Shorts.

Reali staigmena? Kvadratinis vaizdo įrašas (1:1) iš esmės yra miręs. Su maždaug 0%, niekas nebekuria kvadratinių vaizdo įrašų. Instagram'o senasis kvadratinis formatas, kadaise buvęs numatytasis socialiniuose tinkluose, buvo visiškai apleistas AI vaizdo įrašų eroje.

Socialinės žiniasklaidos turinio kūrimas naudojant kelis įrenginius, rodančius skirtingus aspektų santykius

Vaizdo įrašų trukmės

TrukmėProcentas
12 sekundžių30.1%
4 sekundės29.2%
8 sekundės23.3%
6 sekundžių6.6%

Trukmės pageidavimai atskleidžia įdomų dviejų stovyklų pasiskirstymą:

Stovykla 1: 12 sekundžių komanda (30.1%). Šie vartotojai nori maksimalaus galimo trukmės. Jie kuria naratyvinį turinį, produktų demonstracijas ir reklamos vaizdo įrašus, kur kiekviena papildoma sekundė yra svarbi. Dvylika sekundžių yra pakankamai, kad papasakotumėte mini istoriją: paruošimas, atskleidimas, apdovanojimas.

Stovykla 2: 4 sekundžių komanda (29.2%). Šie vartotojai nori greitų, smagių klipų — puikiai tinka socialinės žiniasklaidos kabliams, reklamos kūriniams ar kelių klipų sujungimui į ilgesnius redagavimus. Keturių sekundžių trukmė iš esmės yra vienas stiprus vizualinis momentas.

8 sekundžių vidurio pozicija (23.3%) apima vartotojus, kurie nori šiek tiek daugiau laiko nei 4 sekundės, bet nereikia visų 12. Santykinai mažas 6 sekundžių vaizdo įrašų populiarumas (6.6%) yra įdomus — atrodo, kad žmonės mieliau renkasi arba "trumpus", arba "ilgus", o ne dalijasi skirtumu.

Modelių lenktynės: Veo 3.1 pabėgo su ja

Jei yra viena pagrindinė statistika iš visos šios analizės, tai gali būti ši:

Veo 3.1 sudaro 96.4% visos AI vaizdo generacijos Vivideo.

Tai ne klaida. „Google“ Veo 3.1 modelis yra dominuojantis pasirinkimas AI vaizdo kūrimui.

Modelis% Naudojimo
Veo 3.196.4%
Sora 22.0%
HeyGen (Avatarai)10.5% visų užsakymų

Pastaba: HeyGen avatarų generavimas skaičiuojamas atskirai, nes jis atlieka kitą funkciją (skaitmeniniai avatarai vs. scenų generavimas). Jo 10.5% dalis sutampa su avatarų kategorija mūsų naudojimo atvejų analizėje.

Kodėl Veo 3.1 taip visiškai dominuoja? Remiantis vartotojų atsiliepimais ir mūsų pačių testavimu:

  • Vizualinė kokybė. Veo 3.1 nuolat generuoja labiausiai fotorealistinį ir vizualiai nuoseklų rezultatą.
  • Užklausų laikymasis. Jis tiksliau laikosi sudėtingų užklausų — kameros judesiai, apšvietimo specifikacijos, stiliaus nurodymai.
  • Greitis. Generavimo laikai yra konkurencingi, o kokybės ir greičio santykis yra geriausias klasėje.
  • Nuoseklumas. Mažiau „keistų AI artefaktų“ — mažiau tirpstančių rankų, neįmanomos fizikos ir keistų akimirkų.

Sora 2 su 2.0% vis dar turi savo gerbėjų, ypač meniniam ir stilizuotam turiniui. Tačiau rinka kalba, bent jau šiuo metu: kai žmonės nori patikimo, aukštos kokybės AI vaizdo, jie renkasi Veo 3.1.

Dirbtinio intelekto vizualizacija su neuroninių tinklų raštais

Netikėti atradimai

Kiekviena gera duomenų analizė atskleidžia dalykus, kurių nesitikėjote. Štai modeliai, kurie privertė mus sustoti ir pagalvoti.

1. 9% turinio moderavimo rodiklis

Apie 9% visų užklausų buvo pažymėtos turinio moderavimo sistemų kaip suaugusiųjų ar netinkamas turinys. Tai iš tikrųjų yra mažiau nei daugelis pramonės atstovų tikėjosi — kai kurie vertinimai rodo, kad suaugusiųjų turinio bandymų rodiklis AI vaizdų generatoriams yra 15-20%.

Kas tai reiškia? AI vaizdo kūrimas yra labiau profesionalus ir tikslingas nei AI vaizdų generavimas. Kai mokate už vaizdo generavimą (o ne žaidžiate su nemokamu vaizdų įrankiu), ketinimas yra rimtesnis, o naudojimo atvejai labiau orientuoti į verslą.

2. Gimimo dienos atviruko efektas

Asmeniniai sveikinimai — gimtadieniai, šventės, sukaktys — pasirodė daug dažniau, nei tikėjomės. Tai nėra blizgantys naudojimo atvejai, kurie pateikiami AI demonstraciniuose vaizdo įrašuose, tačiau jie atspindi tikrai širdį šildantį technologijos taikymą. Žmonės kuria suasmenintus vaizdo pranešimus, kurie būtų buvę neįmanomi (arba nepaprastai brangūs) prieš dvejus metus.

3. Kvadratinio vaizdo mirtis

Mes jau tai paminėjome, tačiau verta pakartoti: 1:1 kvadratinis vaizdas yra efektyviai 0%. Formatą, kuris dominuoja Instagram nuo 2012 iki 2019 metų, visiškai apleido. Jei jūsų vaizdo įrankis vis dar numato kvadratinį formatą, jūs sprendžiate vakar dienos problemą.

4. Vietnamo kūrėjų ekonomika

Su 23.1% visų užklausų, vietnamiečių kalba ne tik atstovaujama — ji yra antroji populiariausia kalba didžiuliu atstumu, daugiau nei dvigubai viršijanti trečioje vietoje esančią arabų kalbą su 11.4%. Vietnamo kūrėjų ekonomika akivaizdžiai yra lūžio taške, o AI vaizdo įrankiai yra pagrindinis pagreitintojas.

5. Niekas nenori 6 sekundžių vaizdo įrašų

Su tik 6.6% užsakymų, 6 sekundžių formatas yra mažiausiai populiarus trukmė. Vartotojai stipriai teikia pirmenybę arba trumpiems ir įtaigiems (4s), arba ilgesniems (12s). Vidurio kelias tiesiog nesukelia rezonanso. Tai atspindi tai, ką matėme socialinės žiniasklaidos tendencijose — turinys yra arba greitas kabliukas, arba mini naratyvas, su mažai vietos tarp jų.

Ką tai reiškia kūrėjams

Taigi, jūs matėte duomenis. Ką turėtumėte daryti su jais?

Nepriklausomai nuo to, ar esate rinkodaros specialistas, turinio kūrėjas, verslo savininkas, ar tiesiog kažkas, kas domisi AI vaizdo įrašais, štai keletas veiksmingų išvadų:

1. Pradėkite nuo Teksto į Vaizdo

Jei dar nesate išbandę AI vaizdo, teksto į vaizdo yra ta vieta, kur vyksta veiksmas. Du trečdaliai vartotojų pradeda čia, ir tam yra geras pagrindas — jums nereikia jokių išteklių, tik idėjų. Apibūdinkite, ką norite pamatyti, ir AI tai sukurs.

2. Galvokite 4 ar 12 sekundžių

Planuodami savo AI vaizdo įrašus, galvokite 4 sekundžių smūgiais arba 12 sekundžių istorijomis. Duomenys rodo, kad tai yra trukmės, kurios rezonuoja. Socialinės žiniasklaidos kabliams ir reklamos kūriniams pasirinkite 4 sekundes. Produktų demonstracijoms, paaiškinimams ir naratyviniam turiniui naudokite visą 12.

3. Pasirinkite Orientaciją Apgalvotai

Nepriklausykite kraštovaizdžiui. Jei jūsų turinys yra skirtas TikTok, Reels ar Shorts, pasirinkite 9:16 vertikaliai. Jei tai skirta YouTube, jūsų svetainei ar pristatymams, pasirinkite 16:9. Ir pamirškite kvadratą — rinka jau pasikeitė.

4. Neignoruokite Neangliškų Rinkų

Jei kuriate verslą aplink AI vaizdo turinį, duomenys rodo didžiulę paklausą iš vietnamiečių, arabų, rusų ir turkų kalbomis kalbančių rinkų. Tai nėra nišinės auditorijos — jos atstovauja šimtus milijonų potencialių žiūrovų.

5. Naudokite Vaizdo į Vaizdo Produktų Turiniui

Nors teksto į vaizdo dominuoja bendrai, vaizdo į vaizdo yra slapta ginklas e. prekybai ir produktų rinkodarai. Įkelkite savo produkto nuotrauką ir pridėkite judesį, kontekstą ir gyvybę. Tai greičiau nei fotosesija ir neribotai labiau skalaujama.

Kūrybinė komanda bendradarbiauja kuriant turinio strategiją su nešiojamaisiais kompiuteriais ir užrašais

6. Veo 3.1 yra Saugus Pasirinkimas

Jei klausiate, kurį modelį naudoti, duomenys yra aiškūs: 96.4% vartotojų pasirenka Veo 3.1. Jis siūlo geriausią kokybės, greičio ir užklausų laikymosi derinį. Pradėkite nuo to ir eksperimentuokite su alternatyvomis, tokiomis kaip Sora 2, specifiniams kūrybiniams stiliams.

Galutinė išvada: AI vaizdo įrašai nebėra naujovė. Su daugiau nei 120,000 sukurtų vaizdo įrašų, užklausomis 24+ kalbomis ir naudojimo atvejais, apimančiais gimtadienio atvirukus ir nekilnojamojo turto turus, tai yra pagrindinis kūrybinis įrankis. Klausimas nėra, ar jį naudoti — klausimas yra, kaip jį naudoti geriau nei visi kiti.

Pasiruošę pamatyti, ką galite sukurti? Išbandykite Vivideo nemokamai ir pridėkite savo užklausas prie kito duomenų rinkinio.

Atraskite daugiau

Išbandykite šiuos įrankius

Pasiruošę kurti savo AI vaizdo įrašus?

Išbandykite Vivideo nemokamai jau šiandien – kreditinė kortelė nereikalinga. Sukurkite profesionalius vaizdo įrašus per kelias minutes.

Pradėti kurti nemokamai