Hlavní poznatky
- 1Text-to-video dominuje s 65,7% všech objednávek, zatímco image-to-video tvoří 32,6%
- 288,2% AI videí jsou generované scény — žádní avatáři, žádné animace, ale plně vymyšlené světy z textu
- 3Vytváření AI videí je skutečně globální: prompty přicházejí ve více než 24 jazycích, přičemž angličtina tvoří pouze 47,3%
- 4Veo 3.1 ovládá 96,4% využití modelu, což signalizuje jasného vítěze v závodě AI video modelů
- 516:9 krajina (52,8%) mírně převyšuje 9:16 vertikální (43,7%), což ukazuje na rozdělení TikTok vs. YouTube v reálném čase
Tým Vivideo
Tým Vivideo se nadšeně snaží zpřístupnit tvorbu videí všem prostřednictvím AI. Testujeme a hodnotíme nejnovější nástroje a sdílíme naše znalosti, abychom vám pomohli uspět.
Analyzovali jsme více než 40 000 AI video podnětů
Každý má názor na AI video. Odborníci předpovídají, kam to směřuje. Twitter debatuje, zda je to "už dost dobré." Miniatury na YouTube křičí o nejnovější aktualizaci modelu.
Ale téměř nikdo nemluví o tom, co lidé skutečně vytvářejí s těmito nástroji právě teď.
Takže jsme se rozhodli to zjistit.
Shromáždili jsme data z více než 120 000 AI generovaných videí vytvořených na Vivideo, klasifikovali vzorek 40 000+ podnětů pomocí GPT-4o-mini a zpracovali čísla. Co se objevilo, je překvapivě podrobný portrét toho, jak skuteční lidé — ne influenceři, ne výzkumníci, ale běžní tvůrci a podniky — používají AI video v roce 2025.
Zde je vše, co jsme zjistili.
Dataset: Jak jsme získali tato čísla
Pojďme se zbavit metodologie, abyste přesně věděli, na co se díváte.
Náš kompletní dataset zahrnuje 120 000+ videí generovaných prostřednictvím platformy Vivideo. Pro podrobnou analýzu podnětů jsme vzali stratifikovaný vzorek 915 podnětů a prošli je GPT-4o-mini pro klasifikaci do kategorií použití. Širší statistiky — používání modelu, poměry stran, délky, jazyky a typy vstupů — pocházejí z kompletního datasetu.
Neprováděli jsme selekci. Neprováděli jsme filtraci pro "působivé" výstupy. Toto jsou surová, nefiltrovaná data od skutečných uživatelů, kteří dělají skutečnou práci (a ano, některé z nich jsou lidé, kteří vytvářejí narozeninová videa pro svou mámu — a to je skvělé).
Pár upozornění: klasifikace podnětů pomocí AI není dokonalá. Některé podněty jsou nejednoznačné. "Produktové video s osobou, která mluví" může být označeno buď jako produktová ukázka, nebo video s avatar. Optimalizovali jsme pro nejpravděpodobnější záměr a ručně zkontrolovali stovky klasifikací.
To bylo řečeno, pojďme se ponořit.
Velký obrázek: Text-to-Video vs. Image-to-Video
První otázka, kterou jsme položili, byla jednoduchá: Jak lidé začínají svá videa?
Píšou podnět od nuly? Nebo nahrávají obrázek a oživují ho?
65.7% všech video objednávek je text-to-video. 32.6% je image-to-video. Zbývajících ~1.7% používá jiné metody, jako je generování avatarů.
To bylo poněkud překvapující. Očekávali jsme, že image-to-video bude vyšší — koneckonců, je to "snadnější", protože dáváte AI vizuální výchozí bod. Ale data říkají jiný příběh: dvě třetiny uživatelů dávají přednost popisu své vize slovy a nechávají AI vymyslet vizuály.
Proč? Několik teorií:
- Nižší překážka pro vstup. Nemusíte mít nebo hledat správný obrázek. Stačí napsat, co chcete. Text-to-video je konečná prázdná plátna.
- Více kreativní kontroly. Textové podněty vám umožňují specifikovat náladu, pohyb kamery, osvětlení a styl — věci, které jsou obtížnější komunikovat prostřednictvím statického obrázku.
- "Mezera v představivosti." Mnoho uživatelů vytváří scény, které ještě neexistují — fantastické světy, produktové koncepty, narativní sekvence. Nemůžete nahrát fotografii něčeho, co nebylo postaveno.
To však neznamená, že image-to-video nemá své vlastní věrné publikum. Je obzvlášť populární pro animace produktů v e-commerce, procházky nemovitostmi (začíná se fotografií nemovitosti) a oživování uměleckých děl.
Co lidé skutečně vytvářejí (rozpis použití)
Toto je sekce, na kterou jsme se nejvíce těšili. Když jsme klasifikovali všech 915 vzorových podnětů podle použití, jedna kategorie naprosto dominovala.
| Použití | Procento |
|---|---|
| AI generované video scény | 88.2% |
| Avatar / videa s mluvící hlavou | 7.1% |
| Animace obrázků | 4.7% |
Nechte to na chvíli vstřebat. Téměř 9 z 10 AI videí jsou plně generované scény — ne tvář někoho, kdo mluví do kamery, ne efekt Ken Burnse na fotografii, ale kompletní vizuální scény vyvolané z textových popisů.
Toto je skutečný příběh AI videa v roce 2025: lidé ho používají jako motor vizuální představivosti.
Jak ty scény skutečně vypadají
Prozkoumali jsme hlouběji 88.2%, abychom pochopili, jaké druhy scén lidé generují. I když se kategorie překrývají (propagační video může být také narativní), zde jsou hlavní vzory, které jsme pozorovali:
- Propagační videa — Firmy vytvářející reklamy, videa značek a marketingový obsah. Všechno od propagačních videí místních restaurací po uvedení produktů SaaS.
- Vzdělávací obsah — Vysvětlující videa, tutoriály a sekvence "jak to funguje". Učitelé, tvůrci kurzů a firemní školitelé jsou raní silní uživatelé.
- Obsah pro sociální média — Krátké, úderné klipy určené pro TikTok, Instagram Reels a YouTube Shorts. Často trendově orientované a navržené pro maximální zastavení scrollování.
- Vyprávění a narativ — Krátké filmy, koncepty hudebních videí a narativní sekvence. Tady žijí nejvíce kreativní podněty — lidé budují celé světy za 4-12 sekund.
- Produktové demonstrace — Prodejci e-commerce ukazující produkty v životních kontextech. "Ukažte mi tenisky, které nosí běžec na horské stezce při západu slunce" — něco takového.
- Osobní pozdravy a oslavy — Narozeninové zprávy, přání k svátkům, překvapení k výročí. AI video jako nová pohlednice Hallmark.
- Prohlídky nemovitostí — Virtuální procházky nemovitostmi, ukázky sousedství a architektonické vizualizace.
- Prezentace produktů v e-commerce — Krásné záběry produktů, 360° stylové odhalení a videa v životním kontextu, která dělají produkty vypadat prémiově.
Kategorie avatar/mluvící hlava (7.1%) je menší, než byste očekávali vzhledem k veškerému povyku kolem AI avatarů. To je částečně proto, že generování avatarů je specializovaný případ použití — vyžaduje jiný pracovní postup a oslovuje užší publikum (většinou firemní školení a personalizované prodejní oslovení).
Animace obrázků na 4.7% představuje uživatele, kteří nahrávají statickou fotografii a přidávají pohyb — oblíbená volba pro oživování uměleckých děl, starých fotografií nebo produktových obrázků.
Jazyk AI videa: Fenomén ve 24 jazycích
Zde je něco, co nás skutečně překvapilo. Pokud jste předpokládali, že vytváření AI videí je primárně anglicky mluvící aktivita, data říkají opak.
Angličtina tvoří pouze 47.3% všech podnětů. To znamená, že více než polovina všech AI video podnětů na Vivideo je napsána v neanglických jazycích.
To není jen "trochu mezinárodní." To je globální fenomén, s významnou adopcí na každém kontinentu.
| Jazyk | % podnětů |
|---|---|
| Angličtina | 47.3% |
| Vietnamština | 23.1% |
| Arabština | 11.4% |
| Ruština | 3.2% |
| Turečtina | 2.7% |
| Němčina | 2.2% |
| Ukrajinština | 1.9% |
| Indonéština | 1.7% |
| Španělština | 1.3% |
| Holandština | 0.9% |
| Hebrejština | 0.7% |
| Polština | 0.7% |
| Čínština | 0.6% |
| Portugalština | 0.6% |
| Švédština | 0.5% |
| Řečtina | 0.4% |
Několik věcí vyčnívá:
Vietnamština na 23.1% je obrovská. Téměř čtvrtina všech podnětů je ve vietnamštině. To odráží booming digitální ekonomiky tvůrců ve Vietnamu a ranou adopci AI nástrojů pro vytváření obsahu. Vietnamští tvůrci používají AI video pro všechno od videí produktů v e-commerce po obsah na sociálních médiích ve velkém měřítku.
Arabština na 11.4% činí region MENA jedním z nejaktivnějších trhů AI videa. Vzhledem k rychlé digitální transformaci, která probíhá napříč zeměmi Perského zálivu, a obrovským investicím do AI infrastruktury, to dává smysl.
Dlouhý ocas je skutečný. Kromě hlavních jazyků existuje významná aktivita v ruštině, turečtině, němčině, ukrajinštině, indonéštině a mnoha dalších. AI video není hračkou ze Silicon Valley — je to globální kreativní nástroj.
To má obrovské důsledky pro každého, kdo v této oblasti buduje: pokud váš AI video nástroj funguje dobře pouze s anglickými podněty, ignorujete více než polovinu svých potenciálních uživatelů.
Preferované formáty: Poměry stran a délky
Jak lidé formátují svá videa, vám hodně napoví o tom, kde ta videa skončí.
Poměry stran
| Poměr stran | Procento |
|---|---|
| 16:9 (Krajina) | 52.8% |
| 9:16 (Portrét/Vertikální) | 43.7% |
| 1:1 (Čtverec) | ~0% |
Rozdělení krajina vs. portrét je pozoruhodně blízké — 52.8% ku 43.7% — což nám říká něco důležitého: bitva mezi horizontálním a vertikálním videem je v podstatě hod na minci.
Krajina stále vede, pravděpodobně poháněná YouTube, vložením na webové stránky, prezentacemi a tradičním marketingovým obsahem. Ale vertikální je těsně za ním, poháněný TikTokem, Instagram Reels a YouTube Shorts.
Skutečný šok? Čtvercové video (1:1) je v podstatě mrtvé. Při přibližně 0% už nikdo nevytváří čtvercová videa. Starý čtvercový formát Instagramu, kdysi výchozí pro sociální média, byl v éře AI videa zcela opuštěn.
Délky videí
| Délka | Procento |
|---|---|
| 12 sekund | 30.1% |
| 4 sekundy | 29.2% |
| 8 sekund | 23.3% |
| 6 sekund | 6.6% |
Preference délky odhalují fascinující rozdělení do dvou táborů:
Tábor 1: Skupina 12 sekund (30.1%). Tito uživatelé chtějí maximální dostupnou délku. Vytvářejí narativní obsah, produktové ukázky a propagační videa, kde každá další sekunda má význam. Dvanáct sekund je dost na to, aby se vyprávěl mini-příběh: nastavení, odhalení, vyplacení.
Tábor 2: Skupina 4 sekundy (29.2%). Tito uživatelé chtějí rychlé, úderné klipy — ideální pro háčky na sociálních médiích, reklamní kreativy nebo skládání více klipů do delších editací. Čtyři sekundy jsou v podstatě jeden silný vizuální moment.
Osmisekundová střední cesta (23.3%) zachycuje uživatele, kteří chtějí trochu více prostoru než 4 sekundy, ale nepotřebují plných 12. Relativně nízká popularita 6sekundových videí (6.6%) je zajímavá — zdá se, že lidé dávají přednost buď "krátkým", nebo "dlouhým", než aby se dělili o rozdíl.
Závod modelů: Veo 3.1 to vyhrává
Pokud existuje hlavní statistika z této celé analýzy, může to být tato:
Veo 3.1 pohání 96.4% všech AI video generací na Vivideo.
To není překlep. Model Veo 3.1 od Google je převládající volbou pro vytváření AI videí.
| Model | % použití |
|---|---|
| Veo 3.1 | 96.4% |
| Sora 2 | 2.0% |
| HeyGen (Avataři) | 10.5% všech objednávek |
Poznámka: Generování avatarů HeyGen je počítáno odděleně, protože slouží jiné funkci (digitální avataři vs. generování scén). Jeho podíl 10.5% se překrývá s kategorií avatarů v naší analýze použití.
Proč Veo 3.1 tak úplně dominuje? Na základě zpětné vazby uživatelů a našich vlastních testů:
- Vizuální kvalita. Veo 3.1 konzistentně produkuje nejvíce fotorealistické a vizuálně koherentní výstupy.
- Dodržování podnětů. Věnuje se složitým podnětům věrněji — pohyby kamery, specifikace osvětlení, stylové pokyny.
- Rychlost. Časy generování jsou konkurenceschopné a poměr kvality k rychlosti je nejlepší ve své třídě.
- Konzistence. Méně "podivných AI artefaktů" — méně tání rukou, nemožné fyziky a momenty podivného údolí.
Sora 2 na 2.0% má stále své fanoušky, zejména pro umělecký a stylizovaný obsah. Ale trh promluvil, alespoň prozatím: když lidé chtějí spolehlivé, vysoce kvalitní AI video, volí Veo 3.1.
Překvapivé nálezy
Každá dobrá analýza dat odhalí věci, které jste nečekali. Zde jsou vzory, které nás přiměly se dvakrát podívat.
1. Míra moderace obsahu 9%
Přibližně 9% všech podnětů bylo označeno systémy moderace obsahu jako dospělý nebo nevhodný obsah. To je ve skutečnosti méně, než mnozí v oboru očekávali — některé odhady uvádějí míru pokusů o dospělý obsah pro generátory AI obrázků na 15-20%.
Co to znamená? Vytváření AI videí se zdá být více profesionální a cílené než generování AI obrázků. Když platíte za generování videa (na rozdíl od hraní si s bezplatným nástrojem na obrázky), záměr je vážnější a případy použití jsou více orientovány na podnikání.
2. Efekt narozeninové pohlednice
Osobní pozdravy — narozeniny, svátky, výročí — se objevily mnohem více, než jsme očekávali. To nejsou ty okázalé případy použití, které se objevují v ukázkách AI, ale představují skutečně dojemnou aplikaci technologie. Lidé vytvářejí personalizované video zprávy, které by byly nemožné (nebo prohibitivně drahé) ještě před dvěma lety.
3. Smrt čtvercového videa
To jsme již zmínili, ale stojí za to to zopakovat: 1:1 čtvercové video je v podstatě na 0%. Formát, který dominoval Instagramu od roku 2012 do 2019, byl zcela opuštěn. Pokud váš video nástroj stále defaultně používá čtverec, řešíte problém včerejška.
4. Vietnamská ekonomika tvůrců
Na 23.1% všech podnětů není vietnamština jen zastoupena — je to druhý nejpopulárnější jazyk s obrovským náskokem, více než dvojnásobek třetí arabštiny na 11.4%. Ekonomika tvůrců ve Vietnamu je zjevně na inflexním bodě a nástroje AI videa jsou klíčovým akcelerátorem.
5. Nikdo nechce 6-sekundová videa
Se pouze 6.6% objednávek je 6-sekundový formát nejméně populární délka. Uživatelé silně preferují buď krátké a úderné (4s), nebo delší formát (12s). Střední cesta prostě neoslovuje. To odráží to, co jsme viděli v trendech na sociálních médiích — obsah je buď rychlý háček, nebo mini-narativ, s malým prostorem pro mezi tím.
Co to znamená pro tvůrce
Takže jste viděli data. Co byste měli skutečně dělat s tím?
Ať už jste marketér, tvůrce obsahu, majitel firmy, nebo jen někdo zvědavý na AI video, zde jsou akční závěry:
1. Začněte s Text-to-Video
Pokud jste ještě nezkusili AI video, text-to-video je tam, kde se děje akce. Dvě třetiny uživatelů začínají zde, a to z dobrého důvodu — nepotřebujete žádné prostředky, jen nápady. Popište, co chcete vidět, a AI to postaví.
2. Myslete na 4s nebo 12s
Při plánování svých AI videí myslete v termínech 4-sekundových úderů nebo 12-sekundových příběhů. Data ukazují, že to jsou délky, které rezonují. Pro háčky na sociálních médiích a reklamní kreativy použijte 4 sekundy. Pro produktové ukázky, vysvětlení a narativní obsah použijte plných 12.
3. Zvolte svou orientaci záměrně
Nezůstávejte na krajině. Pokud váš obsah směřuje na TikTok, Reels nebo Shorts, zvolte 9:16 vertikálně. Pokud je to pro YouTube, vaše webové stránky nebo prezentace, zvolte 16:9. A zapomeňte na čtverec — trh se posunul dál.
4. Nepodceňujte neanglické trhy
Pokud budujete podnikání kolem obsahu AI videa, data ukazují obrovskou poptávku po vietnamských, arabských, ruských a tureckých mluvících trzích. To nejsou okrajové publika — představují stovky milionů potenciálních diváků.
5. Použijte Image-to-Video pro produktový obsah
I když text-to-video dominuje celkově, image-to-video je tajná zbraň pro e-commerce a marketing produktů. Nahrajte fotografii svého produktu a přidejte pohyb, kontext a život. Je to rychlejší než focení a nekonečně škálovatelné.
6. Veo 3.1 je bezpečná sázka
Pokud se ptáte, který model použít, data jsou jasná: 96.4% uživatelů volí Veo 3.1. Nabízí nejlepší kombinaci kvality, rychlosti a dodržování podnětů. Začněte tam a experimentujte s alternativami jako Sora 2 pro specifické kreativní styly.
Závěrem: AI video už není novinkou. S více než 120 000 videi generovanými, podněty ve více než 24 jazycích a případy použití sahajícími od narozeninových pohlednic po prohlídky nemovitostí, je to mainstreamový kreativní nástroj. Otázka není, zda ho použít — ale jak ho použít lépe než ostatní.
Připraveni vidět, co můžete vytvořit? Vyzkoušejte Vivideo zdarma a přidejte své podněty do dalšího datasetu.
Prozkoumejte více
Související porovnání
Vyzkoušejte tyto nástroje
Připraveni vytvořit vlastní AI videa?
Vyzkoušejte Vivideo zdarma ještě dnes - bez nutnosti kreditní karty. Vytvářejte profesionální videa během několika minut.
Začněte vytvářet zdarma