Punti chiave
- 1Il testo in video domina con il 65,7% di tutti gli ordini, mentre il passaggio da immagine a video rappresenta il 32,6%
- 2L'88,2% dei video AI sono scene generate — non avatar, non animazioni, ma mondi completamente immaginati a partire dal testo
- 3La creazione di video AI è veramente globale: i prompt provengono in oltre 24 lingue, con l'inglese al solo 47,3%
- 4Veo 3.1 comanda il 96,4% dell'uso del modello, segnalando un chiaro vincitore nella corsa ai modelli di video AI
- 5Il formato 16:9 orizzontale (52,8%) supera leggermente il 9:16 verticale (43,7%), mostrando in tempo reale la divisione tra TikTok e YouTube
Vivideo Team
Il team di Vivideo è appassionato nel rendere la creazione di video accessibile a tutti grazie all'AI. Testiamo e recensiamo gli ultimi strumenti e condividiamo le nostre conoscenze per aiutarti a ottenere risultati.
Abbiamo analizzato oltre 40.000 prompt video AI
Tutti hanno opinioni sui video AI. I commentatori prevedono dove sta andando. Twitter dibatte se sia "abbastanza buono ormai." Le miniature di YouTube urlano riguardo l'ultimo aggiornamento del modello.
Ma quasi nessuno parla di cosa stanno realmente creando le persone con questi strumenti in questo momento.
Così abbiamo deciso di scoprirlo.
Abbiamo estratto dati da oltre 120.000 video generati da AI creati su Vivideo, classificato un campione di 40.000+ prompt utilizzando GPT-4o-mini, e analizzato i numeri. Ciò che è emerso è un ritratto sorprendentemente dettagliato di come le persone reali — non influencer, non ricercatori, ma creatori e aziende quotidiane — stanno usando i video AI nel 2025.
Ecco tutto ciò che abbiamo trovato.
Il Dataset: Come abbiamo ottenuto questi numeri
Mettiamo da parte la metodologia così sai esattamente cosa stai guardando.
Il nostro dataset completo comprende 120.000+ video generati attraverso la piattaforma di Vivideo. Per l'analisi dettagliata dei prompt, abbiamo preso un campione stratificato di 915 prompt e li abbiamo elaborati tramite GPT-4o-mini per la classificazione in categorie di utilizzo. Le statistiche più ampie — utilizzo del modello, rapporti d'aspetto, durate, lingue e tipi di input — provengono dal dataset completo.
Non abbiamo selezionato a caso. Non abbiamo filtrato per output "impressionanti". Questi sono dati grezzi, non filtrati, da utenti reali che fanno lavoro reale (e sì, alcuni di essi sono persone che realizzano video di compleanno per la loro mamma — ed è fantastico).
Alcuni caveat: la classificazione dei prompt da parte dell'AI non è perfetta. Alcuni prompt sono ambigui. Un "video di prodotto con una persona che parla" potrebbe essere etichettato come un demo di prodotto o un video avatar. Abbiamo ottimizzato per l'intento più probabile e controllato manualmente centinaia di classificazioni.
Detto ciò, immergiamoci.
Il quadro generale: Testo-a-video vs. Immagine-a-video
La prima domanda che abbiamo posto era semplice: Come iniziano le persone i loro video?
Stanno digitando un prompt da zero? O stanno caricando un'immagine e portandola in vita?
65.7% di tutti gli ordini video sono testo-a-video. 32.6% sono immagine-a-video. Il restante ~1.7% utilizza altri metodi come la generazione di avatar.
Questo è stato piuttosto sorprendente. Ci aspettavamo che immagine-a-video fosse più alto — dopotutto, è discutibilmente "più facile" poiché stai dando all'AI un punto di partenza visivo. Ma i dati raccontano una storia diversa: due terzi degli utenti preferiscono descrivere la loro visione a parole e lasciare che l'AI si occupi dei visivi.
Perché? Alcune teorie:
- Barriera d'ingresso più bassa. Non hai bisogno di avere o trovare l'immagine giusta. Devi solo digitare ciò che vuoi. Testo-a-video è la tela bianca definitiva.
- Maggiore controllo creativo. I prompt testuali ti permettono di specificare umore, movimento della camera, illuminazione e stile — cose che sono più difficili da comunicare attraverso un'immagine statica.
- Il "gap dell'immaginazione." Molti utenti stanno creando scene che non esistono ancora — mondi fantastici, concetti di prodotto, sequenze narrative. Non puoi caricare una foto di qualcosa che non è stato costruito.
Detto ciò, immagine-a-video ha il suo pubblico fedele. È particolarmente popolare per le animazioni di prodotto e-commerce, tour immobiliari (inizia con una foto della proprietà) e per dare vita a opere d'arte.
Cosa Creano le Persone (La Suddivisione per Casi d'Uso)
Questa è la sezione che ci entusiasmava di più. Quando abbiamo classificato tutti i 915 prompt campione per caso d'uso, una categoria ha assolutamente dominato.
| Uso | Percentuale |
|---|---|
| Scene video generate da AI | 88.2% |
| Video avatar / testa parlante | 7.1% |
| Animazione di immagini | 4.7% |
Lascia che questo affondi. Quasi 9 video AI su 10 sono scene completamente generate — non il volto di qualcuno che parla alla telecamera, non un effetto Ken Burns su una foto, ma scene visive complete evocate da descrizioni testuali.
Questa è la vera storia del video AI nel 2025: le persone lo stanno usando come un motore di immaginazione visiva.
Come Sono Queste Scene
Abbiamo scavato più a fondo nell'88.2% per capire che tipo di scene le persone stanno generando. Sebbene le categorie si sovrappongano (un video promozionale può anche essere narrativo), ecco i principali schemi che abbiamo osservato:
- Video promozionali — Aziende che creano annunci, video di marca e contenuti di marketing. Tutto, dalle promozioni di ristoranti locali ai lanci di prodotti SaaS.
- Contenuti educativi — Video esplicativi, tutorial e sequenze di "come funziona". Insegnanti, creatori di corsi e formatori aziendali sono utenti potenti precoci.
- Contenuti sui social media — Clip brevi e incisive progettate per TikTok, Instagram Reels e YouTube Shorts. Spesso guidate dalle tendenze e progettate per un impatto massimo che ferma lo scorrimento.
- Storytelling e narrativa — Cortometraggi, concetti di video musicali e sequenze narrative. Qui vivono i prompt più creativi — persone che costruiscono interi mondi in 4-12 secondi.
- Dimostrazioni di prodotto — Venditori e-commerce che mostrano prodotti in contesti di vita reale. "Mostra la mia sneaker indossata da un corridore su un sentiero di montagna al tramonto" — quel tipo di cose.
- Saluti e celebrazioni personali — Messaggi di compleanno, biglietti di auguri, sorprese per anniversari. Video AI come il nuovo biglietto di Hallmark.
- Tour immobiliari — Tour virtuali di proprietà, showcase di quartieri e visualizzazioni architettoniche.
- Vetrine di prodotti e-commerce — Scatti di bellezza dei prodotti, rivelazioni in stile 360° e video di contesto di vita che fanno sembrare i prodotti premium.
La categoria avatar/testa parlante (7.1%) è più piccola di quanto ci si potrebbe aspettare data tutta l'attenzione sugli avatar AI. Questo è in parte perché la generazione di avatar è un caso d'uso specializzato — richiede un flusso di lavoro diverso e si rivolge a un pubblico più ristretto (principalmente formazione aziendale e outreach di vendita personalizzato).
L'animazione di immagini al 4.7% rappresenta utenti che caricano una foto fissa e aggiungono movimento — una scelta popolare per dare vita a opere d'arte, vecchie foto o immagini di prodotto.
La Lingua del Video AI: Un Fenomeno in 24 Lingue
Ecco qualcosa che ci ha davvero sorpreso. Se hai assunto che la creazione di video AI sia principalmente un'attività di lingua inglese, i dati dicono il contrario.
L'inglese rappresenta solo 47.3% di tutti i prompt. Ciò significa che più della metà di tutti i prompt video AI su Vivideo sono scritti in lingue non inglesi.
Questo non è solo "un po' internazionale." Questo è un fenomeno globale, con un'adozione significativa in ogni continente.
| Lingua | % di Prompt |
|---|---|
| Inglese | 47.3% |
| Vietnamita | 23.1% |
| Arabo | 11.4% |
| Russo | 3.2% |
| Turco | 2.7% |
| Tedesco | 2.2% |
| Ucraino | 1.9% |
| Indonesiano | 1.7% |
| Spagnolo | 1.3% |
| Olandese | 0.9% |
| Ebraico | 0.7% |
| Polacco | 0.7% |
| Cinese | 0.6% |
| Portoghese | 0.6% |
| Svedese | 0.5% |
| Greco | 0.4% |
Alcune cose saltano all'occhio:
Il vietnamita al 23.1% è enorme. Quasi un quarto di tutti i prompt sono in vietnamita. Questo riflette l'economia dei creatori digitali in rapida crescita del Vietnam e l'adozione precoce degli strumenti AI per la creazione di contenuti. I creatori vietnamiti stanno usando i video AI per tutto, dai video di prodotto e-commerce ai contenuti sui social media su larga scala.
L'arabo all'11.4% rende la regione MENA uno dei mercati di video AI più attivi. Data la rapida trasformazione digitale che sta avvenendo negli stati del Golfo e il massiccio investimento nell'infrastruttura AI, questo è coerente.
La lunga coda è reale. Oltre alle lingue principali, c'è un'attività significativa in russo, turco, tedesco, ucraino, indonesiano e molte altre. I video AI non sono un giocattolo della Silicon Valley — sono uno strumento creativo globale.
Questo ha enormi implicazioni per chiunque stia costruendo in questo spazio: se il tuo strumento di video AI funziona bene solo con prompt in inglese, stai ignorando più della metà dei tuoi potenziali utenti.
Preferenze di Formato: Rapporti d'Aspetto e Durate
Come le persone formattano i loro video ti dice molto su dove quei video andranno a finire.
Rapporti d'Aspetto
| Rapporto d'Aspetto | Percentuale |
|---|---|
| 16:9 (Orizzontale) | 52.8% |
| 9:16 (Verticale) | 43.7% |
| 1:1 (Quadrato) | ~0% |
La divisione orizzontale vs. verticale è sorprendentemente vicina — 52.8% a 43.7% — il che ci dice qualcosa di importante: la battaglia tra video orizzontali e verticali è essenzialmente un lancio di moneta.
Orizzontale guida ancora, probabilmente spinta da YouTube, embed di siti web, presentazioni e contenuti di marketing tradizionali. Ma verticale è subito dietro, alimentato da TikTok, Instagram Reels e YouTube Shorts.
La vera sorpresa? Il video quadrato (1:1) è praticamente morto. A circa 0%, nessuno sta più creando video quadrati. Il vecchio formato quadrato di Instagram, una volta il predefinito per i social media, è stato completamente abbandonato nell'era del video AI.
Durate dei Video
| Durata | Percentuale |
|---|---|
| 12 secondi | 30.1% |
| 4 secondi | 29.2% |
| 8 secondi | 23.3% |
| 6 secondi | 6.6% |
Le preferenze di durata rivelano una affascinante divisione in due campi:
Campo 1: Il gruppo dei 12 secondi (30.1%). Questi utenti vogliono la durata massima disponibile. Stanno creando contenuti narrativi, dimostrazioni di prodotto e video promozionali dove ogni secondo extra conta. Dodici secondi sono sufficienti per raccontare una mini-storia: impostazione, rivelazione, pagamento.
Campo 2: Il gruppo dei 4 secondi (29.2%). Questi utenti vogliono clip rapide e incisive — perfette per ganci sui social media, creativi pubblicitari o per impilare più clip in montaggi più lunghi. Quattro secondi sono fondamentalmente un forte momento visivo.
Il punto intermedio di 8 secondi (23.3%) cattura utenti che vogliono un po' più di respiro rispetto a 4 secondi ma non hanno bisogno del pieno 12. La relativamente bassa popolarità dei video di 6 secondi (6.6%) è interessante — sembra che le persone preferiscano impegnarsi in "corto" o "lungo" piuttosto che dividere la differenza.
La Corsa ai Modelli: Veo 3.1 La Fa Da Padrona
Se c'è una statistica principale da tutta questa analisi, potrebbe essere questa:
Veo 3.1 alimenta il 96.4% di tutta la generazione di video AI su Vivideo.
Non è un errore di battitura. Il modello Veo 3.1 di Google è la scelta predominante per la creazione di video AI.
| Modello | % di Utilizzo |
|---|---|
| Veo 3.1 | 96.4% |
| Sora 2 | 2.0% |
| HeyGen (Avatar) | 10.5% di tutti gli ordini |
Nota: La generazione di avatar HeyGen è conteggiata separatamente poiché svolge una funzione diversa (avatar digitali vs. generazione di scene). La sua quota del 10.5% si sovrappone con la categoria avatar nella nostra analisi dei casi d'uso.
Perché Veo 3.1 domina così completamente? Basato sul feedback degli utenti e sui nostri test:
- Qualità visiva. Veo 3.1 produce costantemente l'output più fotorealistico e visivamente coerente.
- Adesione ai prompt. Segue i prompt complessi in modo più fedele — movimenti della camera, specifiche di illuminazione, direttive di stile.
- Velocità. I tempi di generazione sono competitivi e il rapporto qualità-velocità è il migliore della categoria.
- Coerenza. Meno "artefatti AI strani" — meno mani che si sciolgono, fisica impossibile e momenti di valle inquietante.
Sora 2 al 2.0% ha ancora i suoi fan, particolarmente per contenuti più artistici e stilizzati. Ma il mercato ha parlato, almeno per ora: quando le persone vogliono video AI affidabili e di alta qualità, scelgono Veo 3.1.
Risultati Sorprendenti
Ogni buona analisi dei dati rivela cose che non ti aspettavi. Ecco i modelli che ci hanno fatto fare un doppio take.
1. Il Tasso di Moderazione dei Contenuti del 9%
Circa 9% di tutti i prompt sono stati segnalati dai sistemi di moderazione dei contenuti come contenuti per adulti o inappropriati. Questo è in realtà inferiore a quanto molti nel settore si aspettavano — alcune stime pongono il tasso di tentativi di contenuti per adulti per i generatori di immagini AI al 15-20%.
Cosa significa questo? La creazione di video AI tende a essere più professionale e mirata rispetto alla generazione di immagini AI. Quando paghi per la generazione di video (anziché giocare con uno strumento di immagini gratuito), l'intento è più serio e i casi d'uso sono più orientati al business.
2. L'Effetto del Biglietto di Compleanno
I saluti personali — compleanni, festività, anniversari — sono emersi molto più di quanto ci aspettassimo. Questi non sono i casi d'uso appariscenti che vengono presentati nei reel dimostrativi dell'AI, ma rappresentano un'applicazione genuinamente toccante della tecnologia. Le persone stanno creando messaggi video personalizzati che sarebbero stati impossibili (o proibitivamente costosi) solo due anni fa.
3. La Morte del Video Quadrato
Lo abbiamo già menzionato, ma vale la pena ripeterlo: il video quadrato 1:1 è praticamente a 0%. Il formato che ha dominato Instagram dal 2012 al 2019 è stato completamente abbandonato. Se il tuo strumento video è ancora predefinito su quadrato, stai risolvendo il problema di ieri.
4. L'Economia dei Creatori Vietnamiti
Con il 23.1% di tutti i prompt, il vietnamita non è solo rappresentato — è la seconda lingua più popolare con un margine enorme, più del doppio dell'arabo al terzo posto con l'11.4%. L'economia dei creatori del Vietnam è chiaramente a un punto di svolta, e gli strumenti video AI sono un acceleratore chiave.
5. Nessuno Vuole Video di 6 Secondi
Con solo il 6.6% degli ordini, il formato di 6 secondi è la durata meno popolare. Gli utenti preferiscono fortemente o clip brevi e incisive (4s) o formati più lunghi (12s). Il punto intermedio semplicemente non risuona. Questo rispecchia ciò che abbiamo visto nelle tendenze dei social media — i contenuti sono o un gancio veloce o una mini-narrativa, con poco spazio per il mezzo.
Cosa Significa Questo per i Creatori
Quindi hai visto i dati. Cosa dovresti fare con essi?
Che tu sia un marketer, un creatore di contenuti, un imprenditore o semplicemente qualcuno curioso riguardo ai video AI, ecco i takeaway azionabili:
1. Inizia con Testo-a-Video
Se non hai ancora provato i video AI, testo-a-video è dove si trova l'azione. Due terzi degli utenti iniziano qui, e per una buona ragione — non hai bisogno di alcun asset, solo idee. Descrivi cosa vuoi vedere, e l'AI lo costruisce.
2. Pensa in 4s o 12s
Quando pianifichi i tuoi video AI, pensa in termini di colpi di 4 secondi o storie di 12 secondi. I dati mostrano che queste sono le durate che risuonano. Per ganci sui social media e creativi pubblicitari, vai con 4 secondi. Per dimostrazioni di prodotto, spiegazioni e contenuti narrativi, usa il pieno 12.
3. Scegli Deliberatamente la Tua Orientazione
Non impostare di default su orizzontale. Se il tuo contenuto è destinato a TikTok, Reels o Shorts, vai verticale 9:16. Se è per YouTube, il tuo sito web o presentazioni, vai orizzontale 16:9. E dimentica il quadrato — il mercato è andato avanti.
4. Non Ignorare i Mercati Non Inglesi
Se stai costruendo un business attorno ai contenuti video AI, i dati mostrano una domanda enorme da parte dei mercati di lingua vietnamita, araba, russa e turca. Questi non sono pubblici di nicchia — rappresentano centinaia di milioni di potenziali spettatori.
5. Usa Immagine-a-Video per Contenuti di Prodotto
Seppur testo-a-video domini nel complesso, immagine-a-video è l'arma segreta per l'e-commerce e il marketing di prodotto. Carica la foto del tuo prodotto e aggiungi movimento, contesto e vita. È più veloce di un servizio fotografico e infinitamente più scalabile.
6. Veo 3.1 È la Scelta Sicura
Se ti stai chiedendo quale modello utilizzare, i dati sono chiari: il 96.4% degli utenti sceglie Veo 3.1. Offre la migliore combinazione di qualità, velocità e adesione ai prompt. Inizia da lì e sperimenta con alternative come Sora 2 per stili creativi specifici.
La conclusione: I video AI non sono più una novità. Con oltre 120.000 video generati, prompt in oltre 24 lingue e casi d'uso che spaziano dai biglietti di compleanno ai tour immobiliari, è uno strumento creativo mainstream. La domanda non è se usarlo — è come usarlo meglio di tutti gli altri.
Pronto a vedere cosa puoi creare? Prova Vivideo gratis e aggiungi i tuoi prompt al prossimo dataset.
Scopri altro
Confronti correlati
Prova questi strumenti
Pronto a creare i tuoi video con AI?
Prova Vivideo gratis oggi - non è richiesta la carta di credito. Crea video professionali in pochi minuti.
Inizia a creare gratis