Come scrivere prompt text-to-video (con esempi)

Un ottimo video con Intelligenza Artificiale nasce da un prompt chiaro. I modelli leggono le tue parole sia come script sia come lista di inquadrature, quindi un prompt vago dà risultati vaghi e uno preciso ti dà controllo su soggetto, ambientazione, luce e camera. Questa guida ti offre una struttura di prompt riutilizzabile, riscritture reali prima/dopo, le parole che fanno la differenza e un flusso per iterare senza perdere ciò che già funziona.

Cosa imparerai

Una struttura di prompt in cinque parti (soggetto, azione, ambientazione, stile, camera) da riutilizzare ogni volta
Come riscrivere un prompt vago in uno preciso — con esempi prima/dopo
Perché i vincoli negativi (“no testo, no filigrana”) migliorano i risultati
Un ciclo di iterazione con una modifica alla volta che migliora gli shot senza tentativi alla cieca

Come i modelli interpretano il tuo prompt

Un modello text-to-video non “capisce” una storia come una persona — associa i tuoi testi a visual che ha imparato. Più descrivi concretamente cosa dev’essere a schermo e come si muove la camera, meno deve indovinare. Sostantivi specifici, un’azione chiara e un movimento di camera nominato battono un mucchio di aggettivi di atmosfera.

Una struttura di prompt che funziona

Descrivi l’inquadratura come farebbe un regista — soggetto, azione, ambientazione, stile e camera. Tienilo in una o due frasi chiare.

1Soggetto: chi o cosa è in scena (“un barista”, “uno smartphone elegante”).
2Azione: cosa accade (“versa latte art”, “ruota lentamente su un piedistallo”).
3Ambientazione: dove (“caffetteria specialty illuminata dal sole”, “studio minimal, ombre morbide”).
4Stile: l’aspetto (“cinematico, profondità di campo ridotta, color grade caldo”).
5Camera: il movimento (“lento push-in”, “orbita”, “campo largo statico”).

Prima e dopo

Vago: “un video sul caffè”. Meglio: “Primo piano di un barista che versa latte art in una tazza bianca su bancone in legno, caffetteria specialty illuminata dal sole, stile cinematografico, profondità di campo ridotta, lento push-in, no testo.” Il secondo prompt controlla soggetto, ambientazione, luce, lente e movimento — così il modello inventa molto meno e ottieni più spesso uno shot utilizzabile.

Dì cosa non vuoi

I vincoli negativi ripuliscono i risultati. Aggiungi “no testo, no filigrana, no loghi, no dita extra” per evitare i classici artefatti dell’Intelligenza Artificiale. Per output brand-safe, aggiungi “packaging generico, niente loghi di marca”. Un breve elenco di esclusioni spesso vale più di un altro aggettivo.

Itera, non iper-specificare

Parti da un prompt mirato, genera, poi cambia una cosa alla volta — prima l’illuminazione, poi il movimento di camera, poi il mood. Impilare dieci aggettivi insieme rende impossibile capire cosa abbia aiutato davvero. Considera ogni generazione un esperimento con una sola variabile.

Crea uno “stile di casa” riutilizzabile

Quando trovi un look che ti piace, salva la parte di styling del prompt come suffisso (es. “cinematico, 4K, luce naturale morbida, profondità di campo ridotta”) e riusala tra i clip. Cambi soggetto e azione per inquadratura, ma lo stile di casa mantiene una serie visivamente coerente — è ciò che fa sembrare un canale intenzionale.

Consigli rapidi

Metti l’elemento visivo più importante all’inizio — i modelli pesano maggiormente l’inizio del prompt.
Nomina il movimento di camera (“pan lento”, “orbita”, “statico”) per controllare energia e ritmo.
Riusare un suffisso di “stile di casa” dà coerenza a ogni clip.
Una sola azione per inquadratura — dividi “entra e si siede e parla” in scene separate.
Tieni un archivio di prompt che hanno prodotto ottimi shot; riusali e remixali.

Domande frequenti

Quanto deve essere lungo un prompt?

Una o due frasi chiare di solito battono un paragrafo. Sii specifico, non prolisso.

Posso usare lo stesso prompt su modelli diversi?

Sì — su Vivideo puoi far girare un prompt su modelli diversi (Sora, Veo, Kling e altri) e confrontarli.

Perché il mio video ignora parte del prompt?

I modelli danno priorità all’inizio e possono tralasciare dettagli successivi. Porta l’elemento chiave prima, o dividilo in un’altra scena.

I prompt funzionano anche per image-to-video?

Sì — con un’immagine di input il prompt guida soprattutto il movimento e la camera, non il soggetto.

Come mantengo un personaggio coerente tra gli shot?

Riusa la stessa descrizione dettagliata del soggetto, oppure usa un avatar/immagine di riferimento così l’aspetto resta stabile.

Come scrivere prompt text-to-video (con esempi)

Cosa imparerai

Come i modelli interpretano il tuo prompt

Una struttura di prompt che funziona

Prima e dopo

Dì cosa non vuoi

Itera, non iper-specificare

Crea uno “stile di casa” riutilizzabile

Consigli rapidi

Domande frequenti

Continua a imparare

Come creare un video con Intelligenza Artificiale: guida per principianti

Avatar e voci con Intelligenza Artificiale: guida per principianti

Come creare video per TikTok, Reels e Shorts

Pronto a creare il tuo video?