Cosa imparerai
- Una struttura di prompt in cinque parti (soggetto, azione, ambientazione, stile, camera) da riutilizzare ogni volta
- Come riscrivere un prompt vago in uno preciso — con esempi prima/dopo
- Perché i vincoli negativi (“no testo, no filigrana”) migliorano i risultati
- Un ciclo di iterazione con una modifica alla volta che migliora gli shot senza tentativi alla cieca
Come i modelli interpretano il tuo prompt
Un modello text-to-video non “capisce” una storia come una persona — associa i tuoi testi a visual che ha imparato. Più descrivi concretamente cosa dev’essere a schermo e come si muove la camera, meno deve indovinare. Sostantivi specifici, un’azione chiara e un movimento di camera nominato battono un mucchio di aggettivi di atmosfera.
Una struttura di prompt che funziona
Descrivi l’inquadratura come farebbe un regista — soggetto, azione, ambientazione, stile e camera. Tienilo in una o due frasi chiare.
- 1Soggetto: chi o cosa è in scena (“un barista”, “uno smartphone elegante”).
- 2Azione: cosa accade (“versa latte art”, “ruota lentamente su un piedistallo”).
- 3Ambientazione: dove (“caffetteria specialty illuminata dal sole”, “studio minimal, ombre morbide”).
- 4Stile: l’aspetto (“cinematico, profondità di campo ridotta, color grade caldo”).
- 5Camera: il movimento (“lento push-in”, “orbita”, “campo largo statico”).
Prima e dopo
Vago: “un video sul caffè”. Meglio: “Primo piano di un barista che versa latte art in una tazza bianca su bancone in legno, caffetteria specialty illuminata dal sole, stile cinematografico, profondità di campo ridotta, lento push-in, no testo.” Il secondo prompt controlla soggetto, ambientazione, luce, lente e movimento — così il modello inventa molto meno e ottieni più spesso uno shot utilizzabile.
Dì cosa non vuoi
I vincoli negativi ripuliscono i risultati. Aggiungi “no testo, no filigrana, no loghi, no dita extra” per evitare i classici artefatti dell’Intelligenza Artificiale. Per output brand-safe, aggiungi “packaging generico, niente loghi di marca”. Un breve elenco di esclusioni spesso vale più di un altro aggettivo.
Itera, non iper-specificare
Parti da un prompt mirato, genera, poi cambia una cosa alla volta — prima l’illuminazione, poi il movimento di camera, poi il mood. Impilare dieci aggettivi insieme rende impossibile capire cosa abbia aiutato davvero. Considera ogni generazione un esperimento con una sola variabile.
Crea uno “stile di casa” riutilizzabile
Quando trovi un look che ti piace, salva la parte di styling del prompt come suffisso (es. “cinematico, 4K, luce naturale morbida, profondità di campo ridotta”) e riusala tra i clip. Cambi soggetto e azione per inquadratura, ma lo stile di casa mantiene una serie visivamente coerente — è ciò che fa sembrare un canale intenzionale.
Consigli rapidi
- Metti l’elemento visivo più importante all’inizio — i modelli pesano maggiormente l’inizio del prompt.
- Nomina il movimento di camera (“pan lento”, “orbita”, “statico”) per controllare energia e ritmo.
- Riusare un suffisso di “stile di casa” dà coerenza a ogni clip.
- Una sola azione per inquadratura — dividi “entra e si siede e parla” in scene separate.
- Tieni un archivio di prompt che hanno prodotto ottimi shot; riusali e remixali.
Domande frequenti
Quanto deve essere lungo un prompt?
Una o due frasi chiare di solito battono un paragrafo. Sii specifico, non prolisso.
Posso usare lo stesso prompt su modelli diversi?
Sì — su Vivideo puoi far girare un prompt su modelli diversi (Sora, Veo, Kling e altri) e confrontarli.
Perché il mio video ignora parte del prompt?
I modelli danno priorità all’inizio e possono tralasciare dettagli successivi. Porta l’elemento chiave prima, o dividilo in un’altra scena.
I prompt funzionano anche per image-to-video?
Sì — con un’immagine di input il prompt guida soprattutto il movimento e la camera, non il soggetto.
Come mantengo un personaggio coerente tra gli shot?
Riusa la stessa descrizione dettagliata del soggetto, oppure usa un avatar/immagine di riferimento così l’aspetto resta stabile.