Det här lär du dig
- En prompt i fem delar (motiv, handling, miljö, stil, kamera) du kan återanvända varje gång
- Hur du skriver om en vag prompt till en precis — med före/efter-exempel
- Varför negativa instruktioner (”ingen text, ingen vattenstämpel”) rensar upp resultaten
- En iterationsslinga med en ändring åt gången som förbättrar tagningar utan gissningar
Hur modeller läser din prompt
En text-till-video-modell ”förstår” inte en berättelse som en människa — den matchar mönster mellan dina ord och visuella exempel den lärt sig. Ju mer konkret du beskriver vad som ska synas och hur kameran beter sig, desto mindre behöver den gissa. Specifika substantiv, en tydlig handling och en namngiven kamerarörelse slår en hög av stämningsadjektiv.
En promptstruktur som fungerar
Beskriv tagningen som en regissör — motiv, handling, miljö, stil och kamera. Håll det till en eller två tydliga meningar.
- 1Motiv: vem eller vad syns i bild (”en barista”, ”en elegant telefon”).
- 2Handling: vad händer (”häller latte art”, ”roterar långsamt på en piedestal”).
- 3Miljö: var (”solbelyst specialkaffe-bar”, ”minimal studio, mjuka skuggor”).
- 4Stil: utseendet (”cinematisk, kort skärpedjup, varm färggrad”).
- 5Kamera: rörelsen (”långsam inzoomning”, ”orbit”, ”statisk helbild”).
Före och efter
Vagt: ”en kaffevideo”. Bättre: ”Närbild av en barista som häller latte art i en vit kopp på en trädisk, solbelyst specialcafé, cinematisk, kort skärpedjup, långsam inzoomning, ingen text.” Den andra prompten styr motiv, miljö, ljus, optik och rörelse — så modellen behöver uppfinna mindre och du får användbara tagningar oftare.
Säg vad du inte vill ha
Negativa instruktioner rensar upp resultat. Lägg till ”ingen text, ingen vattenstämpel, inga logotyper, inga extra fingrar” för att undvika klassiska AI-artefakter. För varumärkessäkert innehåll: ”generisk förpackning, inga varumärkeslogotyper”. En kort exklusionslista gör ofta mer för kvaliteten än ännu ett adjektiv.
Iterera, överspecificera inte
Börja med en fokuserad prompt, generera, ändra sedan en sak i taget — först ljuset, sedan kamerarörelsen, sedan stämningen. Om du staplar tio adjektiv på en gång blir det omöjligt att veta vad som hjälpte. Behandla varje generation som ett experiment med en variabel.
Bygg en återanvändbar ”husstil”
När du hittar en look du gillar, spara stilhalvan av prompten som ett suffix (t.ex. ”cinematisk, 4K, mjukt naturligt ljus, kort skärpedjup”) och återanvänd den mellan klipp. Du byter motiv och handling per tagning, men husstilen håller en serie visuellt konsekvent — vilket får en kanal att kännas genomtänkt.
Snabba tips
- Börja med det viktigaste visuella — modeller viktar promptens början tyngre.
- Namnge kamerarörelsen (”långsam panorering”, ”orbit”, ”statisk”) för att styra energi och tempo.
- Återanvänd ett ”husstils”-suffix för en konsekvent look i varje klipp.
- En handling per tagning — dela upp ”går in och sätter sig och pratar” i separata scener.
- Spara en swipe-mapp med promptar som gav grymma tagningar; återanvänd och remixa dem.
Vanliga frågor
Hur lång ska en prompt vara?
En eller två tydliga meningar slår oftast ett stycke. Var specifik, inte lång.
Kan jag använda samma prompt i olika modeller?
Ja — i Vivideo kan du köra en prompt genom flera modeller (Sora, Veo, Kling med flera) och jämföra.
Varför ignorerar min video en del av prompten?
Modeller prioriterar början och kan tappa senare detaljer. Flytta det viktigaste tidigare, eller dela upp i en ny scen.
Funkar promptar även för bild-till-video?
Ja — med en inmatningsbild styr prompten främst rörelse och kamera, inte motivet.
Hur håller jag en karaktär konsekvent över tagningar?
Återanvänd samma detaljerade motivbeskrivning, eller använd en avatar/referensbild så att utseendet förblir stabilt.