Så skriver du text-till-video-promptar (med exempel)

Bra video med artificiell intelligens börjar med en tydlig prompt. Modellerna läser dina ord som både manus och shotlista, så en vag prompt ger vaga resultat medan en precis prompt ger kontroll över motiv, miljö, ljus och kamera. Den här guiden ger en återanvändbar promptstruktur, verkliga före/efter-omskrivningar, orden som gör störst skillnad och ett arbetssätt för att iterera utan att tappa det som redan fungerade.

Det här lär du dig

En prompt i fem delar (motiv, handling, miljö, stil, kamera) du kan återanvända varje gång
Hur du skriver om en vag prompt till en precis — med före/efter-exempel
Varför negativa instruktioner (”ingen text, ingen vattenstämpel”) rensar upp resultaten
En iterationsslinga med en ändring åt gången som förbättrar tagningar utan gissningar

Hur modeller läser din prompt

En text-till-video-modell ”förstår” inte en berättelse som en människa — den matchar mönster mellan dina ord och visuella exempel den lärt sig. Ju mer konkret du beskriver vad som ska synas och hur kameran beter sig, desto mindre behöver den gissa. Specifika substantiv, en tydlig handling och en namngiven kamerarörelse slår en hög av stämningsadjektiv.

En promptstruktur som fungerar

Beskriv tagningen som en regissör — motiv, handling, miljö, stil och kamera. Håll det till en eller två tydliga meningar.

1Motiv: vem eller vad syns i bild (”en barista”, ”en elegant telefon”).
2Handling: vad händer (”häller latte art”, ”roterar långsamt på en piedestal”).
3Miljö: var (”solbelyst specialkaffe-bar”, ”minimal studio, mjuka skuggor”).
4Stil: utseendet (”cinematisk, kort skärpedjup, varm färggrad”).
5Kamera: rörelsen (”långsam inzoomning”, ”orbit”, ”statisk helbild”).

Före och efter

Vagt: ”en kaffevideo”. Bättre: ”Närbild av en barista som häller latte art i en vit kopp på en trädisk, solbelyst specialcafé, cinematisk, kort skärpedjup, långsam inzoomning, ingen text.” Den andra prompten styr motiv, miljö, ljus, optik och rörelse — så modellen behöver uppfinna mindre och du får användbara tagningar oftare.

Säg vad du inte vill ha

Negativa instruktioner rensar upp resultat. Lägg till ”ingen text, ingen vattenstämpel, inga logotyper, inga extra fingrar” för att undvika klassiska AI-artefakter. För varumärkessäkert innehåll: ”generisk förpackning, inga varumärkeslogotyper”. En kort exklusionslista gör ofta mer för kvaliteten än ännu ett adjektiv.

Iterera, överspecificera inte

Börja med en fokuserad prompt, generera, ändra sedan en sak i taget — först ljuset, sedan kamerarörelsen, sedan stämningen. Om du staplar tio adjektiv på en gång blir det omöjligt att veta vad som hjälpte. Behandla varje generation som ett experiment med en variabel.

Bygg en återanvändbar ”husstil”

När du hittar en look du gillar, spara stilhalvan av prompten som ett suffix (t.ex. ”cinematisk, 4K, mjukt naturligt ljus, kort skärpedjup”) och återanvänd den mellan klipp. Du byter motiv och handling per tagning, men husstilen håller en serie visuellt konsekvent — vilket får en kanal att kännas genomtänkt.

Snabba tips

Börja med det viktigaste visuella — modeller viktar promptens början tyngre.
Namnge kamerarörelsen (”långsam panorering”, ”orbit”, ”statisk”) för att styra energi och tempo.
Återanvänd ett ”husstils”-suffix för en konsekvent look i varje klipp.
En handling per tagning — dela upp ”går in och sätter sig och pratar” i separata scener.
Spara en swipe-mapp med promptar som gav grymma tagningar; återanvänd och remixa dem.

Vanliga frågor

Hur lång ska en prompt vara?

En eller två tydliga meningar slår oftast ett stycke. Var specifik, inte lång.

Kan jag använda samma prompt i olika modeller?

Ja — i Vivideo kan du köra en prompt genom flera modeller (Sora, Veo, Kling med flera) och jämföra.

Varför ignorerar min video en del av prompten?

Modeller prioriterar början och kan tappa senare detaljer. Flytta det viktigaste tidigare, eller dela upp i en ny scen.

Funkar promptar även för bild-till-video?

Ja — med en inmatningsbild styr prompten främst rörelse och kamera, inte motivet.

Hur håller jag en karaktär konsekvent över tagningar?

Återanvänd samma detaljerade motivbeskrivning, eller använd en avatar/referensbild så att utseendet förblir stabilt.

Så skriver du text-till-video-promptar (med exempel)

Det här lär du dig

Hur modeller läser din prompt

En promptstruktur som fungerar

Före och efter

Säg vad du inte vill ha

Iterera, överspecificera inte

Bygg en återanvändbar ”husstil”

Snabba tips

Vanliga frågor

Fortsätt lära

Så gör du en video med artificiell intelligens: en nybörjarguide

Avatarrer och röster med artificiell intelligens: en nybörjarguide

Så gör du videor för TikTok, Reels och Shorts

Redo att skapa din video?