Bạn sẽ học được gì
- Cấu trúc prompt 5 phần (chủ thể, hành động, bối cảnh, phong cách, camera) có thể tái sử dụng
- Cách viết lại prompt mơ hồ thành rõ ràng — kèm ví dụ trước/sau
- Vì sao tín hiệu phủ định (“không chữ, không watermark”) làm sạch kết quả
- Vòng lặp chỉnh từng thay đổi một để cải thiện shot không đoán mò
Mô hình “đọc” prompt của bạn thế nào
Mô hình text-to-video không “hiểu” câu chuyện như con người — nó ghép mẫu giữa lời bạn và hình ảnh đã học. Bạn mô tả càng cụ thể những gì xuất hiện trên màn và hành vi camera, nó càng ít phải đoán. Danh từ cụ thể, một hành động rõ, và cú máy được gọi tên sẽ hiệu quả hơn cả đống tính từ mood.
Cấu trúc prompt hiệu quả
Mô tả cú máy như đạo diễn — chủ thể, hành động, bối cảnh, phong cách và camera. Giữ trong 1–2 câu rõ ràng.
- 1Chủ thể: ai/cái gì trên màn hình (“một barista”, “một chiếc điện thoại bóng bẩy”).
- 2Hành động: điều xảy ra (“rót latte art”, “xoay chậm trên bệ”).
- 3Bối cảnh: ở đâu (“quán cà phê specialty ngập nắng”, “studio tối giản, đổ bóng mềm”).
- 4Phong cách: diện mạo (“cinematic, độ sâu trường ảnh nông, tông ấm”).
- 5Camera: chuyển động (“đẩy chậm vào”, “orbit”, “toàn cảnh tĩnh”).
Trước và sau
Mơ hồ: “một video cà phê”. Tốt hơn: “Cận cảnh barista rót latte art vào tách trắng trên quầy gỗ, quán specialty ngập nắng, cinematic, DOF nông, đẩy chậm vào, không chữ.” Prompt thứ hai kiểm soát chủ thể, bối cảnh, ánh sáng, ống kính và chuyển động — mô hình ít phải bịa, nên shot usable nhiều hơn.
Hãy nói điều bạn không muốn
Tín hiệu phủ định làm sạch kết quả. Thêm “không chữ, không watermark, không logo, không thừa ngón tay” để tránh lỗi kinh điển. Muốn an toàn thương hiệu, thêm “bao bì generic, không logo thương hiệu”. Một danh sách loại trừ ngắn thường hiệu quả hơn thêm một tính từ nữa.
Lặp, đừng quá chi tiết hóa
Bắt đầu bằng prompt tập trung, tạo video, rồi mỗi lần chỉ đổi một yếu tố — ánh sáng, rồi đến cú máy, rồi mood. Chồng 10 tính từ một lúc sẽ khiến bạn không biết thứ gì thực sự giúp. Xem mỗi lần tạo như một thí nghiệm với một biến.
Xây “house style” tái sử dụng
Khi tìm được phong cách ưng ý, lưu nửa sau của prompt về styling làm hậu tố (ví dụ: “cinematic, 4K, ánh sáng tự nhiên mềm, DOF nông”) và dùng cho nhiều clip. Bạn chỉ đổi chủ thể và hành động theo shot, còn house style giữ chuỗi video nhất quán — điều làm kênh trông có chủ ý.
Mẹo nhanh
- Đưa chi tiết quan trọng nhất lên đầu — mô hình ưu tiên phần đầu prompt.
- Gọi tên cú máy (“pan chậm”, “orbit”, “tĩnh”) để kiểm soát nhịp độ và năng lượng.
- Tái sử dụng hậu tố house style để giữ diện mạo nhất quán.
- Mỗi shot một hành động — tách “bước vào rồi ngồi rồi nói” thành các cảnh riêng.
- Giữ thư viện prompt đã cho shot đẹp; tái dùng và remix.
Câu hỏi thường gặp
Prompt nên dài bao nhiêu?
Một đến hai câu rõ ràng thường hiệu quả hơn cả đoạn văn. Cụ thể, không cần dài.
Tôi dùng chung một prompt cho nhiều mô hình được không?
Được — trên Vivideo bạn có thể chạy một prompt qua nhiều mô hình (Sora, Veo, Kling và hơn thế) để so sánh.
Vì sao video bỏ qua một phần prompt?
Mô hình ưu tiên phần đầu và có thể bỏ sót chi tiết phía sau. Hãy đưa yếu tố chính lên sớm, hoặc tách sang một cảnh khác.
Prompt có dùng cho image-to-video không?
Có — khi có ảnh đầu vào, prompt chủ yếu chỉ đạo chuyển động và camera, không thay chủ thể.
Làm sao giữ nhân vật nhất quán qua nhiều shot?
Dùng lại mô tả chủ thể thật chi tiết, hoặc dùng avatar/ảnh tham chiếu để giữ diện mạo ổn định.