Một prompt video AI tốt không phải bùa phép. Đó là ghi chú sản xuất được viết đủ rõ để mô hình làm theo và đủ cụ thể để biên tập viên sử dụng.
Hầu hết lỗi prompt đến từ thiếu ngữ cảnh: không có chi tiết về chủ thể, không có chuyển động, không chỉ đạo camera, không thời lượng, không ranh giới phong cách, và không giải thích phần nào phải giữ nhất quán. Prompt tốt hơn không cần dài hơn. Chúng cần có chủ đích hơn.
Điểm rút ra chính
- Một prompt video AI mạnh phải cụ thể về chủ thể, hành động, bối cảnh, camera, phong cách, thời lượng và ràng buộc.
- Prompt tốt mô tả chuyển động, không chỉ thẩm mỹ.
- Dùng ràng buộc phủ định để ngăn lỗi chữ, thừa tay chân, trôi logo và chuyển động camera không mong muốn.
- Việc prompt cải thiện nhanh nhất khi bạn so sánh các biến thể với một storyboard rõ ràng.
Công thức prompt
Dùng cấu trúc này: chủ thể, hành động, bối cảnh, camera, ánh sáng, phong cách, thời lượng, tỷ lệ khung hình, nhu cầu âm thanh và ràng buộc. Nếu bạn dùng image-to-video, hãy nêu rõ phần nào cần ổn định và phần nào được phép chuyển động.
40 ví dụ
- 1. Một chai skincare trên đá ướt, push-in chậm, ánh sáng buổi sáng, hơi ngưng tụ, 6 giây, dọc 9:16, nhãn luôn đọc được.
- 2. Một founder giải thích dashboard SaaS khi các thẻ UI động xuất hiện cạnh họ, văn phòng sạch, 30 giây.
- 3. Ngoại cảnh nhà rao bán lúc golden hour, rise kiểu drone, không người, chân thực, 8 giây.
- 4. Một đầu bếp bày mì pasta, cận cảnh tay, có hơi nước, ánh sáng nhà hàng ấm, 10 giây.
- 5. Avatar giáo viên giải thích quang hợp với ba sơ đồ động đơn giản, giọng thân thiện, 45 giây.
- 6. Một ốp điện thoại rơi xuống bàn, lực va hấp thụ gọn, ống kính macro, phong cách quảng cáo sản phẩm.
- 7. Trước/sau biến đổi góc bàn làm việc, cắt nhanh, có caption, video dọc kiểu creator.
- 8. Bước onboarding SaaS: người dùng nhập CSV, dashboard lấp đầy, con trỏ tô sáng ba thao tác.
- 9. Avatar HLV thể hình giải thích một lỗi cho người mới trong 20 giây, giọng trực diện, không cường điệu.
- 10. Bảng menu quán cà phê animate thành ba thức uống nổi bật, phong cách Reel địa phương trên Instagram.
- 11. Bài blog thành video giải thích 45 giây với heading động và B-roll sạch.
- 12. Ý tưởng hỗ trợ khách: người dùng bối rối rồi nhẹ nhõm sau khi dùng live chat, không testimonial giả.
- 13. Ảnh phòng khách sạn thành walkthrough điện ảnh chậm, nội thất ổn định, không đổi bố cục.
- 14. Trình tự unboxing sản phẩm, tay mở hộp tự nhiên, bao bì chính xác, nhãn không đổi.
- 15. Avatar phòng khám y tế giải thích chuẩn bị lịch hẹn, giọng bình tĩnh, không tuyên bố chẩn đoán.
- 16. Món trưa nhà hàng với âm thanh xèo xèo cận, dọc 9:16, không chữ thừa.
- 17. Short lịch sử không lộ mặt với map animation và hình ảnh phong cách tư liệu được tạo, gắn nhãn rõ là tái dựng.
- 18. Trình phát nhạc với sóng neon trừu tượng chuyển theo beat, không hiển thị lời.
- 19. So sánh split screen: quy trình cũ vs quy trình AI, icon tối giản, phong cách doanh nghiệp.
- 20. Hướng dẫn khu phố thành phố, góc quay tầm đường, nhãn bản đồ tinh tế, hướng đến người tái định cư.
- 21. Móc câu quảng cáo kiểu UGC: creator cầm sản phẩm và nêu một phản đối gây bất ngờ.
- 22. Demo sản phẩm với ba use case trong 15 giây, caption đồng bộ hành động.
- 23. Video ghi chú phát hành app, ba thẻ tính năng, animation UI sắc nét.
- 24. Avatar intro bản địa hóa tiếng Tây Ban Nha, cùng nền thương hiệu và nhịp độ.
- 25. Cảnh đồ chơi, phòng sáng, tay phụ huynh cho thấy tỷ lệ kích thước, không dùng hình ảnh trẻ em.
- 26. Cú macro đồng hồ xa xỉ, bezel xoay, nền đen, phản xạ kiểm soát.
- 27. Bếp trưởng nhà hàng giới thiệu món mới với phụ đề và cắt nguyên liệu nhanh.
- 28. Tổng kết bài giảng đại học với sơ đồ bảng trắng động và câu hỏi quiz kết thúc.
- 29. Clip webinar B2B tái mục đích thành highlight dọc với cutaway diễn giả và caption.
- 30. Môi giới bất động sản giải thích “ba cờ đỏ khi kiểm tra” với hình minh họa đơn giản.
- 31. Câu chuyện gây quỹ nonprofit bằng cảnh minh họa, không người thụ hưởng giả.
- 32. Mẹo đóng gói du lịch với cảnh từ trên xuống vali và overlay chữ nhanh.
- 33. Clip thời trang e-commerce cho thấy vải chuyển động trong gió, nhãn và màu chính xác.
- 34. Avatar đào tạo an ninh mạng giải thích phishing trong 40 giây, ngôn ngữ giản dị.
- 35. Video FAQ sản phẩm trả lời “Có vừa không?” với so sánh kích cỡ.
- 36. Vòng lặp YouTube Shorts: khung cuối quay lại hình đầu.
- 37. Video kiểu teardown trên TikTok: nêu vì sao ba giây đầu hiệu quả.
- 38. Video pitch founder với B-roll tạo sinh về vấn đề, giải pháp và kết quả.
- 39. Clip giáo dục bệnh nhân phòng nha về kỳ vọng khi lấy cao răng, không hứa hẹn điều trị.
- 40. Demo API cho developer: prompt nhập terminal, hiện preview video, dashboard ghi log request.
Cách sửa prompt
Đừng viết lại tất cả cùng lúc. Thay đổi một biến: camera, hành động, phong cách, thời lượng hoặc ràng buộc. Giữ một log prompt đơn giản để bạn biết chi tiết nào thực sự cải thiện đầu ra.
Giữ sổ tay prompt, kể cả lần trượt

Nhiều người chép prompt đã hiệu quả và bỏ ba cái trượt. Hãy đảo thói quen: đồ bị loại mới là bài học. Một clip trả về sai là ghi chép rõ nhất về cách mô hình hiểu chữ của bạn, và chỗ nó hỏng chỉ thẳng vào cách sửa. Khi log một lần trượt, hãy để ý thủ phạm quen thuộc: cú di chuyển camera bạn yêu cầu nhưng không xảy ra, chuyển động giật khựng hoặc không bắt đầu, thứ gì đó biến mất giữa chừng, chữ trên màn hình thành loằng ngoằng, phần tử thương hiệu bị lệch, hoặc nhịp thời gian lê thê hay vội vã.
Lập một bảng nhỏ với mỗi hàng là một lần thử và các cột:
- Mục tiêu — kết quả bạn muốn từ clip
- Prompt — nguyên văn bạn đã gõ
- Đầu vào — bất kỳ ảnh, shot sản phẩm, clip tham chiếu, giọng hoặc bộ nhận diện bạn đính kèm
- Kết quả — phần nào đúng và phần nào sai
- Lần sau — thay đổi bạn thực hiện cho lượt tạo kế tiếp
Sau hai mươi ba mươi hàng, bảng tự viết kết luận. Bạn sẽ thấy mô hình nào giữ nhãn sản phẩm sắc nét, mô hình nào di chuyển clip image-to-video mà không méo, mô hình nào run rẩy ở khuôn mặt, và mô hình nào tỏa sáng ở cảnh trừu tượng hoặc stylized. Sổ tay xây từ clip của chính bạn vượt mọi danh sách “prompt hoàn hảo” đi mượn, vì nó được tinh chỉnh cho công việc bạn thật sự làm.
Thay một thứ, rồi re-roll
Đây là quy tắc tiết kiệm render nhất: di chuyển đúng một cần gạt lớn giữa các lượt. Nếu bạn cùng lúc đổi chủ thể, camera, ánh sáng, phong cách và độ dài, bạn sẽ nhận một clip khác mà không biết chỉnh nào đem lại chiến thắng. Cô lập biến và mỗi lần re-roll sẽ dạy bạn điều gì đó.
Thứ tự sửa như sau:
- Sửa mọi thứ sai sự thật hoặc sai thương hiệu trước.
- Tiếp theo chỉnh bố cục.
- Rồi xử lý chuyển động.
- Tinh chỉnh phong cách sau đó.
- Để khâu đánh bóng cuối cùng.
Bản năng “đánh nhau” là thôi thúc bạn hoàn thiện diện mạo trước. Nhiều người re-roll để có grade điện ảnh hơn trong khi nhãn sản phẩm trong khung vẫn bị đánh vần sai. Hãy sửa nhãn trước, rồi mới làm đẹp.
Quy trình prompt video AI thực dụng
Bắt đầu với một shot, không phải cả video. Một prompt mô tả một clip liên tục, nên nhồi ba cảnh vào một prompt là cách nhanh nhất tạo trôi, biến hình và chuyển động rối. Chọn một shot bạn muốn và viết rõ ràng.
Đặt tên chủ thể, rồi hành động, rồi cú máy, rồi ràng buộc. Viết prompt nền đó một lần. Tạo clip, nhìn đúng một lỗi đã xảy ra, và chỉ đổi biến kiểm soát lỗi đó. Re-roll, so sánh hai đầu ra cạnh nhau, và giữ bản thắng làm nền mới. Lặp lại đến khi clip vững.
Đây là vòng lặp prompt cho một shot:
- Chủ thể
- Hành động
- Bối cảnh
- Camera và chuyển động
- Ánh sáng và phong cách
- Thời lượng và tỷ lệ khung hình
- Quy tắc ổn định (image-to-video)
- Dòng “tránh”
- Tạo clip
- Sửa một biến
Đa số prompt thất bại vì người viết gõ một ý mơ hồ rồi nhấn tạo, hy vọng mô hình tự điền chỗ trống. Hiếm khi vậy. Hãy quyết định shot, chuyển động và ràng buộc bằng chữ trước, rồi mới prompt.
Danh sách kiểm tra trước khi prompt
Trước khi nhấn tạo, đọc lại prompt theo năm câu hỏi:
- Chủ thể đã được mô tả đủ cụ thể để mô hình không thể đoán sai chưa?
- Bạn đã chỉ đạo chuyển động và camera, không chỉ diện mạo?
- Bạn đã nêu thời lượng, tỷ lệ khung hình và nhu cầu âm thanh?
- Với image-to-video, bạn đã nói phần nào phải ổn định và phần nào nên chuyển động?
- Bạn đã thêm dòng “tránh” để chặn lỗi đã biết (chữ méo, logo trôi, thừa tay chân)?
Nếu có câu trả lời là không, hãy sửa prompt trước khi tốn một lượt render. Prompt rõ hơn rẻ hơn re-roll, và cho bạn kết quả có thể sửa từng biến.
Công thức prompt thật sự hữu ích

Dùng thứ tự: chủ thể, hành động, bối cảnh, camera, chuyển động, tâm trạng, ràng buộc và định dạng đầu ra. Ví dụ: “Cận cảnh dọc sản phẩm là cốc giữ nhiệt đen mờ trên bàn gỗ, hơi bốc chậm, ánh sáng cửa sổ buổi sáng, camera push-in nhẹ, phong cách quảng cáo chân thực, không chữ, không méo logo, 8 giây.”
Prompt đó hiệu quả vì nó nói cho mô hình điều gì quan trọng và điều gì không được bịa. Khi kết quả trượt, hãy sửa từng biến. Prompting không phải đoán mò. Đó là lặp có kiểm soát.
Vị trí của prompting trong Vivideo
Vivideo cho bạn ba cách để đưa các prompt này vào việc. One-prompt generation là nơi công thức trên phát huy trực tiếp: viết chủ thể, hành động, camera và ràng buộc, và nhận bản nháp để chỉnh. Khi bạn muốn mô tả mục tiêu hơn là tự viết prompt, agentic AI chat có thể lập kế hoạch shot và dựng video cho bạn, và manual mode có mặt khi clip cần kiểm soát thủ công. Templates, brand kits, avatar và giọng AI giữ đầu ra đúng thương hiệu, và truy cập API/CLI/MCP cho phép bạn chạy cùng mẫu prompt ở quy mô khi chúng đã hiệu quả.
Ví dụ prompt video AI: viết để kiểm soát chuyển động
Một prompt video AI mạnh không chỉ tả cảnh. Nó điều khiển thời gian. Nghĩa là prompt nên nói điều gì xảy ra trước, điều gì thay đổi, điều gì giữ ổn định và camera ứng xử ra sao.
Dùng cấu trúc gọn này:
[Chủ thể] làm [hành động] trong [môi trường]. Camera [chuyển động/khung hình]. Phong cách [phong cách thị giác]. Giữ [đối tượng/người/chi tiết quan trọng] ổn định. Tránh [lỗi đã biết].Ví dụ:
Một founder mở laptop trên bàn nhỏ ở quán cà phê và xem một dashboard analytics gọn sạch. Camera bắt đầu từ sau vai rồi từ từ đẩy gần màn hình. Ánh sáng buổi sáng tự nhiên, phong cách tài liệu chân thực. Giữ bố cục dashboard nhất quán và tránh văn bản khó đọc.Dòng “tránh” thường bị đánh giá thấp. Nó nói cho mô hình biết thất bại trông như thế nào: thừa ngón tay, logo méo, mặt nhấp nháy, nhãn sản phẩm không đọc được, vật thể lơ lửng, chuyển động camera phi thực, hoặc thay đồ đột ngột.
Prompting hoàn hảo không phải là bí chú. Đó là làm công việc của mô hình dễ hơn và quy trình duyệt của bạn sạch hơn.
Kết luận
Một prompt hiệu quả nhất khi đọc như ghi chú sản xuất, không phải điều ước. 40 ví dụ ở trên cùng chung sống lưng: chủ thể cụ thể, chuyển động được chỉ đạo, thời lượng và tỷ lệ khung hình rõ ràng, và một dòng rõ về những gì không được hỏng. Mô hình tự bịa ít hơn, nên bạn re-roll ít hơn.
Hãy dùng công thức trong hướng dẫn này như checklist cho mọi prompt bạn viết: nêu chủ thể, chỉ đạo hành động và camera, đặt thời lượng và tỷ lệ khung hình, khóa những gì phải nhất quán, và thêm dòng “tránh” để chặn chữ méo và logo trôi. Sau đó sửa từng biến. Đó là cách prompting trở thành lặp có kiểm soát thay vì kéo cần máy đánh bạc.
Nếu bạn muốn một nơi để viết những prompt này, tạo từ chúng, và chỉnh biến thể theo biến thể với avatar, giọng và bộ nhận diện đi kèm, hãy dùng thử Vivideo miễn phí tại vivideo.ai.
