Poin Penting
- 1Text-to-video mendominasi dengan 65,7% dari semua pesanan, sementara image-to-video menyumbang 32,6%
- 288,2% dari video AI adalah adegan yang dihasilkan โ bukan avatar, bukan animasi, tetapi dunia yang sepenuhnya dibayangkan dari teks
- 3Pembuatan video AI benar-benar global: prompt datang dalam 24+ bahasa, dengan bahasa Inggris hanya 47,3%
- 4Veo 3.1 menguasai 96,4% penggunaan model, menandakan pemenang yang jelas dalam perlombaan model video AI
- 516:9 landscape (52,8%) sedikit lebih unggul dari 9:16 vertical (43,7%), menunjukkan perpecahan TikTok-vs-YouTube secara real time
Tim Vivideo
Tim Vivideo bersemangat menjadikan pembuatan video mudah diakses oleh semua orang melalui AI. Kami menguji dan meninjau alat terbaru serta membagikan pengetahuan kami untuk membantu Anda sukses.
Kami Menganalisis 40.000+ Prompt Video AI
Setiap orang memiliki pendapat tentang video AI. Para pengamat memprediksi ke mana arahnya. Twitter memperdebatkan apakah itu "cukup baik sekarang." Thumbnail YouTube berteriak tentang pembaruan model terbaru.
Tetapi hampir tidak ada yang membicarakan apa yang sebenarnya orang-orang buat dengan alat ini saat ini.
Jadi kami memutuskan untuk mencari tahu.
Kami menarik data dari lebih dari 120.000 video yang dihasilkan AI yang dibuat di Vivideo, mengklasifikasikan sampel 40.000+ prompt menggunakan GPT-4o-mini, dan menghitung angkanya. Apa yang muncul adalah potret yang mengejutkan rinci tentang bagaimana orang-orang nyata โ bukan influencer, bukan peneliti, tetapi pencipta dan bisnis sehari-hari โ menggunakan video AI pada tahun 2025.
Berikut adalah semua yang kami temukan.
Dataset: Bagaimana Kami Mendapatkan Angka Ini
Mari kita jelaskan metodologinya agar Anda tahu persis apa yang Anda lihat.
Dataset lengkap kami mencakup 120.000+ video yang dihasilkan melalui platform Vivideo. Untuk analisis prompt yang lebih mendetail, kami mengambil sampel terstratifikasi dari 915 prompt dan menjalankannya melalui GPT-4o-mini untuk klasifikasi ke dalam kategori penggunaan. Statistik yang lebih luas โ penggunaan model, rasio aspek, durasi, bahasa, dan jenis input โ berasal dari dataset lengkap.
Kami tidak memilih-milih. Kami tidak menyaring untuk output yang "mengesankan". Ini adalah data mentah, tidak terfilter dari pengguna nyata yang melakukan pekerjaan nyata (dan ya, beberapa di antaranya adalah orang-orang yang membuat video ulang tahun untuk ibu mereka โ dan itu luar biasa).
Beberapa catatan: klasifikasi prompt oleh AI tidak sempurna. Beberapa prompt bersifat ambigu. Sebuah "video produk dengan seseorang berbicara" bisa ditandai sebagai video demo produk atau video avatar. Kami mengoptimalkan untuk niat yang paling mungkin, dan memeriksa ratusan klasifikasi secara manual.
Dengan itu, mari kita selami.
Gambaran Besar: Teks-ke-Video vs. Gambar-ke-Video
Pertanyaan pertama yang kami ajukan sederhana: Bagaimana orang memulai video mereka?
Apakah mereka mengetik prompt dari awal? Atau mengunggah gambar dan menghidupkannya?
65,7% dari semua pesanan video adalah teks-ke-video. 32,6% adalah gambar-ke-video. Sekitar ~1,7% menggunakan metode lain seperti generasi avatar.
Ini agak mengejutkan. Kami mengharapkan gambar-ke-video lebih tinggi โ lagipula, bisa dibilang "lebih mudah" karena Anda memberikan titik awal visual kepada AI. Tetapi data menceritakan kisah yang berbeda: dua pertiga pengguna lebih suka mendeskripsikan visi mereka dengan kata-kata dan membiarkan AI menentukan visualnya.
Mengapa? Beberapa teori:
- Hambatan masuk yang lebih rendah. Anda tidak perlu memiliki atau menemukan gambar yang tepat. Anda hanya perlu mengetik apa yang Anda inginkan. Teks-ke-video adalah kanvas kosong yang sempurna.
- Kontrol kreatif yang lebih besar. Prompt teks memungkinkan Anda menentukan suasana, gerakan kamera, pencahayaan, dan gaya โ hal-hal yang lebih sulit untuk dikomunikasikan melalui gambar statis.
- "Kesenjangan imajinasi." Banyak pengguna menciptakan adegan yang belum ada โ dunia fantasi, konsep produk, urutan naratif. Anda tidak bisa mengunggah foto sesuatu yang belum dibangun.
Dengan demikian, gambar-ke-video memiliki audiens setia sendiri. Ini sangat populer untuk animasi produk e-commerce, tur real estat (mulai dengan foto properti), dan menghidupkan karya seni.
Apa yang Sebenarnya Diciptakan Orang (Rincian Kasus Penggunaan)
Ini adalah bagian yang paling kami nantikan. Ketika kami mengklasifikasikan semua 915 sampel prompt berdasarkan kasus penggunaan, satu kategori benar-benar mendominasi.
| Kasus Penggunaan | Persentase |
|---|---|
| Adegan video yang dihasilkan AI | 88,2% |
| Video avatar / kepala berbicara | 7,1% |
| Animasi gambar | 4,7% |
Biarkan itu meresap. Hampir 9 dari 10 video AI adalah adegan yang sepenuhnya dihasilkan โ bukan wajah seseorang yang berbicara ke kamera, bukan efek Ken Burns pada foto, tetapi adegan visual lengkap yang diciptakan dari deskripsi teks.
Ini adalah kisah nyata video AI pada tahun 2025: orang-orang menggunakannya sebagai mesin imajinasi visual.
Apa yang Sebenarnya Terlihat Seperti Adegan Tersebut
Kami menggali lebih dalam ke dalam 88,2% untuk memahami jenis adegan apa yang dihasilkan orang. Meskipun kategorinya tumpang tindih (video promosi juga bisa menjadi narasi), berikut adalah pola utama yang kami amati:
- Video promosi โ Bisnis membuat iklan, video merek, dan konten pemasaran. Segala sesuatu mulai dari promosi restoran lokal hingga peluncuran produk SaaS.
- Konten edukasi โ Video penjelasan, tutorial, dan urutan "cara kerjanya". Guru, pembuat kursus, dan pelatih perusahaan adalah pengguna awal yang kuat.
- Konten media sosial โ Klip pendek yang dirancang untuk TikTok, Instagram Reels, dan YouTube Shorts. Sering kali dipengaruhi tren dan dirancang untuk dampak maksimum yang menghentikan scroll.
- Penceritaan dan narasi โ Film pendek, konsep video musik, dan urutan naratif. Di sinilah prompt paling kreatif berada โ orang-orang membangun seluruh dunia dalam 4-12 detik.
- Demonstrasi produk โ Penjual e-commerce menampilkan produk dalam konteks gaya hidup. "Tunjukkan sepatu saya dipakai oleh seorang pelari di jalur gunung saat matahari terbenam" โ semacam itu.
- Salam pribadi dan perayaan โ Pesan ulang tahun, kartu liburan, kejutan ulang tahun. Video AI sebagai kartu Hallmark baru.
- Tur real estat โ Tur properti virtual, pameran lingkungan, dan visualisasi arsitektur.
- Pameran produk e-commerce โ Cuplikan keindahan produk, pengungkapan gaya 360ยฐ, dan video konteks gaya hidup yang membuat produk terlihat premium.
Kategori avatar/kepala berbicara (7,1%) lebih kecil dari yang Anda harapkan mengingat semua buzz tentang avatar AI. Ini sebagian karena generasi avatar adalah kasus penggunaan yang lebih spesifik โ itu memerlukan alur kerja yang berbeda dan menarik audiens yang lebih sempit (terutama pelatihan perusahaan dan penjangkauan penjualan yang dipersonalisasi).
Animasi gambar pada 4,7% mewakili pengguna yang mengunggah foto diam dan menambahkan gerakan โ pilihan populer untuk menghidupkan karya seni, foto lama, atau gambar produk.
Bahasa Video AI: Fenomena 24 Bahasa
Ini adalah sesuatu yang benar-benar mengejutkan kami. Jika Anda menganggap pembuatan video AI terutama merupakan aktivitas berbahasa Inggris, data mengatakan sebaliknya.
Bahasa Inggris hanya menyumbang 47,3% dari semua prompt. Itu berarti lebih dari setengah dari semua prompt video AI di Vivideo ditulis dalam bahasa non-Inggris.
Ini bukan hanya "sedikit internasional." Ini adalah fenomena global, dengan adopsi yang signifikan di setiap benua.
| Bahasa | % dari Prompt |
|---|---|
| Bahasa Inggris | 47,3% |
| Vietnam | 23,1% |
| Arab | 11,4% |
| Rusia | 3,2% |
| Turki | 2,7% |
| Jerman | 2,2% |
| Ukraina | 1,9% |
| Indonesia | 1,7% |
| Spanyol | 1,3% |
| Belanda | 0,9% |
| Ibrani | 0,7% |
| Polandia | 0,7% |
| China | 0,6% |
| Portugis | 0,6% |
| Swedia | 0,5% |
| Yunani | 0,4% |
Beberapa hal menonjol:
Vietnam dengan 23,1% sangat besar. Hampir seperempat dari semua prompt dalam bahasa Vietnam. Ini mencerminkan ekonomi kreator digital Vietnam yang berkembang pesat dan adopsi awal alat AI untuk pembuatan konten. Kreator Vietnam menggunakan video AI untuk segala sesuatu mulai dari video produk e-commerce hingga konten media sosial dalam skala besar.
Arab dengan 11,4% menjadikan wilayah MENA salah satu pasar video AI yang paling aktif. Mengingat transformasi digital yang cepat yang terjadi di negara-negara Teluk dan investasi besar dalam infrastruktur AI, ini sesuai.
Ekosistem panjang itu nyata. Di luar bahasa-bahasa teratas, ada aktivitas yang signifikan dalam bahasa Rusia, Turki, Jerman, Ukraina, Indonesia, dan banyak lagi. Video AI bukanlah mainan Silicon Valley โ ini adalah alat kreatif global.
Ini memiliki implikasi besar bagi siapa pun yang membangun di ruang ini: jika alat video AI Anda hanya bekerja dengan baik dengan prompt bahasa Inggris, Anda mengabaikan lebih dari setengah pengguna potensial Anda.
Preferensi Format: Rasio Aspek dan Durasi
Bagaimana orang memformat video mereka memberi tahu Anda banyak tentang di mana video tersebut akan berakhir.
Rasio Aspek
| Rasio Aspek | Persentase |
|---|---|
| 16:9 (Lanskap) | 52,8% |
| 9:16 (Potret/Vertikal) | 43,7% |
| 1:1 (Persegi) | ~0% |
Pembagian lanskap vs. potret sangat dekat โ 52,8% berbanding 43,7% โ yang memberi tahu kita sesuatu yang penting: pertempuran antara video horizontal dan vertikal pada dasarnya adalah undian.
Lanskap masih memimpin, kemungkinan besar didorong oleh YouTube, penyematan situs web, presentasi, dan konten pemasaran tradisional. Tetapi vertikal tepat di belakangnya, didorong oleh TikTok, Instagram Reels, dan YouTube Shorts.
Yang mengejutkan? Video persegi (1:1) pada dasarnya sudah mati. Dengan sekitar 0%, tidak ada yang membuat video persegi lagi. Format persegi lama Instagram, yang dulunya menjadi default untuk media sosial, telah sepenuhnya ditinggalkan di era video AI.
Durasi Video
| Durasi | Persentase |
|---|---|
| 12 detik | 30,1% |
| 4 detik | 29,2% |
| 8 detik | 23,3% |
| 6 detik | 6,6% |
Preferensi durasi mengungkapkan pembagian dua kamp yang menarik:
Kamp 1: Tim 12 detik (30,1%). Pengguna ini menginginkan durasi maksimum yang tersedia. Mereka membuat konten naratif, demo produk, dan video promosi di mana setiap detik tambahan sangat berarti. Dua belas detik cukup untuk menceritakan mini-cerita: pengaturan, pengungkapan, hasil.
Kamp 2: Tim 4 detik (29,2%). Pengguna ini menginginkan klip cepat dan menarik โ sempurna untuk pengait media sosial, kreatif iklan, atau menggabungkan beberapa klip menjadi editan yang lebih panjang. Empat detik pada dasarnya adalah satu momen visual yang kuat.
Titik tengah 8 detik (23,3%) menangkap pengguna yang menginginkan sedikit lebih banyak ruang bernapas daripada 4 detik tetapi tidak memerlukan penuh 12. Popularitas relatif rendah dari video 6 detik (6,6%) menarik โ tampaknya orang lebih suka berkomitmen pada "pendek" atau "panjang" daripada membagi perbedaan.
Perlombaan Model: Veo 3.1 Mendominasi
Jika ada statistik utama dari seluruh analisis ini, mungkin ini:
Veo 3.1 menggerakkan 96,4% dari semua pembuatan video AI di Vivideo.
Itu bukan kesalahan ketik. Model Veo 3.1 dari Google adalah pilihan yang sangat dominan untuk pembuatan video AI.
| Model | % Penggunaan |
|---|---|
| Veo 3.1 | 96,4% |
| Sora 2 | 2,0% |
| HeyGen (Avatar) | 10,5% dari semua pesanan |
Catatan: Generasi avatar HeyGen dihitung secara terpisah karena berfungsi berbeda (avatar digital vs. generasi adegan). Bagian 10,5% ini tumpang tindih dengan kategori avatar dalam analisis kasus penggunaan kami.
Mengapa Veo 3.1 mendominasi begitu lengkap? Berdasarkan umpan balik pengguna dan pengujian kami sendiri:
- Kualitas visual. Veo 3.1 secara konsisten menghasilkan output yang paling fotorealistik dan koheren secara visual.
- Patuh pada prompt. Ini mengikuti prompt kompleks dengan lebih setia โ gerakan kamera, spesifikasi pencahayaan, arahan gaya.
- Kecepatan. Waktu pembuatan bersaing, dan rasio kualitas terhadap kecepatan adalah yang terbaik di kelasnya.
- Konsistensi. Lebih sedikit "artefak AI aneh" โ lebih sedikit tangan yang meleleh, fisika yang tidak mungkin, dan momen lembah yang tidak menyenangkan.
Sora 2 di 2,0% masih memiliki penggemarnya, terutama untuk konten yang lebih artistik dan bergaya. Tetapi pasar telah berbicara, setidaknya untuk saat ini: ketika orang ingin video AI yang andal dan berkualitas tinggi, mereka memilih Veo 3.1.
Temuan Mengejutkan
Setiap analisis data yang baik menemukan hal-hal yang tidak Anda harapkan. Berikut adalah pola-pola yang membuat kami terkejut.
1. Tingkat Moderasi Konten 9%
Sekitar 9% dari semua prompt ditandai oleh sistem moderasi konten sebagai konten dewasa atau tidak pantas. Ini sebenarnya lebih rendah dari yang diharapkan banyak orang di industri โ beberapa perkiraan menempatkan tingkat percobaan konten dewasa untuk generator gambar AI di 15-20%.
Apa artinya ini? Pembuatan video AI cenderung lebih profesional dan bertujuan dibandingkan dengan pembuatan gambar AI. Ketika Anda membayar untuk pembuatan video (berbeda dengan bermain dengan alat gambar gratis), niatnya lebih serius dan kasus penggunaannya lebih berorientasi bisnis.
2. Efek Kartu Ulang Tahun
Salam pribadi โ ulang tahun, liburan, perayaan โ muncul jauh lebih banyak dari yang kami harapkan. Ini bukan kasus penggunaan mencolok yang ditampilkan dalam reel demo AI, tetapi mereka mewakili aplikasi teknologi yang benar-benar menghangatkan hati. Orang-orang menciptakan pesan video pribadi yang akan sulit (atau sangat mahal) dilakukan hanya dua tahun yang lalu.
3. Kematian Video Persegi
Kami sudah menyebutkan ini, tetapi perlu diulang: video persegi 1:1 pada dasarnya berada di 0%. Format yang mendominasi Instagram dari 2012-2019 telah sepenuhnya ditinggalkan. Jika alat video Anda masih default ke persegi, Anda sedang menyelesaikan masalah kemarin.
4. Ekonomi Kreator Vietnam
Dengan 23,1% dari semua prompt, bahasa Vietnam tidak hanya terwakili โ itu adalah bahasa kedua yang paling populer dengan margin besar, lebih dari dua kali lipat bahasa Arab di tempat ketiga dengan 11,4%. Ekonomi kreator Vietnam jelas berada di titik belok, dan alat video AI adalah akselerator kunci.
5. Tidak Ada yang Ingin Video 6 Detik
Dengan hanya 6,6% dari pesanan, format 6 detik adalah durasi yang paling tidak populer. Pengguna sangat lebih suka baik yang pendek dan menarik (4 detik) atau yang lebih panjang (12 detik). Titik tengah tidak begitu menarik. Ini mencerminkan apa yang telah kami lihat dalam tren media sosial โ konten adalah pengait cepat atau mini-narasi, dengan sedikit ruang untuk di antara.
Apa Artinya Ini bagi Pencipta
Jadi Anda telah melihat datanya. Apa yang seharusnya Anda lakukan dengan itu?
Apakah Anda seorang pemasar, pembuat konten, pemilik bisnis, atau hanya seseorang yang penasaran tentang video AI, berikut adalah hal-hal yang dapat diambil tindakan:
1. Mulailah dengan Teks-ke-Video
Jika Anda belum mencoba video AI, teks-ke-video adalah tempat yang tepat. Dua pertiga pengguna memulai di sini, dan dengan alasan yang baik โ Anda tidak memerlukan aset apa pun, hanya ide. Deskripsikan apa yang ingin Anda lihat, dan AI akan membangunnya.
2. Pikirkan dalam 4 atau 12 Detik
Ketika merencanakan video AI Anda, pikirkan dalam hal pukulan 4 detik atau cerita 12 detik. Data menunjukkan ini adalah durasi yang menarik. Untuk pengait media sosial dan kreatif iklan, gunakan 4 detik. Untuk demo produk, penjelasan, dan konten naratif, gunakan penuh 12.
3. Pilih Orientasi Anda dengan Hati-hati
Jangan default ke lanskap. Jika konten Anda akan menuju TikTok, Reels, atau Shorts, gunakan 9:16 vertikal. Jika untuk YouTube, situs web Anda, atau presentasi, gunakan 16:9. Dan lupakan tentang persegi โ pasar telah bergerak.
4. Jangan Abaikan Pasar Non-Inggris
Jika Anda membangun bisnis di sekitar konten video AI, data menunjukkan permintaan besar dari pasar berbahasa Vietnam, Arab, Rusia, dan Turki. Ini bukan audiens niche โ mereka mewakili ratusan juta pemirsa potensial.
5. Gunakan Gambar-ke-Video untuk Konten Produk
Sementara teks-ke-video mendominasi secara keseluruhan, gambar-ke-video adalah senjata rahasia untuk e-commerce dan pemasaran produk. Unggah foto produk Anda dan tambahkan gerakan, konteks, dan kehidupan. Ini lebih cepat daripada pemotretan dan jauh lebih dapat diskalakan.
6. Veo 3.1 Adalah Pilihan Aman
Jika Anda bertanya-tanya model mana yang harus digunakan, data jelas: 96,4% pengguna memilih Veo 3.1. Ini menawarkan kombinasi terbaik antara kualitas, kecepatan, dan kepatuhan pada prompt. Mulailah dari sana, dan eksperimen dengan alternatif seperti Sora 2 untuk gaya kreatif tertentu.
Intinya: Video AI bukan lagi hal baru. Dengan lebih dari 120.000 video yang dihasilkan, prompt dalam 24+ bahasa, dan kasus penggunaan mulai dari kartu ulang tahun hingga tur real estat, ini adalah alat kreatif arus utama. Pertanyaannya bukan apakah akan menggunakannya โ tetapi bagaimana menggunakannya lebih baik daripada orang lain.
Siap untuk melihat apa yang bisa Anda ciptakan? Coba Vivideo gratis dan tambahkan prompt Anda ke dataset berikutnya.
Jelajahi Lainnya
Perbandingan Terkait
Coba Alat-Alat Ini
Siap Membuat Video AI Anda Sendiri?
Coba Vivideo gratis hari ini - tanpa perlu kartu kredit. Buat video profesional dalam hitungan menit.
Mulai Membuat Gratis