Glosarium

Kamus video AI

Setiap istilah yang akan Anda temui saat membuat video dengan kecerdasan buatan — dari dasar kamera dan codec hingga difusi, avatar, dan generasi agen — dijelaskan dengan bahasa sederhana.

74 istilah · Video · AI · Video AI

74 istilah
Avatar AIVideo AI
Presenter di layar yang dihasilkan atau dikloning oleh AI yang dapat membacakan naskah Anda dalam suara dan bahasa pilihan.
B-rollVideo
Cuplikan pelengkap yang disisipkan di atas bidikan utama untuk menambah konteks, mengilustrasikan poin, atau menyamarkan potongan.
Bingkai awal & akhirVideo AI
Memberikan bingkai mulai dan/atau akhir yang dianimasikan model di antaranya, memberi Anda kendali presisi atas awal dan akhir bidikan.
BitrateVideo
Seberapa banyak data yang digunakan per detik video, diukur dalam kbps atau Mbps. Bitrate lebih tinggi mempertahankan lebih banyak detail namun membuat ukuran file lebih besar.
BokehVideo
Buram lembut yang menyenangkan pada area di luar fokus di latar bidikan, sering tampak sebagai lingkaran cahaya yang berpendar.
CheckpointAI
Cuplikan tersimpan dari bobot model. Checkpoint sering dibagikan sebagai 'file model' yang dapat diunduh untuk dijalankan.
Chroma key (green screen)Video
Mengganti latar belakang berwarna solid — biasanya hijau — dengan gambar atau video lain dengan membuat warna tersebut transparan.
CodecVideo
Algoritma yang mengompresi dan mendekompresi video — seperti H.264, H.265/HEVC, AV1, atau VP9. Menyeimbangkan kualitas visual dengan ukuran file.
Color gradingVideo
Langkah kreatif menyesuaikan warna, kontras, dan suasana cuplikan pada pascaproduksi untuk memberi tampilan yang konsisten dan terarah.
Container (format file)Video
Pembungkus file yang menampung video, audio, dan metadata sekaligus — MP4, MOV, WebM, atau MKV. Terpisah dari codec yang disimpan di dalamnya.
DeepfakeVideo AI
Media sintetis yang secara realistis menukar atau merekayasa wajah atau suara seseorang. Kuat, namun memunculkan isu persetujuan, keaslian, dan legal yang nyata.
Dubbing AIVideo AI
Mengganti atau menambahkan audio ucapan dalam bahasa lain, idealnya cocok dengan suara dan gerak bibir pembicara.
EmbeddingAI
Daftar angka (vektor) yang menangkap makna teks, gambar, atau audio, sehingga model dapat membandingkan dan menggabungkan berbagai input.
Establishing shotVideo
Bidikan pembuka lebar yang menetapkan lokasi dan konteks sebuah adegan sebelum Anda memotong lebih dekat.
Fine-tuningAI
Pelatihan lanjutan pada model dasar dengan data spesifik untuk menspesialisasikannya — bagi gaya, merek, atau individu tertentu.
Frame rate (FPS)Video
Frame per detik — berapa banyak gambar diam diputar setiap detik. 24fps terasa sinematik, 30fps umum untuk web, dan 60fps terlihat sangat mulus untuk gerak dan olahraga.
Gambar referensiVideo AI
Gambar yang Anda berikan ke model untuk memandu subjek, karakter, atau gaya video yang dihasilkan.
Gambar-ke-video (I2V)Video AI
Menghidupkan gambar diam menjadi video, sering dipandu oleh prompt yang menjelaskan gerak yang Anda inginkan.
GANAI
Generative Adversarial Network — metode lebih awal di mana generator dan jaringan kritikus saling berkompetisi. Sebagian besar digantikan oleh difusi untuk video berkualitas tinggi.
HalusinasiAI
Ketika model menghasilkan keluaran yang meyakinkan namun salah atau dibuat-buat — seperti teks acak, jari berlebih, atau gerakan mustahil.
HDR (High Dynamic Range)Video
Video dengan rentang kecerahan dan warna lebih luas daripada standar (SDR), untuk highlight dan bayangan yang lebih nyata serta rona yang lebih kaya.
InferensiAI
Menjalankan model yang sudah terlatih untuk menghasilkan output — misalnya membuat video dari prompt. Inilah yang Anda bayarkan per generasi.
Inpainting / outpaintingVideo AI
Mengisi bagian dari sebuah bingkai (inpainting) atau memperluas melampaui tepinya (outpainting). Dalam video, digunakan untuk menghapus, mengganti, atau memperluas area seiring waktu.
Interpolasi frameVideo AI
Menghasilkan bingkai di antaranya untuk menaikkan frame rate atau menghaluskan gerak — misalnya mengubah 24fps menjadi 60fps yang lembut.
Jaringan sarafAI
Model yang terinspirasi secara longgar dari otak: lapisan neuron terhubung yang mempelajari pola dari data. Ini adalah fondasi AI generatif modern.
Kedalaman bidangVideo
Seberapa banyak bagian gambar yang berada dalam fokus tajam. Depth of field dangkal akan memburamkan latar untuk menonjolkan subjek.
Kepala berbicaraVideo AI
Video berfokus pada seseorang yang berbicara ke kamera — kasus penggunaan klasik untuk avatar dan presenter AI.
KeyframeVideo
Dalam penyuntingan, bingkai bertanda yang menetapkan nilai (posisi, skala, opasitas) yang dianimasikan perangkat lunak di antaranya. Dalam kompresi, bingkai referensi penuh yang menjadi acuan rekonstruksi bingkai sekitar.
Kloning suaraVideo AI
Mereplikasi suara spesifik seseorang dari cuplikan singkat sehingga dapat mengucapkan teks baru dengan suara yang sama.
KompositingVideo
Melapiskan banyak elemen visual — cuplikan, grafis, efek, teks — menjadi satu bingkai gabungan.
Konsistensi temporalVideo AI
Menjaga karakter, objek, dan gaya tetap stabil dari bingkai ke bingkai agar video tidak berkedip, melengkung, atau berubah wujud secara tidak wajar.
Kontrol gerak / motion brushVideo AI
Alat yang memungkinkan Anda mengarahkan di mana dan bagaimana sesuatu bergerak dalam klip yang dihasilkan, alih-alih menyerahkannya sepenuhnya ke model.
Kontrol kameraVideo AI
Mengarahkan pergerakan kamera virtual — pan, zoom, orbit, dolly — di dalam bidikan yang dihasilkan AI.
Kumpulan dataAI
Kumpulan contoh — video, gambar, teks — yang digunakan untuk melatih model. Kualitas dan keragamannya membentuk kemampuan model.
Langkah samplingAI
Berapa banyak iterasi yang diambil model difusi untuk mengubah noise menjadi bingkai final. Lebih banyak langkah bisa berarti kualitas lebih tinggi namun generasi lebih lambat dan mahal.
LetterboxingVideo
Bilahan hitam yang ditambahkan di atas dan bawah (atau samping) video agar sesuai dengan aspect ratio lain tanpa memotong gambar.
LoRAAI
Low-Rank Adaptation — cara ringan untuk mengajarkan model gaya, karakter, atau konsep baru dengan file tambahan kecil, alih-alih melatih ulang seluruh model.
Lower thirdVideo
Teks yang ditempatkan di bagian bawah bingkai, biasanya nama dan jabatan pembicara, atau sebuah keterangan.
LUT (Look-Up Table)Video
Preset yang memetakan ulang warna untuk menerapkan tampilan tertentu dalam sekali klik, atau mengonversi cuplikan antar-ruang warna.
Manusia digital / digital twinVideo AI
Replika fotorealistik berbasis kecerdasan buatan dari orang sungguhan, sekali dilatih dan dapat digunakan ulang sebagai presenter on-camera.
ModelAI
Sistem AI terlatih yang mengubah input — seperti prompt teks — menjadi output, seperti video. Tiap model punya kekuatan, kecepatan, dan harga berbeda.
Model difusiAI
Pendekatan dominan di balik gambar dan video kecerdasan buatan: model memulai dari noise acak dan, selangkah demi selangkah, menghapusnya hingga hasil koheren yang sesuai prompt muncul.
Model duniaVideo AI
Sistem AI yang membangun simulasi internal tentang bagaimana adegan, objek, dan fisika berperilaku, membantu menghasilkan video yang lebih panjang, koheren, dan konsisten.
Model fondasiAI
Model besar tujuan umum yang dilatih pada data luas dan dapat diadaptasi ke banyak tugas lanjutan.
Model open-weightAI
Model yang bobotnya dipublikasikan agar siapa pun bisa menjalankan, mempelajari, atau melakukan fine-tuning (mis. di fal atau secara lokal), berbeda dengan model tertutup yang hanya diakses melalui API.
MultimodalAI
Model yang memahami atau menghasilkan lebih dari satu jenis data sekaligus — misalnya teks, gambar, video, dan audio bersama-sama.
Parameter (bobot)AI
Angka-angka internal yang dipelajari model saat pelatihan. Mereka menyimpan apa yang 'diketahui' model; lebih banyak parameter bisa berarti lebih mampu.
PelatihanAI
Melatih model dengan menunjukkan data dalam jumlah besar dan menyesuaikan parameter internalnya secara bertahap hingga menghasilkan keluaran yang baik.
Pembelajaran mendalamAI
Pembelajaran mesin yang menggunakan neural network berlapis-lapis. Mendorong model gambar, video, suara, dan bahasa saat ini.
Peningkatan resolusiVideo AI
Menggunakan AI untuk meningkatkan resolusi video — misalnya 1080p ke 4K — menambah detail yang masuk akal alih-alih sekadar meregangkan piksel.
Perpanjangan videoVideo AI
Meneruskan klip melewati durasi aslinya dengan menghasilkan bingkai tambahan yang mengikuti secara alami.
PromptAI
Instruksi yang Anda berikan ke model — biasanya teks, kadang ditambah gambar — yang menggambarkan video yang ingin Anda buat.
Prompt negatifAI
Deskripsi tentang apa yang TIDAK Anda inginkan pada output. Mengarahkan model menjauhi objek, gaya, atau artefak yang tidak diinginkan.
Rasio aspekVideo
Perbandingan lebar terhadap tinggi bingkai — 16:9 (layar lebar), 9:16 (vertikal untuk Reels dan TikTok), atau 1:1 (persegi). Ini menentukan kecocokan video Anda pada tiap platform dan layar.
Rekayasa promptAI
Seni merangkai prompt agar model secara konsisten menghasilkan hasil sesuai maksud, termasuk subjek, gaya, kamera, dan suasana.
Render / renderingVideo
Memproses proyek menjadi file video final — atau, dalam AI, model yang menghasilkan bingkai menjadi klip akhir.
ResolusiVideo
Dimensi piksel tiap bingkai, ditulis lebar × tinggi (mis. 1920×1080). Lebih banyak piksel berarti lebih banyak detail. Tingkatan umum: 720p (HD), 1080p (Full HD), 4K, dan 8K.
RLHFAI
Reinforcement Learning from Human Feedback — pelatihan yang menggunakan preferensi manusia untuk menyelaraskan keluaran model dengan apa yang benar-benar diinginkan manusia.
Ruang latenAI
Representasi matematis terkompresi tempat model sebenarnya bekerja. Generasi terjadi di sini terlebih dahulu, lalu didekode menjadi piksel yang terlihat.
SeedAI
Angka acak awal untuk sebuah generasi. Menggunakan seed yang sama dengan prompt yang sama akan mereproduksi hasil yang sama — berguna untuk konsistensi dan penyesuaian kecil.
ShotVideo
Satu potongan cuplikan kontinu. Jenis umum termasuk wide shot, medium shot, dan close-up.
Sinkronisasi bibirVideo AI
Menyelaraskan gerak mulut karakter atau avatar dengan audio ucapan agar terlihat benar-benar mengucapkan kata-kata tersebut.
Skala panduan (CFG)AI
Seberapa ketat model mengikuti prompt Anda versus berimprovisasi. Nilai lebih tinggi lebih patuh kata-kata; nilai lebih rendah memberi model lebih banyak kebebasan kreatif.
StoryboardVideo
Rangkaian sketsa atau bingkai terencana yang memetakan tiap bidikan sebelum Anda memproduksi atau menghasilkan video.
Takarir / subtitleVideo
Teks di layar dari audio yang diucapkan. Takarir juga mencatat bunyi dan pembicara untuk aksesibilitas; subtitle biasanya menyalin atau menerjemahkan dialog.
Tanda airVideo
Logo atau teks yang ditumpangkan pada video untuk menandai kepemilikan. Banyak generator gratis menambahkannya; paket berbayar biasanya menghapusnya.
Teks-ke-suara (TTS)Video AI
Mengubah teks tertulis menjadi audio ucapan alami dengan suara sintetis — mesin di balik voice-over AI.
Teks-ke-video (T2V)Video AI
Menghasilkan klip video langsung dari deskripsi tertulis — tanpa kamera, aktor, atau stok cuplikan.
TokenAI
Unit terkecil input yang diproses model — potongan kata untuk teks, atau petak/bingkai untuk video.
Transfer gayaVideo AI
Menerapkan gaya visual dari satu referensi ke cuplikan atau hasil generasi Anda.
TransformerAI
Arsitektur neural network berbasis 'attention' yang menimbang keterkaitan antarbagian input. Menjadi dasar model bahasa besar dan banyak model video modern.
TransisiVideo
Cara satu bidikan berubah ke bidikan berikutnya — potong keras, larut (dissolve), pudar (fade), atau sapuan (wipe).
Video agenVideo AI
Agen kecerdasan buatan yang merencanakan dan menjalankan seluruh produksi — naskah, adegan, suara, avatar, dan edit — dari satu brief, bukan satu klip demi klip.
Video-ke-video (V2V)Video AI
Mengubah klip yang ada menjadi gaya atau tampilan baru sambil mempertahankan gerak dan timing aslinya.

Dari prompt ke render: bahasa video AI

Membuat video dengan kecerdasan buatan berada di persimpangan dua dunia — puluhan tahun kosakata perfilman dan produksi video, serta bahasa pembelajaran mesin yang bergerak cepat. Kamus ini menyatukan keduanya, ditambah istilah baru yang khas untuk video generatif, agar Anda bisa membaca alat, tutorial, atau kartu model apa pun dengan percaya diri.

Mulailah dari dasar: aspect ratio, resolusi, frame rate, dan codec menentukan tampilan video Anda dan di mana ia diputar. Lalu lapisan AI — model, difusi, prompt, seed, dan LoRA membentuk apa yang dihasilkan. Terakhir, hal spesifik video berbasis kecerdasan buatan — text-to-video, image-to-video, lip sync, avatar, konsistensi temporal, dan world model — menjelaskan kemampuan generator masa kini.

Setiap definisi ditulis dengan bahasa sederhana, tanpa perlu matematika. Cari lewat kata kunci, filter berdasarkan topik, atau jelajahi A–Z — lalu terapkan kosakata ini di studio Vivideo.