Glosarium

Kamus video AI

Setiap istilah yang akan Anda temui saat membuat video dengan kecerdasan buatan — dari dasar kamera dan codec hingga difusi, avatar, dan generasi agen — dijelaskan dengan bahasa sederhana.

74 istilah · Video · AI · Video AI

74 istilah

A B C D E F G H I J K L M P R S T V

Avatar AIVideo AI: Presenter di layar yang dihasilkan atau dikloning oleh AI yang dapat membacakan naskah Anda dalam suara dan bahasa pilihan.

B-rollVideo: Cuplikan pelengkap yang disisipkan di atas bidikan utama untuk menambah konteks, mengilustrasikan poin, atau menyamarkan potongan.
Bingkai awal & akhirVideo AI: Memberikan bingkai mulai dan/atau akhir yang dianimasikan model di antaranya, memberi Anda kendali presisi atas awal dan akhir bidikan.
BitrateVideo: Seberapa banyak data yang digunakan per detik video, diukur dalam kbps atau Mbps. Bitrate lebih tinggi mempertahankan lebih banyak detail namun membuat ukuran file lebih besar.
BokehVideo: Buram lembut yang menyenangkan pada area di luar fokus di latar bidikan, sering tampak sebagai lingkaran cahaya yang berpendar.

CheckpointAI: Cuplikan tersimpan dari bobot model. Checkpoint sering dibagikan sebagai 'file model' yang dapat diunduh untuk dijalankan.
Chroma key (green screen)Video: Mengganti latar belakang berwarna solid — biasanya hijau — dengan gambar atau video lain dengan membuat warna tersebut transparan.
CodecVideo: Algoritma yang mengompresi dan mendekompresi video — seperti H.264, H.265/HEVC, AV1, atau VP9. Menyeimbangkan kualitas visual dengan ukuran file.
Color gradingVideo: Langkah kreatif menyesuaikan warna, kontras, dan suasana cuplikan pada pascaproduksi untuk memberi tampilan yang konsisten dan terarah.
Container (format file)Video: Pembungkus file yang menampung video, audio, dan metadata sekaligus — MP4, MOV, WebM, atau MKV. Terpisah dari codec yang disimpan di dalamnya.

DeepfakeVideo AI: Media sintetis yang secara realistis menukar atau merekayasa wajah atau suara seseorang. Kuat, namun memunculkan isu persetujuan, keaslian, dan legal yang nyata.
Dubbing AIVideo AI: Mengganti atau menambahkan audio ucapan dalam bahasa lain, idealnya cocok dengan suara dan gerak bibir pembicara.

EmbeddingAI: Daftar angka (vektor) yang menangkap makna teks, gambar, atau audio, sehingga model dapat membandingkan dan menggabungkan berbagai input.
Establishing shotVideo: Bidikan pembuka lebar yang menetapkan lokasi dan konteks sebuah adegan sebelum Anda memotong lebih dekat.

Fine-tuningAI: Pelatihan lanjutan pada model dasar dengan data spesifik untuk menspesialisasikannya — bagi gaya, merek, atau individu tertentu.
Frame rate (FPS)Video: Frame per detik — berapa banyak gambar diam diputar setiap detik. 24fps terasa sinematik, 30fps umum untuk web, dan 60fps terlihat sangat mulus untuk gerak dan olahraga.

Gambar referensiVideo AI: Gambar yang Anda berikan ke model untuk memandu subjek, karakter, atau gaya video yang dihasilkan.
Gambar-ke-video (I2V)Video AI: Menghidupkan gambar diam menjadi video, sering dipandu oleh prompt yang menjelaskan gerak yang Anda inginkan.
GANAI: Generative Adversarial Network — metode lebih awal di mana generator dan jaringan kritikus saling berkompetisi. Sebagian besar digantikan oleh difusi untuk video berkualitas tinggi.

HalusinasiAI: Ketika model menghasilkan keluaran yang meyakinkan namun salah atau dibuat-buat — seperti teks acak, jari berlebih, atau gerakan mustahil.
HDR (High Dynamic Range)Video: Video dengan rentang kecerahan dan warna lebih luas daripada standar (SDR), untuk highlight dan bayangan yang lebih nyata serta rona yang lebih kaya.

InferensiAI: Menjalankan model yang sudah terlatih untuk menghasilkan output — misalnya membuat video dari prompt. Inilah yang Anda bayarkan per generasi.
Inpainting / outpaintingVideo AI: Mengisi bagian dari sebuah bingkai (inpainting) atau memperluas melampaui tepinya (outpainting). Dalam video, digunakan untuk menghapus, mengganti, atau memperluas area seiring waktu.
Interpolasi frameVideo AI: Menghasilkan bingkai di antaranya untuk menaikkan frame rate atau menghaluskan gerak — misalnya mengubah 24fps menjadi 60fps yang lembut.

Jaringan sarafAI: Model yang terinspirasi secara longgar dari otak: lapisan neuron terhubung yang mempelajari pola dari data. Ini adalah fondasi AI generatif modern.

Kedalaman bidangVideo: Seberapa banyak bagian gambar yang berada dalam fokus tajam. Depth of field dangkal akan memburamkan latar untuk menonjolkan subjek.
Kepala berbicaraVideo AI: Video berfokus pada seseorang yang berbicara ke kamera — kasus penggunaan klasik untuk avatar dan presenter AI.
KeyframeVideo: Dalam penyuntingan, bingkai bertanda yang menetapkan nilai (posisi, skala, opasitas) yang dianimasikan perangkat lunak di antaranya. Dalam kompresi, bingkai referensi penuh yang menjadi acuan rekonstruksi bingkai sekitar.
Kloning suaraVideo AI: Mereplikasi suara spesifik seseorang dari cuplikan singkat sehingga dapat mengucapkan teks baru dengan suara yang sama.
KompositingVideo: Melapiskan banyak elemen visual — cuplikan, grafis, efek, teks — menjadi satu bingkai gabungan.
Konsistensi temporalVideo AI: Menjaga karakter, objek, dan gaya tetap stabil dari bingkai ke bingkai agar video tidak berkedip, melengkung, atau berubah wujud secara tidak wajar.
Kontrol gerak / motion brushVideo AI: Alat yang memungkinkan Anda mengarahkan di mana dan bagaimana sesuatu bergerak dalam klip yang dihasilkan, alih-alih menyerahkannya sepenuhnya ke model.
Kontrol kameraVideo AI: Mengarahkan pergerakan kamera virtual — pan, zoom, orbit, dolly — di dalam bidikan yang dihasilkan AI.
Kumpulan dataAI: Kumpulan contoh — video, gambar, teks — yang digunakan untuk melatih model. Kualitas dan keragamannya membentuk kemampuan model.

Langkah samplingAI: Berapa banyak iterasi yang diambil model difusi untuk mengubah noise menjadi bingkai final. Lebih banyak langkah bisa berarti kualitas lebih tinggi namun generasi lebih lambat dan mahal.
LetterboxingVideo: Bilahan hitam yang ditambahkan di atas dan bawah (atau samping) video agar sesuai dengan aspect ratio lain tanpa memotong gambar.
LoRAAI: Low-Rank Adaptation — cara ringan untuk mengajarkan model gaya, karakter, atau konsep baru dengan file tambahan kecil, alih-alih melatih ulang seluruh model.
Lower thirdVideo: Teks yang ditempatkan di bagian bawah bingkai, biasanya nama dan jabatan pembicara, atau sebuah keterangan.
LUT (Look-Up Table)Video: Preset yang memetakan ulang warna untuk menerapkan tampilan tertentu dalam sekali klik, atau mengonversi cuplikan antar-ruang warna.

Manusia digital / digital twinVideo AI: Replika fotorealistik berbasis kecerdasan buatan dari orang sungguhan, sekali dilatih dan dapat digunakan ulang sebagai presenter on-camera.
ModelAI: Sistem AI terlatih yang mengubah input — seperti prompt teks — menjadi output, seperti video. Tiap model punya kekuatan, kecepatan, dan harga berbeda.
Model difusiAI: Pendekatan dominan di balik gambar dan video kecerdasan buatan: model memulai dari noise acak dan, selangkah demi selangkah, menghapusnya hingga hasil koheren yang sesuai prompt muncul.
Model duniaVideo AI: Sistem AI yang membangun simulasi internal tentang bagaimana adegan, objek, dan fisika berperilaku, membantu menghasilkan video yang lebih panjang, koheren, dan konsisten.
Model fondasiAI: Model besar tujuan umum yang dilatih pada data luas dan dapat diadaptasi ke banyak tugas lanjutan.
Model open-weightAI: Model yang bobotnya dipublikasikan agar siapa pun bisa menjalankan, mempelajari, atau melakukan fine-tuning (mis. di fal atau secara lokal), berbeda dengan model tertutup yang hanya diakses melalui API.
MultimodalAI: Model yang memahami atau menghasilkan lebih dari satu jenis data sekaligus — misalnya teks, gambar, video, dan audio bersama-sama.

Parameter (bobot)AI: Angka-angka internal yang dipelajari model saat pelatihan. Mereka menyimpan apa yang 'diketahui' model; lebih banyak parameter bisa berarti lebih mampu.
PelatihanAI: Melatih model dengan menunjukkan data dalam jumlah besar dan menyesuaikan parameter internalnya secara bertahap hingga menghasilkan keluaran yang baik.
Pembelajaran mendalamAI: Pembelajaran mesin yang menggunakan neural network berlapis-lapis. Mendorong model gambar, video, suara, dan bahasa saat ini.
Peningkatan resolusiVideo AI: Menggunakan AI untuk meningkatkan resolusi video — misalnya 1080p ke 4K — menambah detail yang masuk akal alih-alih sekadar meregangkan piksel.
Perpanjangan videoVideo AI: Meneruskan klip melewati durasi aslinya dengan menghasilkan bingkai tambahan yang mengikuti secara alami.
PromptAI: Instruksi yang Anda berikan ke model — biasanya teks, kadang ditambah gambar — yang menggambarkan video yang ingin Anda buat.
Prompt negatifAI: Deskripsi tentang apa yang TIDAK Anda inginkan pada output. Mengarahkan model menjauhi objek, gaya, atau artefak yang tidak diinginkan.

Rasio aspekVideo: Perbandingan lebar terhadap tinggi bingkai — 16:9 (layar lebar), 9:16 (vertikal untuk Reels dan TikTok), atau 1:1 (persegi). Ini menentukan kecocokan video Anda pada tiap platform dan layar.
Rekayasa promptAI: Seni merangkai prompt agar model secara konsisten menghasilkan hasil sesuai maksud, termasuk subjek, gaya, kamera, dan suasana.
Render / renderingVideo: Memproses proyek menjadi file video final — atau, dalam AI, model yang menghasilkan bingkai menjadi klip akhir.
ResolusiVideo: Dimensi piksel tiap bingkai, ditulis lebar × tinggi (mis. 1920×1080). Lebih banyak piksel berarti lebih banyak detail. Tingkatan umum: 720p (HD), 1080p (Full HD), 4K, dan 8K.
RLHFAI: Reinforcement Learning from Human Feedback — pelatihan yang menggunakan preferensi manusia untuk menyelaraskan keluaran model dengan apa yang benar-benar diinginkan manusia.
Ruang latenAI: Representasi matematis terkompresi tempat model sebenarnya bekerja. Generasi terjadi di sini terlebih dahulu, lalu didekode menjadi piksel yang terlihat.

SeedAI: Angka acak awal untuk sebuah generasi. Menggunakan seed yang sama dengan prompt yang sama akan mereproduksi hasil yang sama — berguna untuk konsistensi dan penyesuaian kecil.
ShotVideo: Satu potongan cuplikan kontinu. Jenis umum termasuk wide shot, medium shot, dan close-up.
Sinkronisasi bibirVideo AI: Menyelaraskan gerak mulut karakter atau avatar dengan audio ucapan agar terlihat benar-benar mengucapkan kata-kata tersebut.
Skala panduan (CFG)AI: Seberapa ketat model mengikuti prompt Anda versus berimprovisasi. Nilai lebih tinggi lebih patuh kata-kata; nilai lebih rendah memberi model lebih banyak kebebasan kreatif.
StoryboardVideo: Rangkaian sketsa atau bingkai terencana yang memetakan tiap bidikan sebelum Anda memproduksi atau menghasilkan video.

Takarir / subtitleVideo: Teks di layar dari audio yang diucapkan. Takarir juga mencatat bunyi dan pembicara untuk aksesibilitas; subtitle biasanya menyalin atau menerjemahkan dialog.
Tanda airVideo: Logo atau teks yang ditumpangkan pada video untuk menandai kepemilikan. Banyak generator gratis menambahkannya; paket berbayar biasanya menghapusnya.
Teks-ke-suara (TTS)Video AI: Mengubah teks tertulis menjadi audio ucapan alami dengan suara sintetis — mesin di balik voice-over AI.
Teks-ke-video (T2V)Video AI: Menghasilkan klip video langsung dari deskripsi tertulis — tanpa kamera, aktor, atau stok cuplikan.
TokenAI: Unit terkecil input yang diproses model — potongan kata untuk teks, atau petak/bingkai untuk video.
Transfer gayaVideo AI: Menerapkan gaya visual dari satu referensi ke cuplikan atau hasil generasi Anda.
TransformerAI: Arsitektur neural network berbasis 'attention' yang menimbang keterkaitan antarbagian input. Menjadi dasar model bahasa besar dan banyak model video modern.
TransisiVideo: Cara satu bidikan berubah ke bidikan berikutnya — potong keras, larut (dissolve), pudar (fade), atau sapuan (wipe).

Video agenVideo AI: Agen kecerdasan buatan yang merencanakan dan menjalankan seluruh produksi — naskah, adegan, suara, avatar, dan edit — dari satu brief, bukan satu klip demi klip.
Video-ke-video (V2V)Video AI: Mengubah klip yang ada menjadi gaya atau tampilan baru sambil mempertahankan gerak dan timing aslinya.

Dari prompt ke render: bahasa video AI

Membuat video dengan kecerdasan buatan berada di persimpangan dua dunia — puluhan tahun kosakata perfilman dan produksi video, serta bahasa pembelajaran mesin yang bergerak cepat. Kamus ini menyatukan keduanya, ditambah istilah baru yang khas untuk video generatif, agar Anda bisa membaca alat, tutorial, atau kartu model apa pun dengan percaya diri.

Mulailah dari dasar: aspect ratio, resolusi, frame rate, dan codec menentukan tampilan video Anda dan di mana ia diputar. Lalu lapisan AI — model, difusi, prompt, seed, dan LoRA membentuk apa yang dihasilkan. Terakhir, hal spesifik video berbasis kecerdasan buatan — text-to-video, image-to-video, lip sync, avatar, konsistensi temporal, dan world model — menjelaskan kemampuan generator masa kini.

Setiap definisi ditulis dengan bahasa sederhana, tanpa perlu matematika. Cari lewat kata kunci, filter berdasarkan topik, atau jelajahi A–Z — lalu terapkan kosakata ini di studio Vivideo.

Kamus video AI

Mulai buat gratis Apa itu Video AI?