शब्दावली

एआई वीडियो शब्दकोश

एआई के साथ वीडियो बनाते समय मिलने वाले हर शब्द की सरल परिभाषा — कैमरा और कोडेक की बुनियाद से लेकर diffusion, अवतार और agentic generation तक।

74 शब्द · वीडियो · एआई · एआई वीडियो

74 शब्द
अपस्केलिंगएआई वीडियो
एआई की मदद से वीडियो की रेज़ोल्यूशन बढ़ाना — जैसे 1080p से 4K — सिर्फ खींचने के बजाय यथार्थपरक डिटेल जोड़कर।
आस्पेक्ट रेशियोवीडियो
फ्रेम की चौड़ाई-से-ऊँचाई का अनुपात — 16:9 (वाइडस्क्रीन), 9:16 (Reels और TikTok के लिए वर्टिकल), या 1:1 (स्क्वायर)। यह तय करता है कि आपका वीडियो हर प्लेटफ़ॉर्म और स्क्रीन पर कैसे फिट होगा।
इनपेंटिंग / आउटपेंटिंगएआई वीडियो
फ्रेम के किसी हिस्से को भरना (इनपेंटिंग) या किनारों से आगे बढ़ाना (आउटपेंटिंग)। वीडियो में, समय के साथ क्षेत्रों को हटाने, बदलने या बढ़ाने के लिए।
इन्फ़रेंसएआई
पहले से प्रशिक्षित मॉडल को चलाकर आउटपुट बनाना — जैसे प्रॉम्प्ट से आपका वीडियो जनरेट करना। प्रति जेनरेशन आप इसी के लिए भुगतान करते हैं।
इमेज-टू-वीडियो (I2V)एआई वीडियो
एक स्थिर इमेज को वीडियो में जान देना, अक्सर ऐसे प्रॉम्प्ट के साथ जो वांछित मोशन बताता है।
एंबेडिंगएआई
संख्याओं की सूची (वेक्टर) जो टेक्स्ट, इमेज या ऑडियो का अर्थ कैद करती है, ताकि मॉडल अलग इनपुट्स की तुलना/मिलान कर सके।
एआई अवतारएआई वीडियो
एक जनरेटेड या क्लोन किया गया ऑन-स्क्रीन प्रेजेंटर जो चुनी हुई आवाज़ और भाषा में आपकी स्क्रिप्ट बोल सकता है।
एआई डबिंगएआई वीडियो
बोले गए ऑडियो को दूसरी भाषा में बदलना या जोड़ना — आदर्श रूप से स्पीकर की आवाज़ और लिप मूवमेंट से मेल खाते हुए।
एजेंटिक वीडियोएआई वीडियो
ऐसा एआई एजेंट जो एक ही ब्रीफ़ से पूरी प्रोडक्शन — स्क्रिप्ट, सीन, वॉइस, अवतार और एडिट्स — की योजना बनाकर चलाता है, एक-एक क्लिप के बजाय।
एस्टैब्लिशिंग शॉटवीडियो
सीन की लोकेशन और सन्दर्भ सेट करने वाला वाइड ओपनिंग शॉट — जिसके बाद आप नज़दीक कट करते हैं।
ओपन-वेट मॉडलएआई
ऐसा मॉडल जिसके वेट्स सार्वजनिक होते हैं ताकि कोई भी उसे चला, अध्ययन या फ़ाइन-ट्यून कर सके (जैसे fal पर या लोकली), जबकि क्लोज़्ड मॉडल सिर्फ API से मिलते हैं।
कंटेनर (फ़ाइल फ़ॉर्मेट)वीडियो
वह फ़ाइल रैपर जो वीडियो, ऑडियो और मेटाडेटा को साथ रखता है — MP4, MOV, WebM या MKV। यह अंदर स्टोर कोडेक से अलग होता है।
कंपोज़िटिंगवीडियो
कई विज़ुअल तत्व — फुटेज, ग्राफ़िक्स, इफेक्ट्स, टेक्स्ट — को लेयर कर एक संयुक्त फ्रेम बनाना।
कलर ग्रेडिंगवीडियो
पोस्ट-प्रोडक्शन में फुटेज के रंग, कॉन्ट्रास्ट और मूड को रचनात्मक रूप से एडजस्ट करना, ताकि एकसार और इरादतन लुक मिले।
कीफ़्रेमवीडियो
एडिटिंग में, ऐसा चिन्हित फ्रेम जो कोई वैल्यू सेट करता है (पोज़िशन, स्केल, अपेसिटी) जिसके बीच सॉफ्टवेयर एनीमेट करता है। कंप्रेशन में, पास के फ्रेम जिनसे दोबारा बनाए जाते हैं, वह पूर्ण रेफ़रेंस फ्रेम।
कैप्शंस / सबटाइटल्सवीडियो
बोली गई ऑडियो का ऑन-स्क्रीन टेक्स्ट। कैप्शंस ध्वनियाँ और स्पीकर भी बताती हैं; सबटाइटल्स सामान्यतः संवाद को ट्रांसक्राइब या अनुवाद करते हैं।
कैमरा कंट्रोलएआई वीडियो
एआई-जनरेटेड शॉट के भीतर वर्चुअल कैमरा मूव्स — पैन, ज़ूम, ऑर्बिट, डॉली — को निर्देशित करना।
कोडेकवीडियो
वीडियो को कंप्रेस/डीकंप्रेस करने वाला एल्गोरिदम — जैसे H.264, H.265/HEVC, AV1 या VP9। यह विज़ुअल क्वालिटी और फ़ाइल साइज़ के बीच संतुलन बनाता है।
क्रोमा की (ग्रीन स्क्रीन)वीडियो
एक सॉलिड-कलर्ड बैकग्राउंड — आमतौर पर हरा — को ट्रांसपेरेंट कर किसी और इमेज या वीडियो से बदलना।
गाइडेंस स्केल (CFG)एआई
मॉडल आपके प्रॉम्प्ट को कितनी सख्ती से मानता है बनाम अपनी ओर से रचनात्मक होता है। ऊँचे मान शब्दों के क़रीब रखते हैं; कम मान अधिक क्रिएटिव आज़ादी देते हैं।
चेकपॉइंटएआई
मॉडल के वेट्स का सेव्ड स्नैपशॉट। चेकपॉइंट्स अक्सर वही ‘मॉडल फ़ाइल’ होते हैं जिन्हें लोग डाउनलोड कर चलाते हैं।
टेक्स्ट-टू-वीडियो (T2V)एआई वीडियो
केवल लिखित विवरण से सीधे वीडियो क्लिप बनाना — कैमरा, एक्टर्स या स्टॉक फुटेज की ज़रूरत नहीं।
टेक्स्ट-टू-स्पीच (TTS)एआई वीडियो
लिखित टेक्स्ट को सिंथेटिक आवाज़ से स्वाभाविक बोले गए ऑडियो में बदलना — एआई वॉइसओवर का इंजन।
टेम्पोरल कंसिस्टेंसीएआई वीडियो
फ्रेम-टू-फ्रेम किरदारों, ऑब्जेक्ट्स और स्टाइल को स्थिर रखना ताकि वीडियो टिमटिमाए, मुड़े-तुड़े या अस्वाभाविक रूप से न बदले।
टॉकिंग हेडएआई वीडियो
ऐसा वीडियो जो कैमरे से बात करते व्यक्ति पर केंद्रित हो — एआई अवतार/प्रेजेंटर्स का क्लासिक केस।
टोकनएआई
वह सबसे छोटा हिस्सा जिसे मॉडल प्रोसेस करता है — टेक्स्ट के लिए शब्द का टुकड़ा, या वीडियो के लिए पैच/फ्रेम।
ट्रांज़िशनवीडियो
एक शॉट से अगले में जाने का तरीका — हार्ड कट, डिसॉल्व, फ़ेड, या वाइप।
ट्रांसफ़ॉर्मरएआई
‘अटेंशन’ पर आधारित न्यूरल-नेट आर्किटेक्चर जो इनपुट के भागों के आपसी संबंध तौलता है। बड़े भाषा मॉडल्स और कई आधुनिक वीडियो मॉडल्स की रीढ़।
ट्रेनिंगएआई
मॉडल को बहुत बड़े डेटा पर दिखाकर सिखाना, और उसके आंतरिक पैरामीटर्स समायोजित करना जब तक अच्छे नतीजे न मिलें।
डिजिटल ह्यूमन / डिजिटल ट्विनएआई वीडियो
किसी वास्तविक व्यक्ति की फोटोरीअलिस्टिक एआई प्रतिकृति, जिसे एक बार ट्रेन कर ऑन-कैमरा प्रेजेंटर की तरह बार-बार इस्तेमाल किया जा सके।
डिफ्यूज़न मॉडलएआई
एआई इमेज और वीडियो के पीछे प्रमुख तरीका: मॉडल रैंडम नॉइज़ से शुरू करता है और चरण-दर-चरण उसे हटाकर आपके प्रॉम्प्ट से मेल खाता सुसंगत नतीजा उभारता है।
डीप लर्निंगएआई
मल्टीलयर न्यूरल नेटवर्क्स वाली मशीन लर्निंग। आज की इमेज, वीडियो, वॉइस और लैंग्वेज मॉडल्स को शक्ति देती है।
डीपफेकएआई वीडियो
ऐसा सिंथेटिक मीडिया जो किसी का चेहरा या आवाज़ यथार्थ रूप से बदलता/गढ़ता है। ताकतवर है, पर सहमति, प्रामाणिकता और कानूनी चिंताएँ उठती हैं।
डेटासेटएआई
उदाहरणों का संग्रह — वीडियो, इमेज, टेक्स्ट — जिस पर मॉडल को ट्रेन किया जाता है। इसकी गुणवत्ता और विविधता तय करती है कि मॉडल क्या कर पाएगा।
डेप्थ ऑफ फील्डवीडियो
इमेज का कितना भाग शार्प फोकस में है। शैलो डेप्थ ऑफ फील्ड बैकग्राउंड धुंधला कर सब्जेक्ट को उभारता है।
नेगेटिव प्रॉम्प्टएआई
वह विवरण जो बताता है कि आउटपुट में आप क्या नहीं चाहते। यह मॉडल को अवांछित ऑब्जेक्ट्स, स्टाइल्स या आर्टिफ़ैक्ट्स से दूर रखता है।
न्यूरल नेटवर्कएआई
दिमाग से ढीली प्रेरणा लिया मॉडल: जुड़े ‘न्यूरॉन्स’ की लेयर्स जो डेटा से पैटर्न सीखती हैं। आधुनिक जनरेटिव एआई की नींव।
पैरामीटर्स (वेट्स)एआई
वह आंतरिक संख्याएँ जो मॉडल ट्रेनिंग के दौरान सीखता है। यही मॉडल का ‘ज्ञान’ स्टोर करती हैं; अधिक पैरामीटर्स अक्सर अधिक क्षमता दर्शाते हैं।
प्रॉम्प्टएआई
वह निर्देश जो आप मॉडल को देते हैं — आमतौर पर टेक्स्ट, कभी-कभार इमेज के साथ — जिसमें आप वांछित वीडियो का वर्णन करते हैं।
प्रॉम्प्ट इंजीनियरिंगएआई
प्रॉम्प्ट ऐसे गढ़ने की कला कि मॉडल विषय, शैली, कैमरा और मूड समेत मनचाहा नतीजा भरोसेमंद रूप से दे।
फ़र्स्ट और लास्ट फ़्रेमएआई वीडियो
स्टार्ट और/या एंड फ़्रेम देना जिन्हें मॉडल बीच में एनीमेट करे — शॉट की शुरुआत और अंत पर सटीक कंट्रोल मिलता है।
फ़ाइन-ट्यूनिंगएआई
किसी बेस मॉडल को विशेष डेटा पर आगे ट्रेन कर उसे किसी खास शैली, ब्रांड या व्यक्ति के अनुरूप बनाना।
फ़ाउंडेशन मॉडलएआई
बड़ा, सामान्य-उद्देश्य मॉडल जो व्यापक डेटा पर ट्रेन होता है और कई डाउनस्ट्रीम टास्क में ढाला जा सकता है।
फ्रेम इंटरपोलेशनएआई वीडियो
बीच-बीच के फ्रेम जनरेट कर फ्रेम रेट बढ़ाना या मोशन स्मूद करना — जैसे 24fps को रेशमी 60fps में बदलना।
फ्रेम रेट (FPS)वीडियो
प्रति सेकंड चलने वाले फ्रेम — यानी हर सेकंड कितनी स्थिर छवियाँ चलती हैं। 24fps सिनेमाई एहसास देता है, 30fps वेब का मानक है, और 60fps तेज़ मोशन व स्पोर्ट्स के लिए बेहद स्मूद दिखता है।
बिटरेटवीडियो
प्रति सेकंड वीडियो में लगने वाला डेटा, kbps या Mbps में मापा जाता है। ऊँचा बिटरेट अधिक डिटेल बनाए रखता है लेकिन फ़ाइलें बड़ी हो जाती हैं।
बी-रोलवीडियो
मुख्य शॉट पर काटकर डाला गया अतिरिक्त फुटेज जो सन्दर्भ जोड़ता है, बात समझाता है, या एडिट छुपाता है।
बोकेहवीडियो
शॉट के बैकग्राउंड में मुलायम, मनभावन आउट-ऑफ-फोकस ब्लर — अक्सर चमकते गोलों जैसा दिखता है।
मल्टीमॉडलएआई
ऐसा मॉडल जो एक साथ एक से अधिक प्रकार के डेटा को समझता/जनरेट करता है — जैसे टेक्स्ट, इमेज, वीडियो और ऑडियो।
मॉडलएआई
एक प्रशिक्षित एआई सिस्टम जो इनपुट — जैसे टेक्स्ट प्रॉम्प्ट — को आउटपुट, जैसे वीडियो, में बदलता है। अलग मॉडल्स की ताकत, गति और कीमतें अलग होती हैं।
मोशन कंट्रोल / मोशन ब्रशएआई वीडियो
ऐसे टूल्स जो जनरेटेड क्लिप में चीज़ें कहाँ और कैसे हिलेंगी, यह निर्देशित करने देते हैं — सब कुछ मॉडल पर छोड़ने के बजाय।
रेंडर / रेंडरिंगवीडियो
किसी प्रोजेक्ट को फाइनल वीडियो फ़ाइल में प्रोसेस करना — या एआई में, मॉडल द्वारा फ्रेम जनरेट कर अंतिम क्लिप बनाना।
रेज़ोल्यूशनवीडियो
हर फ्रेम के पिक्सेल आयाम, चौड़ाई × ऊँचाई के रूप में (जैसे 1920×1080)। ज़्यादा पिक्सेल मतलब ज़्यादा बारीकी। आम स्तर: 720p (HD), 1080p (Full HD), 4K और 8K।
रेफ़रेंस इमेजएआई वीडियो
वह इमेज जो आप मॉडल को देते हैं ताकि जनरेटेड वीडियो का सब्जेक्ट, कैरेक्टर या स्टाइल उसी से मार्गदर्शित हो।
लिप सिंकएआई वीडियो
किसी किरदार या अवतार के मुँह की हरकतों को बोले गए ऑडियो से मिलाना ताकि सचमुच बोलते हुए लगे।
लेटरबॉक्सिंगवीडियो
वीडियो के ऊपर-नीचे (या किनारों) काले बार्स जोड़ना ताकि अलग आस्पेक्ट रेशियो में बिना क्रॉप किए फिट हो सके।
लेटेंट स्पेसएआई
एक संकुचित गणितीय प्रतिनिधित्व जहाँ मॉडल सच में काम करता है। पहले यहीं जनरेशन होती है, फिर दृश्य पिक्सेल में डिकोड होती है।
लोअर थर्डवीडियो
फ्रेम के निचले हिस्से में रखा टेक्स्ट — आमतौर पर वक्ता का नाम-टाइटल या कैप्शन।
वर्ल्ड मॉडलएआई वीडियो
ऐसा एआई जो सीन, ऑब्जेक्ट्स और फ़िज़िक्स का आंतरिक सिमुलेशन बनाता है — इससे वह लंबा, अधिक सुसंगत और संगत वीडियो जनरेट कर पाता है।
वीडियो एक्सटेंशनएआई वीडियो
मूल लंबाई से आगे क्लिप को जारी रखना — ऐसे अतिरिक्त फ्रेम जनरेट कर जो स्वाभाविक तौर पर आगे बढ़ें।
वीडियो-टू-वीडियो (V2V)एआई वीडियो
मौजूदा क्लिप को उसकी मूल मोशन और टाइमिंग बचाते हुए नए स्टाइल/लुक में बदलना।
वॉइस क्लोनिंगएआई वीडियो
कम सैंपल से किसी विशेष व्यक्ति की आवाज़ फिर से गढ़ना, ताकि वही आवाज़ नया टेक्स्ट बोल सके।
वॉटरमार्कवीडियो
वीडियो पर स्वामित्व दिखाने के लिए ओवरले किया गया लोगो या टेक्स्ट। कई मुफ्त एआई जेनरेटर इसे जोड़ते हैं; पेड प्लान प्रायः हटा देते हैं।
शॉटवीडियो
लगातार चलने वाला एकल फुटेज का टुकड़ा। आम प्रकार: वाइड शॉट, मीडियम शॉट और क्लोज़-अप।
सीडएआई
जनरेशन के लिए शुरुआती रैंडम नंबर। वही प्रॉम्प्ट और वही सीड दोहराने पर वही नतीजा बनता है — निरंतरता और छोटे बदलावों के लिए उपयोगी।
सैंपलिंग स्टेप्सएआई
डिफ्यूज़न मॉडल नॉइज़ को अंतिम फ्रेम में बदलने के कितने चरण लेता है। अधिक स्टेप्स से गुणवत्ता बढ़ सकती है पर गति धीमी और लागत ज़्यादा होती है।
स्टाइल ट्रांसफ़रएआई वीडियो
किसी एक रेफ़रेंस की विज़ुअल शैली को अपने फुटेज या जनरेशन पर लागू करना।
स्टोरीबोर्डवीडियो
हर शॉट को पहले से मैप करने के लिए बनाए गए स्केच/फ्रेम की क्रमबद्ध शृंखला — प्रोड्यूस या जनरेट करने से पहले।
हैलुसिनेशनएआई
जब मॉडल आत्मविश्वास से गलत या गढ़ा हुआ आउटपुट दे — जैसे बिगड़ा हुआ टेक्स्ट, अतिरिक्त उंगलियाँ, या असंभव मोशन।
GANएआई
जनरेटिव एडवर्सेरियल नेटवर्क — पुराना तरीका जिसमें जनरेटर और क्रिटिक नेटवर्क प्रतिस्पर्धा करते हैं। उच्च-गुणवत्ता वीडियो के लिए काफी हद तक डिफ्यूज़न ने स्थान ले लिया है।
HDR (हाई डायनामिक रेंज)वीडियो
ऐसा वीडियो जो मानक (SDR) से अधिक ब्राइटनेस और रंग-रेंज ले जाता है — जिससे हाइलाइट्स, शैडो और टोन अधिक नैचुरल दिखते हैं।
LoRAएआई
लो-रैंक अडैप्टेशन — पूरे मॉडल को दोबारा ट्रेन करने के बजाय छोटे ऐड-ऑन फ़ाइल से मॉडल को नई शैली, किरदार या अवधारणा सिखाने का हल्का तरीका।
LUT (लुक-अप टेबल)वीडियो
एक प्रीसेट जो रंगों को रीमैप कर एक क्लिक में खास लुक देता है, या फुटेज को अलग-अलग कलर स्पेस में बदलता है।
RLHFएआई
रीइन्फोर्समेंट लर्निंग फ़्रॉम ह्यूमन फ़ीडबैक — ऐसा ट्रेनिंग तरीका जो लोगों की पसंद से मॉडल के आउटपुट को मानव अपेक्षाओं के अनुरूप करता है।

प्रॉम्प्ट से रेंडर तक: एआई वीडियो की भाषा

एआई से वीडियो बनाना दो दुनियाओं के संगम पर है — दशकों पुरानी फिल्ममेकिंग/वीडियो-प्रोडक्शन की शब्दावली, और मशीन लर्निंग की तेज़ी से बदलती भाषा। यह शब्दकोश दोनों को साथ लाता है, साथ ही जनरेटिव वीडियो के नए शब्द भी, ताकि आप किसी भी टूल, ट्यूटोरियल या मॉडल कार्ड को आत्मविश्वास से पढ़ सकें।

पहले बुनियाद समझें: aspect ratio, resolution, frame rate और codecs तय करते हैं आपका वीडियो कैसा दिखेगा और कहाँ चलेगा। फिर एआई की परत — models, diffusion, prompts, seeds और LoRAs यह आकार देते हैं कि क्या जनरेट होगा। आखिर में एआई-वीडियो की खास बातें — text-to-video, image-to-video, lip sync, avatars, temporal consistency और world models — बताती हैं कि आज के जेनरेटर वास्तव में क्या कर सकते हैं।

हर परिभाषा सरल भाषा में लिखी है, गणित की ज़रूरत नहीं। कीवर्ड से खोजें, विषय के अनुसार फ़िल्टर करें, या A–Z ब्राउज़ करें — फिर इस शब्दावली को Vivideo स्टूडियो में आज़माएँ।