Žodynas

Dirbtinio intelekto vaizdo žodynas

Kiekvienas terminas, su kuriuo susidursite kurdami vaizdo įrašus su dirbtiniu intelektu — nuo kameros ir kodekų pagrindų iki difuzijos, avatarų ir agentinio generavimo — paaiškintas paprasta kalba.

74 terminai · Vaizdo įrašas · Dirbtinis intelektas · DI vaizdo įrašai

74 terminai
Agentinis vaizdo kūrimasDI vaizdo įrašai
DI agentas, kuris suplanuoja ir atlieka visą gamybą — scenarijų, scenas, balsą, avatarus ir montažą — pagal vieną užduotį, o ne po vieną klipą.
Apatinis titrasVaizdo įrašas
Tekstas apatinėje kadro dalyje — paprastai kalbėtojo vardas ir pareigos arba paaiškinimas.
Atvirų svorių modelisDirbtinis intelektas
Modelis, kurio svoriai paskelbti, tad kiekvienas gali jį paleisti, tyrinėti ar derinti (pvz., fal ar lokaliai), priešingai nei uždaras modelis, pasiekiamas tik per API.
B-rollVaizdo įrašas
Papildoma vaizdo medžiaga, įkertama ant pagrindinio kadro, kad suteiktų konteksto, iliustruotų mintį arba paslėptų montažą.
Balso kopijavimasDI vaizdo įrašai
Konkretaus žmogaus balso atkūrimas iš trumpo pavyzdžio, kad tas balsas galėtų ištarti naują tekstą.
Bitų spartaVaizdo įrašas
Kiek duomenų sunaudojama vienai vaizdo įrašo sekundei, matuojama kbps arba Mbps. Didesnė sparta išlaiko daugiau detalių, bet padidina failo dydį.
BokehVaizdo įrašas
Švelnus, malonus nefokusuotos srities suliejimas fone, dažnai matomas kaip švytinčių šviesų apskritimai.
Chroma key (žalias fonas)Vaizdo įrašas
Vientiso fono — dažniausiai žalio — pakeitimas kitu vaizdu ar vaizdo įrašu, tą spalvą padarius permatoma.
DaugiamodalisDirbtinis intelektas
Modelis, kuris vienu metu supranta ar generuoja daugiau nei vieno tipo duomenis — pavyzdžiui, tekstą, vaizdą, vaizdo įrašą ir garsą kartu.
DeepfakeDI vaizdo įrašai
Sintetinė medija, realistiškai pakeičianti ar suklastojanti kieno nors veidą ar balsą. Galinga, tačiau kelia rimtų sutikimo, autentiškumo ir teisinių klausimų.
Derinimas (fine-tuning)Dirbtinis intelektas
Papildomas bazinio modelio mokymas su specifiniais duomenimis, kad jis specializuotųsi — tam tikram stiliui, prekės ženklui ar asmeniui.
DI avatarasDI vaizdo įrašai
Dirbtinio intelekto sugeneruotas ar nukopijuotas ekrano pristatytojas, galintis perskaityti jūsų scenarijų pasirinktu balsu ir kalba.
DI įgarsinimas (dubliavimas)DI vaizdo įrašai
Pakeisti ar pridėti kalbamą garsą kita kalba, idealiai priderinant prie kalbėtojo balso ir lūpų judesių.
Difuzijos modelisDirbtinis intelektas
Dominuojantis požiūris DI vaizdams ir vaizdo įrašams: modelis pradeda nuo atsitiktinio triukšmo ir žingsnis po žingsnio jį šalina, kol pagal užklausą išryškėja nuoseklus rezultatas.
Duomenų rinkinysDirbtinis intelektas
Pavyzdžių kolekcija — vaizdo įrašų, vaizdų, teksto — kuria modelis mokomas. Jo kokybė ir įvairovė lemia, ką modelis gali.
GANDirbtinis intelektas
Generatyvus priešiškas tinklas — ankstyvesnis metodas, kur generatorius ir kritikas varžosi. Daug kur pakeistas difuzijos modelių dėl aukštos kokybės vaizdo.
Gilusis mokymasisDirbtinis intelektas
Mašininis mokymasis, naudojantis daugiasluoksnius neuroninius tinklus. Jis varo šiandienos vaizdų, vaizdo, balso ir kalbos modelius.
HalucinacijaDirbtinis intelektas
Kai modelis užtikrintai pateikia neteisingą ar išgalvotą rezultatą — pvz., išdarkytą tekstą, papildomus pirštus ar neįmanomą judesį.
HDR (High Dynamic Range)Vaizdo įrašas
Vaizdo įrašas, perduodantis platesnį ryškumo ir spalvų diapazoną nei standartinis (SDR), kad šviesios ir tamsios vietos atrodytų gyvesnės, o tonai — sodresni.
Infernsa (generavimas)Dirbtinis intelektas
Jau apmokyto modelio paleidimas rezultatui gauti — pavyzdžiui, vaizdo įrašo generavimas pagal užklausą. Būtent už tai mokama už kiekvieną generaciją.
Įtapymas / ištapymas (in/outpainting)DI vaizdo įrašai
Kadro dalies užpildymas (įtapymas) arba pratęsimas už jo ribų (ištapymas). Vaizdo įraše naudojama sritims šalinti, keisti ar plėsti bėgant laikui.
Įterpinys (embedding)Dirbtinis intelektas
Skaičių sąrašas (vektorius), fiksuojantis teksto, vaizdo ar garso reikšmę, kad modelis galėtų lyginti ir derinti skirtingas įvestis.
Įvadinis (nustatantis) kadrasVaizdo įrašas
Platus atidaromasis kadras, nustatantis scenos vietą ir kontekstą prieš pereinant arčiau.
Judesio valdymas / judesio teptukasDI vaizdo įrašai
Įrankiai, leidžiantys nurodyti, kur ir kaip juda objektai sugeneruotame klipe, o ne palikti tai vien modeliui.
Kadras (šūvis)Vaizdo įrašas
Vientisa, nenutrūkstama vaizdo atkarpa. Dažniausi tipai: bendras planas, vidutinis planas ir stambus planas.
Kadroplanis (storyboard)Vaizdo įrašas
Iš anksto suplanuota eskizų ar kadrų seka, žyminti kiekvieną šūvį prieš pradedant kurti ar generuoti vaizdo įrašą.
Kadrų dažnis (FPS)Vaizdo įrašas
Kiek kadrų per sekundę — kiek statiškų vaizdų sužaidžiama kas sekundę. 24fps atrodo kinematografiškai, 30fps — interneto standartas, o 60fps suteikia itin sklandų judesį sportui ir dinamikai.
Kadrų interpolacijaDI vaizdo įrašai
Tarpinių kadrų generavimas kadrų dažniui pakelti ar judesiui glotninti — pavyzdžiui, 24fps pavertimas šilkiniais 60fps.
Kalbanti galvaDI vaizdo įrašai
Vaizdo įrašas, kuriame žmogus kalba tiesiai į kamerą — klasikinis DI avatarų ir pristatytojų naudojimo atvejis.
Kameros valdymasDI vaizdo įrašai
Virtualių kameros judesių nukreipimas — panoramavimas, priartinimas, orbitavimas, važiuoklė (dolly) — DI sugeneruotame kadre.
KodekasVaizdo įrašas
Algoritmas, kuris suspaudžia ir išskleidžia vaizdo įrašą — pavyzdžiui, H.264, H.265/HEVC, AV1 ar VP9. Jis balansuoją vaizdo kokybę ir failo dydį.
Komponavimas (compositing)Vaizdo įrašas
Kelių vizualinių elementų — medžiagos, grafikos, efektų, teksto — sluoksniavimas į vieną bendrą kadrą.
Konteineris (failo formatas)Vaizdo įrašas
Failo apvalkalas, sujungiantis vaizdą, garsą ir metaduomenis — MP4, MOV, WebM ar MKV. Jis atskiras nuo viduje esančio kodeko.
Kontrolinis taškas (checkpoint)Dirbtinis intelektas
Išsaugota modelio svorių būsena. Kontroliniai taškai dažnai dalijami kaip atsisiunčiamas „modelio failas“, kurį žmonės paleidžia.
Kraštinių santykisVaizdo įrašas
Kadro pločio ir aukščio proporcija — 16:9 (plačiaekranis), 9:16 (vertikalus Reels ir TikTok), arba 1:1 (kvadratas). Ji lemia, kaip jūsų vaizdo įrašas tinka kiekvienai platformai ir ekranui.
Krepsčių žingsniai (sampling)Dirbtinis intelektas
Kiek iteracijų difuzijos modelis atlieka, kad triukšmą paverstų galutiniu kadru. Daugiau žingsnių gali reikšti aukštesnę kokybę, bet lėtesnį ir brangesnį generavimą.
Laikinis nuoseklumasDI vaizdo įrašai
Išlaikyti personažus, objektus ir stilių stabilų kadrų sekoje, kad vaizdo įrašas nemirguotų, nesikraipytų ar nenatūraliai nemorfuotų.
Latentinė erdvėDirbtinis intelektas
Suspausta matematinė reprezentacija, kurioje modelis iš tikrųjų dirba. Generavimas pirmiausia vyksta čia, o tada dekoduojamas į matomus pikselius.
LetterboxingVaizdo įrašas
Juodos juostos viršuje ir apačioje (arba šonuose), kad vaizdo įrašas tilptų į kitą kraštinių santykį be apkirpimo.
LoRADirbtinis intelektas
Low-Rank Adaptation — lengvas būdas išmokyti modelį naujo stiliaus, personažo ar sąvokos su mažu papildomu failu, neužmokinant viso modelio iš naujo.
Lūpų sinchronizavimasDI vaizdo įrašai
Personažo ar avataro lūpų judesių suderinimas su kalbamu garsu, kad atrodytų, jog žodžius jis ištaria realiai.
LUT (Look-Up Table)Vaizdo įrašas
Išankstinis nustatymas, kuris peržemėlapiuoja spalvas ir vienu spustelėjimu pritaiko konkretų „look“, arba konvertuoja medžiagą tarp spalvinių erdvių.
ModelisDirbtinis intelektas
Apmokyta dirbtinio intelekto sistema, kuri paverčia įvestį — pavyzdžiui, tekstinę užklausą — į išvestį, pvz., vaizdo įrašą. Skirtingi modeliai turi skirtingas stiprybes, greitį ir kainą.
MokymasDirbtinis intelektas
Modelio mokymas, jam parodant milžiniškus duomenų kiekius ir palaipsniui derinant vidinius parametrus, kol rezultatai tampa geri.
Neigiama užklausaDirbtinis intelektas
Aprašymas to, ko NENORITE rezultate. Ji nukreipia modelį nuo nepageidaujamų objektų, stilių ar artefaktų.
Neuroninis tinklasDirbtinis intelektas
Modelis, laisvai įkvėptas smegenų: susietų „neuronų“ sluoksniai, mokantys raštų iš duomenų. Tai moderniojo generatyvinio DI pagrindas.
Pamatinis modelisDirbtinis intelektas
Didelis, bendros paskirties modelis, apmokytas plačiais duomenimis ir pritaikomas daugeliui užduočių.
Pamatinis vaizdasDI vaizdo įrašai
Vaizdas, kurį pateikiate modeliui, kad jis vadovautųsi sugeneruoto vaizdo subjekto, personažo ar stiliaus kryptimi.
Parametrai (svoriai)Dirbtinis intelektas
Vidiniai skaičiai, kuriuos modelis išmoksta mokymo metu. Juose saugoma, ką modelis „žino“; daugiau parametrų gali reikšti didesnį pajėgumą.
Pasaulio modelisDI vaizdo įrašai
DI, kuri viduje susikuria scenų, objektų ir fizikos elgsenos simuliaciją, padedančią generuoti ilgesnius, nuoseklesnius ir vientisesnius vaizdo įrašus.
PerėjimasVaizdo įrašas
Kaip vienas kadras virsta kitu — staigus pjūvis, perėjimas (dissolve), išnykimas arba braukimas (wipe).
Pirmas ir paskutinis kadrasDI vaizdo įrašai
Pateikiant pradžios ir (ar) pabaigos kadrą, modelis tarp jų animuoja, suteikdamas tikslų šūvio pradžios ir pabaigos valdymą.
RaiškaVaizdo įrašas
Kiekvieno kadro pikselių matmenys, rašomi plotis × aukštis (pvz., 1920×1080). Daugiau pikselių reiškia daugiau detalių. Įprasti lygiai: 720p (HD), 1080p (Full HD), 4K ir 8K.
Raktinis kadrasVaizdo įrašas
Montaže — pažymėtas kadras, nustatantis reikšmę (poziciją, mastelį, nepermatomumą), tarp kurių programinė įranga animuoja. Suspaudime — pilnas atskaitos kadras, iš kurio atstatomi kaimyniniai kadrai.
Renderis / renderinimasVaizdo įrašas
Projekto apdorojimas į galutinį vaizdo failą — arba, DI atveju, modelio sugeneruotų kadrų sudėjimas į baigtą klipą.
Ryškumo zona (gylio aštrumas)Vaizdo įrašas
Kiek vaizdo dalies yra ryškiai fokusuota. Maža ryškumo zona sulieja foną ir išryškina objektą.
RLHFDirbtinis intelektas
Pastiprinamasis mokymas iš žmogaus grįžtamojo ryšio — mokymas, kai naudojami žmonių vertinimai, kad modelio išvestys labiau atitiktų realius lūkesčius.
SėklaDirbtinis intelektas
Pradinis atsitiktinis skaičius generacijai. Kartojant tą pačią sėklą su ta pačia užklausa gaunamas tas pats rezultatas — patogu nuoseklumui ir smulkiems pakeitimams.
Skaitmeninis žmogus / skaitmeninis dvynysDI vaizdo įrašai
Fotorealistinė tikro žmogaus DI kopija, apmokyta kartą ir pakartotinai naudojama kaip ekrano pristatytojas.
Skalavimas aukštyn (upscaling)DI vaizdo įrašai
Naudojant DI padidinama vaizdo įrašo raiška — tarkime, iš 1080p į 4K — pridedant tikėtinų detalių, o ne tiesiog tempiant pikselius.
Spalvų korekcijaVaizdo įrašas
Kūrybinis žingsnis, kai postprodukcijoje reguliuojamos spalvos, kontrastas ir nuotaika, kad medžiaga įgautų vientisą, apgalvotą išvaizdą.
Stiliaus perkėlimasDI vaizdo įrašai
Vieno pavyzdžio vizualinio stiliaus pritaikymas jūsų medžiagai ar generacijai.
Subtitrai / titraiVaizdo įrašas
Ekrane rodomas sakomo teksto atvaizdavimas. Subtitrai prieinamumui taip pat nurodo garsus ir kalbėtojus; vertimo subtitrai paprastai perrašo ar išverčia dialogą.
Tekstas į kalbą (TTS)DI vaizdo įrašai
Rašytinio teksto pavertimas natūraliai skambančiu garsu sintetiniu balsu — tai DI įgarsinimo variklis.
Tekstas į vaizdo įrašą (T2V)DI vaizdo įrašai
Vaizdo klipo generavimas tiesiai iš rašytinio aprašo — be kameros, aktorių ar stokinės medžiagos.
TokenasDirbtinis intelektas
Mažiausia įvesties dalis, kurią modelis apdoroja — tekste tai žodžio dalis, o vaizde ar vaizdo įraše — lopinėlis ar kadras.
TransformerisDirbtinis intelektas
Neuroninio tinklo architektūra, paremta „dėmesiu“, kuris įvertina, kaip tarpusavyje susijusios įvesties dalys. Tai didžiųjų kalbos modelių ir daugelio šiuolaikinių vaizdo modelių pagrindas.
Užklausa (prompt)Dirbtinis intelektas
Instrukcija, kurią duodate modeliui — paprastai tekstu, kartais su vaizdu — aprašanti, kokį vaizdo įrašą norite sukurti.
Užklausų kūrimasDirbtinis intelektas
Formuluočių meistrystė, kad modelis patikimai sukurtų norimą rezultatą — nurodant objektą, stilių, kamerą ir nuotaiką.
Vaizdas į vaizdo įrašą (I2V)DI vaizdo įrašai
Stacionaraus vaizdo atgaivinimas į vaizdo įrašą, dažnai vadovaujantis užklausa, aprašančia norimą judesį.
Vaizdo įrašas į vaizdo įrašą (V2V)DI vaizdo įrašai
Esamo klipo transformavimas į naują stilių ar išvaizdą, išsaugant pradinį judesį ir laiką.
Vaizdo įrašo pratęsimasDI vaizdo įrašai
Klipas pratęsiamas už pradinės trukmės, sugeneruojant toliau natūraliai sekančius kadrus.
Valdymo skalė (CFG)Dirbtinis intelektas
Kaip griežtai modelis laikosi jūsų užklausos, palyginti su improvizacija. Didesnės reikšmės tiksliau seka tekstą; mažesnės suteikia modeliui daugiau kūrybinės laisvės.
Vandens ženklasVaizdo įrašas
Ant vaizdo uždėtas logotipas ar tekstas nuosavybei žymėti. Daugelis nemokamų DI generatorių jį prideda; mokami planai paprastai pašalina.

Nuo užklausos iki renderio: DI vaizdo kalba

Vaizdo kūrimas su dirbtiniu intelektu yra dviejų pasaulių sankirtoje — dešimtmečius kaupto kino ir vaizdo gamybos žodyno bei sparčiai kintančios mašininio mokymosi kalbos. Šis žodynas sujungia abu, o taip pat ir naujus, generatyviniam vaizdui būdingus terminus, kad galėtumėte užtikrintai skaityti bet kurį įrankį, pamoką ar modelio kortelę.

Pradėkite nuo pagrindų: kraštinių santykis, raiška, kadrų dažnis ir kodekai lemia, kaip jūsų vaizdo įrašas atrodo ir kur jis gros. Tada DI sluoksnis — modeliai, difuzija, užklausos, sėklos ir LoRA formuoja tai, kas sugeneruojama. Galiausiai DI-vaizdo specifika — tekstas į vaizdo įrašą, vaizdas į vaizdo įrašą, lūpų sinchronizavimas, avatarai, laikinis nuoseklumas ir pasaulio modeliai — apibūdina, ką šiandienos generatoriai iš tiesų moka.

Kiekvienas apibrėžimas parašytas paprasta kalba, be matematikos. Ieškokite pagal raktinį žodį, filtruokite pagal temą arba naršykite nuo A iki Ž — tuomet pritaikykite šį žodyną darbui Vivideo studijoje.