Szószedet

A mesterséges intelligencia videós szótára

Minden kifejezés, amellyel a mesterséges intelligenciával készített videóknál találkozol — a kamera- és kodekalapoktól a diffúzión, avatárokon és ügynöki generáláson át — egyszerű, közérthető magyarázattal.

74 kifejezés · Videó · Mesterséges intelligencia · Mesterséges intelligenciás videó

74 kifejezés
Adathalmaz (dataset)Mesterséges intelligencia
Azoknak a példáknak a gyűjteménye — videók, képek, szövegek —, amelyeken a modellt betanítják. Minősége és változatossága meghatározza a modell képességeit.
Alapmodell (foundation model)Mesterséges intelligencia
Nagy, általános célú modell, széles adatkörön tanítva, amely sokféle feladatra adaptálható.
Alsó feliratcsík (lower third)Videó
A képkocka alsó részén elhelyezett szöveg, tipikusan az előadó neve és titulusa, vagy egy kísérő felirat.
ÁtmenetVideó
Ahogyan az egyik beállítás a következőbe vált — kemény vágás, áttűnés, elsötétítés, vagy wipe.
B‑rollVideó
Kiegészítő felvételek, amelyek a fő snitt fölé vágva kontextust adnak, illusztrálnak, vagy elfednek egy vágást.
Beágyazás (embedding)Mesterséges intelligencia
Számok listája (vektor), amely megragadja a szöveg, kép vagy hang jelentését, így a modell összehasonlíthatja és kombinálhatja a különböző bemeneteket.
Beállítás (shot)Videó
Egyetlen folyamatos felvétel. Gyakori típusok: totál, félközeli, közeli.
Beszélő fejMesterséges intelligenciás videó
Olyan videó, amelynek középpontjában egy kamerába beszélő személy áll — a mesterséges intelligenciás avatárok és előadók klasszikus esete.
Bevezető totál (establishing shot)Videó
Széles nyitó beállítás, amely a helyszínt és a jelenet kontextusát adja meg, mielőtt közelebb vágnál.
BitrátaVideó
Az adatmennyiség másodpercenként, kbps‑ben vagy Mbps‑ben mérve. A magasabb bitráta több részletet őriz meg, de nagyobb fájlt eredményez.
BokehVideó
A háttér kellemes, lágy életlensége, gyakran izzó fénypöttyökként megjelenő körökkel.
DeepfakeMesterséges intelligenciás videó
Olyan szintetikus média, amely valósághűen cseréli vagy állítja elő valakinek az arcát vagy hangját. Erős eszköz, de komoly beleegyezési, hitelességi és jogi kérdéseket vet fel.
Diffúziós modellMesterséges intelligencia
A mesterséges intelligencia képek és videók vezető megközelítése: a modell véletlen zajból indul, majd lépésről lépésre eltávolítja, míg a promptodnak megfelelő koherens eredmény meg nem jelenik.
Digitális ember / digitális ikerMesterséges intelligenciás videó
Egy valós személy fotorealisztikus mesterséges intelligenciás mása, egyszer betanítva, majd újra és újra felhasználható képernyős előadóként.
EllenőrzőpontMesterséges intelligencia
A modell súlyainak elmentett pillanatképe. Gyakran így osztják meg letölthető „modellfájlként”, amely helyben futtatható.
Első és utolsó képkockaMesterséges intelligenciás videó
Kezdő és/vagy záró képkocka megadása, amely között a modell animál, precíz kontrollt adva egy snitt eleje és vége felett.
FelbontásVideó
A képkocka pixeles mérete, szélesség × magasság formában (pl. 1920×1080). Több pixel = több részlet. Gyakori szintek: 720p (HD), 1080p (Full HD), 4K és 8K.
Feliratok / subtitlesVideó
A képernyőn megjelenő szöveg a beszélt hang alapján. A feliratok a hangokat és beszélőket is jelölik az akadálymentességért; a subtitles jellemzően a párbeszédet írják le vagy fordítják.
FelskálázásMesterséges intelligenciás videó
Mesterséges intelligencia használata a videó felbontásának növelésére — például 1080p‑ről 4K‑ra —, valószerű részletek hozzáadásával a puszta nyújtás helyett.
FinomhangolásMesterséges intelligencia
Egy alapmodell további tanítása speciális adatokon, hogy adott stílusra, márkára vagy személyre szakosodjon.
Forgatókönyv‑vázlat (storyboard)Videó
Előre megtervezett vázlat‑ vagy képsor, amely felrajzolja az egyes beállításokat, mielőtt leforgatnád vagy legenerálnád a videót.
GANMesterséges intelligencia
Generative Adversarial Network — korábbi megközelítés, ahol egy generátor és egy bíráló hálózat verseng. Nagy minőségű videónál nagyrészt a diffúzió váltotta fel.
HallucinációMesterséges intelligencia
Amikor a modell magabiztosnak tűnő, de téves vagy kitalált kimenetet ad — például torz szöveget, plusz ujjakat, vagy lehetetlen mozgást.
HangklónozásMesterséges intelligenciás videó
Egy adott személy hangjának újrateremtése rövid minta alapján, hogy új szöveget mondhasson ugyanazzal a hangszínnel.
HDR (High Dynamic Range)Videó
A szokásosnál (SDR) szélesebb fényesség- és színtartományt hordozó videó, élethűbb csúcsfényekkel, árnyékokkal és gazdagabb tónusokkal.
Időbeli konzisztenciaMesterséges intelligenciás videó
A szereplők, tárgyak és stílus stabilan tartása képkockáról képkockára, hogy a videó ne villogjon, ne torzuljon vagy alakuljon át természetellenesen.
InferenciaMesterséges intelligencia
Egy már betanított modell futtatása kimenet előállítására — például videó generálása egy promptból. A díjazás jellemzően generációnként itt történik.
Inpainting / outpaintingMesterséges intelligenciás videó
Egy képkocka részének kitöltése (inpainting) vagy a szélein túli kiterjesztése (outpainting). Videóban régiók eltávolítására, cseréjére vagy bővítésére használják időben következetesen.
Irányítási skála (CFG)Mesterséges intelligencia
Mennyire ragaszkodik a modell a promptodhoz a rögtönzéssel szemben. A magasabb érték szorosabban követi a szavakat; az alacsonyabb több kreatív szabadságot ad a modellnek.
KameravezérlésMesterséges intelligenciás videó
Virtuális kameramozgások irányítása — svenk, zoom, körbejárás, dolly — egy mesterséges intelligenciával generált beállításon belül.
KéparányVideó
A képkocka szélesség–magasság aránya — 16:9 (szélesvásznú), 9:16 (álló, Reels és TikTok), vagy 1:1 (négyzet). Meghatározza, hogyan illeszkedik a videód a platformokhoz és kijelzőkhöz.
Képből videó (I2V)Mesterséges intelligenciás videó
Egy állókép életre keltése videóként, gyakran a kívánt mozgást leíró prompttal vezérelve.
Képkocka‑interpolációMesterséges intelligenciás videó
Köztes képkockák generálása a képkockasebesség növeléséhez vagy a mozgás simításához — például 24fps átalakítása selymes 60fps‑re.
Képkockasebesség (FPS)Videó
Másodpercenkénti képkockák száma. A 24fps filmszerű, a 30fps webes alap, a 60fps pedig extra sima mozgást ad sportnál és gyors jeleneteknél.
KodekVideó
Az algoritmus, amely tömöríti és visszafejti a videót — például H.264, H.265/HEVC, AV1 vagy VP9. Az optikai minőséget és a fájlméretet egyensúlyozza.
KompozitálásVideó
Több vizuális elem — felvétel, grafika, effekt, szöveg — rétegezése egyetlen összeállított képkockába.
Konténer (fájltípus)Videó
Az a „burkolat”, amely egyben tartja a videót, hangot és metaadatokat — MP4, MOV, WebM vagy MKV. Független a benne tárolt kodektől.
Krómakulcs (zöld háttér)Videó
Egyszínű háttér — általában zöld — cseréje másik képre vagy videóra az adott szín átlátszóvá tételével.
KulcskockaVideó
Vágásban: megjelölt képkocka, amely beállít egy értéket (pozíció, méret, átlátszóság), a szoftver pedig ezek között animál. Tömörítésben: teljes referencia‑kocka, amelyből a közeli kockákat újraépítik.
Látens térMesterséges intelligencia
Tömörített matematikai reprezentáció, ahol a modell valójában dolgozik. A generálás itt történik, majd dekódolással válik látható pixelekké.
LetterboxingVideó
Fekete sávok a videó felett és alatt (vagy oldalán), hogy eltérő képarányhoz igazodjon vágás nélkül.
LoRAMesterséges intelligencia
Low‑Rank Adaptation — könnyű módszer egy stílus, karakter vagy koncepció betanítására kis kiegészítő fájllal, a teljes modell újratanítása helyett.
LUT (Look‑Up Table)Videó
Előre beállított leképezés, amely egy kattintással újraszínezi a felvételt, vagy konvertál a színtér‑szabványok között.
Mag (seed)Mesterséges intelligencia
A generálás kiinduló véletlen száma. Ugyanazzal a promttal újra felhasználva ugyanazt az eredményt adja — hasznos konzisztenciához és apró módosításokhoz.
MélységélességVideó
Mennyire éles a kép különböző mélységekben. A kis mélységélesség elmosódó hátteret ad, kiemelve a témát.
MélytanulásMesterséges intelligencia
Gépi tanulás sokrétegű neurális hálókkal. Ez hajtja a mai kép-, videó-, hang- és nyelvi modelleket.
Mesterséges intelligencia avatárMesterséges intelligenciás videó
Mesterséges intelligenciával generált vagy klónozott képernyős előadó, aki választott hangon és nyelven felmondja a szövegedet.
Mesterséges intelligenciás szinkronMesterséges intelligenciás videó
Beszéd cseréje vagy hozzáadása más nyelven, ideális esetben a beszélő hangszínéhez és szájmozgásához igazítva.
Mintavételi lépésekMesterséges intelligencia
Hány iterációból áll, míg egy diffúziós modell a zajt végső képkockává alakítja. Több lépés gyakran jobb minőséget, de lassabb, költségesebb generálást jelent.
ModellMesterséges intelligencia
Betanított mesterséges intelligencia rendszer, amely egy bemenetet — például szöveges promptot — kimenetté, például videóvá alakít. A modellek ereje, sebessége és ára eltérő.
Mozgásvezérlés / motion brushMesterséges intelligenciás videó
Eszközök, amelyekkel megadhatod, mi és hogyan mozogjon a generált klipben, ahelyett hogy mindent a modellre bíznál.
MultimodálisMesterséges intelligencia
Olyan modell, amely egyszerre több adattípust ért vagy generál — például szöveget, képet, videót és hangot együtt.
Negatív promptMesterséges intelligencia
Leírás arról, mit NEM szeretnél a kimenetben. Eltéríti a modellt a nem kívánt tárgyaktól, stílusoktól vagy artefaktumoktól.
Neuronháló (neurális háló)Mesterséges intelligencia
Az agy által inspirált modell: összekapcsolt „neuronok” rétegei, amelyek mintákat tanulnak az adatokból. A modern generatív mesterséges intelligencia alapja.
Nyílt súlyú modellMesterséges intelligencia
Olyan modell, amelynek súlyai publikusak, így bárki futtathatja, tanulmányozhatja vagy finomhangolhatja (pl. fal‑on vagy helyben), szemben a csak API‑n át elérhető zárt modellekkel.
Paraméterek (súlyok)Mesterséges intelligencia
A belső számok, amelyeket a modell a tanítás során megtanul. Ezek tárolják, „mit tud” a modell; több paraméter gyakran nagyobb képességet jelenthet.
PromptMesterséges intelligencia
Az utasítás, amelyet a modellnek adsz — jellemzően szöveg, néha képpel kiegészítve —, leírva a videót, amit szeretnél.
PrompttervezésMesterséges intelligencia
A promptok megfogalmazásának gyakorlata, hogy a modell megbízhatóan a kívánt eredményt adja — témát, stílust, kamerát és hangulatot is rögzítve.
ReferenciaképMesterséges intelligenciás videó
Kép, amelyet a modellnek adsz a generált videó témájának, szereplőjének vagy stílusának irányításához.
Render / renderelésVideó
Egy projekt feldolgozása kész videófájllá — vagy MI esetén a modell által generált képkockák végső klippé állítása.
RLHFMesterséges intelligencia
Reinforcement Learning from Human Feedback — tanítási eljárás, amely emberek preferenciáit használja, hogy a modell kimenetei jobban igazodjanak ahhoz, amit az emberek valóban akarnak.
StílustranszferMesterséges intelligenciás videó
Egy referencia vizuális stílusának alkalmazása a saját felvételedre vagy generálásodra.
Szájmozgás‑szinkronMesterséges intelligenciás videó
Egy szereplő vagy avatár szájmozgásának hozzáigazítása a beszélt hanghoz, hogy úgy tűnjön, valóban ő mondja a szavakat.
Színkorrekció / color gradingVideó
A felvételek színének, kontrasztjának és hangulatának kreatív utómunka‑finomítása, hogy egységes, tudatos megjelenést kapjanak.
Szövegből beszéd (TTS)Mesterséges intelligenciás videó
Írott szöveg átalakítása természetes, szintetikus beszéddé — a mesterséges intelligenciás narráció motorja.
Szövegből videó (T2V)Mesterséges intelligenciás videó
Videoklip generálása közvetlenül írásos leírásból — kamera, színészek vagy stock felvételek nélkül.
Tanítás (tréning)Mesterséges intelligencia
A modell betanítása hatalmas mennyiségű adattal, belső paramétereinek fokozatos igazításával, amíg jó eredményeket nem ad.
TokenMesterséges intelligencia
A legkisebb bemeneti egység, amit a modell feldolgoz — szövegnél a szó egy darabja, videónál egy képrész vagy képkocka.
TransformerMesterséges intelligencia
Olyan neurális architektúra, amely „figyelemre” épül, súlyozva a bemenet részeinek kapcsolatát. A nagy nyelvi modellek és sok modern videómodell alapja.
Ügynöki videóMesterséges intelligenciás videó
Olyan mesterséges intelligencia ügynök, amely egyetlen brief alapján megtervezi és lefuttatja a teljes gyártást — szkriptet, jeleneteket, hangot, avatárokat és vágást —, nem pedig csak egyes klipeket generál.
Videó‑hosszabbításMesterséges intelligenciás videó
Egy klip folytatása az eredeti hosszon túl, további, természetesen következő képkockák generálásával.
Videóból videó (V2V)Mesterséges intelligenciás videó
Meglévő klip átalakítása új stílussá vagy megjelenéssé, miközben megőrzi az eredeti mozgást és időzítést.
VilágmodellMesterséges intelligenciás videó
Olyan mesterséges intelligencia, amely belső szimulációt épít a jelenetek, tárgyak és fizika működéséről, segítve a hosszabb, koherensebb és következetesebb videók generálását.
VízjelVideó
A videóra helyezett logó vagy szöveg a tulajdonjog jelölésére. Sok ingyenes MI‑generátor hozzáadja; a fizetős csomagok többnyire eltávolítják.

Prompttól a renderig: a mesterséges intelligenciás videó nyelve

A mesterséges intelligenciával készített videó két világ metszéspontjában él — a több évtizedes filmezési és videógyártási szókinccsel, valamint a gépi tanulás gyorsan változó nyelvével. Ez a szótár összehozza mindkettőt, kiegészítve a generatív videóra jellemző új fogalmakkal, hogy magabiztosan érts bármilyen eszközt, útmutatót vagy modellkártyát.

Kezdd az alapokkal: a képarány, a felbontás, a képkockasebesség és a kodekek döntik el, hogyan néz ki a videód és hol játszható le. Ezután jön az MI réteg — modellek, diffúzió, promtok, seedek és LoRA‑k alakítják, mi generálódik. Végül az MI‑videó specifikumai — szövegből videó, képből videó, szájmozgás‑szinkron, avatárok, időbeli konzisztencia és world modelek — írják le, mire képesek ma a generátorok.

Minden meghatározás közérthetően, matek nélkül készült. Keress kulcsszóval, szűrj témák szerint, vagy böngéssz A–Z-ig — majd vesd be a szókinccset a Vivideo stúdióban.

A mesterséges intelligencia videós szótára

Kezdd el ingyenMi az az MI-videó?