Szószedet

A mesterséges intelligencia videós szótára

Minden kifejezés, amellyel a mesterséges intelligenciával készített videóknál találkozol — a kamera- és kodekalapoktól a diffúzión, avatárokon és ügynöki generáláson át — egyszerű, közérthető magyarázattal.

74 kifejezés · Videó · Mesterséges intelligencia · Mesterséges intelligenciás videó

74 kifejezés

A Á B D E F G H I K L M N P R S T Ü V

Adathalmaz (dataset)Mesterséges intelligencia: Azoknak a példáknak a gyűjteménye — videók, képek, szövegek —, amelyeken a modellt betanítják. Minősége és változatossága meghatározza a modell képességeit.
Alapmodell (foundation model)Mesterséges intelligencia: Nagy, általános célú modell, széles adatkörön tanítva, amely sokféle feladatra adaptálható.
Alsó feliratcsík (lower third)Videó: A képkocka alsó részén elhelyezett szöveg, tipikusan az előadó neve és titulusa, vagy egy kísérő felirat.

ÁtmenetVideó: Ahogyan az egyik beállítás a következőbe vált — kemény vágás, áttűnés, elsötétítés, vagy wipe.

B‑rollVideó: Kiegészítő felvételek, amelyek a fő snitt fölé vágva kontextust adnak, illusztrálnak, vagy elfednek egy vágást.
Beágyazás (embedding)Mesterséges intelligencia: Számok listája (vektor), amely megragadja a szöveg, kép vagy hang jelentését, így a modell összehasonlíthatja és kombinálhatja a különböző bemeneteket.
Beállítás (shot)Videó: Egyetlen folyamatos felvétel. Gyakori típusok: totál, félközeli, közeli.
Beszélő fejMesterséges intelligenciás videó: Olyan videó, amelynek középpontjában egy kamerába beszélő személy áll — a mesterséges intelligenciás avatárok és előadók klasszikus esete.
Bevezető totál (establishing shot)Videó: Széles nyitó beállítás, amely a helyszínt és a jelenet kontextusát adja meg, mielőtt közelebb vágnál.
BitrátaVideó: Az adatmennyiség másodpercenként, kbps‑ben vagy Mbps‑ben mérve. A magasabb bitráta több részletet őriz meg, de nagyobb fájlt eredményez.
BokehVideó: A háttér kellemes, lágy életlensége, gyakran izzó fénypöttyökként megjelenő körökkel.

DeepfakeMesterséges intelligenciás videó: Olyan szintetikus média, amely valósághűen cseréli vagy állítja elő valakinek az arcát vagy hangját. Erős eszköz, de komoly beleegyezési, hitelességi és jogi kérdéseket vet fel.
Diffúziós modellMesterséges intelligencia: A mesterséges intelligencia képek és videók vezető megközelítése: a modell véletlen zajból indul, majd lépésről lépésre eltávolítja, míg a promptodnak megfelelő koherens eredmény meg nem jelenik.
Digitális ember / digitális ikerMesterséges intelligenciás videó: Egy valós személy fotorealisztikus mesterséges intelligenciás mása, egyszer betanítva, majd újra és újra felhasználható képernyős előadóként.

EllenőrzőpontMesterséges intelligencia: A modell súlyainak elmentett pillanatképe. Gyakran így osztják meg letölthető „modellfájlként”, amely helyben futtatható.
Első és utolsó képkockaMesterséges intelligenciás videó: Kezdő és/vagy záró képkocka megadása, amely között a modell animál, precíz kontrollt adva egy snitt eleje és vége felett.

FelbontásVideó: A képkocka pixeles mérete, szélesség × magasság formában (pl. 1920×1080). Több pixel = több részlet. Gyakori szintek: 720p (HD), 1080p (Full HD), 4K és 8K.
Feliratok / subtitlesVideó: A képernyőn megjelenő szöveg a beszélt hang alapján. A feliratok a hangokat és beszélőket is jelölik az akadálymentességért; a subtitles jellemzően a párbeszédet írják le vagy fordítják.
FelskálázásMesterséges intelligenciás videó: Mesterséges intelligencia használata a videó felbontásának növelésére — például 1080p‑ről 4K‑ra —, valószerű részletek hozzáadásával a puszta nyújtás helyett.
FinomhangolásMesterséges intelligencia: Egy alapmodell további tanítása speciális adatokon, hogy adott stílusra, márkára vagy személyre szakosodjon.
Forgatókönyv‑vázlat (storyboard)Videó: Előre megtervezett vázlat‑ vagy képsor, amely felrajzolja az egyes beállításokat, mielőtt leforgatnád vagy legenerálnád a videót.

GANMesterséges intelligencia: Generative Adversarial Network — korábbi megközelítés, ahol egy generátor és egy bíráló hálózat verseng. Nagy minőségű videónál nagyrészt a diffúzió váltotta fel.

HallucinációMesterséges intelligencia: Amikor a modell magabiztosnak tűnő, de téves vagy kitalált kimenetet ad — például torz szöveget, plusz ujjakat, vagy lehetetlen mozgást.
HangklónozásMesterséges intelligenciás videó: Egy adott személy hangjának újrateremtése rövid minta alapján, hogy új szöveget mondhasson ugyanazzal a hangszínnel.
HDR (High Dynamic Range)Videó: A szokásosnál (SDR) szélesebb fényesség- és színtartományt hordozó videó, élethűbb csúcsfényekkel, árnyékokkal és gazdagabb tónusokkal.

Időbeli konzisztenciaMesterséges intelligenciás videó: A szereplők, tárgyak és stílus stabilan tartása képkockáról képkockára, hogy a videó ne villogjon, ne torzuljon vagy alakuljon át természetellenesen.
InferenciaMesterséges intelligencia: Egy már betanított modell futtatása kimenet előállítására — például videó generálása egy promptból. A díjazás jellemzően generációnként itt történik.
Inpainting / outpaintingMesterséges intelligenciás videó: Egy képkocka részének kitöltése (inpainting) vagy a szélein túli kiterjesztése (outpainting). Videóban régiók eltávolítására, cseréjére vagy bővítésére használják időben következetesen.
Irányítási skála (CFG)Mesterséges intelligencia: Mennyire ragaszkodik a modell a promptodhoz a rögtönzéssel szemben. A magasabb érték szorosabban követi a szavakat; az alacsonyabb több kreatív szabadságot ad a modellnek.

KameravezérlésMesterséges intelligenciás videó: Virtuális kameramozgások irányítása — svenk, zoom, körbejárás, dolly — egy mesterséges intelligenciával generált beállításon belül.
KéparányVideó: A képkocka szélesség–magasság aránya — 16:9 (szélesvásznú), 9:16 (álló, Reels és TikTok), vagy 1:1 (négyzet). Meghatározza, hogyan illeszkedik a videód a platformokhoz és kijelzőkhöz.
Képből videó (I2V)Mesterséges intelligenciás videó: Egy állókép életre keltése videóként, gyakran a kívánt mozgást leíró prompttal vezérelve.
Képkocka‑interpolációMesterséges intelligenciás videó: Köztes képkockák generálása a képkockasebesség növeléséhez vagy a mozgás simításához — például 24fps átalakítása selymes 60fps‑re.
Képkockasebesség (FPS)Videó: Másodpercenkénti képkockák száma. A 24fps filmszerű, a 30fps webes alap, a 60fps pedig extra sima mozgást ad sportnál és gyors jeleneteknél.
KodekVideó: Az algoritmus, amely tömöríti és visszafejti a videót — például H.264, H.265/HEVC, AV1 vagy VP9. Az optikai minőséget és a fájlméretet egyensúlyozza.
KompozitálásVideó: Több vizuális elem — felvétel, grafika, effekt, szöveg — rétegezése egyetlen összeállított képkockába.
Konténer (fájltípus)Videó: Az a „burkolat”, amely egyben tartja a videót, hangot és metaadatokat — MP4, MOV, WebM vagy MKV. Független a benne tárolt kodektől.
Krómakulcs (zöld háttér)Videó: Egyszínű háttér — általában zöld — cseréje másik képre vagy videóra az adott szín átlátszóvá tételével.
KulcskockaVideó: Vágásban: megjelölt képkocka, amely beállít egy értéket (pozíció, méret, átlátszóság), a szoftver pedig ezek között animál. Tömörítésben: teljes referencia‑kocka, amelyből a közeli kockákat újraépítik.

Látens térMesterséges intelligencia: Tömörített matematikai reprezentáció, ahol a modell valójában dolgozik. A generálás itt történik, majd dekódolással válik látható pixelekké.
LetterboxingVideó: Fekete sávok a videó felett és alatt (vagy oldalán), hogy eltérő képarányhoz igazodjon vágás nélkül.
LoRAMesterséges intelligencia: Low‑Rank Adaptation — könnyű módszer egy stílus, karakter vagy koncepció betanítására kis kiegészítő fájllal, a teljes modell újratanítása helyett.
LUT (Look‑Up Table)Videó: Előre beállított leképezés, amely egy kattintással újraszínezi a felvételt, vagy konvertál a színtér‑szabványok között.

Mag (seed)Mesterséges intelligencia: A generálás kiinduló véletlen száma. Ugyanazzal a promttal újra felhasználva ugyanazt az eredményt adja — hasznos konzisztenciához és apró módosításokhoz.
MélységélességVideó: Mennyire éles a kép különböző mélységekben. A kis mélységélesség elmosódó hátteret ad, kiemelve a témát.
MélytanulásMesterséges intelligencia: Gépi tanulás sokrétegű neurális hálókkal. Ez hajtja a mai kép-, videó-, hang- és nyelvi modelleket.
Mesterséges intelligencia avatárMesterséges intelligenciás videó: Mesterséges intelligenciával generált vagy klónozott képernyős előadó, aki választott hangon és nyelven felmondja a szövegedet.
Mesterséges intelligenciás szinkronMesterséges intelligenciás videó: Beszéd cseréje vagy hozzáadása más nyelven, ideális esetben a beszélő hangszínéhez és szájmozgásához igazítva.
Mintavételi lépésekMesterséges intelligencia: Hány iterációból áll, míg egy diffúziós modell a zajt végső képkockává alakítja. Több lépés gyakran jobb minőséget, de lassabb, költségesebb generálást jelent.
ModellMesterséges intelligencia: Betanított mesterséges intelligencia rendszer, amely egy bemenetet — például szöveges promptot — kimenetté, például videóvá alakít. A modellek ereje, sebessége és ára eltérő.
Mozgásvezérlés / motion brushMesterséges intelligenciás videó: Eszközök, amelyekkel megadhatod, mi és hogyan mozogjon a generált klipben, ahelyett hogy mindent a modellre bíznál.
MultimodálisMesterséges intelligencia: Olyan modell, amely egyszerre több adattípust ért vagy generál — például szöveget, képet, videót és hangot együtt.

Negatív promptMesterséges intelligencia: Leírás arról, mit NEM szeretnél a kimenetben. Eltéríti a modellt a nem kívánt tárgyaktól, stílusoktól vagy artefaktumoktól.
Neuronháló (neurális háló)Mesterséges intelligencia: Az agy által inspirált modell: összekapcsolt „neuronok” rétegei, amelyek mintákat tanulnak az adatokból. A modern generatív mesterséges intelligencia alapja.
Nyílt súlyú modellMesterséges intelligencia: Olyan modell, amelynek súlyai publikusak, így bárki futtathatja, tanulmányozhatja vagy finomhangolhatja (pl. fal‑on vagy helyben), szemben a csak API‑n át elérhető zárt modellekkel.

Paraméterek (súlyok)Mesterséges intelligencia: A belső számok, amelyeket a modell a tanítás során megtanul. Ezek tárolják, „mit tud” a modell; több paraméter gyakran nagyobb képességet jelenthet.
PromptMesterséges intelligencia: Az utasítás, amelyet a modellnek adsz — jellemzően szöveg, néha képpel kiegészítve —, leírva a videót, amit szeretnél.
PrompttervezésMesterséges intelligencia: A promptok megfogalmazásának gyakorlata, hogy a modell megbízhatóan a kívánt eredményt adja — témát, stílust, kamerát és hangulatot is rögzítve.

ReferenciaképMesterséges intelligenciás videó: Kép, amelyet a modellnek adsz a generált videó témájának, szereplőjének vagy stílusának irányításához.
Render / renderelésVideó: Egy projekt feldolgozása kész videófájllá — vagy MI esetén a modell által generált képkockák végső klippé állítása.
RLHFMesterséges intelligencia: Reinforcement Learning from Human Feedback — tanítási eljárás, amely emberek preferenciáit használja, hogy a modell kimenetei jobban igazodjanak ahhoz, amit az emberek valóban akarnak.

StílustranszferMesterséges intelligenciás videó: Egy referencia vizuális stílusának alkalmazása a saját felvételedre vagy generálásodra.
Szájmozgás‑szinkronMesterséges intelligenciás videó: Egy szereplő vagy avatár szájmozgásának hozzáigazítása a beszélt hanghoz, hogy úgy tűnjön, valóban ő mondja a szavakat.
Színkorrekció / color gradingVideó: A felvételek színének, kontrasztjának és hangulatának kreatív utómunka‑finomítása, hogy egységes, tudatos megjelenést kapjanak.
Szövegből beszéd (TTS)Mesterséges intelligenciás videó: Írott szöveg átalakítása természetes, szintetikus beszéddé — a mesterséges intelligenciás narráció motorja.
Szövegből videó (T2V)Mesterséges intelligenciás videó: Videoklip generálása közvetlenül írásos leírásból — kamera, színészek vagy stock felvételek nélkül.

Tanítás (tréning)Mesterséges intelligencia: A modell betanítása hatalmas mennyiségű adattal, belső paramétereinek fokozatos igazításával, amíg jó eredményeket nem ad.
TokenMesterséges intelligencia: A legkisebb bemeneti egység, amit a modell feldolgoz — szövegnél a szó egy darabja, videónál egy képrész vagy képkocka.
TransformerMesterséges intelligencia: Olyan neurális architektúra, amely „figyelemre” épül, súlyozva a bemenet részeinek kapcsolatát. A nagy nyelvi modellek és sok modern videómodell alapja.

Ügynöki videóMesterséges intelligenciás videó: Olyan mesterséges intelligencia ügynök, amely egyetlen brief alapján megtervezi és lefuttatja a teljes gyártást — szkriptet, jeleneteket, hangot, avatárokat és vágást —, nem pedig csak egyes klipeket generál.

Videó‑hosszabbításMesterséges intelligenciás videó: Egy klip folytatása az eredeti hosszon túl, további, természetesen következő képkockák generálásával.
Videóból videó (V2V)Mesterséges intelligenciás videó: Meglévő klip átalakítása új stílussá vagy megjelenéssé, miközben megőrzi az eredeti mozgást és időzítést.
VilágmodellMesterséges intelligenciás videó: Olyan mesterséges intelligencia, amely belső szimulációt épít a jelenetek, tárgyak és fizika működéséről, segítve a hosszabb, koherensebb és következetesebb videók generálását.
VízjelVideó: A videóra helyezett logó vagy szöveg a tulajdonjog jelölésére. Sok ingyenes MI‑generátor hozzáadja; a fizetős csomagok többnyire eltávolítják.

Prompttól a renderig: a mesterséges intelligenciás videó nyelve

A mesterséges intelligenciával készített videó két világ metszéspontjában él — a több évtizedes filmezési és videógyártási szókinccsel, valamint a gépi tanulás gyorsan változó nyelvével. Ez a szótár összehozza mindkettőt, kiegészítve a generatív videóra jellemző új fogalmakkal, hogy magabiztosan érts bármilyen eszközt, útmutatót vagy modellkártyát.

Kezdd az alapokkal: a képarány, a felbontás, a képkockasebesség és a kodekek döntik el, hogyan néz ki a videód és hol játszható le. Ezután jön az MI réteg — modellek, diffúzió, promtok, seedek és LoRA‑k alakítják, mi generálódik. Végül az MI‑videó specifikumai — szövegből videó, képből videó, szájmozgás‑szinkron, avatárok, időbeli konzisztencia és world modelek — írják le, mire képesek ma a generátorok.

Minden meghatározás közérthetően, matek nélkül készült. Keress kulcsszóval, szűrj témák szerint, vagy böngéssz A–Z-ig — majd vesd be a szókinccset a Vivideo stúdióban.

A mesterséges intelligencia videós szótára

Kezdd el ingyen Mi az az MI-videó?