Slovník

Slovník videa s umělou inteligencí

Každý pojem, na který narazíte při tvorbě videa s umělou inteligencí — od základů kamery a kodeků po difuzi, avatary a agentní generování — vysvětlen jednoduše a bez žargonu.

74 pojmy · Video · Umělá inteligence · Video s umělou inteligencí

74 pojmy
Agentní videoVideo s umělou inteligencí
Agent umělé inteligence, který naplánuje a provede celou produkci — scénář, scény, hlas, avatary i střih — z jednoho zadání, místo generování po jednotlivých klipech.
Avatar s umělou inteligencíVideo s umělou inteligencí
Generovaný nebo naklonovaný moderátor v obraze, který dokáže přečíst váš scénář zvoleným hlasem a v daném jazyce.
B‑rollVideo
Doplňkové záběry vložené přes hlavní záběr pro přidání kontextu, ilustrování pointy nebo skrytí střihu.
BokehVideo
Jemné, příjemné rozostření pozadí v záběru, často viditelné jako zářící kruhy světla.
Color gradingVideo
Kreativní úprava barev, kontrastu a nálady záběrů v postprodukci, která jim dá jednotný a záměrný vzhled.
Chroma key (zelené plátno)Video
Nahrazení jednobarevného pozadí — obvykle zeleného — jiným obrazem či videem tím, že se tato barva zprůhlední.
Časová konzistenceVideo s umělou inteligencí
Udržení postav, objektů a stylu stabilních snímek po snímku, aby video neblikalo, nekroutilo se ani se nepřirozeně neměnilo.
Datová sadaUmělá inteligence
Sbírka příkladů — videí, obrázků, textu — na nichž je model trénován. Její kvalita a rozmanitost formují, co model dokáže.
Datový tokVideo
Kolik dat se použije na jednu sekundu videa, měří se v kbps nebo Mbps. Vyšší bitrate zachová více detailů, ale vytváří větší soubory.
DeepfakeVideo s umělou inteligencí
Syntetické médium, které věrohodně zamění nebo vytvoří něčí tvář či hlas. Mocné, ale vyvolává reálné otázky souhlasu, autenticity a práva.
Difuzní modelUmělá inteligence
Dominantní přístup za obrazovou a video generací: model začíná od náhodného šumu a krok za krokem jej odstraňuje, až se objeví výsledek odpovídající vašemu promptu.
Digitální člověk / digitální dvojčeVideo s umělou inteligencí
Fotorealistická replika skutečné osoby poháněná umělou inteligencí, jednou natrénovaná a znovu používaná jako on‑camera moderátor.
Doladění (fine‑tuning)Umělá inteligence
Další trénink základního modelu na specifických datech, aby se specializoval — na určitý styl, značku nebo osobu.
Dubbing s umělou inteligencíVideo s umělou inteligencí
Nahrazení nebo přidání mluveného zvuku v jiném jazyce, ideálně přizpůsobené hlasu mluvčího a pohybům rtů.
GANUmělá inteligence
Generative Adversarial Network — dřívější metoda, kde spolu soutěží generátor a kritik. Pro vysoce kvalitní video ji z velké části nahradila difuze.
HalucinaceUmělá inteligence
Když model sebejistě vyprodukuje výstup, který je chybný nebo vymyšlený — třeba zkomolený text, extra prsty nebo nemožný pohyb.
HDR (High Dynamic Range)Video
Video s širším rozsahem jasu a barev než standard (SDR), díky čemuž má realističtější světla, stíny a bohatší tóny.
Hloubka ostrostiVideo
Jak velká část obrazu je ostře zaostřená. Malá hloubka ostrosti rozmaže pozadí a zvýrazní subjekt.
Hluboké učeníUmělá inteligence
Strojové učení využívající mnoho vrstev neuronových sítí. Pohání dnešní obrazové, video, hlasové i jazykové modely.
Image‑to‑video (I2V)Video s umělou inteligencí
Oživení statického obrázku do videa, často řízené promptem, který popisuje požadovaný pohyb.
Inferenční běhUmělá inteligence
Spuštění již natrénovaného modelu pro vytvoření výstupu — například vygenerování videa z promptu. Za to se obvykle platí za každou generaci.
Inpainting / outpaintingVideo s umělou inteligencí
Doplnění chybějící části snímku (inpainting) nebo rozšíření za jeho okraje (outpainting). U videa slouží k odstranění, nahrazení či rozšíření oblastí v čase.
Interpolace snímkůVideo s umělou inteligencí
Dopočítávání mezisnímků pro zvýšení snímkové frekvence nebo zjemnění pohybu — například změna 24fps na sametových 60fps.
Kličkový snímekVideo
V editaci označený snímek, který nastaví hodnotu (pozici, měřítko, krytí), mezi nimiž software interpoluje. V kompresi plnohodnotný referenční snímek, z nějž se obnovují okolní snímky.
Klonování hlasuVideo s umělou inteligencí
Rekonstrukce konkrétního hlasu z krátké ukázky tak, aby mohl mluvit nový text tím samým hlasem.
KodekVideo
Algoritmus, který video komprimuje a dekomprimuje — například H.264, H.265/HEVC, AV1 nebo VP9. Vyvažuje kvalitu obrazu a velikost souboru.
KompozitingVideo
Vrstvení více vizuálních prvků — záběrů, grafiky, efektů, textu — do jednoho výsledného snímku.
Kontejner (formát souboru)Video
Obal, který drží video, zvuk a metadata pohromadě — MP4, MOV, WebM nebo MKV. Je oddělený od kodeku uloženého uvnitř.
Kontrolní bodUmělá inteligence
Uložený snímek vah modelu. Checkpointy se často sdílí jako stahovatelné „modelové soubory“, které lze spouštět.
Latentní prostorUmělá inteligence
Zkomprimované matematické vyjádření, ve kterém model skutečně pracuje. Nejdřív probíhá generace zde, až pak se dekóduje do viditelných pixelů.
LetterboxingVideo
Černé pruhy přidané nad a pod (nebo po stranách) videa, aby se vešlo do jiného poměru stran bez ořezu obrazu.
Lip-syncVideo s umělou inteligencí
Sladění pohybů úst postavy či avatara s mluveným zvukem tak, aby to vypadalo, že skutečně vyslovuje daná slova.
LoRAUmělá inteligence
Low‑Rank Adaptation — lehký způsob, jak model naučit nový styl, postavu či koncept pomocí malého přídavného souboru místo znovu‑trénování celého modelu.
LUT (Look-Up Table)Video
Předvolba, která přemapuje barvy a jedním klikem aplikuje konkrétní vzhled, nebo převádí záběry mezi barevnými prostory.
Míra navádění (CFG)Umělá inteligence
Jak striktně model následuje váš prompt oproti improvizaci. Vyšší hodnoty se drží slov přesněji; nižší dávají modelu více tvůrčí svobody.
Mluvící hlavaVideo s umělou inteligencí
Video zaměřené na člověka mluvícího do kamery — klasický případ použití avatarů a virtuálních moderátorů.
ModelUmělá inteligence
Natrénovaný systém umělé inteligence, který mění vstup — například textový prompt — na výstup, například video. Různé modely mají rozdílné přednosti, rychlost i cenu.
Model s otevřenými vahamiUmělá inteligence
Model, jehož váhy jsou zveřejněny, takže jej může kdokoli spustit, zkoumat či doladit (např. na fal nebo lokálně), na rozdíl od uzavřeného modelu dostupného jen přes API.
MultimodálníUmělá inteligence
Model, který chápe nebo generuje více typů dat najednou — například text, obraz, video a audio společně.
Negativní promptUmělá inteligence
Popis toho, co ve výstupu NEchcete. Odvádí model od nežádoucích objektů, stylů nebo artefaktů.
Neuronová síťUmělá inteligence
Model volně inspirovaný mozkem: vrstvy propojených „neuronů“, které se učí vzorce z dat. Je základem moderní generativní umělé inteligence.
Parametry (váhy)Umělá inteligence
Vnitřní čísla, která se model učí během tréninku. Ukládají to, co model „ví“; více parametrů může znamenat vyšší schopnosti.
Počet kroků (sampling steps)Umělá inteligence
Kolik iterací difuzní model provede, než promění šum ve finální snímek. Více kroků může znamenat vyšší kvalitu, ale pomalejší a dražší generování.
Poměr stranVideo
Poměr šířky k výšce snímku — 16:9 (širokoúhlé), 9:16 (vertikální pro Reels a TikTok) nebo 1:1 (čtverec). Určuje, jak se video přizpůsobí platformám a obrazovkám.
Prodloužení videaVideo s umělou inteligencí
Pokračování klipu za jeho původní délku generováním navazujících snímků, které přirozeně vyústí z dosavadního děje.
PromptUmělá inteligence
Instrukce, kterou dáte modelu — obvykle text, někdy s obrázkem — popisující video, které chcete vytvořit.
První a poslední snímekVideo s umělou inteligencí
Dodání úvodního a/nebo koncového snímku, mezi nimiž model animuje — získáte přesnou kontrolu nad začátkem a koncem záběru.
PřechodVideo
Jak jeden záběr přejde do dalšího — tvrdý střih, prolínačka, ztmavení/roztmavení nebo wipe.
Přenos styluVideo s umělou inteligencí
Aplikace vizuálního stylu jedné reference na vaše záběry nebo generaci.
Referenční obrázekVideo s umělou inteligencí
Obrázek, který dáte modelu jako vodítko pro subjekt, postavu nebo styl generovaného videa.
Render / renderováníVideo
Zpracování projektu do finálního video souboru — nebo v oblasti umělé inteligence přegenerování snímků modelem do výsledného klipu.
RLHFUmělá inteligence
Reinforcement Learning from Human Feedback — trénink, který využívá lidské preference, aby model ladil výstupy k tomu, co lidé skutečně chtějí.
RozlišeníVideo
Rozměry v pixelech pro každý snímek, zapisují se šířka × výška (např. 1920×1080). Více pixelů znamená více detailů. Běžné stupně jsou 720p (HD), 1080p (Full HD), 4K a 8K.
Řízení kameryVideo s umělou inteligencí
Směrování virtuálních kamerových pohybů — pan, zoom, orbit, dolly — v rámci záběru generovaného umělou inteligencí.
Řízení pohybu / motion brushVideo s umělou inteligencí
Nástroje, které vám umožní určovat, kde a jak se budou věci v generovaném klipu hýbat, místo aby o všem rozhodoval jen model.
SeedUmělá inteligence
Počáteční náhodné číslo pro generování. Zopakování stejného seedu se stejným promptem reprodukuje stejný výsledek — užitečné pro konzistenci a drobné úpravy.
Snímková frekvence (FPS)Video
Počet snímků za sekundu. 24fps působí filmově, 30fps je standard na webu a 60fps vypadá extra plynule pro rychlý pohyb a sport.
Spodní třetinaVideo
Text umístěný ve spodní části obrazu, typicky jméno a funkce mluvčího nebo popisek.
StoryboardVideo
Plánovaná posloupnost skic nebo snímků, která rozkreslí každý záběr ještě před produkcí či generováním videa.
Světový modelVideo s umělou inteligencí
Umělá inteligence, která si buduje vnitřní simulaci chování scén, objektů a fyziky, což jí pomáhá generovat delší, soudržnější a konzistentnější video.
Text‑to‑speech (TTS)Video s umělou inteligencí
Převod psaného textu na přirozeně znějící mluvený zvuk se syntetickým hlasem — motor, který stojí za voiceovery s umělou inteligencí.
Text‑to‑video (T2V)Video s umělou inteligencí
Generování video klipu přímo z psaného popisu — bez kamery, herců nebo stock záběrů.
Titulky / captionsVideo
Text na obrazovce odpovídající mluvenému zvuku. Skryté titulky (captions) pro zpřístupnění navíc uvádějí i zvuky a mluvčí; běžné titulky (subtitles) obvykle přepisují nebo překládají dialog.
TokenUmělá inteligence
Nejmenší jednotka vstupu, kterou model zpracovává — část slova u textu nebo ploška či snímek u videa.
TransformerUmělá inteligence
Architektura neuronové sítě postavená na „pozornosti“, která váží vztahy mezi částmi vstupu. Tvoří základ velkých jazykových modelů i mnoha moderních video modelů.
TréninkUmělá inteligence
Učení modelu pomocí obrovského množství dat a postupného ladění jeho vnitřních parametrů, dokud nedává dobré výsledky.
Tvorba promptůUmělá inteligence
Dovednost formulovat prompty tak, aby model spolehlivě vytvořil zamýšlený výsledek — včetně subjektu, stylu, kamery a nálady.
Uvozující (establishing) záběrVideo
Široký úvodní záběr, který nastaví lokaci a kontext scény, než přejdete na bližší záběry.
Video‑to‑video (V2V)Video s umělou inteligencí
Převod existujícího klipu do nového stylu nebo vzhledu při zachování původního pohybu a timingů.
VkládáníUmělá inteligence
Seznam čísel (vektor), který zachycuje význam textu, obrázku nebo audia, aby model mohl různé vstupy porovnávat a kombinovat.
VodoznakVideo
Logo nebo text překrytý přes video jako označení vlastnictví. Mnoho bezplatných generátorů s umělou inteligencí jej přidává; placené tarify jej obvykle odstraní.
ZáběrVideo
Jedna souvislá část záznamu. Běžné typy jsou celkový záběr, polodetail a detail.
Základní (foundation) modelUmělá inteligence
Velký, univerzální model trénovaný na široké škále dat, který lze přizpůsobit mnoha následným úlohám.
Zvětšování rozlišeníVideo s umělou inteligencí
Využití umělé inteligence ke zvýšení rozlišení videa — třeba z 1080p na 4K — s doplněním věrohodných detailů místo prostého roztažení pixelů.

Od promptu k renderu: jazyk videa s umělou inteligencí

Tvorba videa s umělou inteligencí stojí na průsečíku dvou světů — desetiletí filmové a video produkční terminologie a rychle se vyvíjejícího jazyka strojového učení. Tento slovník je spojuje, a navíc přidává nové pojmy unikátní pro generativní video, abyste se v jakémkoli nástroji, tutoriálu či model card zorientovali s jistotou.

Začněte základy: poměr stran, rozlišení, snímková frekvence a kodeky určují, jak vaše video vypadá a kde se přehraje. Pak přichází vrstva umělé inteligence — modely, difuze, prompty, seedy a LoRA formují, co se vygeneruje. A nakonec specifika AI videa — text‑to‑video, image‑to‑video, lip sync, avatary, časová konzistence a world models — popisují, co dnešní generátory skutečně umí.

Každá definice je napsaná jednoduše, bez matematiky. Hledejte podle klíčového slova, filtrujte podle tématu nebo procházejte A–Z — a pak si novou slovní zásobu vyzkoušejte přímo ve studiu Vivideo.