Slovník

Slovník videa s umělou inteligencí

Každý pojem, na který narazíte při tvorbě videa s umělou inteligencí — od základů kamery a kodeků po difuzi, avatary a agentní generování — vysvětlen jednoduše a bez žargonu.

74 pojmy · Video · Umělá inteligence · Video s umělou inteligencí

74 pojmy

A B C Č D G H I K L M N P R Ř S T U V Z

Agentní videoVideo s umělou inteligencí: Agent umělé inteligence, který naplánuje a provede celou produkci — scénář, scény, hlas, avatary i střih — z jednoho zadání, místo generování po jednotlivých klipech.
Avatar s umělou inteligencíVideo s umělou inteligencí: Generovaný nebo naklonovaný moderátor v obraze, který dokáže přečíst váš scénář zvoleným hlasem a v daném jazyce.

B‑rollVideo: Doplňkové záběry vložené přes hlavní záběr pro přidání kontextu, ilustrování pointy nebo skrytí střihu.
BokehVideo: Jemné, příjemné rozostření pozadí v záběru, často viditelné jako zářící kruhy světla.

Color gradingVideo: Kreativní úprava barev, kontrastu a nálady záběrů v postprodukci, která jim dá jednotný a záměrný vzhled.
Chroma key (zelené plátno)Video: Nahrazení jednobarevného pozadí — obvykle zeleného — jiným obrazem či videem tím, že se tato barva zprůhlední.

Časová konzistenceVideo s umělou inteligencí: Udržení postav, objektů a stylu stabilních snímek po snímku, aby video neblikalo, nekroutilo se ani se nepřirozeně neměnilo.

Datová sadaUmělá inteligence: Sbírka příkladů — videí, obrázků, textu — na nichž je model trénován. Její kvalita a rozmanitost formují, co model dokáže.
Datový tokVideo: Kolik dat se použije na jednu sekundu videa, měří se v kbps nebo Mbps. Vyšší bitrate zachová více detailů, ale vytváří větší soubory.
DeepfakeVideo s umělou inteligencí: Syntetické médium, které věrohodně zamění nebo vytvoří něčí tvář či hlas. Mocné, ale vyvolává reálné otázky souhlasu, autenticity a práva.
Difuzní modelUmělá inteligence: Dominantní přístup za obrazovou a video generací: model začíná od náhodného šumu a krok za krokem jej odstraňuje, až se objeví výsledek odpovídající vašemu promptu.
Digitální člověk / digitální dvojčeVideo s umělou inteligencí: Fotorealistická replika skutečné osoby poháněná umělou inteligencí, jednou natrénovaná a znovu používaná jako on‑camera moderátor.
Doladění (fine‑tuning)Umělá inteligence: Další trénink základního modelu na specifických datech, aby se specializoval — na určitý styl, značku nebo osobu.
Dubbing s umělou inteligencíVideo s umělou inteligencí: Nahrazení nebo přidání mluveného zvuku v jiném jazyce, ideálně přizpůsobené hlasu mluvčího a pohybům rtů.

GANUmělá inteligence: Generative Adversarial Network — dřívější metoda, kde spolu soutěží generátor a kritik. Pro vysoce kvalitní video ji z velké části nahradila difuze.

HalucinaceUmělá inteligence: Když model sebejistě vyprodukuje výstup, který je chybný nebo vymyšlený — třeba zkomolený text, extra prsty nebo nemožný pohyb.
HDR (High Dynamic Range)Video: Video s širším rozsahem jasu a barev než standard (SDR), díky čemuž má realističtější světla, stíny a bohatší tóny.
Hloubka ostrostiVideo: Jak velká část obrazu je ostře zaostřená. Malá hloubka ostrosti rozmaže pozadí a zvýrazní subjekt.
Hluboké učeníUmělá inteligence: Strojové učení využívající mnoho vrstev neuronových sítí. Pohání dnešní obrazové, video, hlasové i jazykové modely.

Image‑to‑video (I2V)Video s umělou inteligencí: Oživení statického obrázku do videa, často řízené promptem, který popisuje požadovaný pohyb.
Inferenční běhUmělá inteligence: Spuštění již natrénovaného modelu pro vytvoření výstupu — například vygenerování videa z promptu. Za to se obvykle platí za každou generaci.
Inpainting / outpaintingVideo s umělou inteligencí: Doplnění chybějící části snímku (inpainting) nebo rozšíření za jeho okraje (outpainting). U videa slouží k odstranění, nahrazení či rozšíření oblastí v čase.
Interpolace snímkůVideo s umělou inteligencí: Dopočítávání mezisnímků pro zvýšení snímkové frekvence nebo zjemnění pohybu — například změna 24fps na sametových 60fps.

Kličkový snímekVideo: V editaci označený snímek, který nastaví hodnotu (pozici, měřítko, krytí), mezi nimiž software interpoluje. V kompresi plnohodnotný referenční snímek, z nějž se obnovují okolní snímky.
Klonování hlasuVideo s umělou inteligencí: Rekonstrukce konkrétního hlasu z krátké ukázky tak, aby mohl mluvit nový text tím samým hlasem.
KodekVideo: Algoritmus, který video komprimuje a dekomprimuje — například H.264, H.265/HEVC, AV1 nebo VP9. Vyvažuje kvalitu obrazu a velikost souboru.
KompozitingVideo: Vrstvení více vizuálních prvků — záběrů, grafiky, efektů, textu — do jednoho výsledného snímku.
Kontejner (formát souboru)Video: Obal, který drží video, zvuk a metadata pohromadě — MP4, MOV, WebM nebo MKV. Je oddělený od kodeku uloženého uvnitř.
Kontrolní bodUmělá inteligence: Uložený snímek vah modelu. Checkpointy se často sdílí jako stahovatelné „modelové soubory“, které lze spouštět.

Latentní prostorUmělá inteligence: Zkomprimované matematické vyjádření, ve kterém model skutečně pracuje. Nejdřív probíhá generace zde, až pak se dekóduje do viditelných pixelů.
LetterboxingVideo: Černé pruhy přidané nad a pod (nebo po stranách) videa, aby se vešlo do jiného poměru stran bez ořezu obrazu.
Lip-syncVideo s umělou inteligencí: Sladění pohybů úst postavy či avatara s mluveným zvukem tak, aby to vypadalo, že skutečně vyslovuje daná slova.
LoRAUmělá inteligence: Low‑Rank Adaptation — lehký způsob, jak model naučit nový styl, postavu či koncept pomocí malého přídavného souboru místo znovu‑trénování celého modelu.
LUT (Look-Up Table)Video: Předvolba, která přemapuje barvy a jedním klikem aplikuje konkrétní vzhled, nebo převádí záběry mezi barevnými prostory.

Míra navádění (CFG)Umělá inteligence: Jak striktně model následuje váš prompt oproti improvizaci. Vyšší hodnoty se drží slov přesněji; nižší dávají modelu více tvůrčí svobody.
Mluvící hlavaVideo s umělou inteligencí: Video zaměřené na člověka mluvícího do kamery — klasický případ použití avatarů a virtuálních moderátorů.
ModelUmělá inteligence: Natrénovaný systém umělé inteligence, který mění vstup — například textový prompt — na výstup, například video. Různé modely mají rozdílné přednosti, rychlost i cenu.
Model s otevřenými vahamiUmělá inteligence: Model, jehož váhy jsou zveřejněny, takže jej může kdokoli spustit, zkoumat či doladit (např. na fal nebo lokálně), na rozdíl od uzavřeného modelu dostupného jen přes API.
MultimodálníUmělá inteligence: Model, který chápe nebo generuje více typů dat najednou — například text, obraz, video a audio společně.

Negativní promptUmělá inteligence: Popis toho, co ve výstupu NEchcete. Odvádí model od nežádoucích objektů, stylů nebo artefaktů.
Neuronová síťUmělá inteligence: Model volně inspirovaný mozkem: vrstvy propojených „neuronů“, které se učí vzorce z dat. Je základem moderní generativní umělé inteligence.

Parametry (váhy)Umělá inteligence: Vnitřní čísla, která se model učí během tréninku. Ukládají to, co model „ví“; více parametrů může znamenat vyšší schopnosti.
Počet kroků (sampling steps)Umělá inteligence: Kolik iterací difuzní model provede, než promění šum ve finální snímek. Více kroků může znamenat vyšší kvalitu, ale pomalejší a dražší generování.
Poměr stranVideo: Poměr šířky k výšce snímku — 16:9 (širokoúhlé), 9:16 (vertikální pro Reels a TikTok) nebo 1:1 (čtverec). Určuje, jak se video přizpůsobí platformám a obrazovkám.
Prodloužení videaVideo s umělou inteligencí: Pokračování klipu za jeho původní délku generováním navazujících snímků, které přirozeně vyústí z dosavadního děje.
PromptUmělá inteligence: Instrukce, kterou dáte modelu — obvykle text, někdy s obrázkem — popisující video, které chcete vytvořit.
První a poslední snímekVideo s umělou inteligencí: Dodání úvodního a/nebo koncového snímku, mezi nimiž model animuje — získáte přesnou kontrolu nad začátkem a koncem záběru.
PřechodVideo: Jak jeden záběr přejde do dalšího — tvrdý střih, prolínačka, ztmavení/roztmavení nebo wipe.
Přenos styluVideo s umělou inteligencí: Aplikace vizuálního stylu jedné reference na vaše záběry nebo generaci.

Referenční obrázekVideo s umělou inteligencí: Obrázek, který dáte modelu jako vodítko pro subjekt, postavu nebo styl generovaného videa.
Render / renderováníVideo: Zpracování projektu do finálního video souboru — nebo v oblasti umělé inteligence přegenerování snímků modelem do výsledného klipu.
RLHFUmělá inteligence: Reinforcement Learning from Human Feedback — trénink, který využívá lidské preference, aby model ladil výstupy k tomu, co lidé skutečně chtějí.
RozlišeníVideo: Rozměry v pixelech pro každý snímek, zapisují se šířka × výška (např. 1920×1080). Více pixelů znamená více detailů. Běžné stupně jsou 720p (HD), 1080p (Full HD), 4K a 8K.

Řízení kameryVideo s umělou inteligencí: Směrování virtuálních kamerových pohybů — pan, zoom, orbit, dolly — v rámci záběru generovaného umělou inteligencí.
Řízení pohybu / motion brushVideo s umělou inteligencí: Nástroje, které vám umožní určovat, kde a jak se budou věci v generovaném klipu hýbat, místo aby o všem rozhodoval jen model.

SeedUmělá inteligence: Počáteční náhodné číslo pro generování. Zopakování stejného seedu se stejným promptem reprodukuje stejný výsledek — užitečné pro konzistenci a drobné úpravy.
Snímková frekvence (FPS)Video: Počet snímků za sekundu. 24fps působí filmově, 30fps je standard na webu a 60fps vypadá extra plynule pro rychlý pohyb a sport.
Spodní třetinaVideo: Text umístěný ve spodní části obrazu, typicky jméno a funkce mluvčího nebo popisek.
StoryboardVideo: Plánovaná posloupnost skic nebo snímků, která rozkreslí každý záběr ještě před produkcí či generováním videa.
Světový modelVideo s umělou inteligencí: Umělá inteligence, která si buduje vnitřní simulaci chování scén, objektů a fyziky, což jí pomáhá generovat delší, soudržnější a konzistentnější video.

Text‑to‑speech (TTS)Video s umělou inteligencí: Převod psaného textu na přirozeně znějící mluvený zvuk se syntetickým hlasem — motor, který stojí za voiceovery s umělou inteligencí.
Text‑to‑video (T2V)Video s umělou inteligencí: Generování video klipu přímo z psaného popisu — bez kamery, herců nebo stock záběrů.
Titulky / captionsVideo: Text na obrazovce odpovídající mluvenému zvuku. Skryté titulky (captions) pro zpřístupnění navíc uvádějí i zvuky a mluvčí; běžné titulky (subtitles) obvykle přepisují nebo překládají dialog.
TokenUmělá inteligence: Nejmenší jednotka vstupu, kterou model zpracovává — část slova u textu nebo ploška či snímek u videa.
TransformerUmělá inteligence: Architektura neuronové sítě postavená na „pozornosti“, která váží vztahy mezi částmi vstupu. Tvoří základ velkých jazykových modelů i mnoha moderních video modelů.
TréninkUmělá inteligence: Učení modelu pomocí obrovského množství dat a postupného ladění jeho vnitřních parametrů, dokud nedává dobré výsledky.
Tvorba promptůUmělá inteligence: Dovednost formulovat prompty tak, aby model spolehlivě vytvořil zamýšlený výsledek — včetně subjektu, stylu, kamery a nálady.

Uvozující (establishing) záběrVideo: Široký úvodní záběr, který nastaví lokaci a kontext scény, než přejdete na bližší záběry.

Video‑to‑video (V2V)Video s umělou inteligencí: Převod existujícího klipu do nového stylu nebo vzhledu při zachování původního pohybu a timingů.
VkládáníUmělá inteligence: Seznam čísel (vektor), který zachycuje význam textu, obrázku nebo audia, aby model mohl různé vstupy porovnávat a kombinovat.
VodoznakVideo: Logo nebo text překrytý přes video jako označení vlastnictví. Mnoho bezplatných generátorů s umělou inteligencí jej přidává; placené tarify jej obvykle odstraní.

ZáběrVideo: Jedna souvislá část záznamu. Běžné typy jsou celkový záběr, polodetail a detail.
Základní (foundation) modelUmělá inteligence: Velký, univerzální model trénovaný na široké škále dat, který lze přizpůsobit mnoha následným úlohám.
Zvětšování rozlišeníVideo s umělou inteligencí: Využití umělé inteligence ke zvýšení rozlišení videa — třeba z 1080p na 4K — s doplněním věrohodných detailů místo prostého roztažení pixelů.

Od promptu k renderu: jazyk videa s umělou inteligencí

Tvorba videa s umělou inteligencí stojí na průsečíku dvou světů — desetiletí filmové a video produkční terminologie a rychle se vyvíjejícího jazyka strojového učení. Tento slovník je spojuje, a navíc přidává nové pojmy unikátní pro generativní video, abyste se v jakémkoli nástroji, tutoriálu či model card zorientovali s jistotou.

Začněte základy: poměr stran, rozlišení, snímková frekvence a kodeky určují, jak vaše video vypadá a kde se přehraje. Pak přichází vrstva umělé inteligence — modely, difuze, prompty, seedy a LoRA formují, co se vygeneruje. A nakonec specifika AI videa — text‑to‑video, image‑to‑video, lip sync, avatary, časová konzistence a world models — popisují, co dnešní generátory skutečně umí.

Každá definice je napsaná jednoduše, bez matematiky. Hledejte podle klíčového slova, filtrujte podle tématu nebo procházejte A–Z — a pak si novou slovní zásobu vyzkoušejte přímo ve studiu Vivideo.

Slovník videa s umělou inteligencí

Začněte tvořit zdarma Co je video s umělou inteligencí?