Речник

Речникът на видео с изкуствен интелект

Всеки термин, с който ще се сблъскате при създаване на видео с изкуствен интелект — от основи за камера и кодеци до diffusion, аватари и агентно генериране — обяснен на разбираем език.

74 термини · Видео · Изкуствен интелект · Видео с изкуствен интелект

74 термини

B G H L O R А Б В Г Д Е И К Л М Н О П Р С Т У Ф Х Ц Ч Ъ

Аватар с изкуствен интелектВидео с изкуствен интелект: Генериран или клониран екранен водещ, който може да изговаря сценария ви с избран глас и на избран език.
Агентно видеоВидео с изкуствен интелект: Агент с изкуствен интелект, който планира и управлява цялото производство — сценарий, сцени, глас, аватари и монтаж — от едно задание, вместо клип по клип.

БитрейтВидео: Колко данни се използват за секунда видео, измерено в kbps или Mbps. По-високият битрейт запазва повече детайл, но прави по-големи файлове.
БокеВидео: Мекото, приятно размазване извън фокус в задния план на кадъра, често като светещи кръгове.

Видео-към-видео (V2V)Видео с изкуствен интелект: Преобразяване на съществуващ клип в нов стил или визия, като се запази оригиналното движение и тайминг.
Воден знакВидео: Лого или текст върху видео за отбелязване на собственост. Много безплатни генератори го добавят; платените планове обичайно го премахват.
Временна консистентностВидео с изкуствен интелект: Запазване на персонажи, обекти и стил стабилни кадър по кадър, за да не трепти, изкривява или морфва видео по неестествен начин.

Говореща главаВидео с изкуствен интелект: Видео, фокусирано върху човек, който говори към камерата — класически случай за ИИ аватари и презентатори.

Данни за обучение (dataset)Изкуствен интелект: Сборът от примери — видеа, изображения, текст — върху които се обучава моделът. Качеството и разнообразието му определят какво може моделът.
Дигитален човек / дигитален двойникВидео с изкуствен интелект: Фотореалистичен ИИ двойник на реален човек, обучен веднъж и преизползван като водещ пред камера.
ДийпфейкВидео с изкуствен интелект: Синтетична медия, която реалистично заменя или фабрикува чуждо лице или глас. Мощна технология, но с важни въпроси за съгласие, автентичност и законност.
Дифузионен моделИзкуствен интелект: Водещият подход зад изображения и видео с изкуствен интелект: моделът тръгва от случаен шум и стъпка по стъпка го премахва, докато се появи резултат, отговарящ на подсказката.
Долна ивица (lower third)Видео: Текст, поставен в долната част на кадъра — обичайно име и длъжност на говорещия или надпис.
Дълбоко обучениеИзкуствен интелект: Машинно обучение с многослойни невронни мрежи. Захранва днешните модели за изображения, видео, глас и език.
Дълбочина на рязкостВидео: Колко от изображението е на фокус. Малката дълбочина на рязкост размазва фона и изпъква обекта.

ЕмбедингИзкуствен интелект: Списък от числа (вектор), който улавя значението на текст, изображение или аудио, за да може моделът да сравнява и комбинира различни входове.

Изображение-към-видео (I2V)Видео с изкуствен интелект: Оживяване на статично изображение като видео, често насочвано от подсказка, описващ желаното движение.
ИИ дублажВидео с изкуствен интелект: Замяна или добавяне на говор на друг език, за предпочитане съобразен с гласа и движенията на устните на говорещия.
Инпейтинг / аутпейтингВидео с изкуствен интелект: Запълване на част от кадър (inpainting) или разширение отвъд ръбовете му (outpainting). При видео се ползва за премахване, замяна или разширяване на области във времето.
Интерполация на кадриВидео с изкуствен интелект: Генериране на междинни кадри за повишаване на кадровата честота или заглаждане на движението — например превръщане на 24fps в копринени 60fps.
ИнференцияИзкуствен интелект: Изпълнение на вече обучен модел за да произведе изход — например генериране на видео от подсказка. Това е частта, за която се плаща на генериране.

Кадрова честота (FPS)Видео: Кадри в секунда — колко неподвижни изображения се възпроизвеждат всяка секунда. 24fps е кинематографско, 30fps е стандарт за уеб, а 60fps дава супер-плавно движение за екшън и спорт.
Клониране на гласВидео с изкуствен интелект: Възпроизвеждане на гласа на конкретен човек от кратка проба, за да говори нов текст със същия тембър.
Ключов кадърВидео: В монтажа: отбелязан кадър, който задава стойност (позиция, мащаб, непрозрачност), между които софтуерът анимира. В компресията: пълен референтен кадър, от който се възстановяват близки кадри.
КодекВидео: Алгоритъмът за компресия и декомпресия на видео — като H.264, H.265/HEVC, AV1 или VP9. Балансира качеството спрямо размера на файла.
КомпозитингВидео: Наслагване на множество визуални елементи — кадри, графики, ефекти, текст — в един общ кадър.
Контейнер (формат на файла)Видео: Обвивката, която държи видео, аудио и метаданни заедно — MP4, MOV, WebM или MKV. Тя е отделна от кодека вътре в нея.
Контрол на движение / motion brushВидео с изкуствен интелект: Инструменти, с които насочвате как и къде да се движат обектите в генериран клип, вместо всичко да се оставя на модела.
Контрол на камераВидео с изкуствен интелект: Управление на виртуални движения на камерата — пан, зуум, орбита, доли — в кадър, генериран от изкуствен интелект.

Латентно пространствоИзкуствен интелект: Компресирано математическо представяне, в което моделът реално работи. Генерацията се случва първо там, после се декодира във видими пиксели.
ЛетербоксингВидео: Черни ленти отгоре и отдолу (или отстрани), за да пасне видео към друго съотношение на страните без изрязване.

МоделИзкуствен интелект: Обучена система с изкуствен интелект, която превръща вход — като текстова подсказка — в изход, например видео. Различните модели имат различни силни страни, скорост и цена.
МултимодаленИзкуствен интелект: Модел, който разбира или генерира повече от един тип данни едновременно — например текст, изображение, видео и аудио заедно.

Надписи / субтитриВидео: Текст на екрана на изговореното аудио. Надписите включват и звуци/говорители за достъпност; субтитрите обикновено транскрибират или превеждат диалога.
Невронна мрежаИзкуствен интелект: Модел, вдъхновен от мозъка: слоеве свързани „неврони“, които учат шаблони от данни. Основата на съвременния генеративен изкуствен интелект.
Негативна подсказкаИзкуствен интелект: Описание на това, което НЕ искате в изхода. Насочва модела да избягва нежелани обекти, стилове или артефакти.

ОбучениеИзкуствен интелект: Научаване на модел чрез показване на огромни обеми данни и постепенно нагласяне на вътрешните параметри, докато дава добри резултати.

Параметри (тегла)Изкуствен интелект: Вътрешните числа, които моделът научава по време на обучение. Те съхраняват „знанието“; повече параметри може да значат по-голяма способност.
План / кадърВидео: Едно непрекъснато парче видеоматериал. Чести видове са общ план, среден план и близък план.
ПодсказкаИзкуствен интелект: Инструкцията, която давате на модела — обикновено текст, понякога и изображение — описваща видеото, което искате да създаде.
подсказка инженерингИзкуствен интелект: Умението да формулирате подсказки така, че моделът надеждно да дава търсения резултат — тема, стил, камера и настроение.
ПреходВидео: Как един кадър преминава в следващия — твърд срез, разтваряне, избледняване или „wipe“.
Първи и последен кадърВидео с изкуствен интелект: Подаване на стартов и/или краен кадър, между които моделът анимира, за прецизен контрол на началото и края на плана.

Разширение на видеоВидео с изкуствен интелект: Продължаване на клип отвъд оригиналната му дължина чрез генериране на допълнителни, естествено следващи кадри.
РезолюцияВидео: Брой пиксели по ширина × височина (напр. 1920×1080) във всеки кадър. Повече пиксели означава повече детайл. Чести нива са 720p (HD), 1080p (Full HD), 4K и 8K.
Рендер / рендериранеВидео: Превръщане на проект във финално видеофайл — или, при изкуствен интелект, генериране на кадри от модела до завършен клип.
Референтно изображениеВидео с изкуствен интелект: Изображение, което давате на модела, за да води темата, персонажа или стила на генерираното видео.

Световен моделВидео с изкуствен интелект: Система с изкуствен интелект, която изгражда вътрешна симулация как сцените, обектите и физиката се държат, за да генерира по-дълги, по-свързани и последователни видеа.
СийдИзкуствен интелект: Началното случайно число за генерация. Повторно използване на същия seed със същата подсказка възпроизвежда същия резултат — полезно за консистентност и фини промени.
Синхрон на устнитеВидео с изкуствен интелект: Съгласуване на устните на персонаж или аватар с говор, така че да изглежда, че наистина произнася думите.
Скала на насочване (CFG)Изкуствен интелект: Колко стриктно моделът следва подсказката спрямо импровизация. По-високи стойности се придържат повече към думите; по-ниски дават повече творческа свобода.
СторибордВидео: Планирана последователност от скици или кадри, която разписва всеки план преди да заснемете или генерирате видео.
Стъпки на семплиранеИзкуствен интелект: Броят итерации, с които дифузионен модел превръща шума във финален кадър. Повече стъпки често значат по-високо качество, но по-бавно и по-скъпо генериране.
Съотношение на странитеВидео: Пропорцията между ширина и височина на кадъра — 16:9 (широкоекранно), 9:16 (вертикално за Reels и TikTok) или 1:1 (квадратно). Определя как видеото пасва на платформи и екрани.

Текст-към-видео (T2V)Видео с изкуствен интелект: Генериране на видео клип директно от писмено описание — без камера, актьори или стокови кадри.
Текст-към-говор (TTS)Видео с изкуствен интелект: Превръщане на писмен текст в естествено звучащ говор със синтетичен глас — „двигателят“ зад гласовите записи с изкуствен интелект.
ТокенИзкуствен интелект: Най-малката част от входа, която един модел обработва — част от дума при текст или петно/кадър при видео.
Трансфер на стилВидео с изкуствен интелект: Прилагане на визуалния стил на една референция към вашите кадри или генерация.
ТрансформърИзкуствен интелект: Архитектура на невронна мрежа, базирана на „внимание“, което оценява връзките във входа. Стои в основата на големите езикови модели и много модерни видео модели.

Установяващ кадърВидео: Широк откриващ кадър, който задава локацията и контекста на сцената преди преминаване към по-близки планове.

Финна дообучаване (fine-tuning)Изкуствен интелект: Допълнително обучение на базов модел със специфични данни за специализация — за даден стил, бранд или човек.
Фондационен моделИзкуствен интелект: Голям, общовалиден модел, обучен на широки данни, който може да се приспособи към много последващи задачи.

ХалюцинацияИзкуствен интелект: Когато моделът дава уверени, но грешни или измислени резултати — като объркан текст, допълнителни пръсти или невъзможно движение.
Хромакей (зелен екран)Видео: Замяна на едноцветен фон — обикновено зелен — с друго изображение или видео, като този цвят се прави прозрачен.

Цветокорекция (grading)Видео: Творческият етап по настройване на цвят, контраст и настроение в постпродукцията, за целенасочена и консистентна визия.

ЧекпойнтИзкуствен интелект: Записан моментен образ на теглата на модела. Чекпойнтовете често се споделят като „model file“, който хората пускат локално.

ЪпскейлванеВидео с изкуствен интелект: Използване на изкуствен интелект за увеличаване на резолюцията на видео — например от 1080p към 4K — добавяйки правдоподобен детайл вместо просто разтягане на пиксели.

B-rollВидео: Допълнителни кадри, вмъкнати върху основния план за контекст, илюстрация или за да прикрият срез в монтажа.

GANИзкуствен интелект: Generative Adversarial Network — по-ранен метод с „генератор“ и „критик“, които се съревновават. До голяма степен заменен от diffusion за висококачествено видео.

HDR (High Dynamic Range)Видео: Видео с по-широк диапазон на яркост и цвят от стандартното (SDR), за по-реалистични светлини, сенки и богати тонове.

LoRAИзкуствен интелект: Low-Rank Adaptation — лек начин да научите модела на нов стил, персонаж или концепция с малък допълнителен файл, вместо пълно претрениране.
LUT (Look-Up Table)Видео: Пресет, който пренастройва цветовете, за да приложи конкретна визия с едно щракване или да конвертира кадри между цветови пространства.

Open-weight моделИзкуствен интелект: Модел, чиито тегла са публикувани и всеки може да го стартира, изучава или дообучава (напр. във fal или локално), за разлика от затворен модел, достъпен само през API.

RLHFИзкуствен интелект: Reinforcement Learning from Human Feedback — обучение чрез предпочитанията на хора, за да се изравнят изходите на модела с това, което реално желаем.

От подсказка до render: езикът на видеото с изкуствен интелект

Създаването на видео с изкуствен интелект стои на кръстопътя между два свята — десетилетия кинематографски и продуцентски жаргон и бързоразвиващия се език на машинното обучение. Този речник събира и двата, плюс новите термини, характерни за генеративното видео, за да четете уверено всеки инструмент, урок или model card.

Започнете с основите: съотношение на страните, резолюция, кадрова честота и кодеци определят как изглежда видеото и къде се възпроизвежда. После идва слойът на изкуствения интелект — модели, diffusion, подсказки, seed-ове и LoRA оформят какво се генерира. Накрая специфичното за ИИ видеото — text-to-video, image-to-video, lip sync, аватари, временна консистентност и world models — описва какво днешните генератори реално могат.

Всяко определение е написано на разбираем език, без математика. Търсете по ключова дума, филтрирайте по тема или разглеждайте от А до Я — после приложете речника директно в студиото на Vivideo.

Речникът на видео с изкуствен интелект

Започнете безплатно Какво е ИИ видео?