Речник

Речникът на видео с изкуствен интелект

Всеки термин, с който ще се сблъскате при създаване на видео с изкуствен интелект — от основи за камера и кодеци до diffusion, аватари и агентно генериране — обяснен на разбираем език.

74 термини · Видео · Изкуствен интелект · Видео с изкуствен интелект

74 термини
Аватар с изкуствен интелектВидео с изкуствен интелект
Генериран или клониран екранен водещ, който може да изговаря сценария ви с избран глас и на избран език.
Агентно видеоВидео с изкуствен интелект
Агент с изкуствен интелект, който планира и управлява цялото производство — сценарий, сцени, глас, аватари и монтаж — от едно задание, вместо клип по клип.
БитрейтВидео
Колко данни се използват за секунда видео, измерено в kbps или Mbps. По-високият битрейт запазва повече детайл, но прави по-големи файлове.
БокеВидео
Мекото, приятно размазване извън фокус в задния план на кадъра, често като светещи кръгове.
Видео-към-видео (V2V)Видео с изкуствен интелект
Преобразяване на съществуващ клип в нов стил или визия, като се запази оригиналното движение и тайминг.
Воден знакВидео
Лого или текст върху видео за отбелязване на собственост. Много безплатни генератори го добавят; платените планове обичайно го премахват.
Временна консистентностВидео с изкуствен интелект
Запазване на персонажи, обекти и стил стабилни кадър по кадър, за да не трепти, изкривява или морфва видео по неестествен начин.
Говореща главаВидео с изкуствен интелект
Видео, фокусирано върху човек, който говори към камерата — класически случай за ИИ аватари и презентатори.
Данни за обучение (dataset)Изкуствен интелект
Сборът от примери — видеа, изображения, текст — върху които се обучава моделът. Качеството и разнообразието му определят какво може моделът.
Дигитален човек / дигитален двойникВидео с изкуствен интелект
Фотореалистичен ИИ двойник на реален човек, обучен веднъж и преизползван като водещ пред камера.
ДийпфейкВидео с изкуствен интелект
Синтетична медия, която реалистично заменя или фабрикува чуждо лице или глас. Мощна технология, но с важни въпроси за съгласие, автентичност и законност.
Дифузионен моделИзкуствен интелект
Водещият подход зад изображения и видео с изкуствен интелект: моделът тръгва от случаен шум и стъпка по стъпка го премахва, докато се появи резултат, отговарящ на подсказката.
Долна ивица (lower third)Видео
Текст, поставен в долната част на кадъра — обичайно име и длъжност на говорещия или надпис.
Дълбоко обучениеИзкуствен интелект
Машинно обучение с многослойни невронни мрежи. Захранва днешните модели за изображения, видео, глас и език.
Дълбочина на рязкостВидео
Колко от изображението е на фокус. Малката дълбочина на рязкост размазва фона и изпъква обекта.
ЕмбедингИзкуствен интелект
Списък от числа (вектор), който улавя значението на текст, изображение или аудио, за да може моделът да сравнява и комбинира различни входове.
Изображение-към-видео (I2V)Видео с изкуствен интелект
Оживяване на статично изображение като видео, често насочвано от подсказка, описващ желаното движение.
ИИ дублажВидео с изкуствен интелект
Замяна или добавяне на говор на друг език, за предпочитане съобразен с гласа и движенията на устните на говорещия.
Инпейтинг / аутпейтингВидео с изкуствен интелект
Запълване на част от кадър (inpainting) или разширение отвъд ръбовете му (outpainting). При видео се ползва за премахване, замяна или разширяване на области във времето.
Интерполация на кадриВидео с изкуствен интелект
Генериране на междинни кадри за повишаване на кадровата честота или заглаждане на движението — например превръщане на 24fps в копринени 60fps.
ИнференцияИзкуствен интелект
Изпълнение на вече обучен модел за да произведе изход — например генериране на видео от подсказка. Това е частта, за която се плаща на генериране.
Кадрова честота (FPS)Видео
Кадри в секунда — колко неподвижни изображения се възпроизвеждат всяка секунда. 24fps е кинематографско, 30fps е стандарт за уеб, а 60fps дава супер-плавно движение за екшън и спорт.
Клониране на гласВидео с изкуствен интелект
Възпроизвеждане на гласа на конкретен човек от кратка проба, за да говори нов текст със същия тембър.
Ключов кадърВидео
В монтажа: отбелязан кадър, който задава стойност (позиция, мащаб, непрозрачност), между които софтуерът анимира. В компресията: пълен референтен кадър, от който се възстановяват близки кадри.
КодекВидео
Алгоритъмът за компресия и декомпресия на видео — като H.264, H.265/HEVC, AV1 или VP9. Балансира качеството спрямо размера на файла.
КомпозитингВидео
Наслагване на множество визуални елементи — кадри, графики, ефекти, текст — в един общ кадър.
Контейнер (формат на файла)Видео
Обвивката, която държи видео, аудио и метаданни заедно — MP4, MOV, WebM или MKV. Тя е отделна от кодека вътре в нея.
Контрол на движение / motion brushВидео с изкуствен интелект
Инструменти, с които насочвате как и къде да се движат обектите в генериран клип, вместо всичко да се оставя на модела.
Контрол на камераВидео с изкуствен интелект
Управление на виртуални движения на камерата — пан, зуум, орбита, доли — в кадър, генериран от изкуствен интелект.
Латентно пространствоИзкуствен интелект
Компресирано математическо представяне, в което моделът реално работи. Генерацията се случва първо там, после се декодира във видими пиксели.
ЛетербоксингВидео
Черни ленти отгоре и отдолу (или отстрани), за да пасне видео към друго съотношение на страните без изрязване.
МоделИзкуствен интелект
Обучена система с изкуствен интелект, която превръща вход — като текстова подсказка — в изход, например видео. Различните модели имат различни силни страни, скорост и цена.
МултимодаленИзкуствен интелект
Модел, който разбира или генерира повече от един тип данни едновременно — например текст, изображение, видео и аудио заедно.
Надписи / субтитриВидео
Текст на екрана на изговореното аудио. Надписите включват и звуци/говорители за достъпност; субтитрите обикновено транскрибират или превеждат диалога.
Невронна мрежаИзкуствен интелект
Модел, вдъхновен от мозъка: слоеве свързани „неврони“, които учат шаблони от данни. Основата на съвременния генеративен изкуствен интелект.
Негативна подсказкаИзкуствен интелект
Описание на това, което НЕ искате в изхода. Насочва модела да избягва нежелани обекти, стилове или артефакти.
ОбучениеИзкуствен интелект
Научаване на модел чрез показване на огромни обеми данни и постепенно нагласяне на вътрешните параметри, докато дава добри резултати.
Параметри (тегла)Изкуствен интелект
Вътрешните числа, които моделът научава по време на обучение. Те съхраняват „знанието“; повече параметри може да значат по-голяма способност.
План / кадърВидео
Едно непрекъснато парче видеоматериал. Чести видове са общ план, среден план и близък план.
ПодсказкаИзкуствен интелект
Инструкцията, която давате на модела — обикновено текст, понякога и изображение — описваща видеото, което искате да създаде.
подсказка инженерингИзкуствен интелект
Умението да формулирате подсказки така, че моделът надеждно да дава търсения резултат — тема, стил, камера и настроение.
ПреходВидео
Как един кадър преминава в следващия — твърд срез, разтваряне, избледняване или „wipe“.
Първи и последен кадърВидео с изкуствен интелект
Подаване на стартов и/или краен кадър, между които моделът анимира, за прецизен контрол на началото и края на плана.
Разширение на видеоВидео с изкуствен интелект
Продължаване на клип отвъд оригиналната му дължина чрез генериране на допълнителни, естествено следващи кадри.
РезолюцияВидео
Брой пиксели по ширина × височина (напр. 1920×1080) във всеки кадър. Повече пиксели означава повече детайл. Чести нива са 720p (HD), 1080p (Full HD), 4K и 8K.
Рендер / рендериранеВидео
Превръщане на проект във финално видеофайл — или, при изкуствен интелект, генериране на кадри от модела до завършен клип.
Референтно изображениеВидео с изкуствен интелект
Изображение, което давате на модела, за да води темата, персонажа или стила на генерираното видео.
Световен моделВидео с изкуствен интелект
Система с изкуствен интелект, която изгражда вътрешна симулация как сцените, обектите и физиката се държат, за да генерира по-дълги, по-свързани и последователни видеа.
СийдИзкуствен интелект
Началното случайно число за генерация. Повторно използване на същия seed със същата подсказка възпроизвежда същия резултат — полезно за консистентност и фини промени.
Синхрон на устнитеВидео с изкуствен интелект
Съгласуване на устните на персонаж или аватар с говор, така че да изглежда, че наистина произнася думите.
Скала на насочване (CFG)Изкуствен интелект
Колко стриктно моделът следва подсказката спрямо импровизация. По-високи стойности се придържат повече към думите; по-ниски дават повече творческа свобода.
СторибордВидео
Планирана последователност от скици или кадри, която разписва всеки план преди да заснемете или генерирате видео.
Стъпки на семплиранеИзкуствен интелект
Броят итерации, с които дифузионен модел превръща шума във финален кадър. Повече стъпки често значат по-високо качество, но по-бавно и по-скъпо генериране.
Съотношение на странитеВидео
Пропорцията между ширина и височина на кадъра — 16:9 (широкоекранно), 9:16 (вертикално за Reels и TikTok) или 1:1 (квадратно). Определя как видеото пасва на платформи и екрани.
Текст-към-видео (T2V)Видео с изкуствен интелект
Генериране на видео клип директно от писмено описание — без камера, актьори или стокови кадри.
Текст-към-говор (TTS)Видео с изкуствен интелект
Превръщане на писмен текст в естествено звучащ говор със синтетичен глас — „двигателят“ зад гласовите записи с изкуствен интелект.
ТокенИзкуствен интелект
Най-малката част от входа, която един модел обработва — част от дума при текст или петно/кадър при видео.
Трансфер на стилВидео с изкуствен интелект
Прилагане на визуалния стил на една референция към вашите кадри или генерация.
ТрансформърИзкуствен интелект
Архитектура на невронна мрежа, базирана на „внимание“, което оценява връзките във входа. Стои в основата на големите езикови модели и много модерни видео модели.
Установяващ кадърВидео
Широк откриващ кадър, който задава локацията и контекста на сцената преди преминаване към по-близки планове.
Финна дообучаване (fine-tuning)Изкуствен интелект
Допълнително обучение на базов модел със специфични данни за специализация — за даден стил, бранд или човек.
Фондационен моделИзкуствен интелект
Голям, общовалиден модел, обучен на широки данни, който може да се приспособи към много последващи задачи.
ХалюцинацияИзкуствен интелект
Когато моделът дава уверени, но грешни или измислени резултати — като объркан текст, допълнителни пръсти или невъзможно движение.
Хромакей (зелен екран)Видео
Замяна на едноцветен фон — обикновено зелен — с друго изображение или видео, като този цвят се прави прозрачен.
Цветокорекция (grading)Видео
Творческият етап по настройване на цвят, контраст и настроение в постпродукцията, за целенасочена и консистентна визия.
ЧекпойнтИзкуствен интелект
Записан моментен образ на теглата на модела. Чекпойнтовете често се споделят като „model file“, който хората пускат локално.
ЪпскейлванеВидео с изкуствен интелект
Използване на изкуствен интелект за увеличаване на резолюцията на видео — например от 1080p към 4K — добавяйки правдоподобен детайл вместо просто разтягане на пиксели.
B-rollВидео
Допълнителни кадри, вмъкнати върху основния план за контекст, илюстрация или за да прикрият срез в монтажа.
GANИзкуствен интелект
Generative Adversarial Network — по-ранен метод с „генератор“ и „критик“, които се съревновават. До голяма степен заменен от diffusion за висококачествено видео.
HDR (High Dynamic Range)Видео
Видео с по-широк диапазон на яркост и цвят от стандартното (SDR), за по-реалистични светлини, сенки и богати тонове.
LoRAИзкуствен интелект
Low-Rank Adaptation — лек начин да научите модела на нов стил, персонаж или концепция с малък допълнителен файл, вместо пълно претрениране.
LUT (Look-Up Table)Видео
Пресет, който пренастройва цветовете, за да приложи конкретна визия с едно щракване или да конвертира кадри между цветови пространства.
Open-weight моделИзкуствен интелект
Модел, чиито тегла са публикувани и всеки може да го стартира, изучава или дообучава (напр. във fal или локално), за разлика от затворен модел, достъпен само през API.
RLHFИзкуствен интелект
Reinforcement Learning from Human Feedback — обучение чрез предпочитанията на хора, за да се изравнят изходите на модела с това, което реално желаем.

От подсказка до render: езикът на видеото с изкуствен интелект

Създаването на видео с изкуствен интелект стои на кръстопътя между два свята — десетилетия кинематографски и продуцентски жаргон и бързоразвиващия се език на машинното обучение. Този речник събира и двата, плюс новите термини, характерни за генеративното видео, за да четете уверено всеки инструмент, урок или model card.

Започнете с основите: съотношение на страните, резолюция, кадрова честота и кодеци определят как изглежда видеото и къде се възпроизвежда. После идва слойът на изкуствения интелект — модели, diffusion, подсказки, seed-ове и LoRA оформят какво се генерира. Накрая специфичното за ИИ видеото — text-to-video, image-to-video, lip sync, аватари, временна консистентност и world models — описва какво днешните генератори реално могат.

Всяко определение е написано на разбираем език, без математика. Търсете по ключова дума, филтрирайте по тема или разглеждайте от А до Я — после приложете речника директно в студиото на Vivideo.

Речникът на видео с изкуствен интелект

Започнете безплатноКакво е ИИ видео?