Глоссарий

Словарь по видео с искусственным интеллектом

Каждый термин, который встретится вам при создании видео с искусственным интеллектом — от азов камеры и кодеков до диффузии, аватаров и агентной генерации — объяснен простым языком.

74 термины · Видео · Искусственный интеллект · Видео с искусственным интеллектом

74 термины

B G H L R А Б В Г Д З И К Л М Н О П Р С Т У Х Ц Ч Ш Э

Аватар на искусственном интеллектеВидео с искусственным интеллектом: Сгенерированный или клонированный ведущий в кадре, который озвучивает ваш текст выбранным голосом и на нужном языке.
Агентное видеоВидео с искусственным интеллектом: Агент на основе искусственного интеллекта, который планирует и ведет всю продакшн-цепочку — сценарий, сцены, озвучку, аватары и монтаж — по одному брифу, а не клип за клипом.
Апскейл (повышение разрешения)Видео с искусственным интеллектом: Использование искусственного интеллекта для увеличения разрешения видео — скажем, с 1080p до 4K — с добавлением правдоподобных деталей, а не простым растягиванием пикселей.

Базовая модельИскусственный интеллект: Крупная универсальная модель, обученная на широком наборе данных и пригодная для адаптации к множеству задач.
БитрейтВидео: Сколько данных используется на секунду видео, измеряется в kbps или Mbps. Более высокий битрейт сохраняет больше деталей, но увеличивает размер файлов.
БокеВидео: Мягкое, приятное размытие вне зоны фокуса на заднем плане, часто в виде сияющих кружков света.

Видео-в-видео (V2V)Видео с искусственным интеллектом: Преобразование существующего клипа в новый стиль или вид с сохранением исходного движения и тайминга.
Водяной знакВидео: Логотип или текст поверх видео для обозначения прав. Многие бесплатные генераторы на искусственном интеллекте добавляют его; платные тарифы обычно убирают.
Временная согласованностьВидео с искусственным интеллектом: Стабильность персонажей, объектов и стиля от кадра к кадру, чтобы видео не мерцало, не «плыло» и не деформировалось.

ГаллюцинацияИскусственный интеллект: Когда модель уверенно выдает неверный или выдуманный результат — например ломанный текст, лишние пальцы или невозможное движение.
Глубина резкостиВидео: Часть изображения, которая находится в четком фокусе. Небольшая глубина размывает фон и выделяет объект.
Глубокое обучениеИскусственный интеллект: Машинное обучение с использованием многослойных нейросетей. Лежит в основе современных моделей изображений, видео, голоса и языка.
Говорящая головаВидео с искусственным интеллектом: Видео, сосредоточенное на человеке, говорящем в камеру — классический сценарий для аватаров и ведущих на искусственном интеллекте.

ДатасетИскусственный интеллект: Набор примеров — видео, изображения, тексты — на которых обучают модель. Его качество и разнообразие определяют, на что модель способна.
ДипфейкВидео с искусственным интеллектом: Синтетические медиа, которые правдоподобно подменяют или создают лицо или голос человека. Мощно, но вызывает серьезные вопросы согласия, подлинности и права.
Диффузионная модельИскусственный интеллект: Доминирующий подход к созданию изображений и видео с искусственным интеллектом: модель стартует с случайного шума и шаг за шагом удаляет его, пока не проявится результат, соответствующий запросу.
Дообучение (fine-tuning)Искусственный интеллект: Дополнительное обучение базовой модели на специальных данных для специализации — под конкретный стиль, бренд или персону.
Дубляж на искусственном интеллектеВидео с искусственным интеллектом: Замена или добавление речи на другом языке, в идеале с совпадением голоса и движений губ спикера.

Задающий планВидео: Широкий вступительный кадр, который задает локацию и контекст сцены перед переходом на более крупные планы.

Изображение-в-видео (I2V)Видео с искусственным интеллектом: Оживление статичного изображения в видеоролик, часто с подсказкой, описывающей желаемое движение.
Инпейтинг / аутпейтингВидео с искусственным интеллектом: Заполнение части кадра (инпейтинг) или расширение за его пределы (аутпейтинг). В видео используется для удаления, замены или наращивания областей во времени.
Интерполяция кадровВидео с искусственным интеллектом: Генерация промежуточных кадров для повышения частоты или сглаживания движения — например, превращение 24fps в шелковистые 60fps.
ИнференсИскусственный интеллект: Запуск уже обученной модели для получения результата — например генерация видео по запросу. Именно за инференс обычно платят «за генерацию».

Клонирование голосаВидео с искусственным интеллектом: Воссоздание голоса конкретного человека по короткой записи, чтобы он мог произносить новый текст тем же тембром.
Ключевой кадрВидео: В монтаже — помеченный кадр, задающий значение (позиция, масштаб, прозрачность); между такими кадрами программа выполняет анимацию. В сжатии — полный опорный кадр, по которому восстанавливаются соседние кадры.
КодекВидео: Алгоритм сжатия и распаковки видео — например, H.264, H.265/HEVC, AV1 или VP9. Балансирует качество изображения и размер файла.
Колор-коррекция (грейдинг)Видео: Творческая настройка цвета, контраста и настроения материала на постпродакшне, чтобы придать ему цельный, продуманный вид.
КомпозитингВидео: Совмещение нескольких визуальных элементов — видео, графики, эффектов, текста — в единый кадр.
Контейнер (формат файла)Видео: «Обертка» файла, которая хранит вместе видео, аудио и метаданные — MP4, MOV, WebM или MKV. Это отдельно от кодека, записанного внутри.

Латентное пространствоИскусственный интеллект: Сжатое математическое представление, в котором модель реально работает. Сначала генерация происходит здесь, затем декодируется в видимые пиксели.
ЛеттербоксингВидео: Черные полосы сверху и снизу (или по бокам) видео, чтобы вписать его в другое соотношение сторон без кадрирования.
ЛипсинкВидео с искусственным интеллектом: Синхронизация движений рта персонажа или аватара со звуком речи, чтобы казалось, что он действительно произносит слова.

Мировая модельВидео с искусственным интеллектом: Искусственный интеллект, который строит внутреннюю симуляцию поведения сцен, объектов и физики, помогая генерировать более длинное, связное и стабильное видео.
МодельИскусственный интеллект: Обученная система искусственного интеллекта, которая превращает вход — например текстовый запрос — в выход, например видео. У разных моделей свои сильные стороны, скорость и стоимость.
Модель с открытыми весамиИскусственный интеллект: Модель, чьи веса опубликованы, так что любой может запускать, изучать или дообучать ее (например, на fal или локально), в отличие от закрытой модели, доступной только через API.
МультимодальнаяИскусственный интеллект: Модель, которая понимает или генерирует сразу несколько типов данных — например текст, изображение, видео и аудио вместе.

Негативный промптИскусственный интеллект: Описание того, ЧЕГО вы НЕ хотите видеть в результате. Отводит модель от нежелательных объектов, стилей или артефактов.
Нейронная сетьИскусственный интеллект: Модель, отдаленно вдохновленная мозгом: слои взаимосвязанных «нейронов», которые учатся распознавать закономерности. Основа современного генеративного искусственного интеллекта.
Нижняя треть (lower third)Видео: Текстовая подпись в нижней части кадра — обычно имя и должность спикера или титр.

ОбучениеИскусственный интеллект: Процесс «обучения» модели на огромных массивах данных с постепенной подстройкой внутренних параметров до получения хороших результатов.

Параметры (веса)Искусственный интеллект: Внутренние числа, которые модель выучивает в процессе обучения. В них хранится «знание» модели; больше параметров может означать больше возможностей.
Первый и последний кадрВидео с искусственным интеллектом: Вы задаете стартовый и/или конечный кадр, а модель анимирует между ними — точный контроль начала и завершения плана.
Перенос стиляВидео с искусственным интеллектом: Применение визуального стиля одного референса к вашему материалу или генерации.
ПереходВидео: Как один план меняется на следующий — резкая склейка, растворение, наплыв или вайп.
План (shot)Видео: Один непрерывный фрагмент видео. Частые типы: общий план, средний план и крупный план.
ПромптИскусственный интеллект: Инструкция для модели — обычно текст, иногда с изображением — описывающая, какое видео вы хотите получить.
Промпт-инжинирингИскусственный интеллект: Навык формулирования запросов так, чтобы модель стабильно выдавала задуманный результат: объект, стиль, камеру и настроение.

РазрешениеВидео: Размеры кадра в пикселях, записываются как ширина × высота (например, 1920×1080). Больше пикселей — больше деталей. Частые уровни: 720p (HD), 1080p (Full HD), 4K и 8K.
РаскадровкаВидео: Запланированная последовательность эскизов или кадров, которая описывает каждый план до съемки или генерации видео.
Расширение видеоВидео с искусственным интеллектом: Продление клипа за исходную длину путем генерации дополнительных кадров, естественно продолжающих движение.
Рендер / рендерингВидео: Преобразование проекта в готовый видеофайл — или, в контексте искусственного интеллекта, когда модель собирает кадры в финальный клип.
Референс-изображениеВидео с искусственным интеллектом: Картинка, которой вы направляете модель — по объекту, персонажу или стилю будущего видео.

СидИскусственный интеллект: Стартовое случайное число для генерации. Повтор с тем же сидом и тем же промптом воспроизводит тот же результат — полезно для согласованности и точечных правок.
Сила управления (CFG)Искусственный интеллект: Насколько строго модель следует вашему промпту или импровизирует. Более высокие значения — ближе к тексту; более низкие — больше творческой свободы модели.
Соотношение сторонВидео: Пропорция ширины к высоте кадра — 16:9 (широкий), 9:16 (вертикальный для Reels и TikTok) или 1:1 (квадрат). От него зависит, как видео ляжет на разные экраны и платформы.
Субтитры / скрытые субтитрыВидео: Текст на экране, отражающий озвучку. Субтитры для доступности также отмечают звуки и говорящих; обычные субтитры обычно транскрибируют или переводят диалоги.

Текст в речь (TTS)Видео с искусственным интеллектом: Преобразование текста в естественную речь синтетическим голосом — движок озвучек на основе искусственного интеллекта.
Текст-в-видео (T2V)Видео с искусственным интеллектом: Генерация видео напрямую по письменному описанию — без камеры, актеров и стоков.
ТокенИскусственный интеллект: Наименьшая часть входа, которую обрабатывает модель — кусочек слова для текста или патч/кадр для видео.
ТрансформерИскусственный интеллект: Архитектура нейросети на основе «внимания», которое оценивает взаимосвязи частей входа. Лежит в основе больших языковых моделей и многих современных видеомоделей.

Управление движением / motion brushВидео с искусственным интеллектом: Инструменты, позволяющие задавать, где и как объекты двигаются в сгенерированном клипе, а не полагаться полностью на модель.
Управление камеройВидео с искусственным интеллектом: Задание виртуальных движений камеры — панорамирования, зума, орбиты, долли — внутри сгенерированного кадра.

Хромакей (зеленый экран)Видео: Замена однотонного фона — обычно зеленого — на другое изображение или видео за счет «прозрачности» этого цвета.

Цифровой человек / цифровой двойникВидео с искусственным интеллектом: Фотореалистичная копия реального человека на основе искусственного интеллекта, обученная один раз и повторно используемая как ведущий в кадре.

Частота кадров (FPS)Видео: Кадров в секунду — сколько статичных изображений проигрывается за секунду. 24fps выглядит «киношно», 30fps — стандарт для веба, 60fps — сверхплавно для динамики и спорта.
ЧекпоинтИскусственный интеллект: Сохраненный снимок весов модели. Чекпоинты часто публикуют как загружаемые «файлы модели» для запуска.

Шаги семплированияИскусственный интеллект: Сколько итераций делает диффузионная модель, чтобы превратить шум в финальный кадр. Больше шагов — потенциально выше качество, но медленнее и дороже.

ЭмбеддингИскусственный интеллект: Список чисел (вектор), который отражает смысл текста, изображения или аудио, чтобы модель могла сравнивать и комбинировать разные входы.

B-rollВидео: Дополнительные планы, которые накладываются поверх основного, чтобы добавить контекст, проиллюстрировать мысль или скрыть склейку.

GANИскусственный интеллект: Generative Adversarial Network — ранний метод, где соревнуются генератор и критик. Для высококачественного видео в значительной мере вытеснен диффузией.

HDR (High Dynamic Range)Видео: Видео с более широким диапазоном яркости и цветов, чем стандартное (SDR), — для более живых светов, теней и насыщенных тонов.

LoRAИскусственный интеллект: Low-Rank Adaptation — легковесный способ обучить модель новому стилю, персонажу или концепту с помощью небольшого подключаемого файла вместо переобучения всей модели.
LUT (Look-Up Table)Видео: Пресет, который перенастраивает цвета для быстрого применения нужного образа одним кликом или конвертации между цветовыми пространствами.

RLHFИскусственный интеллект: Reinforcement Learning from Human Feedback — обучение с подкреплением по человеческой обратной связи, которое согласует ответы модели с предпочтениями людей.

От запроса до рендера: язык видео с искусственным интеллектом

Создание видео с искусственным интеллектом находится на стыке двух миров — десятилетий терминологии кино и видеопроизводства и стремительно развивающегося языка машинного обучения. Этот словарь объединяет их, добавляя новые понятия, уникальные для генеративного видео, чтобы вы с уверенностью читали любые инструменты, обучалки и карточки моделей.

Начните с базовых вещей: соотношение сторон, разрешение, частота кадров и кодеки определяют, как выглядит ваше видео и где оно воспроизводится. Затем слой искусственного интеллекта — модели, диффузия, промпты, сиды и LoRA формируют то, что будет сгенерировано. И наконец, специфика генеративного видео — text-to-video, image-to-video, липсинк, аватары, временная согласованность и мировые модели — описывает, что современные генераторы реально умеют.

Каждое определение написано простым языком, без математики. Ищите по ключевым словам, фильтруйте по теме или листайте от A до Z — а затем применяйте лексику на практике в студии Vivideo.

Словарь по видео с искусственным интеллектом

Начать бесплатно Что такое видео с искусственным интеллектом?