Глоссарий

Словарь по видео с искусственным интеллектом

Каждый термин, который встретится вам при создании видео с искусственным интеллектом — от азов камеры и кодеков до диффузии, аватаров и агентной генерации — объяснен простым языком.

74 термины · Видео · Искусственный интеллект · Видео с искусственным интеллектом

74 термины
Аватар на искусственном интеллектеВидео с искусственным интеллектом
Сгенерированный или клонированный ведущий в кадре, который озвучивает ваш текст выбранным голосом и на нужном языке.
Агентное видеоВидео с искусственным интеллектом
Агент на основе искусственного интеллекта, который планирует и ведет всю продакшн-цепочку — сценарий, сцены, озвучку, аватары и монтаж — по одному брифу, а не клип за клипом.
Апскейл (повышение разрешения)Видео с искусственным интеллектом
Использование искусственного интеллекта для увеличения разрешения видео — скажем, с 1080p до 4K — с добавлением правдоподобных деталей, а не простым растягиванием пикселей.
Базовая модельИскусственный интеллект
Крупная универсальная модель, обученная на широком наборе данных и пригодная для адаптации к множеству задач.
БитрейтВидео
Сколько данных используется на секунду видео, измеряется в kbps или Mbps. Более высокий битрейт сохраняет больше деталей, но увеличивает размер файлов.
БокеВидео
Мягкое, приятное размытие вне зоны фокуса на заднем плане, часто в виде сияющих кружков света.
Видео-в-видео (V2V)Видео с искусственным интеллектом
Преобразование существующего клипа в новый стиль или вид с сохранением исходного движения и тайминга.
Водяной знакВидео
Логотип или текст поверх видео для обозначения прав. Многие бесплатные генераторы на искусственном интеллекте добавляют его; платные тарифы обычно убирают.
Временная согласованностьВидео с искусственным интеллектом
Стабильность персонажей, объектов и стиля от кадра к кадру, чтобы видео не мерцало, не «плыло» и не деформировалось.
ГаллюцинацияИскусственный интеллект
Когда модель уверенно выдает неверный или выдуманный результат — например ломанный текст, лишние пальцы или невозможное движение.
Глубина резкостиВидео
Часть изображения, которая находится в четком фокусе. Небольшая глубина размывает фон и выделяет объект.
Глубокое обучениеИскусственный интеллект
Машинное обучение с использованием многослойных нейросетей. Лежит в основе современных моделей изображений, видео, голоса и языка.
Говорящая головаВидео с искусственным интеллектом
Видео, сосредоточенное на человеке, говорящем в камеру — классический сценарий для аватаров и ведущих на искусственном интеллекте.
ДатасетИскусственный интеллект
Набор примеров — видео, изображения, тексты — на которых обучают модель. Его качество и разнообразие определяют, на что модель способна.
ДипфейкВидео с искусственным интеллектом
Синтетические медиа, которые правдоподобно подменяют или создают лицо или голос человека. Мощно, но вызывает серьезные вопросы согласия, подлинности и права.
Диффузионная модельИскусственный интеллект
Доминирующий подход к созданию изображений и видео с искусственным интеллектом: модель стартует с случайного шума и шаг за шагом удаляет его, пока не проявится результат, соответствующий запросу.
Дообучение (fine-tuning)Искусственный интеллект
Дополнительное обучение базовой модели на специальных данных для специализации — под конкретный стиль, бренд или персону.
Дубляж на искусственном интеллектеВидео с искусственным интеллектом
Замена или добавление речи на другом языке, в идеале с совпадением голоса и движений губ спикера.
Задающий планВидео
Широкий вступительный кадр, который задает локацию и контекст сцены перед переходом на более крупные планы.
Изображение-в-видео (I2V)Видео с искусственным интеллектом
Оживление статичного изображения в видеоролик, часто с подсказкой, описывающей желаемое движение.
Инпейтинг / аутпейтингВидео с искусственным интеллектом
Заполнение части кадра (инпейтинг) или расширение за его пределы (аутпейтинг). В видео используется для удаления, замены или наращивания областей во времени.
Интерполяция кадровВидео с искусственным интеллектом
Генерация промежуточных кадров для повышения частоты или сглаживания движения — например, превращение 24fps в шелковистые 60fps.
ИнференсИскусственный интеллект
Запуск уже обученной модели для получения результата — например генерация видео по запросу. Именно за инференс обычно платят «за генерацию».
Клонирование голосаВидео с искусственным интеллектом
Воссоздание голоса конкретного человека по короткой записи, чтобы он мог произносить новый текст тем же тембром.
Ключевой кадрВидео
В монтаже — помеченный кадр, задающий значение (позиция, масштаб, прозрачность); между такими кадрами программа выполняет анимацию. В сжатии — полный опорный кадр, по которому восстанавливаются соседние кадры.
КодекВидео
Алгоритм сжатия и распаковки видео — например, H.264, H.265/HEVC, AV1 или VP9. Балансирует качество изображения и размер файла.
Колор-коррекция (грейдинг)Видео
Творческая настройка цвета, контраста и настроения материала на постпродакшне, чтобы придать ему цельный, продуманный вид.
КомпозитингВидео
Совмещение нескольких визуальных элементов — видео, графики, эффектов, текста — в единый кадр.
Контейнер (формат файла)Видео
«Обертка» файла, которая хранит вместе видео, аудио и метаданные — MP4, MOV, WebM или MKV. Это отдельно от кодека, записанного внутри.
Латентное пространствоИскусственный интеллект
Сжатое математическое представление, в котором модель реально работает. Сначала генерация происходит здесь, затем декодируется в видимые пиксели.
ЛеттербоксингВидео
Черные полосы сверху и снизу (или по бокам) видео, чтобы вписать его в другое соотношение сторон без кадрирования.
ЛипсинкВидео с искусственным интеллектом
Синхронизация движений рта персонажа или аватара со звуком речи, чтобы казалось, что он действительно произносит слова.
Мировая модельВидео с искусственным интеллектом
Искусственный интеллект, который строит внутреннюю симуляцию поведения сцен, объектов и физики, помогая генерировать более длинное, связное и стабильное видео.
МодельИскусственный интеллект
Обученная система искусственного интеллекта, которая превращает вход — например текстовый запрос — в выход, например видео. У разных моделей свои сильные стороны, скорость и стоимость.
Модель с открытыми весамиИскусственный интеллект
Модель, чьи веса опубликованы, так что любой может запускать, изучать или дообучать ее (например, на fal или локально), в отличие от закрытой модели, доступной только через API.
МультимодальнаяИскусственный интеллект
Модель, которая понимает или генерирует сразу несколько типов данных — например текст, изображение, видео и аудио вместе.
Негативный промптИскусственный интеллект
Описание того, ЧЕГО вы НЕ хотите видеть в результате. Отводит модель от нежелательных объектов, стилей или артефактов.
Нейронная сетьИскусственный интеллект
Модель, отдаленно вдохновленная мозгом: слои взаимосвязанных «нейронов», которые учатся распознавать закономерности. Основа современного генеративного искусственного интеллекта.
Нижняя треть (lower third)Видео
Текстовая подпись в нижней части кадра — обычно имя и должность спикера или титр.
ОбучениеИскусственный интеллект
Процесс «обучения» модели на огромных массивах данных с постепенной подстройкой внутренних параметров до получения хороших результатов.
Параметры (веса)Искусственный интеллект
Внутренние числа, которые модель выучивает в процессе обучения. В них хранится «знание» модели; больше параметров может означать больше возможностей.
Первый и последний кадрВидео с искусственным интеллектом
Вы задаете стартовый и/или конечный кадр, а модель анимирует между ними — точный контроль начала и завершения плана.
Перенос стиляВидео с искусственным интеллектом
Применение визуального стиля одного референса к вашему материалу или генерации.
ПереходВидео
Как один план меняется на следующий — резкая склейка, растворение, наплыв или вайп.
План (shot)Видео
Один непрерывный фрагмент видео. Частые типы: общий план, средний план и крупный план.
ПромптИскусственный интеллект
Инструкция для модели — обычно текст, иногда с изображением — описывающая, какое видео вы хотите получить.
Промпт-инжинирингИскусственный интеллект
Навык формулирования запросов так, чтобы модель стабильно выдавала задуманный результат: объект, стиль, камеру и настроение.
РазрешениеВидео
Размеры кадра в пикселях, записываются как ширина × высота (например, 1920×1080). Больше пикселей — больше деталей. Частые уровни: 720p (HD), 1080p (Full HD), 4K и 8K.
РаскадровкаВидео
Запланированная последовательность эскизов или кадров, которая описывает каждый план до съемки или генерации видео.
Расширение видеоВидео с искусственным интеллектом
Продление клипа за исходную длину путем генерации дополнительных кадров, естественно продолжающих движение.
Рендер / рендерингВидео
Преобразование проекта в готовый видеофайл — или, в контексте искусственного интеллекта, когда модель собирает кадры в финальный клип.
Референс-изображениеВидео с искусственным интеллектом
Картинка, которой вы направляете модель — по объекту, персонажу или стилю будущего видео.
СидИскусственный интеллект
Стартовое случайное число для генерации. Повтор с тем же сидом и тем же промптом воспроизводит тот же результат — полезно для согласованности и точечных правок.
Сила управления (CFG)Искусственный интеллект
Насколько строго модель следует вашему промпту или импровизирует. Более высокие значения — ближе к тексту; более низкие — больше творческой свободы модели.
Соотношение сторонВидео
Пропорция ширины к высоте кадра — 16:9 (широкий), 9:16 (вертикальный для Reels и TikTok) или 1:1 (квадрат). От него зависит, как видео ляжет на разные экраны и платформы.
Субтитры / скрытые субтитрыВидео
Текст на экране, отражающий озвучку. Субтитры для доступности также отмечают звуки и говорящих; обычные субтитры обычно транскрибируют или переводят диалоги.
Текст в речь (TTS)Видео с искусственным интеллектом
Преобразование текста в естественную речь синтетическим голосом — движок озвучек на основе искусственного интеллекта.
Текст-в-видео (T2V)Видео с искусственным интеллектом
Генерация видео напрямую по письменному описанию — без камеры, актеров и стоков.
ТокенИскусственный интеллект
Наименьшая часть входа, которую обрабатывает модель — кусочек слова для текста или патч/кадр для видео.
ТрансформерИскусственный интеллект
Архитектура нейросети на основе «внимания», которое оценивает взаимосвязи частей входа. Лежит в основе больших языковых моделей и многих современных видеомоделей.
Управление движением / motion brushВидео с искусственным интеллектом
Инструменты, позволяющие задавать, где и как объекты двигаются в сгенерированном клипе, а не полагаться полностью на модель.
Управление камеройВидео с искусственным интеллектом
Задание виртуальных движений камеры — панорамирования, зума, орбиты, долли — внутри сгенерированного кадра.
Хромакей (зеленый экран)Видео
Замена однотонного фона — обычно зеленого — на другое изображение или видео за счет «прозрачности» этого цвета.
Цифровой человек / цифровой двойникВидео с искусственным интеллектом
Фотореалистичная копия реального человека на основе искусственного интеллекта, обученная один раз и повторно используемая как ведущий в кадре.
Частота кадров (FPS)Видео
Кадров в секунду — сколько статичных изображений проигрывается за секунду. 24fps выглядит «киношно», 30fps — стандарт для веба, 60fps — сверхплавно для динамики и спорта.
ЧекпоинтИскусственный интеллект
Сохраненный снимок весов модели. Чекпоинты часто публикуют как загружаемые «файлы модели» для запуска.
Шаги семплированияИскусственный интеллект
Сколько итераций делает диффузионная модель, чтобы превратить шум в финальный кадр. Больше шагов — потенциально выше качество, но медленнее и дороже.
ЭмбеддингИскусственный интеллект
Список чисел (вектор), который отражает смысл текста, изображения или аудио, чтобы модель могла сравнивать и комбинировать разные входы.
B-rollВидео
Дополнительные планы, которые накладываются поверх основного, чтобы добавить контекст, проиллюстрировать мысль или скрыть склейку.
GANИскусственный интеллект
Generative Adversarial Network — ранний метод, где соревнуются генератор и критик. Для высококачественного видео в значительной мере вытеснен диффузией.
HDR (High Dynamic Range)Видео
Видео с более широким диапазоном яркости и цветов, чем стандартное (SDR), — для более живых светов, теней и насыщенных тонов.
LoRAИскусственный интеллект
Low-Rank Adaptation — легковесный способ обучить модель новому стилю, персонажу или концепту с помощью небольшого подключаемого файла вместо переобучения всей модели.
LUT (Look-Up Table)Видео
Пресет, который перенастраивает цвета для быстрого применения нужного образа одним кликом или конвертации между цветовыми пространствами.
RLHFИскусственный интеллект
Reinforcement Learning from Human Feedback — обучение с подкреплением по человеческой обратной связи, которое согласует ответы модели с предпочтениями людей.

От запроса до рендера: язык видео с искусственным интеллектом

Создание видео с искусственным интеллектом находится на стыке двух миров — десятилетий терминологии кино и видеопроизводства и стремительно развивающегося языка машинного обучения. Этот словарь объединяет их, добавляя новые понятия, уникальные для генеративного видео, чтобы вы с уверенностью читали любые инструменты, обучалки и карточки моделей.

Начните с базовых вещей: соотношение сторон, разрешение, частота кадров и кодеки определяют, как выглядит ваше видео и где оно воспроизводится. Затем слой искусственного интеллекта — модели, диффузия, промпты, сиды и LoRA формируют то, что будет сгенерировано. И наконец, специфика генеративного видео — text-to-video, image-to-video, липсинк, аватары, временная согласованность и мировые модели — описывает, что современные генераторы реально умеют.

Каждое определение написано простым языком, без математики. Ищите по ключевым словам, фильтруйте по теме или листайте от A до Z — а затем применяйте лексику на практике в студии Vivideo.

Словарь по видео с искусственным интеллектом

Начать бесплатноЧто такое видео с искусственным интеллектом?