Глосарій

Словник відео зі штучним інтелектом

Усі терміни, з якими ви зіткнетеся, створюючи відео зі штучним інтелектом — від азів камери й кодеків до дифузії, аватарів і агентної генерації — пояснені простою мовою.

74 терміни · Відео · Штучний інтелект · Відео зі штучним інтелектом

74 терміни

«B G H L R А Б В Г Д Е З І К Л М Н П Р С Т Х Ц Ч

«Говоряча голова»Відео зі штучним інтелектом: Відео, зосереджене на людині, яка говорить у камеру — класичний кейс для ШІ-аватарів і ведучих.

Аватар зі штучним інтелектомВідео зі штучним інтелектом: Згенерований або клонований ШІ ведучий у кадрі, який може озвучити ваш скрипт обраним голосом і мовою.
Агентне відеоВідео зі штучним інтелектом: Агент ШІ, що планує й веде всю постановку — сценарій, сцени, голос, аватари та монтаж — за одним брифом, а не кліп за кліпом.
АпскейлінгВідео зі штучним інтелектом: Використання ШІ для підвищення роздільної здатності відео — скажімо, з 1080p до 4K — з додаванням правдоподібних деталей, а не просто розтягуванням пікселів.

Базова (foundation) модельШтучний інтелект: Велика універсальна модель, навчена на широких даних і придатна до адаптації для багатьох завдань.
БітрейтВідео: Обсяг даних за секунду відео, вимірюється у kbps або Mbps. Вищий бітрейт зберігає більше деталей, але збільшує розмір файлу.
БокеВідео: М’який, приємний розмитий фон у кадрі, часто у вигляді сяйливих кіл світла.

Відео у відео (V2V)Відео зі штучним інтелектом: Перетворення наявного кліпу в новий стиль або вигляд зі збереженням початкового руху та таймінгу.
Водяний знакВідео: Логотип або текст, накладені на відео для позначення прав. Багато безкоштовних генераторів ШІ додають його; у платних тарифах зазвичай відсутній.

ГалюцинаціяШтучний інтелект: Коли модель упевнено видає хибний або вигаданий результат — як-от криваві літери, зайві пальці чи неможливий рух.
Глибина різкостіВідео: Наскільки велика частина зображення у фокусі. Мала глибина різкості розмиває тло, підкреслюючи об’єкт.
Глибоке навчанняШтучний інтелект: Машинне навчання, що використовує багатошарові нейромережі. Живить сучасні моделі зображення, відео, голосу та мови.

ДатасетШтучний інтелект: Набір прикладів — відео, зображень, текстів — на якому навчають модель. Якість і різноманіття визначають її спроможності.
Дифузійна модельШтучний інтелект: Провідний підхід до зображень і відео зі ШІ: модель стартує з випадкового шуму й крок за кроком прибирає його, доки не з’явиться цілісний результат, що відповідає вашому промпту.
ДіпфейкВідео зі штучним інтелектом: Синтетичний медіаконтент, що реалістично підміняє або вигадує чиєсь обличчя чи голос. Потужна технологія, але постає питання згоди, автентичності та права.
Донавчання (fine-tuning)Штучний інтелект: Додаткове навчання базової моделі на специфічних даних для спеціалізації — під певний стиль, бренд або персону.
Дубляж зі штучним інтелектомВідео зі штучним інтелектом: Заміна або додавання мовлення іншою мовою з бажано подібним голосом і узгодженими рухами губ.

ЕмбедингШтучний інтелект: Список чисел (вектор), що схоплює зміст тексту, зображення чи аудіо, аби модель могла порівнювати й поєднувати різні входи.

Задавальний (установчий) планВідео: Широкий початковий кадр, що задає локацію й контекст сцени перед переходом на ближчі плани.
Зображення у відео (I2V)Відео зі штучним інтелектом: Оживлення статичного зображення у вигляді відео, часто з промптом, що описує бажаний рух.

Інженерія промптівШтучний інтелект: Майстерність формулювання промптів так, щоб модель стабільно видавала задуманий результат: об’єкт, стиль, камеру та настрій.
Інпейнтинг / аутпейнтингВідео зі штучним інтелектом: Заповнення частини кадру (інпейнтинг) або розширення за його межі (аутпейнтинг). У відео використовується для видалення, заміни чи розширення ділянок у часі.
Інтерполяція кадрівВідео зі штучним інтелектом: Генерація проміжних кадрів для підвищення частоти або згладження руху — наприклад перетворення 24fps на шовковисті 60fps.
ІнференсШтучний інтелект: Запуск уже навченої моделі для отримання виходу — наприклад генерація вашого відео за промптом. Саме за це зазвичай платять за кожну генерацію.

Керування камероюВідео зі штучним інтелектом: Задання віртуальних рухів камери — панорама, зум, оберт, доллі — усередині згенерованого ШІ-кадру.
Керування рухом / motion brushВідео зі штучним інтелектом: Інструменти, які дозволяють задавати, де й як рухаються об’єкти у згенерованому кліпі, а не залишати все моделі.
Клонування голосуВідео зі штучним інтелектом: Відтворення голосу конкретної людини з короткого зразка, щоби надалі озвучувати новий текст тим самим голосом.
Ключовий кадрВідео: В монтажі — позначений кадр, що задає значення (позиція, масштаб, прозорість), між якими софт анімує. У стисненні — повний опорний кадр, від якого відновлюються сусідні кадри.
КодекВідео: Алгоритм стиснення та розпакування відео — наприклад H.264, H.265/HEVC, AV1 або VP9. Балансує якість зображення та розмір файлу.
Кольорокорекція (грейдинг)Відео: Творче налаштування кольору, контрасту й настрою матеріалу на постпродакшені, щоб надати йому цілісного, продуманого вигляду.
КомпозитингВідео: Нашарування кількох візуальних елементів — відео, графіки, ефектів, тексту — в єдиний кадр.
Контейнер (формат файлу)Відео: «Обгортка» файлу, що тримає разом відео, аудіо й метадані — MP4, MOV, WebM або MKV. Відрізняється від кодека, який зберігається всередині.
Кроки семплюванняШтучний інтелект: Скільки ітерацій робить дифузійна модель, перетворюючи шум на фінальний кадр. Більше кроків може дати вищу якість, але повільнішу й дорожчу генерацію.

Латентний простірШтучний інтелект: Стиснене математичне представлення, у якому фактично працює модель. Спершу генерація відбувається тут, а потім декодується у видимі пікселі.
ЛеттербоксингВідео: Чорні смуги зверху й знизу (або з боків) відео, аби воно пасувало до іншого співвідношення сторін без обрізання зображення.
Ловер-третинаВідео: Текст у нижній частині кадру, зазвичай ім’я та посада спікера або титр.

Масштаб підказки (CFG)Штучний інтелект: Наскільки суворо модель дотримується вашого промпту порівняно з імпровізацією. Вищі значення тримаються ближче до тексту; нижчі дають моделі більше творчої свободи.
МодельШтучний інтелект: Навчена система штучного інтелекту, що перетворює вхід — наприклад текстовий промпт — на вихід, наприклад відео. Різні моделі відрізняються сильними сторонами, швидкістю та вартістю.
Модель з відкритими вагамиШтучний інтелект: Модель, чиї ваги опубліковані, тож кожен може запускати, досліджувати або донавчати її (напр. на fal чи локально), на відміну від закритої моделі, доступної лише через API.
МультимодальнаШтучний інтелект: Модель, що розуміє або генерує кілька типів даних одночасно — наприклад текст, зображення, відео й аудіо разом.

НавчанняШтучний інтелект: Навчання моделі на величезних масивах даних із поступовим корегуванням внутрішніх параметрів, доки вона не дає добрі результати.
Негативний промптШтучний інтелект: Опис того, чого ви НЕ хочете у виході. Скеровує модель повз небажані об’єкти, стилі чи артефакти.
НейромережаШтучний інтелект: Модель, вільно натхненна мозком: шари з’єднаних «нейронів», що вчаться на даних. Основа сучасного генеративного ШІ.

Параметри (ваги)Штучний інтелект: Внутрішні числа, які модель засвоює під час навчання. Вони зберігають те, що «знає» модель; більше параметрів може означати більші можливості.
ПерехідВідео: Як один кадр переходить в інший — жорстка склейка, дисолв, наплив або вайт.
Перший і останній кадрВідео зі штучним інтелектом: Задання стартового та/або фінального кадру, між якими модель виконує анімацію, надаючи точний контроль початку й кінця шоту.
План / шотВідео: Одна безперервна зйомка. Поширені типи: загальний план, середній план і крупний план.
Продовження відеоВідео зі штучним інтелектом: Подовження кліпу за межі початкової тривалості шляхом генерації додаткових кадрів, що природно продовжують сцену.
ПромптШтучний інтелект: Інструкція для моделі — зазвичай текст, інколи з доданим зображенням — що описує відео, яке ви хочете отримати.

РаскадровкаВідео: Запланована послідовність ескізів чи кадрів, що розкладає кожен план до зйомки або генерації відео.
Рендер / рендерингВідео: Обробка проєкту у фінальний відеофайл — або, у ШІ, генерація кадрів моделлю в готовий кліп.
Референсне зображенняВідео зі штучним інтелектом: Зображення, яким ви задаєте моделі суб’єкт, персонажа або стиль згенерованого відео.
Роздільна здатністьВідео: Розмір у пікселях для кожного кадру, записується як ширина × висота (напр., 1920×1080). Більше пікселів — більше деталей. Поширені рівні: 720p (HD), 1080p (Full HD), 4K і 8K.

Світова модельВідео зі штучним інтелектом: ШІ, який будує внутрішню симуляцію того, як поводяться сцени, об’єкти та фізика, допомагаючи генерувати довші, більш цілісні та послідовні відео.
Синхронізація губВідео зі штучним інтелектом: Узгодження руху губ персонажа чи аватара зі звуковою доріжкою, щоби виглядало, ніби він справді вимовляє слова.
СідШтучний інтелект: Стартове випадкове число для генерації. Повторне використання того ж сіду з тим самим промптом відтворює той самий результат — зручно для узгодженості та дрібних правок.
Співвідношення сторінВідео: Пропорція ширини до висоти кадру — 16:9 (широкоекранне), 9:16 (вертикальне для Reels і TikTok) або 1:1 (квадрат). Визначає, як відео лягає під платформу й екран.
Субтитри / captionsВідео: Текст на екрані зі сказаним аудіо. Субтитри для доступності також позначають звуки та мовців; звичайні субтитри переважно транскрибують або перекладають діалоги.

Текст у відео (T2V)Відео зі штучним інтелектом: Генерація відеокліпу безпосередньо з текстового опису — без камери, акторів і стоків.
Текст у мовлення (TTS)Відео зі штучним інтелектом: Перетворення написаного тексту на природне мовлення синтетичним голосом — рушій закадрових голосів зі ШІ.
ТокенШтучний інтелект: Найменший фрагмент входу, який обробляє модель — частина слова для тексту або «патч» чи кадр для відео.
Трансфер стилюВідео зі штучним інтелектом: Застосування візуального стилю одного референса до вашого відеоматеріалу або генерації.
ТрансформерШтучний інтелект: Архітектура нейромережі на основі «уваги», що зважує зв’язки між частинами входу. Лежить в основі великих мовних і багатьох сучасних відеомоделей.

Хромакей (зелений екран)Відео: Заміна однотонного тла — зазвичай зеленого — іншим зображенням або відео шляхом зроблення цього кольору прозорим.

Цифрова людина / цифровий двійникВідео зі штучним інтелектом: Фотореалістична ШІ-репліка реальної особи, натренована один раз і повторно використовувана як ведучий у кадрі.

Часова узгодженістьВідео зі штучним інтелектом: Стабільність персонажів, об’єктів і стилю від кадру до кадру, щоби відео не блимало, не «пливло» і не викривлювалося неприродно.
Частота кадрів (FPS)Відео: Кадрів за секунду — скільки нерухомих зображень відтворюється щосекунди. 24fps — кінематографічно, 30fps — стандарт для вебу, 60fps — надплавна динаміка для руху та спорту.
ЧекпойнтШтучний інтелект: Збережений знімок ваг моделі. Чекпойнти часто поширюють як завантажуваний «файл моделі», який запускають.

B-rollВідео: Додатковий відеоряд, що вставляється поверх основного кадру, щоб додати контекст, проілюструвати думку або приховати склейку.

GANШтучний інтелект: Generative Adversarial Network — ранній метод, де змагаються генератор і «критик». Значною мірою поступився місцем дифузії для високоякісного відео.

HDR (розширений динамічний діапазон)Відео: Відео з ширшим діапазоном яскравості й кольору, ніж стандартне (SDR), для реалістичніших світлих і темних ділянок та насиченіших тонів.

LoRAШтучний інтелект: Low-Rank Adaptation — легковажний спосіб навчити модель новому стилю, персонажу чи концепту невеликим додатковим файлом замість повного перенавчання.
LUT (таблиця відповідності кольорів)Відео: Пресет, що переналаштовує кольори для застосування певного вигляду в один клік або для конвертації між колірними просторами.

RLHFШтучний інтелект: Reinforcement Learning from Human Feedback — навчання з підкріпленням за людськими відгуками, що узгоджує виходи моделі з людськими уподобаннями.

Від промпту до рендера: мова відео зі штучним інтелектом

Створення відео зі штучним інтелектом стоїть на перетині двох світів — десятиліттями напрацьованого кінематографічного та відеовиробничого лексикону і стрімко зростаючої мови машинного навчання. Цей словник об’єднує обидва, а також нові терміни, властиві генеративному відео, щоби ви впевнено читали будь-який інструмент, туторіал чи картку моделі.

Почніть з бази: співвідношення сторін, роздільна здатність, частота кадрів і кодеки визначають, як виглядатиме ваше відео та де відтворюватиметься. Далі шар ШІ — моделі, дифузія, промпти, сіди та LoRA формують те, що буде згенеровано. Нарешті, специфіка відео зі ШІ — text-to-video, image-to-video, lip sync, аватари, часова узгодженість і світові моделі — описують, що сучасні генератори реально вміють.

Кожне визначення написане простою мовою, без математики. Шукайте за ключовим словом, фільтруйте за темою або гортайте A–Z — а потім застосовуйте терміни в студії Vivideo.

Словник відео зі штучним інтелектом

Почати безплатно Що таке відео на штучному інтелекті?