Глосарій

Словник відео зі штучним інтелектом

Усі терміни, з якими ви зіткнетеся, створюючи відео зі штучним інтелектом — від азів камери й кодеків до дифузії, аватарів і агентної генерації — пояснені простою мовою.

74 терміни · Відео · Штучний інтелект · Відео зі штучним інтелектом

74 терміни
«Говоряча голова»Відео зі штучним інтелектом
Відео, зосереджене на людині, яка говорить у камеру — класичний кейс для ШІ-аватарів і ведучих.
Аватар зі штучним інтелектомВідео зі штучним інтелектом
Згенерований або клонований ШІ ведучий у кадрі, який може озвучити ваш скрипт обраним голосом і мовою.
Агентне відеоВідео зі штучним інтелектом
Агент ШІ, що планує й веде всю постановку — сценарій, сцени, голос, аватари та монтаж — за одним брифом, а не кліп за кліпом.
АпскейлінгВідео зі штучним інтелектом
Використання ШІ для підвищення роздільної здатності відео — скажімо, з 1080p до 4K — з додаванням правдоподібних деталей, а не просто розтягуванням пікселів.
Базова (foundation) модельШтучний інтелект
Велика універсальна модель, навчена на широких даних і придатна до адаптації для багатьох завдань.
БітрейтВідео
Обсяг даних за секунду відео, вимірюється у kbps або Mbps. Вищий бітрейт зберігає більше деталей, але збільшує розмір файлу.
БокеВідео
М’який, приємний розмитий фон у кадрі, часто у вигляді сяйливих кіл світла.
Відео у відео (V2V)Відео зі штучним інтелектом
Перетворення наявного кліпу в новий стиль або вигляд зі збереженням початкового руху та таймінгу.
Водяний знакВідео
Логотип або текст, накладені на відео для позначення прав. Багато безкоштовних генераторів ШІ додають його; у платних тарифах зазвичай відсутній.
ГалюцинаціяШтучний інтелект
Коли модель упевнено видає хибний або вигаданий результат — як-от криваві літери, зайві пальці чи неможливий рух.
Глибина різкостіВідео
Наскільки велика частина зображення у фокусі. Мала глибина різкості розмиває тло, підкреслюючи об’єкт.
Глибоке навчанняШтучний інтелект
Машинне навчання, що використовує багатошарові нейромережі. Живить сучасні моделі зображення, відео, голосу та мови.
ДатасетШтучний інтелект
Набір прикладів — відео, зображень, текстів — на якому навчають модель. Якість і різноманіття визначають її спроможності.
Дифузійна модельШтучний інтелект
Провідний підхід до зображень і відео зі ШІ: модель стартує з випадкового шуму й крок за кроком прибирає його, доки не з’явиться цілісний результат, що відповідає вашому промпту.
ДіпфейкВідео зі штучним інтелектом
Синтетичний медіаконтент, що реалістично підміняє або вигадує чиєсь обличчя чи голос. Потужна технологія, але постає питання згоди, автентичності та права.
Донавчання (fine-tuning)Штучний інтелект
Додаткове навчання базової моделі на специфічних даних для спеціалізації — під певний стиль, бренд або персону.
Дубляж зі штучним інтелектомВідео зі штучним інтелектом
Заміна або додавання мовлення іншою мовою з бажано подібним голосом і узгодженими рухами губ.
ЕмбедингШтучний інтелект
Список чисел (вектор), що схоплює зміст тексту, зображення чи аудіо, аби модель могла порівнювати й поєднувати різні входи.
Задавальний (установчий) планВідео
Широкий початковий кадр, що задає локацію й контекст сцени перед переходом на ближчі плани.
Зображення у відео (I2V)Відео зі штучним інтелектом
Оживлення статичного зображення у вигляді відео, часто з промптом, що описує бажаний рух.
Інженерія промптівШтучний інтелект
Майстерність формулювання промптів так, щоб модель стабільно видавала задуманий результат: об’єкт, стиль, камеру та настрій.
Інпейнтинг / аутпейнтингВідео зі штучним інтелектом
Заповнення частини кадру (інпейнтинг) або розширення за його межі (аутпейнтинг). У відео використовується для видалення, заміни чи розширення ділянок у часі.
Інтерполяція кадрівВідео зі штучним інтелектом
Генерація проміжних кадрів для підвищення частоти або згладження руху — наприклад перетворення 24fps на шовковисті 60fps.
ІнференсШтучний інтелект
Запуск уже навченої моделі для отримання виходу — наприклад генерація вашого відео за промптом. Саме за це зазвичай платять за кожну генерацію.
Керування камероюВідео зі штучним інтелектом
Задання віртуальних рухів камери — панорама, зум, оберт, доллі — усередині згенерованого ШІ-кадру.
Керування рухом / motion brushВідео зі штучним інтелектом
Інструменти, які дозволяють задавати, де й як рухаються об’єкти у згенерованому кліпі, а не залишати все моделі.
Клонування голосуВідео зі штучним інтелектом
Відтворення голосу конкретної людини з короткого зразка, щоби надалі озвучувати новий текст тим самим голосом.
Ключовий кадрВідео
В монтажі — позначений кадр, що задає значення (позиція, масштаб, прозорість), між якими софт анімує. У стисненні — повний опорний кадр, від якого відновлюються сусідні кадри.
КодекВідео
Алгоритм стиснення та розпакування відео — наприклад H.264, H.265/HEVC, AV1 або VP9. Балансує якість зображення та розмір файлу.
Кольорокорекція (грейдинг)Відео
Творче налаштування кольору, контрасту й настрою матеріалу на постпродакшені, щоб надати йому цілісного, продуманого вигляду.
КомпозитингВідео
Нашарування кількох візуальних елементів — відео, графіки, ефектів, тексту — в єдиний кадр.
Контейнер (формат файлу)Відео
«Обгортка» файлу, що тримає разом відео, аудіо й метадані — MP4, MOV, WebM або MKV. Відрізняється від кодека, який зберігається всередині.
Кроки семплюванняШтучний інтелект
Скільки ітерацій робить дифузійна модель, перетворюючи шум на фінальний кадр. Більше кроків може дати вищу якість, але повільнішу й дорожчу генерацію.
Латентний простірШтучний інтелект
Стиснене математичне представлення, у якому фактично працює модель. Спершу генерація відбувається тут, а потім декодується у видимі пікселі.
ЛеттербоксингВідео
Чорні смуги зверху й знизу (або з боків) відео, аби воно пасувало до іншого співвідношення сторін без обрізання зображення.
Ловер-третинаВідео
Текст у нижній частині кадру, зазвичай ім’я та посада спікера або титр.
Масштаб підказки (CFG)Штучний інтелект
Наскільки суворо модель дотримується вашого промпту порівняно з імпровізацією. Вищі значення тримаються ближче до тексту; нижчі дають моделі більше творчої свободи.
МодельШтучний інтелект
Навчена система штучного інтелекту, що перетворює вхід — наприклад текстовий промпт — на вихід, наприклад відео. Різні моделі відрізняються сильними сторонами, швидкістю та вартістю.
Модель з відкритими вагамиШтучний інтелект
Модель, чиї ваги опубліковані, тож кожен може запускати, досліджувати або донавчати її (напр. на fal чи локально), на відміну від закритої моделі, доступної лише через API.
МультимодальнаШтучний інтелект
Модель, що розуміє або генерує кілька типів даних одночасно — наприклад текст, зображення, відео й аудіо разом.
НавчанняШтучний інтелект
Навчання моделі на величезних масивах даних із поступовим корегуванням внутрішніх параметрів, доки вона не дає добрі результати.
Негативний промптШтучний інтелект
Опис того, чого ви НЕ хочете у виході. Скеровує модель повз небажані об’єкти, стилі чи артефакти.
НейромережаШтучний інтелект
Модель, вільно натхненна мозком: шари з’єднаних «нейронів», що вчаться на даних. Основа сучасного генеративного ШІ.
Параметри (ваги)Штучний інтелект
Внутрішні числа, які модель засвоює під час навчання. Вони зберігають те, що «знає» модель; більше параметрів може означати більші можливості.
ПерехідВідео
Як один кадр переходить в інший — жорстка склейка, дисолв, наплив або вайт.
Перший і останній кадрВідео зі штучним інтелектом
Задання стартового та/або фінального кадру, між якими модель виконує анімацію, надаючи точний контроль початку й кінця шоту.
План / шотВідео
Одна безперервна зйомка. Поширені типи: загальний план, середній план і крупний план.
Продовження відеоВідео зі штучним інтелектом
Подовження кліпу за межі початкової тривалості шляхом генерації додаткових кадрів, що природно продовжують сцену.
ПромптШтучний інтелект
Інструкція для моделі — зазвичай текст, інколи з доданим зображенням — що описує відео, яке ви хочете отримати.
РаскадровкаВідео
Запланована послідовність ескізів чи кадрів, що розкладає кожен план до зйомки або генерації відео.
Рендер / рендерингВідео
Обробка проєкту у фінальний відеофайл — або, у ШІ, генерація кадрів моделлю в готовий кліп.
Референсне зображенняВідео зі штучним інтелектом
Зображення, яким ви задаєте моделі суб’єкт, персонажа або стиль згенерованого відео.
Роздільна здатністьВідео
Розмір у пікселях для кожного кадру, записується як ширина × висота (напр., 1920×1080). Більше пікселів — більше деталей. Поширені рівні: 720p (HD), 1080p (Full HD), 4K і 8K.
Світова модельВідео зі штучним інтелектом
ШІ, який будує внутрішню симуляцію того, як поводяться сцени, об’єкти та фізика, допомагаючи генерувати довші, більш цілісні та послідовні відео.
Синхронізація губВідео зі штучним інтелектом
Узгодження руху губ персонажа чи аватара зі звуковою доріжкою, щоби виглядало, ніби він справді вимовляє слова.
СідШтучний інтелект
Стартове випадкове число для генерації. Повторне використання того ж сіду з тим самим промптом відтворює той самий результат — зручно для узгодженості та дрібних правок.
Співвідношення сторінВідео
Пропорція ширини до висоти кадру — 16:9 (широкоекранне), 9:16 (вертикальне для Reels і TikTok) або 1:1 (квадрат). Визначає, як відео лягає під платформу й екран.
Субтитри / captionsВідео
Текст на екрані зі сказаним аудіо. Субтитри для доступності також позначають звуки та мовців; звичайні субтитри переважно транскрибують або перекладають діалоги.
Текст у відео (T2V)Відео зі штучним інтелектом
Генерація відеокліпу безпосередньо з текстового опису — без камери, акторів і стоків.
Текст у мовлення (TTS)Відео зі штучним інтелектом
Перетворення написаного тексту на природне мовлення синтетичним голосом — рушій закадрових голосів зі ШІ.
ТокенШтучний інтелект
Найменший фрагмент входу, який обробляє модель — частина слова для тексту або «патч» чи кадр для відео.
Трансфер стилюВідео зі штучним інтелектом
Застосування візуального стилю одного референса до вашого відеоматеріалу або генерації.
ТрансформерШтучний інтелект
Архітектура нейромережі на основі «уваги», що зважує зв’язки між частинами входу. Лежить в основі великих мовних і багатьох сучасних відеомоделей.
Хромакей (зелений екран)Відео
Заміна однотонного тла — зазвичай зеленого — іншим зображенням або відео шляхом зроблення цього кольору прозорим.
Цифрова людина / цифровий двійникВідео зі штучним інтелектом
Фотореалістична ШІ-репліка реальної особи, натренована один раз і повторно використовувана як ведучий у кадрі.
Часова узгодженістьВідео зі штучним інтелектом
Стабільність персонажів, об’єктів і стилю від кадру до кадру, щоби відео не блимало, не «пливло» і не викривлювалося неприродно.
Частота кадрів (FPS)Відео
Кадрів за секунду — скільки нерухомих зображень відтворюється щосекунди. 24fps — кінематографічно, 30fps — стандарт для вебу, 60fps — надплавна динаміка для руху та спорту.
ЧекпойнтШтучний інтелект
Збережений знімок ваг моделі. Чекпойнти часто поширюють як завантажуваний «файл моделі», який запускають.
B-rollВідео
Додатковий відеоряд, що вставляється поверх основного кадру, щоб додати контекст, проілюструвати думку або приховати склейку.
GANШтучний інтелект
Generative Adversarial Network — ранній метод, де змагаються генератор і «критик». Значною мірою поступився місцем дифузії для високоякісного відео.
HDR (розширений динамічний діапазон)Відео
Відео з ширшим діапазоном яскравості й кольору, ніж стандартне (SDR), для реалістичніших світлих і темних ділянок та насиченіших тонів.
LoRAШтучний інтелект
Low-Rank Adaptation — легковажний спосіб навчити модель новому стилю, персонажу чи концепту невеликим додатковим файлом замість повного перенавчання.
LUT (таблиця відповідності кольорів)Відео
Пресет, що переналаштовує кольори для застосування певного вигляду в один клік або для конвертації між колірними просторами.
RLHFШтучний інтелект
Reinforcement Learning from Human Feedback — навчання з підкріпленням за людськими відгуками, що узгоджує виходи моделі з людськими уподобаннями.

Від промпту до рендера: мова відео зі штучним інтелектом

Створення відео зі штучним інтелектом стоїть на перетині двох світів — десятиліттями напрацьованого кінематографічного та відеовиробничого лексикону і стрімко зростаючої мови машинного навчання. Цей словник об’єднує обидва, а також нові терміни, властиві генеративному відео, щоби ви впевнено читали будь-який інструмент, туторіал чи картку моделі.

Почніть з бази: співвідношення сторін, роздільна здатність, частота кадрів і кодеки визначають, як виглядатиме ваше відео та де відтворюватиметься. Далі шар ШІ — моделі, дифузія, промпти, сіди та LoRA формують те, що буде згенеровано. Нарешті, специфіка відео зі ШІ — text-to-video, image-to-video, lip sync, аватари, часова узгодженість і світові моделі — описують, що сучасні генератори реально вміють.

Кожне визначення написане простою мовою, без математики. Шукайте за ключовим словом, фільтруйте за темою або гортайте A–Z — а потім застосовуйте терміни в студії Vivideo.

Словник відео зі штучним інтелектом

Почати безплатноЩо таке відео на штучному інтелекті?