Glosario

El diccionario de video con inteligencia artificial

Cada término que encontrarás al crear video con inteligencia artificial — desde lo básico de cámara y códecs hasta difusión, avatares y generación agente — explicado en lenguaje sencillo.

74 términos · Video · Inteligencia artificial · Video con inteligencia artificial

74 términos
Ajuste finoInteligencia artificial
Entrenar más un modelo base con datos específicos para especializarlo — para un estilo, marca o persona concretos.
AlucinaciónInteligencia artificial
Cuando un modelo produce una salida convincente pero incorrecta o inventada — como texto deformado, dedos extra o movimientos imposibles.
Aprendizaje profundoInteligencia artificial
Aprendizaje automático que emplea redes neuronales con muchas capas. Impulsa los modelos actuales de imagen, video, voz y lenguaje.
Avatar con inteligencia artificialVideo con inteligencia artificial
Un presentador en pantalla generado o clonado con inteligencia artificial que puede locutar tu guion con una voz e idioma elegidos.
B-rollVideo
Metraje de apoyo que se intercala sobre el plano principal para dar contexto, ilustrar una idea o disimular un corte.
Barras negras (letterboxing)Video
Barras negras añadidas arriba y abajo (o a los lados) para que el video se adapte a otra relación de aspecto sin recortar la imagen.
BokehVideo
El desenfoque suave y agradable del fondo de un plano, que a menudo aparece como círculos de luz brillantes.
Cabeza parlanteVideo con inteligencia artificial
Un video centrado en una persona hablándole a cámara — el caso clásico para avatares y presentadores con inteligencia artificial.
Chroma key (pantalla verde)Video
Reemplazar un fondo de color sólido — normalmente verde — por otra imagen o video haciendo ese color transparente.
Clonación de vozVideo con inteligencia artificial
Recrear la voz específica de una persona a partir de una muestra breve para que pueda hablar texto nuevo con esa misma voz.
CódecVideo
El algoritmo que comprime y descomprime el video — como H.264, H.265/HEVC, AV1 o VP9. Equilibra la calidad visual con el tamaño del archivo.
Coherencia temporalVideo con inteligencia artificial
Mantener estables personajes, objetos y estilo de un fotograma a otro para que el video no parpadee, se deforme ni cambie de forma de manera antinatural.
ComposiciónVideo
Superponer múltiples elementos visuales — metraje, gráficos, efectos, texto — en un solo encuadre combinado.
Conjunto de datosInteligencia artificial
La colección de ejemplos — videos, imágenes, texto — con la que se entrena un modelo. Su calidad y variedad determinan lo que el modelo puede hacer.
Contenedor (formato de archivo)Video
La “carcasa” que agrupa video, audio y metadatos — MP4, MOV, WebM o MKV. Es independiente del códec almacenado dentro.
Control de cámaraVideo con inteligencia artificial
Dirigir movimientos de cámara virtuales — paneo, zoom, órbita, travelling — dentro de un plano generado con inteligencia artificial.
Control de movimiento / pincel de movimientoVideo con inteligencia artificial
Herramientas que te permiten dirigir dónde y cómo se mueven las cosas en un clip generado, en lugar de dejarlo totalmente al modelo.
DeepfakeVideo con inteligencia artificial
Contenido sintético que sustituye o fabrica de forma realista la cara o la voz de alguien. Potente, pero conlleva preocupaciones reales de consentimiento, autenticidad y aspectos legales.
Doblaje con inteligencia artificialVideo con inteligencia artificial
Reemplazar o añadir audio hablado en otro idioma, idealmente ajustado a la voz y a los movimientos labiales del hablante.
EntrenamientoInteligencia artificial
Enseñar a un modelo mostrándole grandes volúmenes de datos y ajustando gradualmente sus parámetros internos hasta que produzca buenos resultados.
Escala de guía (CFG)Inteligencia artificial
Qué tan estrictamente sigue el modelo tu prompt frente a improvisar. Valores altos se ciñen más a las palabras; valores bajos dan más libertad creativa al modelo.
Escalado (upscaling)Video con inteligencia artificial
Usar inteligencia artificial para aumentar la resolución de un video — por ejemplo, de 1080p a 4K — añadiendo detalle plausible en lugar de estirar píxeles.
Espacio latenteInteligencia artificial
Una representación matemática comprimida donde realmente trabaja el modelo. La generación sucede primero allí y luego se decodifica a píxeles visibles.
Etalonaje de colorVideo
El paso creativo de ajustar color, contraste y atmósfera del metraje en posproducción para darle un look coherente e intencional.
Extensión de videoVideo con inteligencia artificial
Continuar un clip más allá de su duración original generando fotogramas adicionales que sigan naturalmente.
Fotograma claveVideo
En edición, un fotograma marcado que fija un valor (posición, escala, opacidad) entre el que el software anima. En compresión, un fotograma de referencia completo del que se reconstruyen los cercanos.
GANInteligencia artificial
Red Generativa Antagónica — un método anterior donde compiten una red generadora y una crítica. Ampliamente reemplazado por difusión para video de alta calidad.
HDR (Alto Rango Dinámico)Video
Video que transporta un rango más amplio de brillo y color que el estándar (SDR), para brillos, sombras y tonos más realistas y ricos.
Humano digital / gemelo digitalVideo con inteligencia artificial
Una réplica fotorrealista con inteligencia artificial de una persona real, entrenada una vez y reutilizada como presentador en cámara.
Imagen a video (I2V)Video con inteligencia artificial
Dar vida a una imagen fija como video, a menudo guiado por un prompt que describe el movimiento deseado.
Imagen de referenciaVideo con inteligencia artificial
Una imagen que proporcionas al modelo para guiar el sujeto, personaje o estilo del video generado.
InferenciaInteligencia artificial
Ejecutar un modelo ya entrenado para producir una salida — por ejemplo, generar tu video a partir de un prompt. Es lo que se cobra por generación.
Ingeniería de promptsInteligencia artificial
El arte de redactar prompts para que el modelo produzca de forma fiable el resultado que buscas, incluyendo sujeto, estilo, cámara y estado de ánimo.
InserciónInteligencia artificial
Una lista de números (un vector) que captura el significado de texto, imagen o audio, para que el modelo compare y combine distintas entradas.
Interpolación de fotogramasVideo con inteligencia artificial
Generar fotogramas intermedios para elevar la tasa de fotogramas o suavizar el movimiento — por ejemplo, convertir 24fps en un fluido 60fps.
LoRAInteligencia artificial
Low-Rank Adaptation — una forma ligera de enseñar a un modelo un estilo, personaje o concepto nuevo con un pequeño archivo adicional, en lugar de reentrenar todo el modelo.
LUT (Look-Up Table)Video
Un ajuste preestablecido que reasigna colores para aplicar un look específico con un clic o convertir metraje entre espacios de color.
Marca de aguaVideo
Un logo o texto superpuesto en un video para señalar la autoría. Muchos generadores gratuitos la añaden; los planes de pago suelen eliminarla.
ModeloInteligencia artificial
Un sistema de inteligencia artificial entrenado que convierte una entrada — como un prompt de texto — en una salida, como un video. Los modelos varían en fortalezas, velocidad y precio.
Modelo de difusiónInteligencia artificial
El enfoque dominante detrás de imágenes y video generativos: el modelo parte de ruido aleatorio y, paso a paso, lo elimina hasta que aparece un resultado coherente que coincide con tu prompt.
Modelo de mundoVideo con inteligencia artificial
Una inteligencia artificial que construye una simulación interna de cómo se comportan escenas, objetos y física, ayudando a generar video más largo, coherente y consistente.
Modelo de pesos abiertosInteligencia artificial
Un modelo cuyos pesos se publican para que cualquiera pueda ejecutarlo, estudiarlo o ajustarlo (p. ej., en fal o localmente), a diferencia de un modelo cerrado accesible solo mediante una API.
Modelo fundacionalInteligencia artificial
Un modelo grande y de propósito general entrenado con datos amplios que puede adaptarse a muchas tareas posteriores.
MultimodalInteligencia artificial
Un modelo que entiende o genera más de un tipo de dato a la vez — por ejemplo, texto, imagen, video y audio juntos.
Parámetros (pesos)Inteligencia artificial
Los valores internos que un modelo aprende durante el entrenamiento. Almacenan lo que el modelo “sabe”; más parámetros pueden implicar más capacidad.
Pasos de muestreoInteligencia artificial
Cuántas iteraciones realiza un modelo de difusión para convertir el ruido en el fotograma final. Más pasos pueden dar mayor calidad pero una generación más lenta y costosa.
PlanoVideo
Un fragmento continuo de metraje. Tipos comunes: plano general, plano medio y primer plano.
Plano de establecimientoVideo
Un plano de apertura amplio que ubica el lugar y el contexto de una escena antes de cortar a más cerca.
Primer y último fotogramaVideo con inteligencia artificial
Aportar un fotograma inicial y/o final que el modelo anima entre sí, dándote control preciso sobre el inicio y el cierre del plano.
Profundidad de campoVideo
Cuánta parte de la imagen está en foco. Una profundidad de campo reducida desenfoca el fondo para resaltar al sujeto.
PromptInteligencia artificial
La instrucción que das al modelo — generalmente texto, a veces con una imagen — describiendo el video que quieres crear.
Prompt negativoInteligencia artificial
Una descripción de lo que NO quieres en la salida. Aleja al modelo de objetos, estilos o artefactos no deseados.
Punto de controlInteligencia artificial
Una instantánea guardada de los pesos de un modelo. A menudo se comparte como el “archivo de modelo” descargable que la gente ejecuta.
Red neuronalInteligencia artificial
Un modelo inspirado vagamente en el cerebro: capas de “neuronas” conectadas que aprenden patrones a partir de datos. Es la base de la IA generativa moderna.
Relación de aspectoVideo
La proporción entre ancho y alto del encuadre — 16:9 (pantalla ancha), 9:16 (vertical para Reels y TikTok) o 1:1 (cuadrado). Determina cómo encaja tu video en cada plataforma y pantalla.
Relleno interior/exterior (inpainting/outpainting)Video con inteligencia artificial
Rellenar parte de un fotograma (inpainting) o extender más allá de sus bordes (outpainting). En video, se usa para eliminar, reemplazar o ampliar regiones a lo largo del tiempo.
Render / renderizadoVideo
Procesar un proyecto hasta obtener un archivo de video final — o, en inteligencia artificial, cuando el modelo genera fotogramas para un clip final.
ResoluciónVideo
Las dimensiones en píxeles de cada fotograma, escritas ancho × alto (p. ej., 1920×1080). Más píxeles implican más detalle. Niveles comunes: 720p (HD), 1080p (Full HD), 4K y 8K.
RLHFInteligencia artificial
Aprendizaje por Refuerzo con Retroalimentación Humana — entrenamiento que usa preferencias de personas para alinear las salidas del modelo con lo que realmente queremos.
Rótulo inferiorVideo
Texto ubicado en la parte baja del encuadre, típicamente con el nombre y cargo de quien habla o un subtítulo.
SemillaInteligencia artificial
El número aleatorio inicial de una generación. Reutilizar la misma semilla con el mismo prompt reproduce el mismo resultado — útil para coherencia y pequeños ajustes.
Sincronía labialVideo con inteligencia artificial
Alinear los movimientos de la boca de un personaje o avatar con el audio hablado para que parezca que realmente dice esas palabras.
StoryboardVideo
Una secuencia planificada de bocetos o fotogramas que traza cada plano antes de producir o generar un video.
Subtítulos / subtituladoVideo
Texto en pantalla del audio hablado. Los subtítulos para sordos también señalan sonidos e interlocutores; los subtítulos convencionales transcriben o traducen el diálogo.
Tasa de bitsVideo
Cuánta información se usa por segundo de video, medida en kbps o Mbps. Un bitrate más alto conserva más detalle, pero genera archivos más pesados.
Tasa de fotogramas (FPS)Video
Fotogramas por segundo — cuántas imágenes fijas se reproducen cada segundo. 24fps se siente cinematográfico, 30fps es el estándar web y 60fps se ve ultra fluido para movimiento y deportes.
Texto a video (T2V)Video con inteligencia artificial
Generar un clip de video directamente desde una descripción escrita — sin cámara, actores ni stock.
Texto a voz (TTS)Video con inteligencia artificial
Convertir texto escrito en audio hablado natural con una voz sintética — el motor detrás de las locuciones con inteligencia artificial.
TokenInteligencia artificial
La porción más pequeña de entrada que procesa un modelo — una parte de palabra en texto, o un parche o fotograma en video.
Transferencia de estiloVideo con inteligencia artificial
Aplicar el estilo visual de una referencia a tu propio metraje o generación.
TransformerInteligencia artificial
Una arquitectura de red neuronal basada en “atención”, que pondera cómo se relacionan las partes de la entrada. Sustenta los grandes modelos de lenguaje y muchos modelos de video modernos.
TransiciónVideo
Cómo cambia un plano al siguiente — corte directo, disolvencia, fundido o cortinilla.
Video a video (V2V)Video con inteligencia artificial
Transformar un clip existente a un nuevo estilo o look preservando su movimiento y tiempos originales.
Video agenteVideo con inteligencia artificial
Un agente de inteligencia artificial que planifica y ejecuta toda la producción — guion, escenas, voz, avatares y edición — a partir de un único encargo, en lugar de clip por clip.

Del prompt al render: el lenguaje del video con inteligencia artificial

Hacer video con inteligencia artificial se sitúa en la intersección de dos mundos: décadas de vocabulario de cine y producción de video, y el lenguaje vertiginoso del aprendizaje automático. Este diccionario reúne ambos, además de los términos nuevos propios del video generativo, para que leas con confianza cualquier herramienta, tutorial o ficha de modelo.

Empieza por los fundamentos: la relación de aspecto, la resolución, la tasa de fotogramas y los códecs deciden cómo se ve tu video y dónde se reproduce. Luego la capa de inteligencia artificial: modelos, difusión, prompts, semillas y LoRAs dan forma a lo que se genera. Por último, los específicos del video con inteligencia artificial: texto a video, imagen a video, sincronía labial, avatares, coherencia temporal y modelos de mundo describen lo que hoy realmente pueden hacer los generadores.

Cada definición está escrita en lenguaje claro, sin matemáticas. Busca por palabra clave, filtra por tema o navega de la A a la Z, y luego pon el vocabulario en práctica en el estudio de Vivideo.

El diccionario de video con inteligencia artificial

Empieza gratis¿Qué es el video con inteligencia artificial?