Glosario

El diccionario de video con inteligencia artificial

Cada término que encontrarás al crear video con inteligencia artificial — desde lo básico de cámara y códecs hasta difusión, avatares y generación agente — explicado en lenguaje sencillo.

74 términos · Video · Inteligencia artificial · Video con inteligencia artificial

74 términos

A B C D E F G H I L M P R S T V

Ajuste finoInteligencia artificial: Entrenar más un modelo base con datos específicos para especializarlo — para un estilo, marca o persona concretos.
AlucinaciónInteligencia artificial: Cuando un modelo produce una salida convincente pero incorrecta o inventada — como texto deformado, dedos extra o movimientos imposibles.
Aprendizaje profundoInteligencia artificial: Aprendizaje automático que emplea redes neuronales con muchas capas. Impulsa los modelos actuales de imagen, video, voz y lenguaje.
Avatar con inteligencia artificialVideo con inteligencia artificial: Un presentador en pantalla generado o clonado con inteligencia artificial que puede locutar tu guion con una voz e idioma elegidos.

B-rollVideo: Metraje de apoyo que se intercala sobre el plano principal para dar contexto, ilustrar una idea o disimular un corte.
Barras negras (letterboxing)Video: Barras negras añadidas arriba y abajo (o a los lados) para que el video se adapte a otra relación de aspecto sin recortar la imagen.
BokehVideo: El desenfoque suave y agradable del fondo de un plano, que a menudo aparece como círculos de luz brillantes.

Cabeza parlanteVideo con inteligencia artificial: Un video centrado en una persona hablándole a cámara — el caso clásico para avatares y presentadores con inteligencia artificial.
Chroma key (pantalla verde)Video: Reemplazar un fondo de color sólido — normalmente verde — por otra imagen o video haciendo ese color transparente.
Clonación de vozVideo con inteligencia artificial: Recrear la voz específica de una persona a partir de una muestra breve para que pueda hablar texto nuevo con esa misma voz.
CódecVideo: El algoritmo que comprime y descomprime el video — como H.264, H.265/HEVC, AV1 o VP9. Equilibra la calidad visual con el tamaño del archivo.
Coherencia temporalVideo con inteligencia artificial: Mantener estables personajes, objetos y estilo de un fotograma a otro para que el video no parpadee, se deforme ni cambie de forma de manera antinatural.
ComposiciónVideo: Superponer múltiples elementos visuales — metraje, gráficos, efectos, texto — en un solo encuadre combinado.
Conjunto de datosInteligencia artificial: La colección de ejemplos — videos, imágenes, texto — con la que se entrena un modelo. Su calidad y variedad determinan lo que el modelo puede hacer.
Contenedor (formato de archivo)Video: La “carcasa” que agrupa video, audio y metadatos — MP4, MOV, WebM o MKV. Es independiente del códec almacenado dentro.
Control de cámaraVideo con inteligencia artificial: Dirigir movimientos de cámara virtuales — paneo, zoom, órbita, travelling — dentro de un plano generado con inteligencia artificial.
Control de movimiento / pincel de movimientoVideo con inteligencia artificial: Herramientas que te permiten dirigir dónde y cómo se mueven las cosas en un clip generado, en lugar de dejarlo totalmente al modelo.

DeepfakeVideo con inteligencia artificial: Contenido sintético que sustituye o fabrica de forma realista la cara o la voz de alguien. Potente, pero conlleva preocupaciones reales de consentimiento, autenticidad y aspectos legales.
Doblaje con inteligencia artificialVideo con inteligencia artificial: Reemplazar o añadir audio hablado en otro idioma, idealmente ajustado a la voz y a los movimientos labiales del hablante.

EntrenamientoInteligencia artificial: Enseñar a un modelo mostrándole grandes volúmenes de datos y ajustando gradualmente sus parámetros internos hasta que produzca buenos resultados.
Escala de guía (CFG)Inteligencia artificial: Qué tan estrictamente sigue el modelo tu prompt frente a improvisar. Valores altos se ciñen más a las palabras; valores bajos dan más libertad creativa al modelo.
Escalado (upscaling)Video con inteligencia artificial: Usar inteligencia artificial para aumentar la resolución de un video — por ejemplo, de 1080p a 4K — añadiendo detalle plausible en lugar de estirar píxeles.
Espacio latenteInteligencia artificial: Una representación matemática comprimida donde realmente trabaja el modelo. La generación sucede primero allí y luego se decodifica a píxeles visibles.
Etalonaje de colorVideo: El paso creativo de ajustar color, contraste y atmósfera del metraje en posproducción para darle un look coherente e intencional.
Extensión de videoVideo con inteligencia artificial: Continuar un clip más allá de su duración original generando fotogramas adicionales que sigan naturalmente.

Fotograma claveVideo: En edición, un fotograma marcado que fija un valor (posición, escala, opacidad) entre el que el software anima. En compresión, un fotograma de referencia completo del que se reconstruyen los cercanos.

GANInteligencia artificial: Red Generativa Antagónica — un método anterior donde compiten una red generadora y una crítica. Ampliamente reemplazado por difusión para video de alta calidad.

HDR (Alto Rango Dinámico)Video: Video que transporta un rango más amplio de brillo y color que el estándar (SDR), para brillos, sombras y tonos más realistas y ricos.
Humano digital / gemelo digitalVideo con inteligencia artificial: Una réplica fotorrealista con inteligencia artificial de una persona real, entrenada una vez y reutilizada como presentador en cámara.

Imagen a video (I2V)Video con inteligencia artificial: Dar vida a una imagen fija como video, a menudo guiado por un prompt que describe el movimiento deseado.
Imagen de referenciaVideo con inteligencia artificial: Una imagen que proporcionas al modelo para guiar el sujeto, personaje o estilo del video generado.
InferenciaInteligencia artificial: Ejecutar un modelo ya entrenado para producir una salida — por ejemplo, generar tu video a partir de un prompt. Es lo que se cobra por generación.
Ingeniería de promptsInteligencia artificial: El arte de redactar prompts para que el modelo produzca de forma fiable el resultado que buscas, incluyendo sujeto, estilo, cámara y estado de ánimo.
InserciónInteligencia artificial: Una lista de números (un vector) que captura el significado de texto, imagen o audio, para que el modelo compare y combine distintas entradas.
Interpolación de fotogramasVideo con inteligencia artificial: Generar fotogramas intermedios para elevar la tasa de fotogramas o suavizar el movimiento — por ejemplo, convertir 24fps en un fluido 60fps.

LoRAInteligencia artificial: Low-Rank Adaptation — una forma ligera de enseñar a un modelo un estilo, personaje o concepto nuevo con un pequeño archivo adicional, en lugar de reentrenar todo el modelo.
LUT (Look-Up Table)Video: Un ajuste preestablecido que reasigna colores para aplicar un look específico con un clic o convertir metraje entre espacios de color.

Marca de aguaVideo: Un logo o texto superpuesto en un video para señalar la autoría. Muchos generadores gratuitos la añaden; los planes de pago suelen eliminarla.
ModeloInteligencia artificial: Un sistema de inteligencia artificial entrenado que convierte una entrada — como un prompt de texto — en una salida, como un video. Los modelos varían en fortalezas, velocidad y precio.
Modelo de difusiónInteligencia artificial: El enfoque dominante detrás de imágenes y video generativos: el modelo parte de ruido aleatorio y, paso a paso, lo elimina hasta que aparece un resultado coherente que coincide con tu prompt.
Modelo de mundoVideo con inteligencia artificial: Una inteligencia artificial que construye una simulación interna de cómo se comportan escenas, objetos y física, ayudando a generar video más largo, coherente y consistente.
Modelo de pesos abiertosInteligencia artificial: Un modelo cuyos pesos se publican para que cualquiera pueda ejecutarlo, estudiarlo o ajustarlo (p. ej., en fal o localmente), a diferencia de un modelo cerrado accesible solo mediante una API.
Modelo fundacionalInteligencia artificial: Un modelo grande y de propósito general entrenado con datos amplios que puede adaptarse a muchas tareas posteriores.
MultimodalInteligencia artificial: Un modelo que entiende o genera más de un tipo de dato a la vez — por ejemplo, texto, imagen, video y audio juntos.

Parámetros (pesos)Inteligencia artificial: Los valores internos que un modelo aprende durante el entrenamiento. Almacenan lo que el modelo “sabe”; más parámetros pueden implicar más capacidad.
Pasos de muestreoInteligencia artificial: Cuántas iteraciones realiza un modelo de difusión para convertir el ruido en el fotograma final. Más pasos pueden dar mayor calidad pero una generación más lenta y costosa.
PlanoVideo: Un fragmento continuo de metraje. Tipos comunes: plano general, plano medio y primer plano.
Plano de establecimientoVideo: Un plano de apertura amplio que ubica el lugar y el contexto de una escena antes de cortar a más cerca.
Primer y último fotogramaVideo con inteligencia artificial: Aportar un fotograma inicial y/o final que el modelo anima entre sí, dándote control preciso sobre el inicio y el cierre del plano.
Profundidad de campoVideo: Cuánta parte de la imagen está en foco. Una profundidad de campo reducida desenfoca el fondo para resaltar al sujeto.
PromptInteligencia artificial: La instrucción que das al modelo — generalmente texto, a veces con una imagen — describiendo el video que quieres crear.
Prompt negativoInteligencia artificial: Una descripción de lo que NO quieres en la salida. Aleja al modelo de objetos, estilos o artefactos no deseados.
Punto de controlInteligencia artificial: Una instantánea guardada de los pesos de un modelo. A menudo se comparte como el “archivo de modelo” descargable que la gente ejecuta.

Red neuronalInteligencia artificial: Un modelo inspirado vagamente en el cerebro: capas de “neuronas” conectadas que aprenden patrones a partir de datos. Es la base de la IA generativa moderna.
Relación de aspectoVideo: La proporción entre ancho y alto del encuadre — 16:9 (pantalla ancha), 9:16 (vertical para Reels y TikTok) o 1:1 (cuadrado). Determina cómo encaja tu video en cada plataforma y pantalla.
Relleno interior/exterior (inpainting/outpainting)Video con inteligencia artificial: Rellenar parte de un fotograma (inpainting) o extender más allá de sus bordes (outpainting). En video, se usa para eliminar, reemplazar o ampliar regiones a lo largo del tiempo.
Render / renderizadoVideo: Procesar un proyecto hasta obtener un archivo de video final — o, en inteligencia artificial, cuando el modelo genera fotogramas para un clip final.
ResoluciónVideo: Las dimensiones en píxeles de cada fotograma, escritas ancho × alto (p. ej., 1920×1080). Más píxeles implican más detalle. Niveles comunes: 720p (HD), 1080p (Full HD), 4K y 8K.
RLHFInteligencia artificial: Aprendizaje por Refuerzo con Retroalimentación Humana — entrenamiento que usa preferencias de personas para alinear las salidas del modelo con lo que realmente queremos.
Rótulo inferiorVideo: Texto ubicado en la parte baja del encuadre, típicamente con el nombre y cargo de quien habla o un subtítulo.

SemillaInteligencia artificial: El número aleatorio inicial de una generación. Reutilizar la misma semilla con el mismo prompt reproduce el mismo resultado — útil para coherencia y pequeños ajustes.
Sincronía labialVideo con inteligencia artificial: Alinear los movimientos de la boca de un personaje o avatar con el audio hablado para que parezca que realmente dice esas palabras.
StoryboardVideo: Una secuencia planificada de bocetos o fotogramas que traza cada plano antes de producir o generar un video.
Subtítulos / subtituladoVideo: Texto en pantalla del audio hablado. Los subtítulos para sordos también señalan sonidos e interlocutores; los subtítulos convencionales transcriben o traducen el diálogo.

Tasa de bitsVideo: Cuánta información se usa por segundo de video, medida en kbps o Mbps. Un bitrate más alto conserva más detalle, pero genera archivos más pesados.
Tasa de fotogramas (FPS)Video: Fotogramas por segundo — cuántas imágenes fijas se reproducen cada segundo. 24fps se siente cinematográfico, 30fps es el estándar web y 60fps se ve ultra fluido para movimiento y deportes.
Texto a video (T2V)Video con inteligencia artificial: Generar un clip de video directamente desde una descripción escrita — sin cámara, actores ni stock.
Texto a voz (TTS)Video con inteligencia artificial: Convertir texto escrito en audio hablado natural con una voz sintética — el motor detrás de las locuciones con inteligencia artificial.
TokenInteligencia artificial: La porción más pequeña de entrada que procesa un modelo — una parte de palabra en texto, o un parche o fotograma en video.
Transferencia de estiloVideo con inteligencia artificial: Aplicar el estilo visual de una referencia a tu propio metraje o generación.
TransformerInteligencia artificial: Una arquitectura de red neuronal basada en “atención”, que pondera cómo se relacionan las partes de la entrada. Sustenta los grandes modelos de lenguaje y muchos modelos de video modernos.
TransiciónVideo: Cómo cambia un plano al siguiente — corte directo, disolvencia, fundido o cortinilla.

Video a video (V2V)Video con inteligencia artificial: Transformar un clip existente a un nuevo estilo o look preservando su movimiento y tiempos originales.
Video agenteVideo con inteligencia artificial: Un agente de inteligencia artificial que planifica y ejecuta toda la producción — guion, escenas, voz, avatares y edición — a partir de un único encargo, en lugar de clip por clip.

Del prompt al render: el lenguaje del video con inteligencia artificial

Hacer video con inteligencia artificial se sitúa en la intersección de dos mundos: décadas de vocabulario de cine y producción de video, y el lenguaje vertiginoso del aprendizaje automático. Este diccionario reúne ambos, además de los términos nuevos propios del video generativo, para que leas con confianza cualquier herramienta, tutorial o ficha de modelo.

Empieza por los fundamentos: la relación de aspecto, la resolución, la tasa de fotogramas y los códecs deciden cómo se ve tu video y dónde se reproduce. Luego la capa de inteligencia artificial: modelos, difusión, prompts, semillas y LoRAs dan forma a lo que se genera. Por último, los específicos del video con inteligencia artificial: texto a video, imagen a video, sincronía labial, avatares, coherencia temporal y modelos de mundo describen lo que hoy realmente pueden hacer los generadores.

Cada definición está escrita en lenguaje claro, sin matemáticas. Busca por palabra clave, filtra por tema o navega de la A a la Z, y luego pon el vocabulario en práctica en el estudio de Vivideo.

El diccionario de video con inteligencia artificial

Empieza gratis ¿Qué es el video con inteligencia artificial?