Puntos clave
- 1El texto a video domina con el 65.7% de todos los pedidos, mientras que el imagen a video representa el 32.6%
- 2El 88.2% de los videos AI son escenas generadas — no avatares, no animaciones, sino mundos completamente imaginados a partir de texto
- 3La creación de videos AI es verdaderamente global: los prompts vienen en más de 24 idiomas, con el inglés en solo el 47.3%
- 4Veo 3.1 comanda el 96.4% del uso del modelo, señalando un claro ganador en la carrera de modelos de video AI
- 5El formato 16:9 paisaje (52.8%) supera ligeramente al 9:16 vertical (43.7%), mostrando la división TikTok-vs-YouTube en tiempo real
Equipo de Vivideo
El equipo de Vivideo se apasiona por hacer la creación de videos accesible para todos mediante AI. Probamos y reseñamos las últimas herramientas y compartimos nuestro conocimiento para ayudarte a tener éxito.
Analizamos más de 40,000 Prompts de Video AI
Todos tienen opiniones sobre el video AI. Los expertos predicen hacia dónde se dirige. Twitter debate si ya es "suficientemente bueno". Las miniaturas de YouTube gritan sobre la última actualización del modelo.
Pero casi nadie habla sobre lo que la gente está realmente creando con estas herramientas en este momento.
Así que decidimos averiguarlo.
Recopilamos datos de más de 120,000 videos generados por AI creados en Vivideo, clasificamos una muestra de 40,000+ prompts utilizando GPT-4o-mini, y analizamos los números. Lo que surgió es un retrato sorprendentemente detallado de cómo las personas reales — no influencers, no investigadores, sino creadores y negocios cotidianos — están utilizando el video AI en 2025.
Aquí está todo lo que encontramos.
El Conjunto de Datos: Cómo Obtuvimos Estos Números
Vamos a sacar la metodología del camino para que sepas exactamente qué estás viendo.
Nuestro conjunto de datos completo abarca 120,000+ videos generados a través de la plataforma de Vivideo. Para el análisis detallado de prompts, tomamos una muestra estratificada de 915 prompts y los procesamos a través de GPT-4o-mini para clasificarlos en categorías de uso. Las estadísticas más amplias — uso del modelo, relaciones de aspecto, duraciones, idiomas y tipos de entrada — provienen del conjunto de datos completo.
No seleccionamos a dedo. No filtramos por resultados "impresionantes". Estos son datos en bruto, sin filtrar, de usuarios reales haciendo trabajo real (y sí, parte de esto son personas haciendo videos de cumpleaños para su mamá — y eso es genial).
Unas pocas advertencias: la clasificación de prompts por AI no es perfecta. Algunos prompts son ambiguos. Un "video de producto con una persona hablando" podría etiquetarse como una demostración de producto o un video de avatar. Optimizamos para la intención más probable y revisamos manualmente cientos de clasificaciones.
Dicho esto, vamos a profundizar.
La Gran Imagen: Texto-a-Video vs. Imagen-a-Video
La primera pregunta que hicimos fue simple: ¿Cómo están comenzando las personas sus videos?
¿Están escribiendo un prompt desde cero? ¿O subiendo una imagen y dándole vida?
65.7% de todos los pedidos de video son texto-a-video. 32.6% son imagen-a-video. El restante ~1.7% utiliza otros métodos como la generación de avatares.
Esto fue algo sorprendente. Esperábamos que imagen-a-video fuera más alto — después de todo, es "más fácil" ya que le estás dando a la AI un punto de partida visual. Pero los datos cuentan una historia diferente: dos tercios de los usuarios prefieren describir su visión en palabras y dejar que la AI se encargue de los visuales.
¿Por qué? Algunas teorías:
- Barrera de entrada más baja. No necesitas tener o encontrar la imagen correcta. Solo escribes lo que quieres. Texto-a-video es el lienzo en blanco definitivo.
- Más control creativo. Los prompts de texto te permiten especificar el estado de ánimo, el movimiento de la cámara, la iluminación y el estilo — cosas que son más difíciles de comunicar a través de una imagen estática.
- La "brecha de imaginación." Muchos usuarios están creando escenas que aún no existen — mundos de fantasía, conceptos de productos, secuencias narrativas. No puedes subir una foto de algo que no se ha construido.
Dicho esto, imagen-a-video tiene su propia audiencia leal. Es particularmente popular para animaciones de productos de comercio electrónico, recorridos de bienes raíces (comenzando con una foto de la propiedad), y dando vida a obras de arte.
Lo Que La Gente Realmente Crea (Desglose de Casos de Uso)
Esta es la sección que más nos emocionaba. Cuando clasificamos todos los 915 prompts de muestra por caso de uso, una categoría dominó absolutamente.
| Caso de Uso | Porcentaje |
|---|---|
| Escenas de video generadas por AI | 88.2% |
| Videos de avatar / cabeza parlante | 7.1% |
| Animación de imágenes | 4.7% |
Deja que eso se asiente. Casi 9 de cada 10 videos de AI son escenas completamente generadas — no la cara de alguien hablando a la cámara, no un efecto Ken Burns en una foto, sino escenas visuales completas conjuradas a partir de descripciones de texto.
Esta es la verdadera historia del video AI en 2025: la gente lo está utilizando como un motor de imaginación visual.
Cómo Se Ven Realmente Esas Escenas
Profundizamos en el 88.2% para entender qué tipos de escenas están generando las personas. Si bien las categorías se superponen (un video promocional también puede ser una narrativa), aquí están los patrones principales que observamos:
- Videos promocionales — Negocios creando anuncios, videos de marca y contenido de marketing. Todo, desde promociones de restaurantes locales hasta lanzamientos de productos SaaS.
- Contenido educativo — Videos explicativos, tutoriales y secuencias de "cómo funciona". Los maestros, creadores de cursos y capacitadores corporativos son usuarios avanzados tempranos.
- Contenido de redes sociales — Clips cortos y contundentes diseñados para TikTok, Instagram Reels y YouTube Shorts. A menudo impulsados por tendencias y diseñados para un impacto máximo que detenga el desplazamiento.
- Narración y narrativa — Cortometrajes, conceptos de videos musicales y secuencias narrativas. Aquí es donde viven los prompts más creativos — personas construyendo mundos enteros en 4-12 segundos.
- Demostraciones de productos — Vendedores de comercio electrónico mostrando productos en contextos de estilo de vida. "Muestra mi zapatilla siendo usada por un corredor en un sendero de montaña al atardecer" — ese tipo de cosas.
- Saludos y celebraciones personales — Mensajes de cumpleaños, tarjetas de vacaciones, sorpresas de aniversario. Video AI como la nueva tarjeta Hallmark.
- Recorridos de bienes raíces — Recorridos virtuales de propiedades, exhibiciones de vecindarios y visualizaciones arquitectónicas.
- Exhibiciones de productos de comercio electrónico — Tomas de belleza de productos, revelaciones estilo 360° y videos de contexto de estilo de vida que hacen que los productos se vean premium.
La categoría de avatar/cabeza parlante (7.1%) es más pequeña de lo que podrías esperar dado todo el revuelo en torno a los avatares de AI. Esto se debe en parte a que la generación de avatares es un caso de uso especializado — requiere un flujo de trabajo diferente y atrae a una audiencia más reducida (principalmente capacitación corporativa y alcance de ventas personalizado).
La animación de imágenes al 4.7% representa a los usuarios que suben una foto fija y añaden movimiento — una opción popular para dar vida a obras de arte, fotos antiguas o imágenes de productos.
El Lenguaje del Video AI: Un Fenómeno de 24 Idiomas
Aquí hay algo que realmente nos sorprendió. Si asumiste que la creación de videos AI es principalmente una actividad de habla inglesa, los datos dicen lo contrario.
El inglés representa solo 47.3% de todos los prompts. Eso significa que más de la mitad de todos los prompts de video AI en Vivideo están escritos en idiomas no ingleses.
Esto no es solo "un poco internacional". Este es un fenómeno global, con una adopción significativa en cada continente.
| Idioma | % de Prompts |
|---|---|
| Inglés | 47.3% |
| Vietnamita | 23.1% |
| Árabe | 11.4% |
| Ruso | 3.2% |
| Turco | 2.7% |
| Alemán | 2.2% |
| Ucraniano | 1.9% |
| Indonesio | 1.7% |
| Español | 1.3% |
| Holandés | 0.9% |
| Hebreo | 0.7% |
| Polaco | 0.7% |
| Chino | 0.6% |
| Portugués | 0.6% |
| Sueco | 0.5% |
| Griego | 0.4% |
Algunas cosas destacan:
El vietnamita al 23.1% es masivo. Casi una cuarta parte de todos los prompts están en vietnamita. Esto refleja la floreciente economía de creadores digitales de Vietnam y la adopción temprana de herramientas de AI para la creación de contenido. Los creadores vietnamitas están utilizando video AI para todo, desde videos de productos de comercio electrónico hasta contenido de redes sociales a gran escala.
El árabe al 11.4% convierte a la región MENA en uno de los mercados de video AI más activos. Dada la rápida transformación digital que está ocurriendo en los estados del Golfo y la enorme inversión en infraestructura de AI, esto tiene sentido.
La larga cola es real. Más allá de los principales idiomas, hay una actividad significativa en ruso, turco, alemán, ucraniano, indonesio y muchos más. El video AI no es un juguete de Silicon Valley — es una herramienta creativa global.
Esto tiene enormes implicaciones para cualquiera que esté construyendo en este espacio: si tu herramienta de video AI solo funciona bien con prompts en inglés, estás ignorando a más de la mitad de tus usuarios potenciales.
Preferencias de Formato: Relaciones de Aspecto y Duraciones
Cómo las personas formatean sus videos te dice mucho sobre dónde van a terminar esos videos.
Relaciones de Aspecto
| Relación de Aspecto | Porcentaje |
|---|---|
| 16:9 (Horizontal) | 52.8% |
| 9:16 (Vertical) | 43.7% |
| 1:1 (Cuadrado) | ~0% |
La división horizontal vs. vertical es notablemente cercana — 52.8% a 43.7% — lo que nos dice algo importante: la batalla entre video horizontal y vertical es esencialmente un lanzamiento de moneda.
El horizontal todavía lidera, probablemente impulsado por YouTube, incrustaciones en sitios web, presentaciones y contenido de marketing tradicional. Pero el vertical está justo detrás, alimentado por TikTok, Instagram Reels y YouTube Shorts.
¿La verdadera sorpresa? El video cuadrado (1:1) está esencialmente muerto. Con aproximadamente 0%, nadie está creando videos cuadrados ya. El antiguo formato cuadrado de Instagram, que alguna vez fue el predeterminado para las redes sociales, ha sido completamente abandonado en la era del video AI.
Duraciones de Video
| Duración | Porcentaje |
|---|---|
| 12 segundos | 30.1% |
| 4 segundos | 29.2% |
| 8 segundos | 23.3% |
| 6 segundos | 6.6% |
Las preferencias de duración revelan una fascinante división en dos campamentos:
Campamento 1: El grupo de 12 segundos (30.1%). Estos usuarios quieren la duración máxima disponible. Están creando contenido narrativo, demostraciones de productos y videos promocionales donde cada segundo extra cuenta. Doce segundos son suficientes para contar una mini-historia: configuración, revelación, recompensa.
Campamento 2: El grupo de 4 segundos (29.2%). Estos usuarios quieren clips rápidos y contundentes — perfectos para ganchos en redes sociales, creativos publicitarios, o apilando múltiples clips en ediciones más largas. Cuatro segundos son básicamente un fuerte momento visual.
El punto medio de 8 segundos (23.3%) captura a los usuarios que quieren un poco más de espacio que 4 segundos pero no necesitan los 12 completos. La relativamente baja popularidad de los videos de 6 segundos (6.6%) es interesante — parece que a la gente le gusta comprometerse ya sea con "corto" o "largo" en lugar de dividir la diferencia.
La Carrera de Modelos: Veo 3.1 Se Lleva el Premio
Si hay una estadística destacada de todo este análisis, podría ser esta:
Veo 3.1 impulsa el 96.4% de toda la generación de video AI en Vivideo.
No es un error tipográfico. El modelo Veo 3.1 de Google es la opción abrumadora para la creación de videos AI.
| Modelo | % de Uso |
|---|---|
| Veo 3.1 | 96.4% |
| Sora 2 | 2.0% |
| HeyGen (Avatares) | 10.5% de todos los pedidos |
Nota: La generación de avatares HeyGen se cuenta por separado ya que cumple una función diferente (avatares digitales vs. generación de escenas). Su participación del 10.5% se superpone con la categoría de avatares en nuestro análisis de casos de uso.
¿Por qué domina Veo 3.1 tan completamente? Basado en la retroalimentación de los usuarios y nuestras propias pruebas:
- Calidad visual. Veo 3.1 produce consistentemente la salida más fotorrealista y visualmente coherente.
- Adherencia a los prompts. Sigue los prompts complejos de manera más fiel — movimientos de cámara, especificaciones de iluminación, directrices de estilo.
- Velocidad. Los tiempos de generación son competitivos, y la relación calidad-velocidad es la mejor de su clase.
- Consistencia. Menos "artefactos extraños de AI" — menos manos derretidas, física imposible y momentos de valle inquietante.
Sora 2 al 2.0% todavía tiene sus fanáticos, particularmente para contenido más artístico y estilizado. Pero el mercado ha hablado, al menos por ahora: cuando la gente quiere video AI confiable y de alta calidad, elige Veo 3.1.
Hallazgos Sorprendentes
Todo buen análisis de datos revela cosas que no esperabas. Aquí están los patrones que nos hicieron mirar dos veces.
1. La Tasa de Moderación de Contenido del 9%
Aproximadamente 9% de todos los prompts fueron marcados por sistemas de moderación de contenido como contenido adulto o inapropiado. Esto es en realidad más bajo de lo que muchos en la industria esperaban — algunas estimaciones colocan la tasa de intento de contenido adulto para generadores de imágenes AI en 15-20%.
¿Qué significa esto? La creación de video AI se inclina más hacia lo profesional y lo intencionado que la generación de imágenes AI. Cuando estás pagando por la generación de video (en lugar de jugar con una herramienta de imagen gratuita), la intención es más seria y los casos de uso son más orientados a negocios.
2. El Efecto de la Tarjeta de Cumpleaños
Los saludos personales — cumpleaños, vacaciones, aniversarios — aparecieron mucho más de lo que esperábamos. Estos no son los casos de uso llamativos que se presentan en los reels de demostración de AI, pero representan una aplicación genuinamente conmovedora de la tecnología. La gente está creando mensajes de video personalizados que habrían sido imposibles (o prohibitivamente caros) hace solo dos años.
3. La Muerte del Video Cuadrado
Ya mencionamos esto, pero vale la pena repetirlo: el video cuadrado 1:1 está efectivamente en 0%. El formato que dominó Instagram de 2012 a 2019 ha sido completamente abandonado. Si tu herramienta de video todavía predetermina a cuadrado, estás resolviendo el problema de ayer.
4. La Economía de Creadores Vietnamita
Con el 23.1% de todos los prompts, el vietnamita no solo está representado — es el segundo idioma más popular por un amplio margen, más del doble que el árabe en tercer lugar con 11.4%. La economía de creadores de Vietnam está claramente en un punto de inflexión, y las herramientas de video AI son un acelerador clave.
5. Nadie Quiere Videos de 6 Segundos
Con solo el 6.6% de los pedidos, el formato de 6 segundos es la duración menos popular. Los usuarios prefieren fuertemente ya sea corto y contundente (4s) o de formato más largo (12s). El punto medio simplemente no resuena. Esto refleja lo que hemos visto en las tendencias de redes sociales — el contenido es ya sea un gancho rápido o una mini-narrativa, con poco espacio para el intermedio.
Lo Que Esto Significa para los Creadores
Así que has visto los datos. ¿Qué deberías hacer realmente con ellos?
Ya seas un comercializador, creador de contenido, propietario de un negocio, o simplemente alguien curioso sobre el video AI, aquí están las conclusiones prácticas:
1. Comienza con Texto-a-Video
Si no has probado el video AI aún, texto-a-video es donde está la acción. Dos tercios de los usuarios comienzan aquí, y por una buena razón — no necesitas ningún activo, solo ideas. Describe lo que quieres ver, y la AI lo construye.
2. Piensa en 4s o 12s
Al planificar tus videos AI, piensa en términos de golpes de 4 segundos o historias de 12 segundos. Los datos muestran que estas son las duraciones que resuenan. Para ganchos en redes sociales y creativos publicitarios, opta por 4 segundos. Para demostraciones de productos, explicaciones y contenido narrativo, utiliza los 12 completos.
3. Elige Tu Orientación Deliberadamente
No defaults a horizontal. Si tu contenido va a TikTok, Reels o Shorts, opta por 9:16 vertical. Si es para YouTube, tu sitio web o presentaciones, elige 16:9. Y olvídate del cuadrado — el mercado ha avanzado.
4. No Subestimes los Mercados No Ingleses
Si estás construyendo un negocio en torno al contenido de video AI, los datos muestran una enorme demanda de los mercados de habla vietnamita, árabe, rusa y turca. Estas no son audiencias de nicho — representan cientos de millones de espectadores potenciales.
5. Usa Imagen-a-Video para Contenido de Productos
Si bien texto-a-video domina en general, imagen-a-video es el arma secreta para el comercio electrónico y el marketing de productos. Sube la foto de tu producto y añade movimiento, contexto y vida. Es más rápido que una sesión de fotos y infinitamente más escalable.
6. Veo 3.1 Es la Apuesta Segura
Si te preguntas qué modelo usar, los datos son claros: el 96.4% de los usuarios eligen Veo 3.1. Ofrece la mejor combinación de calidad, velocidad y adherencia a los prompts. Comienza allí, y experimenta con alternativas como Sora 2 para estilos creativos específicos.
La conclusión: El video AI ya no es una novedad. Con más de 120,000 videos generados, prompts en más de 24 idiomas, y casos de uso que van desde tarjetas de cumpleaños hasta recorridos de bienes raíces, es una herramienta creativa convencional. La pregunta no es si usarlo — es cómo usarlo mejor que los demás.
¿Listo para ver qué puedes crear? Prueba Vivideo gratis y añade tus prompts al próximo conjunto de datos.
Explorar más
Comparaciones relacionadas
Prueba estas herramientas
¿Listo para crear tus propios videos con AI?
Prueba Vivideo gratis hoy: no se requiere tarjeta de crédito. Crea videos profesionales en minutos.
Comienza a crear gratis