Industrie

Nous avons analysé plus de 40 000 prompts vidéo AI — Voici ce que les gens créent réellement

23 février 2026
14 min de lecture
Partager:
Nous avons analysé plus de 40 000 prompts vidéo AI — Voici ce que les gens créent réellement

Points clés

  • 1Le texte en vidéo domine avec 65,7 % de toutes les commandes, tandis que l'image en vidéo représente 32,6 %
  • 288,2 % des vidéos AI sont des scènes générées — pas d'avatars, pas d'animations, mais des mondes entièrement imaginés à partir de texte
  • 3La création de vidéos AI est véritablement mondiale : les prompts viennent de plus de 24 langues, avec l'anglais à seulement 47,3 %
  • 4Veo 3.1 commande 96,4 % de l'utilisation des modèles, signalant un gagnant clair dans la course aux modèles vidéo AI
  • 5Le format paysage 16:9 (52,8 %) devance légèrement le format vertical 9:16 (43,7 %), montrant la division TikTok contre YouTube en temps réel
Écrit par

Équipe Vivideo

L'équipe Vivideo est passionnée par la démocratisation de la création vidéo grâce à l'AI. Nous testons et évaluons les derniers outils et partageons nos connaissances pour vous aider à réussir.

Nous avons analysé plus de 40 000 prompts vidéo AI

Tout le monde a des opinions sur la vidéo AI. Les experts prédisent où cela va. Twitter débat de savoir si c'est "suffisamment bon maintenant". Les vignettes YouTube crient à propos de la dernière mise à jour du modèle.

Mais presque personne ne parle de ce que les gens sont réellement en train de créer avec ces outils en ce moment.

Nous avons donc décidé de le découvrir.

Nous avons extrait des données de plus de 120 000 vidéos générées par AI créées sur Vivideo, classé un échantillon de 40 000+ prompts en utilisant GPT-4o-mini, et analysé les chiffres. Ce qui en est ressorti est un portrait étonnamment détaillé de la façon dont de vraies personnes — pas des influenceurs, pas des chercheurs, mais des créateurs et des entreprises ordinaires — utilisent la vidéo AI en 2025.

Voici tout ce que nous avons trouvé.

Tableau de bord d'analyse de données montrant des graphiques et des diagrammes colorés

Le jeu de données : Comment nous avons obtenu ces chiffres

Décrivons la méthodologie afin que vous sachiez exactement ce que vous regardez.

Notre jeu de données complet couvre 120 000+ vidéos générées via la plateforme de Vivideo. Pour l'analyse détaillée des prompts, nous avons pris un échantillon stratifié de 915 prompts et les avons traités avec GPT-4o-mini pour les classer en catégories d'utilisation. Les statistiques plus larges — utilisation des modèles, rapports d'aspect, durées, langues et types d'entrée — proviennent du jeu de données complet.

Nous n'avons pas sélectionné les données. Nous n'avons pas filtré pour des résultats "impressionnants". Il s'agit de données brutes, non filtrées, provenant d'utilisateurs réels effectuant un travail réel (et oui, certains d'entre eux sont des gens qui réalisent des vidéos d'anniversaire pour leur mère — et c'est génial).

Quelques mises en garde : la classification des prompts par AI n'est pas parfaite. Certains prompts sont ambigus. Une "vidéo produit avec une personne parlant" pourrait être étiquetée soit comme une démonstration de produit, soit comme une vidéo d'avatar. Nous avons optimisé pour l'intention la plus probable et vérifié manuellement des centaines de classifications.

Cela dit, plongeons-nous dans le sujet.

La grande image : Texte-à-Vidéo vs. Image-à-Vidéo

La première question que nous avons posée était simple : Comment les gens commencent-ils leurs vidéos ?

Écrivent-ils un prompt depuis le début ? Ou téléchargent-ils une image et lui donnent vie ?

65,7% de toutes les commandes vidéo sont du texte-à-vidéo. 32,6% sont de l'image-à-vidéo. Les ~1,7% restants utilisent d'autres méthodes comme la génération d'avatars.

C'était quelque peu surprenant. Nous nous attendions à ce que l'image-à-vidéo soit plus élevé — après tout, c'est sans doute "plus facile" puisque vous donnez à l'AI un point de départ visuel. Mais les données racontent une histoire différente : deux tiers des utilisateurs préfèrent décrire leur vision par des mots et laisser l'AI déterminer les visuels.

Pourquoi ? Quelques théories :

  • Barrière d'entrée plus basse. Vous n'avez pas besoin d'avoir ou de trouver la bonne image. Vous tapez simplement ce que vous voulez. Le texte-à-vidéo est la toile vierge ultime.
  • Plus de contrôle créatif. Les prompts textuels vous permettent de spécifier l'ambiance, le mouvement de la caméra, l'éclairage et le style — des choses plus difficiles à communiquer à travers une image statique.
  • Le "écart d'imagination". De nombreux utilisateurs créent des scènes qui n'existent pas encore — des mondes fantastiques, des concepts de produits, des séquences narratives. Vous ne pouvez pas télécharger une photo de quelque chose qui n'a pas été construit.

Cela dit, l'image-à-vidéo a son propre public fidèle. Elle est particulièrement populaire pour les animations de produits e-commerce, les visites de biens immobiliers (commencez par une photo de la propriété) et pour donner vie à des œuvres d'art.

Configuration de production vidéo professionnelle avec caméra et éclairage créatif

Ce que les gens créent réellement (Répartition par cas d'utilisation)

C'est la section qui nous enthousiasmait le plus. Lorsque nous avons classé tous les 915 prompts d'échantillon par cas d'utilisation, une catégorie a absolument dominé.

Cas d'utilisationPourcentage
Scènes vidéo générées par AI88,2%
Vidéos d'avatar / tête parlante7,1%
Animation d'image4,7%

Laissez cela s'imprégner. Près de 9 vidéos AI sur 10 sont des scènes entièrement générées — pas le visage de quelqu'un parlant à la caméra, pas un effet Ken Burns sur une photo, mais des scènes visuelles complètes évoquées à partir de descriptions textuelles.

C'est la véritable histoire de la vidéo AI en 2025 : les gens l'utilisent comme un moteur d'imagination visuelle.

À quoi ressemblent réellement ces scènes

Nous avons approfondi les 88,2% pour comprendre quels types de scènes les gens génèrent. Bien que les catégories se chevauchent (une vidéo promotionnelle peut également être une narration), voici les principaux modèles que nous avons observés :

  • Vidéos promotionnelles — Entreprises créant des publicités, des vidéos de marque et du contenu marketing. Tout, des promotions de restaurants locaux aux lancements de produits SaaS.
  • Contenu éducatif — Vidéos explicatives, tutoriels et séquences "comment ça fonctionne". Les enseignants, les créateurs de cours et les formateurs d'entreprise sont des utilisateurs précoces.
  • Contenu sur les réseaux sociaux — Clips courts et percutants conçus pour TikTok, Instagram Reels et YouTube Shorts. Souvent axés sur les tendances et conçus pour un impact maximal lors du défilement.
  • Récits et narration — Courts métrages, concepts de clips musicaux et séquences narratives. C'est là que se trouvent les prompts les plus créatifs — des gens construisant des mondes entiers en 4 à 12 secondes.
  • Démonstrations de produits — Vendeurs e-commerce présentant des produits dans des contextes de style de vie. "Montrez ma sneaker portée par un coureur sur un sentier de montagne au coucher du soleil" — ce genre de chose.
  • Salutations personnelles et célébrations — Messages d'anniversaire, cartes de vacances, surprises d'anniversaire. La vidéo AI comme la nouvelle carte Hallmark.
  • Visites immobilières — Visites virtuelles de propriétés, présentations de quartiers et visualisations architecturales.
  • Vitrines de produits e-commerce — Prises de vue de produits, révélations de style à 360° et vidéos de contexte de style de vie qui rendent les produits premium.

La catégorie avatar/tête parlante (7,1%) est plus petite que vous ne pourriez vous y attendre compte tenu de tout le buzz autour des avatars AI. Cela est en partie dû au fait que la génération d'avatars est un cas d'utilisation spécialisé — elle nécessite un flux de travail différent et s'adresse à un public plus restreint (principalement la formation en entreprise et la prospection de ventes personnalisées).

L'animation d'image à 4,7% représente des utilisateurs qui téléchargent une photo fixe et ajoutent du mouvement — un choix populaire pour donner vie à des œuvres d'art, des photos anciennes ou des images de produits.

La langue de la vidéo AI : Un phénomène de 24 langues

Voici quelque chose qui nous a vraiment surpris. Si vous supposiez que la création de vidéos AI est principalement une activité anglophone, les données disent le contraire.

L'anglais ne représente que 47,3% de tous les prompts. Cela signifie que plus de la moitié de tous les prompts vidéo AI sur Vivideo sont écrits dans des langues non anglaises.

Ce n'est pas juste "un peu international". C'est un phénomène mondial, avec une adoption significative sur chaque continent.

Connexions réseau mondiales illustrées sur une carte du monde
Langue% de Prompts
Anglais47,3%
Vietnamien23,1%
Arabe11,4%
Russe3,2%
Turc2,7%
Allemand2,2%
Ukrainien1,9%
Indonésien1,7%
Espagnol1,3%
Néerlandais0,9%
Hébreu0,7%
Polonais0,7%
Chinois0,6%
Portugais0,6%
Suédois0,5%
Grec0,4%

Quelques éléments ressortent :

Le vietnamien à 23,1% est énorme. Près d'un quart de tous les prompts sont en vietnamien. Cela reflète l'économie numérique en plein essor du Vietnam et l'adoption précoce des outils AI pour la création de contenu. Les créateurs vietnamiens utilisent la vidéo AI pour tout, des vidéos de produits e-commerce au contenu sur les réseaux sociaux à grande échelle.

L'arabe à 11,4% fait de la région MENA l'un des marchés de vidéo AI les plus actifs. Étant donné la transformation numérique rapide qui se produit dans les États du Golfe et l'énorme investissement dans l'infrastructure AI, cela se vérifie.

La longue traîne est réelle. Au-delà des langues principales, il y a une activité significative en russe, turc, allemand, ukrainien, indonésien, et bien d'autres. La vidéo AI n'est pas un jouet de la Silicon Valley — c'est un outil créatif mondial.

Cela a d'énormes implications pour quiconque construit dans cet espace : si votre outil de vidéo AI ne fonctionne bien qu'avec des prompts en anglais, vous ignorez plus de la moitié de vos utilisateurs potentiels.

Préférences de format : Rapports d'aspect et durées

Comment les gens formatent leurs vidéos en dit long sur l'endroit où ces vidéos vont finir.

Rapports d'aspect

Rapport d'aspectPourcentage
16:9 (Paysage)52,8%
9:16 (Portrait/Vertical)43,7%
1:1 (Carré)~0%

La répartition paysage vs portrait est remarquablement proche — 52,8% contre 43,7% — ce qui nous dit quelque chose d'important : la bataille entre la vidéo horizontale et verticale est essentiellement un tirage au sort.

Le paysage reste en tête, probablement en raison de YouTube, des intégrations de sites web, des présentations et du contenu marketing traditionnel. Mais la verticale est juste derrière, alimentée par TikTok, Instagram Reels et YouTube Shorts.

La véritable surprise ? La vidéo carrée (1:1) est essentiellement morte. À environ 0%, personne ne crée plus de vidéos carrées. Le format carré ancien d'Instagram, autrefois le défaut pour les réseaux sociaux, a été complètement abandonné à l'ère de la vidéo AI.

Création de contenu sur les réseaux sociaux sur plusieurs appareils montrant différents rapports d'aspect

Durées de vidéo

DuréePourcentage
12 secondes30,1%
4 secondes29,2%
8 secondes23,3%
6 secondes6,6%

Les préférences de durée révèlent une fascinante division en deux camps :

Camp 1 : Le groupe des 12 secondes (30,1%). Ces utilisateurs veulent la durée maximale disponible. Ils créent du contenu narratif, des démonstrations de produits et des vidéos promotionnelles où chaque seconde supplémentaire compte. Douze secondes suffisent pour raconter une mini-histoire : mise en place, révélation, résultat.

Camp 2 : Le groupe des 4 secondes (29,2%). Ces utilisateurs veulent des clips rapides et percutants — parfaits pour des accroches sur les réseaux sociaux, des créations publicitaires, ou pour empiler plusieurs clips dans des montages plus longs. Quatre secondes représentent essentiellement un moment visuel fort.

Le juste milieu de 8 secondes (23,3%) capture les utilisateurs qui veulent un peu plus de temps que 4 secondes mais n'ont pas besoin des 12 complètes. La popularité relativement faible des vidéos de 6 secondes (6,6%) est intéressante — il semble que les gens préfèrent s'engager soit dans le "court" soit dans le "long" plutôt que de partager la différence.

La course aux modèles : Veo 3.1 prend la tête

S'il y a une statistique phare de toute cette analyse, ce pourrait être celle-ci :

Veo 3.1 alimente 96,4% de toute la génération de vidéos AI sur Vivideo.

Ce n'est pas une faute de frappe. Le modèle Veo 3.1 de Google est le choix écrasant pour la création de vidéos AI.

Modèle% d'utilisation
Veo 3.196,4%
Sora 22,0%
HeyGen (Avatars)10,5% de toutes les commandes

Remarque : La génération d'avatars HeyGen est comptée séparément car elle sert une fonction différente (avatars numériques contre génération de scènes). Sa part de 10,5% se chevauche avec la catégorie avatar dans notre analyse des cas d'utilisation.

Pourquoi Veo 3.1 domine-t-il si complètement ? D'après les retours des utilisateurs et nos propres tests :

  • Qualité visuelle. Veo 3.1 produit systématiquement les sorties les plus photoréalistes et visuellement cohérentes.
  • Adhésion aux prompts. Il suit les prompts complexes de manière plus fidèle — mouvements de caméra, spécifications d'éclairage, directives de style.
  • Vitesse. Les temps de génération sont compétitifs, et le rapport qualité-vitesse est le meilleur de sa catégorie.
  • Consistance. Moins de "bizarreries AI" — moins de mains fondantes, de physiques impossibles et de moments de vallée étrange.

Sora 2 à 2,0% a encore ses fans, en particulier pour un contenu plus artistique et stylisé. Mais le marché a parlé, du moins pour l'instant : lorsque les gens veulent une vidéo AI fiable et de haute qualité, ils choisissent Veo 3.1.

Visualisation de l'intelligence artificielle avec des motifs de réseau neuronal

Découvertes surprenantes

Chaque bonne analyse de données révèle des choses que vous ne vous attendiez pas. Voici les modèles qui nous ont fait faire un double take.

1. Le taux de modération de contenu de 9%

Environ 9% de tous les prompts ont été signalés par les systèmes de modération de contenu comme étant du contenu adulte ou inapproprié. C'est en fait inférieur à ce que beaucoup dans l'industrie s'attendaient — certaines estimations placent le taux de tentative de contenu adulte pour les générateurs d'images AI à 15-20%.

Que signifie cela ? La création de vidéos AI est plus professionnelle et intentionnelle que la génération d'images AI. Lorsque vous payez pour la génération de vidéos (contrairement à jouer avec un outil d'image gratuit), l'intention est plus sérieuse et les cas d'utilisation sont plus orientés vers les affaires.

2. L'effet carte d'anniversaire

Les salutations personnelles — anniversaires, vacances, anniversaires — sont apparues beaucoup plus que nous ne l'avions prévu. Ce ne sont pas les cas d'utilisation flashy qui sont présentés dans les bandes-annonces AI, mais ils représentent une application vraiment réconfortante de la technologie. Les gens créent des messages vidéo personnalisés qui auraient été impossibles (ou prohibitivement coûteux) il y a seulement deux ans.

3. La mort de la vidéo carrée

Nous l'avons déjà mentionné, mais cela mérite d'être répété : la vidéo carrée 1:1 est à effectivement 0%. Le format qui a dominé Instagram de 2012 à 2019 a été complètement abandonné. Si votre outil vidéo par défaut est toujours carré, vous résolvez le problème d'hier.

4. L'économie des créateurs vietnamiens

À 23,1% de tous les prompts, le vietnamien n'est pas seulement représenté — c'est la deuxième langue la plus populaire avec une énorme marge, plus du double de l'arabe en troisième position à 11,4%. L'économie des créateurs du Vietnam est clairement à un point d'inflexion, et les outils vidéo AI en sont un accélérateur clé.

5. Personne ne veut de vidéos de 6 secondes

Avec seulement 6,6% des commandes, le format de 6 secondes est la durée la moins populaire. Les utilisateurs préfèrent fortement soit le "court et percutant" (4s) soit le "long" (12s). Le juste milieu ne résonne tout simplement pas. Cela reflète ce que nous avons vu dans les tendances des réseaux sociaux — le contenu est soit un crochet rapide, soit une mini-narration, avec peu de place pour le milieu.

Ce que cela signifie pour les créateurs

Vous avez donc vu les données. Que devriez-vous réellement faire avec cela ?

Que vous soyez un marketeur, un créateur de contenu, un propriétaire d'entreprise, ou simplement quelqu'un de curieux à propos de la vidéo AI, voici les points à retenir :

1. Commencez par le texte-à-vidéo

Si vous n'avez pas encore essayé la vidéo AI, le texte-à-vidéo est là où se trouve l'action. Deux tiers des utilisateurs commencent ici, et pour une bonne raison — vous n'avez besoin d'aucun actif, juste d'idées. Décrivez ce que vous voulez voir, et l'AI le construit.

2. Pensez en 4s ou 12s

Lorsque vous planifiez vos vidéos AI, pensez en termes de coups de 4 secondes ou d'histoires de 12 secondes. Les données montrent que ce sont les durées qui résonnent. Pour des accroches sur les réseaux sociaux et des créations publicitaires, optez pour 4 secondes. Pour des démonstrations de produits, des explications et du contenu narratif, utilisez les 12 complètes.

3. Choisissez votre orientation délibérément

Ne vous contentez pas du paysage. Si votre contenu est destiné à TikTok, Reels ou Shorts, optez pour le vertical 9:16. Si c'est pour YouTube, votre site web ou des présentations, optez pour le 16:9. Et oubliez le carré — le marché a évolué.

4. Ne négligez pas les marchés non anglophones

Si vous construisez une entreprise autour du contenu vidéo AI, les données montrent une demande massive des marchés vietnamien, arabe, russe et turc. Ce ne sont pas des audiences de niche — elles représentent des centaines de millions de spectateurs potentiels.

5. Utilisez l'image-à-vidéo pour le contenu produit

Bien que le texte-à-vidéo domine globalement, l'image-à-vidéo est l'arme secrète pour le e-commerce et le marketing de produits. Téléchargez votre photo de produit et ajoutez du mouvement, du contexte et de la vie. C'est plus rapide qu'une séance photo et infiniment plus évolutif.

Équipe créative collaborant sur la stratégie de contenu avec ordinateurs portables et notes

6. Veo 3.1 est le choix sûr

Si vous vous demandez quel modèle utiliser, les données sont claires : 96,4% des utilisateurs choisissent Veo 3.1. Il offre la meilleure combinaison de qualité, de vitesse et d'adhésion aux prompts. Commencez par là, et expérimentez avec des alternatives comme Sora 2 pour des styles créatifs spécifiques.

En résumé : La vidéo AI n'est plus une nouveauté. Avec plus de 120 000 vidéos générées, des prompts dans plus de 24 langues, et des cas d'utilisation allant des cartes d'anniversaire aux visites immobilières, c'est un outil créatif grand public. La question n'est pas de savoir s'il faut l'utiliser — mais comment l'utiliser mieux que tout le monde.

Prêt à voir ce que vous pouvez créer ? Essayez Vivideo gratuitement et ajoutez vos prompts au prochain jeu de données.

Explorer davantage

Essayez ces outils

Prêt à créer vos propres vidéos AI ?

Essayez Vivideo gratuitement dès aujourd'hui - carte de crédit non requise. Créez des vidéos professionnelles en quelques minutes.

Commencez à créer gratuitement