業界

40,000以上のAIビデオプロンプトを分析しました — 人々が実際に作成するものはこれです

2026年2月23日
14 分で読めます
共有:
40,000以上のAIビデオプロンプトを分析しました — 人々が実際に作成するものはこれです

要点

  • 1テキストからビデオへの生成が全注文の65.7%を占め、画像からビデオへの生成は32.6%です
  • 2AIビデオの88.2%は生成されたシーンであり、アバターやアニメーションではなく、テキストから完全に想像された世界です
  • 3AIビデオ制作は真にグローバルで、プロンプトは24以上の言語で提供され、英語はわずか47.3%です
  • 4Veo 3.1はモデル使用の96.4%を占め、AIビデオモデルレースの明確な勝者を示しています
  • 516:9の横長(52.8%)が9:16の縦長(43.7%)をわずかに上回り、TikTokとYouTubeの分裂をリアルタイムで示しています
執筆者

Vivideo チーム

Vivideo チームは、AIを通じて誰もが動画作成にアクセスできるようにすることに情熱を注いでいます。最新のツールをテスト・レビューし、成功に役立つ知識を共有しています。

私たちは40,000以上のAIビデオプロンプトを分析しました

誰もがAIビデオについて意見を持っています。専門家たちはその行く先を予測します。Twitterでは「もう十分良いのか?」と議論されています。YouTubeのサムネイルは最新のモデルアップデートについて叫んでいます。

しかし、ほとんど誰もが今、これらのツールを使って人々が実際に何を作っているかについて話しません。

そこで私たちは調べることにしました。

私たちはVivideoで作成された120,000以上のAI生成ビデオからデータを抽出し、GPT-4o-miniを使用して40,000以上のプロンプトのサンプルを分類し、数字を分析しました。そこから浮かび上がったのは、2025年にリアルな人々—インフルエンサーでも研究者でもなく、日常のクリエイターやビジネス—がAIビデオをどのように使用しているかの驚くほど詳細な肖像です。

私たちが見つけたすべてのことはこちらです。

データ分析ダッシュボードのカラフルなチャートとグラフ

データセット:これらの数字を得た方法

あなたが何を見ているのか正確に理解できるように、方法論を説明しましょう。

私たちの完全なデータセットは、Vivideoのプラットフォームを通じて生成された120,000以上の動画にわたります。詳細なプロンプト分析のために、915のプロンプトの層別サンプルを取り、GPT-4o-miniを通じてユースケースカテゴリに分類しました。モデルの使用状況、アスペクト比、長さ、言語、入力タイプといった広範な統計は、完全なデータセットから得られています。

私たちは選り好みをしませんでした。「印象的な」出力のためにフィルタリングもしませんでした。これは、実際のユーザーが実際の作業を行っている生の未加工データです(はい、その中にはお母さんのために誕生日動画を作っている人々も含まれています — それは素晴らしいことです)。

いくつかの注意点:AIによるプロンプト分類は完璧ではありません。一部のプロンプトは曖昧です。「人が話している製品動画」は、製品デモまたはアバタービデオのいずれかとしてタグ付けされる可能性があります。私たちは最も可能性の高い意図に最適化し、数百の分類を手動でスポットチェックしました。

それでは、さっそく始めましょう。

全体像: テキストからビデオへ vs. 画像からビデオへ

私たちが最初に尋ねた質問はシンプルでした: 人々はどのようにしてビデオを始めていますか?

彼らはゼロからプロンプトを入力していますか?それとも画像をアップロードして命を吹き込んでいますか?

65.7% のすべてのビデオ注文はテキストからビデオです。 32.6% は画像からビデオです。残りの約1.7%はアバター生成などの他の方法を使用しています。

これはやや驚きでした。私たちは画像からビデオの方が多いと予想していました — 結局のところ、AIに視覚的な出発点を与えるので「簡単」だと言えます。しかし、データは異なる物語を語っています: ユーザーの3分の2は自分のビジョンを言葉で説明することを好み、AIに視覚を考えさせています。

なぜでしょうか?いくつかの理論があります:

  • 参入障壁が低い。 正しい画像を持っている必要も、見つける必要もありません。欲しいことをただ入力するだけです。 テキストからビデオは究極の真っ白なキャンバスです。
  • より多くの創造的コントロール。 テキストプロンプトを使用すると、ムード、カメラの動き、照明、スタイルを指定できます — 静的な画像では伝えにくいものです。
  • 「想像のギャップ」。 多くのユーザーはまだ存在しないシーンを作成しています — ファンタジーの世界、製品コンセプト、物語のシーケンス。まだ構築されていないものの写真をアップロードすることはできません。
画像からビデオには独自の忠実なオーディエンスがあります。特にeコマースの製品アニメーション、不動産のウォークスルー(物件の写真から始める)、アートワークを生き生きとさせるために人気があります。

カメラとクリエイティブな照明を使ったプロフェッショナルなビデオ制作セットアップ

人々が実際に作成するもの(ユースケースの内訳)

これは私たちが最も楽しみにしていたセクションです。915のサンプルプロンプトをユースケース別に分類したとき、1つのカテゴリーが圧倒的に支配していました。

ユースケース割合
AI生成のビデオシーン88.2%
アバター / トーキングヘッドビデオ7.1%
画像アニメーション4.7%

これを考えてみてください。 AIビデオのほぼ9割は完全に生成されたシーンです — 誰かの顔がカメラに向かって話しているわけでもなく、写真にケン・バーンズ効果がかかっているわけでもなく、テキストの説明から conjuredされた完全な視覚シーンです。

これが2025年のAIビデオの本当の物語です:人々はそれを視覚的想像エンジンとして使用しています。

それらのシーンは実際にどのように見えるか

私たちは88.2%のデータをさらに掘り下げて、人々が生成しているシーンの種類を理解しました。カテゴリーは重複しますが(プロモーションビデオは物語性を持つこともあります)、私たちが観察した主なパターンは以下の通りです:

  • プロモーションビデオ — 企業が広告、ブランドビデオ、マーケティングコンテンツを作成しています。地元のレストランのプロモーションからSaaS製品のローンチまで、さまざまです。
  • 教育コンテンツ — 説明ビデオ、チュートリアル、"どのように機能するか"のシーケンス。教師、コースクリエイター、企業トレーナーが初期のパワーユーザーです。
  • ソーシャルメディアコンテンツ — TikTok、Instagram Reels、YouTube Shorts向けにデザインされた短くてインパクトのあるクリップ。トレンドに基づいており、最大限のスクロールストッピング効果を狙っています。
  • ストーリーテリングと物語 — 短編映画、ミュージックビデオのコンセプト、物語のシーケンス。ここには最もクリエイティブなプロンプトが存在します — 人々が4〜12秒で全く新しい世界を構築しています。
  • 製品デモンストレーション — Eコマースの販売者がライフスタイルコンテキストで製品を紹介します。「夕日が沈む山道でランナーが履いているスニーカーを見せて」 — そのようなものです。
  • 個人的な挨拶とお祝い — 誕生日メッセージ、ホリデーカード、記念日のサプライズ。AIビデオは新しいホールマークカードです。
  • 不動産ツアー — バーチャルプロパティウォークスルー、近隣の紹介、建築ビジュアライゼーション。
  • Eコマース製品ショーケース — 製品の美しいショット、360°スタイルの公開、製品をプレミアムに見せるライフスタイルコンテキストのビデオ。

アバター/トーキングヘッドカテゴリー(7.1%)は、AIアバターに関するすべての話題を考えると、予想よりも小さいです。これは部分的には、アバター生成が専門的なユースケースであり、異なるワークフローを必要とし、狭いオーディエンス(主に企業トレーニングやパーソナライズされた営業アプローチ)にアピールするためです。

画像アニメーションの4.7%は、静止写真をアップロードして動きを加えるユーザーを表しています — アートワーク、古い写真、または製品画像を生き生きとさせるための人気の選択肢です。

AIビデオの言語:24言語の現象

私たちを本当に驚かせたことがあります。AIビデオ制作が主に英語を話す活動であると仮定していたなら、データはそれとは異なることを示しています。

英語はすべてのプロンプトの47.3%を占めています。つまり、VivideoのすべてのAIビデオプロンプトの半分以上が非英語の言語で書かれています

これは単なる「少し国際的」ではありません。これは世界的な現象であり、すべての大陸での重要な採用があります。

世界地図に示されたグローバルネットワーク接続
言語プロンプトの割合
英語47.3%
ベトナム語23.1%
アラビア語11.4%
ロシア語3.2%
トルコ語2.7%
ドイツ語2.2%
ウクライナ語1.9%
インドネシア語1.7%
スペイン語1.3%
オランダ語0.9%
ヘブライ語0.7%
ポーランド語0.7%
中国語0.6%
ポルトガル語0.6%
スウェーデン語0.5%
ギリシャ語0.4%

いくつかのことが目立ちます:

ベトナム語の23.1%は非常に大きいです。すべてのプロンプトのほぼ4分の1がベトナム語です。これは、ベトナムの急成長するデジタルクリエイター経済とコンテンツ制作のためのAIツールの早期採用を反映しています。ベトナムのクリエイターは、eコマース製品ビデオからソーシャルメディアコンテンツまで、AIビデオを大規模に使用しています。

アラビア語の11.4%はMENA地域を最も活発なAIビデオ市場の一つにしています。湾岸諸国で進行中の急速なデジタル変革とAIインフラへの大規模な投資を考えると、これは納得がいきます。

ロングテールは実在します。主要な言語を超えて、ロシア語、トルコ語、ドイツ語、ウクライナ語、インドネシア語などで意味のある活動があります。AIビデオはシリコンバレーのおもちゃではなく、グローバルなクリエイティブツールです。

これはこの分野で構築しているすべての人にとって大きな意味を持ちます:もしあなたのAIビデオツールが英語のプロンプトでしかうまく機能しないなら、あなたは潜在的なユーザーの半分以上を無視していることになります。

フォーマットの好み:アスペクト比と長さ

人々が動画をフォーマットする方法は、その動画がどこに行くかについて多くのことを教えてくれます。

アスペクト比

アスペクト比割合
16:9 (横向き)52.8%
9:16 (縦向き)43.7%
1:1 (正方形)~0%

横向きと縦向きの分割は非常に接近しています — 52.8% 対 43.7% — これは重要なことを示しています:横動画と縦動画の戦いは本質的にコインの裏表のようなものです。

横向きがまだリードしていますが、これはYouTube、ウェブサイトの埋め込み、プレゼンテーション、伝統的なマーケティングコンテンツによって推進されている可能性があります。しかし、縦向きもTikTok、Instagram Reels、YouTube Shortsによってすぐ後ろに迫っています。

本当に驚くべきことは? 正方形の動画 (1:1) は実質的に死んでいます。 約0%で、誰も正方形の動画を作成していません。Instagramの古い正方形フォーマットは、かつてソーシャルメディアのデフォルトでしたが、AI動画の時代に完全に放棄されています。

異なるアスペクト比を示す複数のデバイスでのソーシャルメディアコンテンツ作成

動画の長さ

長さ割合
12秒30.1%
4秒29.2%
8秒23.3%
6秒6.6%

長さの好みは、興味深い二つのキャンプの分割を明らかにします:

キャンプ1:12秒のクルー (30.1%)。 これらのユーザーは、最大の利用可能な長さを求めています。彼らは、ナarrativeコンテンツ、製品デモ、プロモーション動画を作成しており、追加の秒数が重要です。12秒はミニストーリーを語るのに十分です:設定、明らかにする、報酬。

キャンプ2:4秒のクルー (29.2%)。 これらのユーザーは、迅速でインパクトのあるクリップを求めています — ソーシャルメディアのフック、広告クリエイティブ、または複数のクリップを長い編集にまとめるのに最適です。4秒は基本的に一つの強いビジュアルモーメントです。

8秒の中間地帯 (23.3%) は、4秒よりも少し余裕が欲しいが、12秒のフルは必要ないユーザーを捉えています。6秒の動画の比較的低い人気 (6.6%) は興味深いです — 人々は「短い」または「長い」のどちらかにコミットすることを好むようです。

モデルレース:Veo 3.1が圧倒的に勝利

この分析全体からの見出しの統計は、これかもしれません:

Veo 3.1はVivideoでのすべてのAIビデオ生成の96.4%を占めています。

これは誤植ではありません。GoogleのVeo 3.1モデルは、AIビデオ制作の圧倒的な選択肢です。

モデル使用率
Veo 3.196.4%
Sora 22.0%
HeyGen(アバター)すべての注文の10.5%

注:HeyGenアバター生成は異なる機能(デジタルアバター対シーン生成)を提供するため、別々にカウントされています。その10.5%のシェアは、私たちのユースケース分析のアバターカテゴリーと重なります。

なぜVeo 3.1がこれほど完全に支配しているのでしょうか?ユーザーのフィードバックと私たち自身のテストに基づいて:

  • 視覚的品質。 Veo 3.1は常に最もフォトリアルで視覚的に一貫した出力を生成します。
  • プロンプトの遵守。 複雑なプロンプトに対してより忠実に従います — カメラの動き、照明の仕様、スタイルの指示。
  • スピード。 生成時間は競争力があり、品質とスピードの比率は業界最高です。
  • 一貫性。 「奇妙なAIアーティファクト」が少ない — 溶けた手、不可能な物理、そして不気味の谷の瞬間が減少しています。

Sora 2は2.0%でまだファンがいますが、特により芸術的でスタイライズされたコンテンツに対して。しかし、市場は少なくとも今のところはっきりとした声を上げています:人々が信頼できる高品質なAIビデオを求めるとき、彼らはVeo 3.1を選んでいます。

人工知能の視覚化とニューラルネットワークのパターン

驚くべき発見

すべての良いデータ分析は、予期しないことを明らかにします。ここに私たちが二度見したパターンがあります。

1. 9%のコンテンツモデレーション率

9%のすべてのプロンプトがコンテンツモデレーションシステムによって成人向けまたは不適切なコンテンツとしてフラグ付けされました。これは実際には業界の多くが予想していたよりも低い数字です — 一部の推定では、AI画像生成器の成人向けコンテンツの試行率は15-20%とされています。

これは何を意味するのでしょうか?AIビデオ制作は、AI画像生成よりもよりプロフェッショナルで目的志向です。ビデオ生成にお金を払っているとき(無料の画像ツールで遊ぶのとは異なり)、意図はより真剣で、使用ケースはよりビジネス志向です。

2. バースデーカード効果

個人的な挨拶 — 誕生日、休日、記念日 — は、私たちが予想していたよりもはるかに多く現れました。これらはAIデモリールで特集される派手な使用ケースではありませんが、技術の本当に心温まる応用を表しています。人々は、たった2年前には不可能だった(または非常に高価だった)パーソナライズされたビデオメッセージを作成しています。

3. 正方形ビデオの死

これについてはすでに言及しましたが、繰り返す価値があります:1:1の正方形ビデオは実質的に0%です。2012年から2019年までInstagramを支配していたフォーマットは完全に放棄されました。あなたのビデオツールがまだ正方形をデフォルトにしているなら、あなたは昨日の問題を解決していることになります。

4. ベトナムのクリエイター経済

すべてのプロンプトの23.1%を占めるベトナム語は、単に表現されているだけでなく、圧倒的な差で第二に人気のある言語です。第三位のアラビア語の11.4%を倍以上上回っています。ベトナムのクリエイター経済は明らかに転換点にあり、AIビデオツールは重要な加速器です。

5. 誰も6秒のビデオを望んでいない

6.6%の注文しかない6秒フォーマットは、最も人気のない長さです。ユーザーは短くてインパクトのある(4秒)か、長めの(12秒)を強く好みます。中間の長さは共鳴しません。これは、私たちがソーシャルメディアのトレンドで見てきたことを反映しています — コンテンツは迅速なフックかミニナラティブのいずれかであり、その間にはほとんど余地がありません。

クリエイターにとっての意味

データを見たので、実際に何をするべきでしょうか?

マーケター、コンテンツクリエイター、ビジネスオーナー、またはAI動画に興味がある人であれば、以下の実行可能なポイントを参考にしてください:

1. テキストから動画を始める

まだAI動画を試していないなら、テキストから動画がアクションの場です。ユーザーの3分の2がここから始めており、それには理由があります — 資産は必要なく、アイデアだけで済みます。見たいものを説明すれば、AIがそれを作成します。

2. 4秒または12秒で考える

AI動画を計画する際は、4秒のパンチや12秒のストーリーを考えてください。データは、これらの時間が共鳴することを示しています。ソーシャルメディアのフックや広告クリエイティブには4秒を、製品デモ、説明動画、ナarrativeコンテンツには12秒を使用してください。

3. オリエンテーションを意図的に選ぶ

横向きにデフォルト設定しないでください。コンテンツがTikTok、Reels、またはShortsに向かう場合は、9:16の縦向きにしてください。YouTube、あなたのウェブサイト、またはプレゼンテーション用の場合は、16:9にしてください。そして、正方形は忘れてください — 市場は進化しています。

4. 非英語市場を軽視しない

AI動画コンテンツを中心にビジネスを構築しているなら、データはベトナム語、アラビア語、ロシア語、トルコ語を話す市場からの巨大な需要を示しています。これらはニッチなオーディエンスではなく、数億人の潜在的な視聴者を代表しています。

5. 製品コンテンツには画像から動画を使用する

テキストから動画が全体的に支配している一方で、画像から動画はeコマースや製品マーケティングの秘密兵器です。製品写真をアップロードし、動き、コンテキスト、命を加えてください。フォトシュートよりも速く、無限にスケーラブルです。

クリエイティブチームがラップトップとノートを使ってコンテンツ戦略を協力している

6. Veo 3.1は安全な選択

どのモデルを使用するか迷っているなら、データは明確です:ユーザーの96.4%がVeo 3.1を選択しています。これは、品質、速度、プロンプトの遵守の最良の組み合わせを提供します。ここから始めて、特定のクリエイティブスタイルのためにSora 2などの代替案を試してみてください。

結論:AI動画はもはや新しいものではありません。120,000以上の動画が生成され、24以上の言語でプロンプトがあり、誕生日カードから不動産ツアーまでのユースケースが広がっており、これは主流のクリエイティブツールです。問題は使用するかどうかではなく、他の誰よりも上手に使う方法です。

何を作成できるか見てみたいですか? Vivideoを無料で試して、次のデータセットにあなたのプロンプトを追加してください。

さらに見る

これらのツールを試す

自分だけのAI動画を作成する準備はできましたか?

今すぐVivideoを無料でお試しください - クレジットカードは不要です。数分でプロ並みの動画を作成できます。

無料で作り始める