
| 開発元 | Zhipu AI |
| 提供元地域 | 中国 |
| 提供開始 | CogVideoX 1.5 · Nov 2024 |
| ネイティブ音声対応 | ナレーションを追加 |
| 最大解像度 | 1360×768 |
| 最大クリップ長 | 6~10秒 |
| 配布形態 | オープンウェイト · オープン重み(2B: Apache 2.0) |
| 提供形態 | Open weights · Z.ai API |
| 価格(最安) | Free (open) · API |
CogVideoXは、手軽で柔軟なテキスト/画像からの動画生成に最適な、アクセスしやすいオープンモデルを求める場面に向いています。
背景. Zhipu AIと清華大学THUDMによるCogVideoX(1.5、2024年11月)は、コンシューマー環境で動作し、ICLR採択の設計を持つ初期のオープン動画モデルの中でも特にフォーク数の多い一つです。
Vivideoを開き、新規動画を開始。
CogVideoXをモデルとして選択 — もしくはVideo Agentに自動選択させる。
ショットの内容を説明(または画像をアップロード)し、尺とアスペクト比を設定。
CogVideoXで生成し、微調整して声やアバターを追加。各プラットフォーム向けに書き出す。
各モデルはVivideoにある30以上のひとつ。ショットごとに切り替えて、狙いどおりのルックを実現。








Zhipu AIのCogVideoXは、テキスト・画像からの動画生成に対応する広く使われるオープンソースモデルで、その開放性ゆえにコミュニティでの実験にも人気です。
毎日のクリップ制作や、テキスト/画像入力を跨いだ素早い反復に、柔軟で使いやすいエンジンを求めるクリエイターに向いています。
Vivideoでは、CogVideoXは30以上のモデルの一つとして単一サブスクリプションで利用可能。日常の万能モデルとして使い、より磨き上げが必要なショットではVeoやSoraに切り替える、といった運用が同一プロジェクトで完結します。
まずはVivideoでCogVideoXを無料でお試しできます。クレジットカードは不要です。より重い利用やプレミアムモデルは有料プランの対象です。
CogVideoXはアクセスしやすいオープンモデルで、テキストからも画像からも動画生成をそつなくこなす、日常使いに柔軟な選択肢です。
はい。VivideoではCogVideoXでテキスト・画像の双方から動画を生成でき、ショット単位で他モデルへ切り替えることも可能です。
はい。Vivideoではショットごとにモデルを切り替えられるため、同一プロジェクト内でCogVideoXと他エンジンを組み合わせられます。