
| 개발사 | Zhipu AI |
| 출시 지역 | 중국 |
| 출시 | CogVideoX 1.5 · Nov 2024 |
| 원본 오디오 포함 | 보이스오버 추가 |
| 최대 해상도 | 1360×768 |
| 최대 클립 길이 | 6–10초 |
| 공개 형태 | 오픈 웨이트 · 오픈 웨이트 (2B: Apache 2.0) |
| 접근 방식 | Open weights · Z.ai API |
| 가격 시작 | Free (open) · API |
CogVideoX는 접근성 좋은 오픈 모델이 잘 맞는, 빠르고 유연한 텍스트·이미지 투 비디오에 최적입니다.
배경. Zhipu AI와 칭화대 THUDM이 개발한 CogVideoX(1.5, 2024년 11월)는 소비자 하드웨어에서 구동 가능한, 가장 많이 포크된 초기 오픈 비디오 모델 중 하나로 ICLR 채택 설계를 갖추고 있습니다.
Vivideo를 열고 새 비디오를 시작하세요.
모델로 CogVideoX를 선택하거나, Video Agent가 자동으로 선택하도록 하세요.
샷을 설명하거나 이미지를 업로드하고, 길이와 화면비를 설정하세요.
CogVideoX로 생성한 뒤 다듬고, 목소리나 아바타를 추가해 어떤 플랫폼이든 내보내세요.
각 모델은 Vivideo의 30개+ 중 하나입니다 — 샷마다 전환해 원하는 룩을 정확히 얻으세요.








Zhipu AI의 CogVideoX는 텍스트·이미지 투 비디오를 지원하는 널리 쓰이는 오픈소스 비디오 모델로, 개방성 덕분에 실험과 커뮤니티 활용이 활발합니다.
CogVideoX는 텍스트와 이미지 입력 전반에서 빠른 반복과 일상적 클립 제작을 원하는 크리에이터에게 유연하고 접근성 좋은 엔진입니다.
Vivideo에서는 하나의 구독으로 30개 이상의 모델을 이용할 수 있습니다 — 일상용으로 CogVideoX를 쓰다가, 더 높은 완성도가 필요할 땐 같은 프로젝트 안에서 Veo나 Sora로 손쉽게 격상하세요.
Vivideo에서 CogVideoX를 무료로 체험해 볼 수 있습니다 — 신용카드 불필요. 고용량 사용과 프리미엄 모델은 유료 요금제가 적용됩니다.
CogVideoX는 접근성 높은 오픈 모델로, 텍스트 투 비디오와 이미지 투 비디오를 모두 안정적으로 처리해 일상적 제작에 유연한 선택지입니다.
네 — Vivideo에서 CogVideoX로 텍스트 투 비디오와 이미지 투 비디오를 모두 사용할 수 있으며, 샷별로 다른 모델로 전환할 수 있습니다.
네 — Vivideo는 샷별 모델 전환을 지원하므로, 한 프로젝트에서 CogVideoX와 다른 엔진을 혼합해 사용할 수 있습니다.