Zentrale Ergebnisse
- Über 30+ Modelle hinweg renderte ein standardisierter 5‑Sekunden‑Clip in ~33s bis ~540s — eine 16×‑Spanne.
- Der Median der Renderzeit lag bei ~150 Sekunden; „fast/turbo“-Stufen lagen gebündelt deutlich unter einer Minute.
- Renderzeit skaliert mit Auflösung, Dauer und nativer Audiosynthese — nicht nur mit dem Modell.
- Modellspezifische Zeitabschätzungen treiben nun die Vivideo‑Ladeanzeige: Die Wartezeit wird angezeigt, nicht geraten.
Warum wir das gemessen haben
Die häufigste Frage neuer Nutzer lautet: „Wie lange dauert das?“ Bisher war die ehrliche Antwort „kommt darauf an“ — auf das Modell, die Auflösung, die Länge und darauf, ob der Clip native Audiospur enthält. Wir wollten eine echte Antwort und haben deshalb denselben standardisierten Text‑zu‑Video‑Prompt über jedes auf Vivideo verfügbare Modell laufen lassen und die Echtzeit von Absenden bis zum fertigen, abspielbaren Clip gemessen.
Das Ergebnis ist weniger eine Rangliste als eine Landkarte: Es gibt kein pauschales „schnell“ oder „langsam“ — es gibt ein Band, und wo ein Modell darin liegt, zeigt, wozu man es greifen sollte: zum Iterieren versus fürs finale Rendering.
Die Streuung
Ein standardisierter 5‑Sekunden‑Clip renderte am schnellen Ende in rund 33 Sekunden und am langsamen Ende nahe 9 Minuten (≈540s) — etwa ein 16×‑Unterschied. Der Median lag bei rund 150 Sekunden. Die schnellsten Ergebnisse kamen aus den „fast“- und „turbo“-Stufen, die etwas Qualität gegen Tempo tauschen; die langsamsten waren die höchstauflösenden, längeren und 4K‑mit‑Audio‑Render.
| Stufe | Typische Renderzeit | Am besten geeignet für |
|---|---|---|
| Schnell / Turbo | ~30–60s | Prompts iterieren, Entwürfe, Social‑Entwürfe |
| Standard | ~90–180s | Die meisten fertigen Social‑ + Marketing‑Clips |
| Hohe Detailtreue / 4K / Audio | ~180–540s | Hero‑Shots, finale Cuts, cineastische Ausgabe |
Was die Wartezeit wirklich treibt
Die Auflösung ist der größte Hebel: 4K‑Render dauern deutlich länger als 1080p. Danach kommt die Dauer — ein 10‑Sekunden‑Clip ist nicht einfach nur doppelt so lang wie 5 Sekunden, aber konsistent langsamer. Native Audiosynthese erhöht die Zeit bei Modellen, die sie erzeugen. Und die Queue‑Auslastung zählt: Zu Spitzenzeiten ist jedes Modell etwas langsamer, weshalb wir Bänder statt Einzelzahlen angeben.
Was wir daraus gemacht haben
Wir haben die modellgenauen Messwerte im Produkt verankert. Statt eines generischen „Bitte warten“-Spinners zeigt Vivideo nun eine Ladeprognose, die auf das gewählte Modell kalibriert ist — die Fortschrittsanzeige spiegelt also die Realität. Praktischer Merksatz für Creators: Iteriere auf einer schnellen Stufe und rendere den finalen Cut auf dem hochauflösenden Modell, sobald der Prompt sitzt. Die lange Renderzeit investierst du einmal — in die Version, die du wirklich veröffentlichst.