Glossario

Il dizionario del video con intelligenza artificiale

Ogni termine che incontrerai creando video con intelligenza artificiale — dalle basi di camera e codec a diffusion, avatar e generazione agentica — spiegato in modo chiaro e semplice.

74 termini · Video · Intelligenza artificiale · Video con intelligenza artificiale

74 termini
AddestramentoIntelligenza artificiale
Addestrare un modello mostrandogli enormi quantità di dati e regolando gradualmente i suoi parametri interni finché non produce buoni risultati.
AllucinazioneIntelligenza artificiale
Quando un modello produce output sicuro di sé ma errato o inventato — come testo confuso, dita extra o movimenti impossibili.
Apprendimento profondoIntelligenza artificiale
Apprendimento automatico che usa reti neurali con molti strati. Alimenta gli attuali modelli di immagini, video, voce e linguaggio.
Avatar con intelligenza artificialeVideo con intelligenza artificiale
Un presentatore su schermo generato o clonato con intelligenza artificiale che può leggere il tuo script nella voce e lingua scelte.
B-rollVideo
Riprese di supporto montate sopra l’inquadratura principale per aggiungere contesto, illustrare un punto o coprire un taglio.
BitrateVideo
Quanti dati vengono usati per ogni secondo di video, misurati in kbps o Mbps. Un bitrate più alto conserva più dettaglio ma genera file più pesanti.
BokehVideo
Il morbido e gradevole sfocato sullo sfondo di un’inquadratura, spesso reso come cerchi di luce brillanti.
CheckpointIntelligenza artificiale
Un’istantanea salvata dei pesi di un modello. I checkpoint sono spesso condivisi come “file del modello” scaricabili da eseguire.
Chroma key (green screen)Video
Sostituire uno sfondo a tinta unita — di solito verde — con un’altra immagine o video rendendo trasparente quel colore.
Clonazione vocaleVideo con intelligenza artificiale
Ricreare la voce specifica di una persona da un breve campione, così da poter leggere nuovo testo con la stessa voce.
CodecVideo
L’algoritmo che comprime e decomprime il video — ad esempio H.264, H.265/HEVC, AV1 o VP9. Bilancia qualità visiva e dimensione del file.
Coerenza temporaleVideo con intelligenza artificiale
Mantenere stabili personaggi, oggetti e stile da un frame all’altro così che il video non sfarfalli, si deformi o cambi in modo innaturale.
Color gradingVideo
La fase creativa di regolazione di colore, contrasto e mood del girato in post‑produzione per dargli un look coerente e intenzionale.
CompositingVideo
Sovrapporre più elementi visivi — girato, grafiche, effetti, testo — in un unico frame combinato.
Container (formato file)Video
L’involucro che contiene insieme video, audio e metadati — MP4, MOV, WebM o MKV. È separato dal codec archiviato al suo interno.
Controllo cameraVideo con intelligenza artificiale
Dirigere i movimenti di una camera virtuale — pan, zoom, orbit, dolly — all’interno di un’inquadratura generata con intelligenza artificiale.
Controllo del movimento / motion brushVideo con intelligenza artificiale
Strumenti che ti permettono di dirigere dove e come le cose si muovono in una clip generata, invece di lasciare tutto al modello.
DatasetIntelligenza artificiale
L’insieme di esempi — video, immagini, testo — su cui un modello viene addestrato. La sua qualità e varietà determinano ciò che il modello può fare.
DeepfakeVideo con intelligenza artificiale
Media sintetici che sostituiscono o fabbricano in modo realistico il volto o la voce di qualcuno. Potenti, ma sollevano seri temi di consenso, autenticità e legali.
Doppiaggio con intelligenza artificialeVideo con intelligenza artificiale
Sostituire o aggiungere audio parlato in un’altra lingua, idealmente allineato alla voce e ai movimenti labiali dello speaker.
EmbeddingIntelligenza artificiale
Una lista di numeri (un vettore) che cattura il significato di testo, immagine o audio, così che il modello possa confrontare e combinare input diversi.
Estensione videoVideo con intelligenza artificiale
Proseguire una clip oltre la sua durata originaria generando frame aggiuntivi che seguono in modo naturale.
FiligranaVideo
Un logo o un testo sovrapposto al video per indicarne la proprietà. Molti generatori gratuiti lo aggiungono; i piani a pagamento lo rimuovono.
Formato (aspect ratio)Video
Il rapporto tra larghezza e altezza dell’inquadratura — 16:9 (widescreen), 9:16 (verticale per Reels e TikTok) o 1:1 (quadrato). Decide come il tuo video si adatta a ogni piattaforma e schermo.
Frame rate (FPS)Video
Fotogrammi al secondo — quante immagini statiche scorrono ogni secondo. 24fps dà un effetto cinematografico, 30fps è lo standard per il web, 60fps appare ultra‑fluido per movimento e sport.
GANIntelligenza artificiale
Generative Adversarial Network — un metodo precedente in cui un generatore e una rete critica competono. In gran parte sostituito dalla diffusion per video di alta qualità.
HDR (High Dynamic Range)Video
Video che trasporta una gamma più ampia di luminosità e colore rispetto allo standard (SDR), per luci e ombre più realistiche e toni più ricchi.
Immagine di riferimentoVideo con intelligenza artificiale
Un’immagine che fornisci al modello per guidare soggetto, personaggio o stile del video generato.
Immagine-in-video (I2V)Video con intelligenza artificiale
Dare vita a un’immagine statica come video, spesso guidato da un prompt che descrive il movimento desiderato.
InferenzaIntelligenza artificiale
Eseguire un modello già addestrato per produrre un output — ad esempio generare il tuo video da un prompt. È ciò per cui si paga a ogni generazione.
Inpainting / outpaintingVideo con intelligenza artificiale
Riempire una parte del frame (inpainting) o estendere oltre i suoi bordi (outpainting). Nel video, usato per rimuovere, sostituire o espandere aree nel tempo.
InquadraturaVideo
Un singolo pezzo continuo di girato. Tipi comuni includono il campo lungo, il mezzo busto e il primo piano.
Inquadratura di aperturaVideo
Un’inquadratura ampia di apertura che definisce luogo e contesto di una scena prima di stringere.
Interpolazione dei frameVideo con intelligenza artificiale
Generare fotogrammi intermedi per aumentare il frame rate o rendere più fluido il movimento — ad esempio trasformare 24fps in un morbido 60fps.
KeyframeVideo
Nel montaggio, un frame marcato che imposta un valore (posizione, scala, opacità) tra cui il software anima. Nella compressione, un frame di riferimento completo da cui vengono ricostruiti i frame vicini.
LetterboxingVideo
Bande nere aggiunte sopra e sotto (o ai lati) di un video così da adattarlo a un aspect ratio diverso senza ritagliarlo.
LoRAIntelligenza artificiale
Low-Rank Adaptation — un modo leggero per insegnare a un modello un nuovo stile, personaggio o concetto con un piccolo file aggiuntivo, invece di riaddestrare l’intero modello.
LUT (Look-Up Table)Video
Un preset che rimappa i colori per applicare un look specifico in un clic o per convertire il girato tra spazi colore.
ModelloIntelligenza artificiale
Un sistema di intelligenza artificiale addestrato che trasforma un input — per esempio un prompt testuale — in un output, come un video. Modelli diversi hanno punti di forza, velocità e prezzi differenti.
Modello a pesi apertiIntelligenza artificiale
Un modello i cui pesi sono pubblicati così che chiunque possa eseguirlo, studiarlo o fare fine‑tuning (es. su fal o in locale), a differenza di un modello chiuso accessibile solo tramite API.
Modello del mondoVideo con intelligenza artificiale
Un’intelligenza artificiale che costruisce una simulazione interna di come si comportano scene, oggetti e fisica, aiutandola a generare video più lunghi, coerenti e consistenti.
Modello di baseIntelligenza artificiale
Un modello ampio e generico addestrato su dati estesi che può essere adattato a molti compiti a valle.
Modello di diffusionIntelligenza artificiale
L’approccio dominante dietro immagini e video generativi: il modello parte dal rumore casuale e, passo dopo passo, lo rimuove finché appare un risultato coerente che corrisponde al tuo prompt.
MultimodaleIntelligenza artificiale
Un modello che comprende o genera più tipi di dato insieme — ad esempio testo, immagine, video e audio.
Ottimizzazione fineIntelligenza artificiale
Ulteriore addestramento di un modello base su dati specifici per specializzarlo — per uno stile, un brand o una persona in particolare.
Parametri (pesi)Intelligenza artificiale
I numeri interni che un modello apprende durante l’addestramento. Conservano ciò che il modello “sa”; più parametri possono significare più capacità.
Passi di campionamentoIntelligenza artificiale
Quante iterazioni impiega un modello di diffusion per trasformare il rumore nel frame finale. Più passi possono significare qualità superiore ma generazione più lenta e costosa.
Primo e ultimo frameVideo con intelligenza artificiale
Fornire un frame iniziale e/o finale che il modello anima tra i due, dandoti controllo preciso su inizio e fine di una ripresa.
Profondità di campoVideo
Quanto dell’immagine è a fuoco nitido. Una profondità di campo ridotta sfoca lo sfondo per far risaltare il soggetto.
PromptIntelligenza artificiale
L’istruzione che dai al modello — di solito testo, talvolta con un’immagine — descrivendo il video che vuoi creare.
Prompt engineeringIntelligenza artificiale
L’arte di formulare i prompt affinché il modello produca in modo affidabile il risultato desiderato, inclusi soggetto, stile, camera e atmosfera.
Prompt negativoIntelligenza artificiale
Una descrizione di ciò che NON vuoi nell’output. Guida il modello lontano da oggetti, stili o artefatti indesiderati.
Render / renderingVideo
Elaborare un progetto in un file video finito — oppure, con l’intelligenza artificiale, il modello che genera frame in una clip finale.
Rete neuraleIntelligenza artificiale
Un modello vagamente ispirato al cervello: strati di “neuroni” connessi che apprendono schemi dai dati. È la base dell’intelligenza artificiale generativa moderna.
RisoluzioneVideo
Le dimensioni in pixel di ogni frame, scritte larghezza × altezza (es. 1920×1080). Più pixel significa più dettaglio. Livelli comuni: 720p (HD), 1080p (Full HD), 4K e 8K.
RLHFIntelligenza artificiale
Reinforcement Learning from Human Feedback — addestramento che usa le preferenze umane per allineare gli output del modello a ciò che le persone vogliono davvero.
Scala di guida (CFG)Intelligenza artificiale
Quanto rigorosamente il modello segue il tuo prompt rispetto a improvvisare. Valori più alti restano più aderenti alle parole; più bassi danno al modello maggiore libertà creativa.
SemeIntelligenza artificiale
Il numero casuale di partenza per una generazione. Riutilizzare lo stesso seed con lo stesso prompt riproduce lo stesso risultato — utile per coerenza e piccole modifiche.
Sincronizzazione labialeVideo con intelligenza artificiale
Allineare i movimenti della bocca di un personaggio o avatar all’audio parlato in modo che sembri davvero pronunciare le parole.
Sintesi vocale (TTS)Video con intelligenza artificiale
Convertire testo scritto in audio parlato naturale con una voce sintetica — il motore dietro i voice‑over con intelligenza artificiale.
SottopanciaVideo
Testo posizionato nella parte bassa del frame, tipicamente nome e titolo dello speaker, o una didascalia.
Sottotitoli / captionsVideo
Testo a schermo dell’audio parlato. I sottotitoli per l’accessibilità includono anche suoni e speaker; i sottotitoli standard di solito trascrivono o traducono i dialoghi.
Spazio latenteIntelligenza artificiale
Una rappresentazione matematica compressa in cui il modello lavora realmente. La generazione avviene prima qui, poi viene decodificata in pixel visibili.
StoryboardVideo
Una sequenza pianificata di schizzi o frame che mappa ogni inquadratura prima di produrre o generare un video.
Testa parlanteVideo con intelligenza artificiale
Un video incentrato su una persona che parla in camera — il caso d’uso classico per avatar e presentatori con intelligenza artificiale.
Testo-in-video (T2V)Video con intelligenza artificiale
Generare una clip video direttamente da una descrizione scritta — senza camera, attori o stock footage.
TokenIntelligenza artificiale
La porzione più piccola di input che un modello elabora — un pezzo di parola per il testo, o una patch o un frame per il video.
TransformerIntelligenza artificiale
Un’architettura di rete neurale basata sull’“attenzione”, che pesa le relazioni tra le parti dell’input. Sostiene i grandi modelli linguistici e molti modelli video moderni.
TransizioneVideo
Come un’inquadratura passa alla successiva — un taglio secco, una dissolvenza, un fade o una tendina (wipe).
Trasferimento di stileVideo con intelligenza artificiale
Applicare lo stile visivo di un riferimento al tuo girato o alla tua generazione.
Umano digitale / gemello digitaleVideo con intelligenza artificiale
Una replica fotorealistica con intelligenza artificiale di una persona reale, addestrata una volta e riutilizzata come presentatore in camera.
UpscalingVideo con intelligenza artificiale
Usare l’intelligenza artificiale per aumentare la risoluzione di un video — ad esempio da 1080p a 4K — aggiungendo dettaglio plausibile invece di allungare i pixel.
Video agenticoVideo con intelligenza artificiale
Un agente con intelligenza artificiale che pianifica e gestisce l’intera produzione — script, scene, voce, avatar e montaggio — da un unico brief, invece che una clip alla volta.
Video-in-video (V2V)Video con intelligenza artificiale
Trasformare una clip esistente in un nuovo stile o look preservandone movimento e timing originali.

Dal prompt al render: il linguaggio del video con intelligenza artificiale

Creare video con intelligenza artificiale sta all’incrocio di due mondi: decenni di lessico del filmmaking e della produzione video, e il linguaggio in rapida evoluzione del machine learning. Questo dizionario li riunisce entrambi, più i termini nuovi tipici del video generativo, così puoi leggere con sicurezza qualsiasi tool, tutorial o model card.

Parti dai fondamentali: aspect ratio, risoluzione, frame rate e codec determinano come appare il tuo video e dove può essere riprodotto. Poi lo strato di intelligenza artificiale — modelli, diffusion, prompt, seed e LoRA plasmano ciò che viene generato. Infine le specificità del video con intelligenza artificiale — text-to-video, image-to-video, lip sync, avatar, coerenza temporale e world model — descrivono ciò che i generatori di oggi sanno fare davvero.

Ogni definizione è scritta in italiano semplice, senza matematica. Cerca per parola chiave, filtra per argomento o sfoglia dalla A alla Z — poi metti il lessico al lavoro nello studio di Vivideo.

Il dizionario del video con intelligenza artificiale

Inizia gratisCos’è il video con Intelligenza Artificiale?