Glossario

Il dizionario del video con intelligenza artificiale

Ogni termine che incontrerai creando video con intelligenza artificiale — dalle basi di camera e codec a diffusion, avatar e generazione agentica — spiegato in modo chiaro e semplice.

74 termini · Video · Intelligenza artificiale · Video con intelligenza artificiale

74 termini

A B C D E F G H I K L M O P R S T U V

AddestramentoIntelligenza artificiale: Addestrare un modello mostrandogli enormi quantità di dati e regolando gradualmente i suoi parametri interni finché non produce buoni risultati.
AllucinazioneIntelligenza artificiale: Quando un modello produce output sicuro di sé ma errato o inventato — come testo confuso, dita extra o movimenti impossibili.
Apprendimento profondoIntelligenza artificiale: Apprendimento automatico che usa reti neurali con molti strati. Alimenta gli attuali modelli di immagini, video, voce e linguaggio.
Avatar con intelligenza artificialeVideo con intelligenza artificiale: Un presentatore su schermo generato o clonato con intelligenza artificiale che può leggere il tuo script nella voce e lingua scelte.

B-rollVideo: Riprese di supporto montate sopra l’inquadratura principale per aggiungere contesto, illustrare un punto o coprire un taglio.
BitrateVideo: Quanti dati vengono usati per ogni secondo di video, misurati in kbps o Mbps. Un bitrate più alto conserva più dettaglio ma genera file più pesanti.
BokehVideo: Il morbido e gradevole sfocato sullo sfondo di un’inquadratura, spesso reso come cerchi di luce brillanti.

CheckpointIntelligenza artificiale: Un’istantanea salvata dei pesi di un modello. I checkpoint sono spesso condivisi come “file del modello” scaricabili da eseguire.
Chroma key (green screen)Video: Sostituire uno sfondo a tinta unita — di solito verde — con un’altra immagine o video rendendo trasparente quel colore.
Clonazione vocaleVideo con intelligenza artificiale: Ricreare la voce specifica di una persona da un breve campione, così da poter leggere nuovo testo con la stessa voce.
CodecVideo: L’algoritmo che comprime e decomprime il video — ad esempio H.264, H.265/HEVC, AV1 o VP9. Bilancia qualità visiva e dimensione del file.
Coerenza temporaleVideo con intelligenza artificiale: Mantenere stabili personaggi, oggetti e stile da un frame all’altro così che il video non sfarfalli, si deformi o cambi in modo innaturale.
Color gradingVideo: La fase creativa di regolazione di colore, contrasto e mood del girato in post‑produzione per dargli un look coerente e intenzionale.
CompositingVideo: Sovrapporre più elementi visivi — girato, grafiche, effetti, testo — in un unico frame combinato.
Container (formato file)Video: L’involucro che contiene insieme video, audio e metadati — MP4, MOV, WebM o MKV. È separato dal codec archiviato al suo interno.
Controllo cameraVideo con intelligenza artificiale: Dirigere i movimenti di una camera virtuale — pan, zoom, orbit, dolly — all’interno di un’inquadratura generata con intelligenza artificiale.
Controllo del movimento / motion brushVideo con intelligenza artificiale: Strumenti che ti permettono di dirigere dove e come le cose si muovono in una clip generata, invece di lasciare tutto al modello.

DatasetIntelligenza artificiale: L’insieme di esempi — video, immagini, testo — su cui un modello viene addestrato. La sua qualità e varietà determinano ciò che il modello può fare.
DeepfakeVideo con intelligenza artificiale: Media sintetici che sostituiscono o fabbricano in modo realistico il volto o la voce di qualcuno. Potenti, ma sollevano seri temi di consenso, autenticità e legali.
Doppiaggio con intelligenza artificialeVideo con intelligenza artificiale: Sostituire o aggiungere audio parlato in un’altra lingua, idealmente allineato alla voce e ai movimenti labiali dello speaker.

EmbeddingIntelligenza artificiale: Una lista di numeri (un vettore) che cattura il significato di testo, immagine o audio, così che il modello possa confrontare e combinare input diversi.
Estensione videoVideo con intelligenza artificiale: Proseguire una clip oltre la sua durata originaria generando frame aggiuntivi che seguono in modo naturale.

FiligranaVideo: Un logo o un testo sovrapposto al video per indicarne la proprietà. Molti generatori gratuiti lo aggiungono; i piani a pagamento lo rimuovono.
Formato (aspect ratio)Video: Il rapporto tra larghezza e altezza dell’inquadratura — 16:9 (widescreen), 9:16 (verticale per Reels e TikTok) o 1:1 (quadrato). Decide come il tuo video si adatta a ogni piattaforma e schermo.
Frame rate (FPS)Video: Fotogrammi al secondo — quante immagini statiche scorrono ogni secondo. 24fps dà un effetto cinematografico, 30fps è lo standard per il web, 60fps appare ultra‑fluido per movimento e sport.

GANIntelligenza artificiale: Generative Adversarial Network — un metodo precedente in cui un generatore e una rete critica competono. In gran parte sostituito dalla diffusion per video di alta qualità.

HDR (High Dynamic Range)Video: Video che trasporta una gamma più ampia di luminosità e colore rispetto allo standard (SDR), per luci e ombre più realistiche e toni più ricchi.

Immagine di riferimentoVideo con intelligenza artificiale: Un’immagine che fornisci al modello per guidare soggetto, personaggio o stile del video generato.
Immagine-in-video (I2V)Video con intelligenza artificiale: Dare vita a un’immagine statica come video, spesso guidato da un prompt che descrive il movimento desiderato.
InferenzaIntelligenza artificiale: Eseguire un modello già addestrato per produrre un output — ad esempio generare il tuo video da un prompt. È ciò per cui si paga a ogni generazione.
Inpainting / outpaintingVideo con intelligenza artificiale: Riempire una parte del frame (inpainting) o estendere oltre i suoi bordi (outpainting). Nel video, usato per rimuovere, sostituire o espandere aree nel tempo.
InquadraturaVideo: Un singolo pezzo continuo di girato. Tipi comuni includono il campo lungo, il mezzo busto e il primo piano.
Inquadratura di aperturaVideo: Un’inquadratura ampia di apertura che definisce luogo e contesto di una scena prima di stringere.
Interpolazione dei frameVideo con intelligenza artificiale: Generare fotogrammi intermedi per aumentare il frame rate o rendere più fluido il movimento — ad esempio trasformare 24fps in un morbido 60fps.

KeyframeVideo: Nel montaggio, un frame marcato che imposta un valore (posizione, scala, opacità) tra cui il software anima. Nella compressione, un frame di riferimento completo da cui vengono ricostruiti i frame vicini.

LetterboxingVideo: Bande nere aggiunte sopra e sotto (o ai lati) di un video così da adattarlo a un aspect ratio diverso senza ritagliarlo.
LoRAIntelligenza artificiale: Low-Rank Adaptation — un modo leggero per insegnare a un modello un nuovo stile, personaggio o concetto con un piccolo file aggiuntivo, invece di riaddestrare l’intero modello.
LUT (Look-Up Table)Video: Un preset che rimappa i colori per applicare un look specifico in un clic o per convertire il girato tra spazi colore.

ModelloIntelligenza artificiale: Un sistema di intelligenza artificiale addestrato che trasforma un input — per esempio un prompt testuale — in un output, come un video. Modelli diversi hanno punti di forza, velocità e prezzi differenti.
Modello a pesi apertiIntelligenza artificiale: Un modello i cui pesi sono pubblicati così che chiunque possa eseguirlo, studiarlo o fare fine‑tuning (es. su fal o in locale), a differenza di un modello chiuso accessibile solo tramite API.
Modello del mondoVideo con intelligenza artificiale: Un’intelligenza artificiale che costruisce una simulazione interna di come si comportano scene, oggetti e fisica, aiutandola a generare video più lunghi, coerenti e consistenti.
Modello di baseIntelligenza artificiale: Un modello ampio e generico addestrato su dati estesi che può essere adattato a molti compiti a valle.
Modello di diffusionIntelligenza artificiale: L’approccio dominante dietro immagini e video generativi: il modello parte dal rumore casuale e, passo dopo passo, lo rimuove finché appare un risultato coerente che corrisponde al tuo prompt.
MultimodaleIntelligenza artificiale: Un modello che comprende o genera più tipi di dato insieme — ad esempio testo, immagine, video e audio.

Ottimizzazione fineIntelligenza artificiale: Ulteriore addestramento di un modello base su dati specifici per specializzarlo — per uno stile, un brand o una persona in particolare.

Parametri (pesi)Intelligenza artificiale: I numeri interni che un modello apprende durante l’addestramento. Conservano ciò che il modello “sa”; più parametri possono significare più capacità.
Passi di campionamentoIntelligenza artificiale: Quante iterazioni impiega un modello di diffusion per trasformare il rumore nel frame finale. Più passi possono significare qualità superiore ma generazione più lenta e costosa.
Primo e ultimo frameVideo con intelligenza artificiale: Fornire un frame iniziale e/o finale che il modello anima tra i due, dandoti controllo preciso su inizio e fine di una ripresa.
Profondità di campoVideo: Quanto dell’immagine è a fuoco nitido. Una profondità di campo ridotta sfoca lo sfondo per far risaltare il soggetto.
PromptIntelligenza artificiale: L’istruzione che dai al modello — di solito testo, talvolta con un’immagine — descrivendo il video che vuoi creare.
Prompt engineeringIntelligenza artificiale: L’arte di formulare i prompt affinché il modello produca in modo affidabile il risultato desiderato, inclusi soggetto, stile, camera e atmosfera.
Prompt negativoIntelligenza artificiale: Una descrizione di ciò che NON vuoi nell’output. Guida il modello lontano da oggetti, stili o artefatti indesiderati.

Render / renderingVideo: Elaborare un progetto in un file video finito — oppure, con l’intelligenza artificiale, il modello che genera frame in una clip finale.
Rete neuraleIntelligenza artificiale: Un modello vagamente ispirato al cervello: strati di “neuroni” connessi che apprendono schemi dai dati. È la base dell’intelligenza artificiale generativa moderna.
RisoluzioneVideo: Le dimensioni in pixel di ogni frame, scritte larghezza × altezza (es. 1920×1080). Più pixel significa più dettaglio. Livelli comuni: 720p (HD), 1080p (Full HD), 4K e 8K.
RLHFIntelligenza artificiale: Reinforcement Learning from Human Feedback — addestramento che usa le preferenze umane per allineare gli output del modello a ciò che le persone vogliono davvero.

Scala di guida (CFG)Intelligenza artificiale: Quanto rigorosamente il modello segue il tuo prompt rispetto a improvvisare. Valori più alti restano più aderenti alle parole; più bassi danno al modello maggiore libertà creativa.
SemeIntelligenza artificiale: Il numero casuale di partenza per una generazione. Riutilizzare lo stesso seed con lo stesso prompt riproduce lo stesso risultato — utile per coerenza e piccole modifiche.
Sincronizzazione labialeVideo con intelligenza artificiale: Allineare i movimenti della bocca di un personaggio o avatar all’audio parlato in modo che sembri davvero pronunciare le parole.
Sintesi vocale (TTS)Video con intelligenza artificiale: Convertire testo scritto in audio parlato naturale con una voce sintetica — il motore dietro i voice‑over con intelligenza artificiale.
SottopanciaVideo: Testo posizionato nella parte bassa del frame, tipicamente nome e titolo dello speaker, o una didascalia.
Sottotitoli / captionsVideo: Testo a schermo dell’audio parlato. I sottotitoli per l’accessibilità includono anche suoni e speaker; i sottotitoli standard di solito trascrivono o traducono i dialoghi.
Spazio latenteIntelligenza artificiale: Una rappresentazione matematica compressa in cui il modello lavora realmente. La generazione avviene prima qui, poi viene decodificata in pixel visibili.
StoryboardVideo: Una sequenza pianificata di schizzi o frame che mappa ogni inquadratura prima di produrre o generare un video.

Testa parlanteVideo con intelligenza artificiale: Un video incentrato su una persona che parla in camera — il caso d’uso classico per avatar e presentatori con intelligenza artificiale.
Testo-in-video (T2V)Video con intelligenza artificiale: Generare una clip video direttamente da una descrizione scritta — senza camera, attori o stock footage.
TokenIntelligenza artificiale: La porzione più piccola di input che un modello elabora — un pezzo di parola per il testo, o una patch o un frame per il video.
TransformerIntelligenza artificiale: Un’architettura di rete neurale basata sull’“attenzione”, che pesa le relazioni tra le parti dell’input. Sostiene i grandi modelli linguistici e molti modelli video moderni.
TransizioneVideo: Come un’inquadratura passa alla successiva — un taglio secco, una dissolvenza, un fade o una tendina (wipe).
Trasferimento di stileVideo con intelligenza artificiale: Applicare lo stile visivo di un riferimento al tuo girato o alla tua generazione.

Umano digitale / gemello digitaleVideo con intelligenza artificiale: Una replica fotorealistica con intelligenza artificiale di una persona reale, addestrata una volta e riutilizzata come presentatore in camera.
UpscalingVideo con intelligenza artificiale: Usare l’intelligenza artificiale per aumentare la risoluzione di un video — ad esempio da 1080p a 4K — aggiungendo dettaglio plausibile invece di allungare i pixel.

Video agenticoVideo con intelligenza artificiale: Un agente con intelligenza artificiale che pianifica e gestisce l’intera produzione — script, scene, voce, avatar e montaggio — da un unico brief, invece che una clip alla volta.
Video-in-video (V2V)Video con intelligenza artificiale: Trasformare una clip esistente in un nuovo stile o look preservandone movimento e timing originali.

Dal prompt al render: il linguaggio del video con intelligenza artificiale

Creare video con intelligenza artificiale sta all’incrocio di due mondi: decenni di lessico del filmmaking e della produzione video, e il linguaggio in rapida evoluzione del machine learning. Questo dizionario li riunisce entrambi, più i termini nuovi tipici del video generativo, così puoi leggere con sicurezza qualsiasi tool, tutorial o model card.

Parti dai fondamentali: aspect ratio, risoluzione, frame rate e codec determinano come appare il tuo video e dove può essere riprodotto. Poi lo strato di intelligenza artificiale — modelli, diffusion, prompt, seed e LoRA plasmano ciò che viene generato. Infine le specificità del video con intelligenza artificiale — text-to-video, image-to-video, lip sync, avatar, coerenza temporale e world model — descrivono ciò che i generatori di oggi sanno fare davvero.

Ogni definizione è scritta in italiano semplice, senza matematica. Cerca per parola chiave, filtra per argomento o sfoglia dalla A alla Z — poi metti il lessico al lavoro nello studio di Vivideo.

Il dizionario del video con intelligenza artificiale

Inizia gratis Cos’è il video con Intelligenza Artificiale?