Sanasto

Tekoälyvideon sanakirja

Kaikki termit, joihin törmäät tehdessäsi videota tekoälyllä — kameran ja koodekkien perusteista diffuusioon, avatareihin ja agenttimaiseen generointiin — selitettynä selkeällä kielellä.

74 termit · Video · Tekoäly · Tekoälyvideo

74 termit
Agenttimainen videoTekoälyvideo
Tekoälyagentti, joka suunnittelee ja hoitaa koko tuotannon — käsikirjoituksen, kohtaukset, äänen, avatarit ja leikkaukset — yhdestä briiffistä sen sijaan, että tekisi yhden klipin kerrallaan.
Aineisto (dataset)Tekoäly
Esimerkkien kokoelma — videot, kuvat, teksti — jolla malli koulutetaan. Sen laatu ja monipuolisuus muovaavat mallin kykyjä.
Ajallinen johdonmukaisuusTekoälyvideo
Hahmojen, objektien ja tyylin pitäminen vakaina ruudusta toiseen, jotta video ei välky, vääristy tai muunnu luonnottomasti.
AlapalkkiVideo
Teksti kuvan alaosassa, tyypillisesti puhujan nimi ja titteli tai kuvateksti.
AvainruutuVideo
Editoinnissa merkitty ruutu, joka asettaa arvon (sijainti, skaala, peittokyky), joiden välillä ohjelma animoi. Pakkauksessa täysi viiteruutu, josta läheiset ruudut rakennetaan uudelleen.
Avoinpainoinen malliTekoäly
Malli, jonka painot on julkaistu, jotta kuka tahansa voi ajaa, tutkia tai hienosäätää sitä (esim. falissa tai paikallisesti), toisin kuin suljettu malli, jota käytetään vain API:n kautta.
B-rollVideo
Pääkuvan päälle leikattu lisämateriaali, joka tuo kontekstia, havainnollistaa asiaa tai peittää leikkauksen.
BittinopeusVideo
Kuinka paljon dataa käytetään videon sekuntia kohden, mitataan kbps- tai Mbps-yksiköissä. Korkeampi bittinopeus säilyttää enemmän yksityiskohtia, mutta kasvattaa tiedostokokoa.
BokehVideo
Pehmeä, miellyttävä epäterävä taustasumennus, joka näkyy usein hehkuvina valokehänä.
Chroma key (vihreä tausta)Video
Yhtenäisen taustavärin — yleensä vihreän — korvaaminen toisella kuvalla tai videolla tekemällä tuo väri läpinäkyväksi.
DeepfakeTekoälyvideo
Synteettinen media, joka vaihtaa tai keksii jonkun kasvot tai äänen realistisesti. Vahva tekniikka, mutta herättää aitoja suostumus-, aitous- ja oikeudellisia kysymyksiä.
DiffuusiomalliTekoäly
Valtakäsitys kuvan ja videon generoinnissa: malli lähtee satunnaiskohinasta ja poistaa sitä askel askeleelta, kunnes promptiasi vastaava eheä tulos ilmestyy.
Digitaalinen ihminen / digitaalinen kaksonenTekoälyvideo
Valokuvantarkka tekoälyreplika oikeasta henkilöstä, joka koulutetaan kerran ja käytetään uudelleen kamerajuontajana.
Ensimmäinen ja viimeinen ruutuTekoälyvideo
Aloitus- ja/tai lopetusruudun antaminen mallille animoitavaksi niiden väliin, jotta saat tarkan kontrollin otoksen alusta ja lopusta.
GANTekoäly
Generative Adversarial Network — aiempi menetelmä, jossa generaattori ja kriitikko kilpailevat. Laajalti korvattu diffuusiolla laadukasta videota varten.
HallusinaatioTekoäly
Kun malli tuottaa itsevarman mutta virheellisen tai keksityn tuloksen — kuten sotkuista tekstiä, ylimääräisiä sormia tai mahdotonta liikettä.
HDR (High Dynamic Range)Video
Video, joka kantaa laajemman kirkkaus- ja värialueen kuin standardi (SDR), tuottaen luonnollisemmat huippuvalot, varjot ja rikkaammat sävyt.
Hienosäätö (fine-tuning)Tekoäly
Perusmallin jatkokouluttaminen tietyllä datalla sen erikoistamiseksi — tiettyyn tyyliin, brändiin tai henkilöön.
HuulisynkkaTekoälyvideo
Hahmon tai avatarin suun liikkeiden sovittaminen puheääneen niin, että näyttää siltä kuin se todella sanoisi sanat.
InferenssiTekoäly
Valmiiksi koulutetun mallin ajaminen tuotoksen luomiseksi — esimerkiksi videon generointi promptista. Tästä veloitetaan per generointi.
Inpainttaus / outpainttausTekoälyvideo
Ruutuosan täyttäminen (inpainttaus) tai laajentaminen reunan yli (outpainttaus). Videossa käytetään alueiden poistoon, vaihtoon tai laajennukseen ajassa.
KameraohjausTekoälyvideo
Virtuaalisen kameran liikkeiden ohjaaminen — pan, zoom, orbit, dolly — tekoälyn generoimassa otoksessa.
KompositointiVideo
Useiden visuaalisten elementtien — kuvamateriaali, grafiikat, efektit, teksti — kerrostaminen yhdeksi yhdistetyksi kuvaksi.
KoodekkiVideo
Algoritmi, joka pakkaa ja purkaa videon — kuten H.264, H.265/HEVC, AV1 tai VP9. Tasapainottaa kuvanlaadun ja tiedostokoon.
KoulutusTekoäly
Mallin opettaminen näyttämällä sille valtavasti dataa ja säätämällä sen sisäisiä parametreja vähitellen, kunnes tulokset ovat hyviä.
KuvakäsikirjoitusVideo
Suunniteltu luonnosten tai ruutujen sarja, joka hahmottaa jokaisen otoksen ennen kuin tuotat tai generoitat videon.
Kuvasta videoksi (I2V)Tekoälyvideo
Still-kuvan herättäminen eloon videoksi, usein promptilla, joka kuvaa halutun liikkeen.
KuvasuhdeVideo
Kuvan leveyden ja korkeuden suhde — 16:9 (laajakuva), 9:16 (pysty Reelsiin ja TikTokiin) tai 1:1 (neliö). Määrittää, miten videosi istuu kullekin alustalle ja näytölle.
Kuvataajuus (FPS)Video
Ruutua sekunnissa — kuinka monta still-kuvaa toistuu sekunnissa. 24fps tuntuu elokuvamaiselta, 30fps on verkkostandardi ja 60fps näyttää erittäin sulavalta liikkeessä ja urheilussa.
LatenttiavaruusTekoäly
Pakkaantunut matemaattinen esitys, jossa malli oikeasti työskentelee. Generointi tapahtuu ensin täällä ja dekoodataan sitten näkyviksi pikseleiksi.
LetterboxausVideo
Mustat palkit videon ylä- ja ala- (tai sivu)reunoissa, jotta se sopii toiseen kuvasuhteeseen ilman rajausta.
Liikeohjaus / motion brushTekoälyvideo
Työkalut, joilla ohjaat mitä ja miten jokin liikkuu generoidussa klipissä sen sijaan, että jättäisit kaiken mallin varaan.
LoRATekoäly
Low-Rank Adaptation — kevyt tapa opettaa mallille uusi tyyli, hahmo tai käsite pienellä lisätiedostolla ilman koko mallin uudelleenkoulutusta.
LUT (Look-Up Table)Video
Esiasetus, joka uudelleenkartoittaa värit ja antaa tietyn ilmeen yhdellä klikkauksella tai muuntaa materiaalia väriavaruuksien välillä.
MalliTekoäly
Koulutettu tekoälyjärjestelmä, joka muuntaa syötteen — kuten tekstipromptin — tuotokseksi, kuten videoksi. Eri mallit eroavat vahvuuksiltaan, nopeuksiltaan ja hinnoiltaan.
MonimodaalinenTekoäly
Malli, joka ymmärtää tai tuottaa useampaa datatyyppiä yhtä aikaa — esimerkiksi tekstiä, kuvaa, videota ja ääntä yhdessä.
Negatiivinen promptiTekoäly
Kuvaus asioista, joita ET halua tuotokseen. Ohjaa mallia pois ei-toivotuista objekteista, tyyleistä tai artefakteista.
NeuroverkkoTekoäly
Aivoista löyhästi inspiroitu malli: kerroksia toisiinsa kytkettyjä “neuroneita”, jotka oppivat kuvioita datasta. Modernin generatiivisen tekoälyn perusta.
NäytteenottoaskeleetTekoäly
Kuinka monta iteraatiota diffuusiomalli tekee muuttaakseen kohinan lopulliseksi ruuduksi. Enemmän askeleita voi parantaa laatua, mutta hidastaa ja kallistaa generointia.
Ohjauskerroin (CFG)Tekoäly
Kuinka tiukasti malli seuraa promptiasi verrattuna improvisointiin. Korkeammat arvot pysyvät lähempänä tekstiä; matalammat antavat mallille enemmän luovaa vapautta.
OtosVideo
Yksi yhtenäinen pätkä kuvamateriaalia. Yleisiä tyyppejä ovat laaja otos, puolikuva ja lähikuva.
Parametrit (painot)Tekoäly
Sisäiset luvut, jotka malli oppii koulutuksen aikana. Ne tallettavat sen “tiedon”; enemmän parametreja voi tarkoittaa enemmän kyvykkyyttä.
Perusmalli (foundation model)Tekoäly
Suuri, yleiskäyttöinen malli, joka on koulutettu laajalla datalla ja mukautettavissa useisiin jatkotehtäviin.
PromptiTekoäly
Ohje, jonka annat mallille — yleensä teksti, joskus myös kuva — kuvaamaan videon, jonka haluat sen luovan.
Promptien suunnitteluTekoäly
Taito muotoilla promptit niin, että malli tuottaa johdonmukaisesti toivotun tuloksen — aihe, tyyli, kamera ja tunnelma mukaan lukien.
Puhuva pääTekoälyvideo
Video, joka keskittyy kameralle puhuvaan henkilöön — klassinen käyttötapa avatareille ja juontajille.
ReferenssikuvaTekoälyvideo
Kuva, jonka annat mallille ohjaamaan generoidun videon aihetta, hahmoa tai tyyliä.
RenderöintiVideo
Projektin prosessointi valmiiksi videotiedostoksi — tai tekoälyssä, mallin generoimien ruutujen kokoaminen lopulliseksi klipiksi.
ResoluutioVideo
Kunkin ruudun pikselimitat, kirjoitetaan leveys × korkeus (esim. 1920×1080). Enemmän pikseleitä tarkoittaa enemmän yksityiskohtia. Yleisiä tasoja ovat 720p (HD), 1080p (Full HD), 4K ja 8K.
RLHFTekoäly
Reinforcement Learning from Human Feedback — koulutus, joka käyttää ihmisten mieltymyksiä linjaamaan mallin tuotokset siihen, mitä ihmiset oikeasti haluavat.
Ruutujen väli-inferointiTekoälyvideo
Väliruutujen generointi kuvataajuuden nostamiseksi tai liikkeen silottamiseksi — esimerkiksi 24fps:stä silkkiseen 60fps:ään.
Siemen (seed)Tekoäly
Generoinnin alkusatunnaisluku. Saman siemenen käyttäminen samalla promptilla tuottaa saman tuloksen — kätevää johdonmukaisuuteen ja pieniin säätöihin.
SiirtymäVideo
Miten yksi otos vaihtuu seuraavaan — suora leikkaus, ristihäivytys, häivytys sisään/ulos tai pyyhkäisy.
Skalointi ylöspäinTekoälyvideo
Tekoälyn käyttö videon resoluution nostamiseen — vaikkapa 1080p:stä 4K:hon — lisäten uskottavaa yksityiskohtaa pelkän venytyksen sijaan.
SyväoppiminenTekoäly
Koneoppimista, joka käyttää monikerroksisia neuroverkkoja. Mahdollistaa nykyiset kuva-, video-, ääni- ja kielimallit.
SyväterävyysVideo
Kuinka suuri osa kuvasta on tarkkana. Kapea syväterävyys sumentaa taustan ja nostaa kohteen esiin.
Säiliö (tiedostomuoto)Video
Tiedostokuori, joka pitää videon, äänen ja metadatan yhdessä — MP4, MOV, WebM tai MKV. Se on eri asia kuin sen sisällä oleva koodekki.
TarkistuspisteTekoäly
Tallennettu mallitilanne eli painot. Checkpointit jaetaan usein ladattavina “mallitiedostoina”, joita ajetaan.
TekoälyavatarTekoälyvideo
Tekoälyn tuottama tai kloonattu ruudulla esiintyvä juontaja, joka voi puhua käsikirjoituksesi valitulla äänellä ja kielellä.
Tekoälyjuonnos (dubbing)Tekoälyvideo
Puhutun äänen korvaaminen tai lisääminen toisella kielellä, mieluiten sovitettuna puhujan ääneen ja huulisynkkaan.
Tekstistä puheeksi (TTS)Tekoälyvideo
Kirjoitetun tekstin muuttaminen luonnolliseksi puheääneksi synteettisellä äänellä — tekoälypuheiden moottori.
Tekstistä videoksi (T2V)Tekoälyvideo
Videoklipin generointi suoraan kirjallisesta kuvauksesta — ilman kameraa, näyttelijöitä tai arkistomateriaalia.
TekstitysVideo
Ruudulla näkyvä puheen teksti. Tekstitykset voivat merkitä myös äänet ja puhujat saavutettavuuden vuoksi; varsinaiset käännöstekstitykset toistavat tai kääntävät dialogin.
Tilannekuva (establishing shot)Video
Laaja aloitusotos, joka asettaa kohtauksen sijainnin ja kontekstin ennen siirtymistä lähemmäs.
TokeniTekoäly
Pienin syöteyksikkö, jota malli prosessoi — tekstissä sanan osa, videossa laikku tai ruutu.
TransformerTekoäly
Neuroverkkorakenne, joka perustuu huomioon (attention) ja painottaa syötteen osien suhteita. Suurten kielimallien ja monien nykyaikaisten videomallien perusta.
TyylinsiirtoTekoälyvideo
Toisen referenssin visuaalisen tyylin soveltaminen omaan materiaaliisi tai generointiin.
Upotus (embedding)Tekoäly
Lukujono (vektori), joka tiivistää tekstin, kuvan tai äänen merkityksen, jotta malli voi vertailla ja yhdistellä eri syötteitä.
VesileimaVideo
Videon päälle sijoitettu logo tai teksti omistajuuden merkitsemiseksi. Monet ilmaiset tekoälygeneraattorit lisäävät sellaisen; maksulliset paketit poistavat sen yleensä.
Videon jatkaminenTekoälyvideo
Klipin jatkaminen alkuperäisen pituuden yli generoimalla luonnollisesti seuraavia ruutuja.
Videosta videoksi (V2V)Tekoälyvideo
Olemassa olevan klipin muuntaminen uuteen tyyliin tai ilmeeseen säilyttäen alkuperäisen liikkeen ja ajoituksen.
VärimäärittelyVideo
Luova vaihe, jossa kuvamateriaalin värejä, kontrastia ja tunnelmaa säädetään jälkituotannossa yhtenäisen, harkitun ilmeen saamiseksi.
World malliTekoälyvideo
Tekoäly, joka rakentaa sisäisen simulaation siitä, miten kohtaukset, objektit ja fysiikka käyttäytyvät, auttaen generoimaan pidempää, yhtenäisempää ja johdonmukaisempaa videota.
ÄänikloonausTekoälyvideo
Tietyn henkilön äänen uudelleenluonti lyhyen näytteen perusteella, jotta se voi puhua uutta tekstiä samalla äänellä.

Promptista renderiin: tekoälyvideon kieli

Tekoälyllä tehty video elää kahden maailman risteyksessä — vuosikymmenten elokuvauksen ja videotuotannon sanaston sekä nopeasti kehittyvän koneoppimisen kielen. Tämä sanakirja tuo molemmat yhteen sekä uudet generatiivisen videon omat termit, jotta voit tulkita mitä tahansa työkalua, tutoriaalia tai mallikorttia luottavaisin mielin.

Aloita perusteista: kuvasuhde, resoluutio, kuvataajuus ja koodekit määrittävät miltä videosi näyttää ja missä se toimii. Sitten tekoälykerros — mallit, diffuusio, promptit, seedit ja LoRAt ohjaavat mitä syntyy. Lopuksi tekoälyvideon erityispiirteet — tekstistä videoksi, kuvasta videoksi, huulisynkka, avatarit, ajallinen johdonmukaisuus ja world mallit — kuvaavat, mitä nykyiset generaattorit todella osaavat.

Jokainen määritelmä on kirjoitettu selkokielellä, ilman matematiikkaa. Hae avainsanalla, suodata aiheen mukaan tai selaa A–Ö — ja ota sanasto käyttöön Vivideo-studiossa.