BlogOktatóanyag

Hogyan lokalizálj egy videót 30 nyelvre: lépésről lépésre munkafolyamat

Lépésről lépésre többnyelvű videó-munkafolyamat: master előkészítése, fordítás, szinkron/dubbing, ajakszinkron, képernyőn megjelenő szöveg adaptálása és minőségellenőrzés mind a 30 nyelven.

Leforgattál egy videót. A csapatod most spanyolul, vietnámiul, arabul, portugálul és még 26 nyelven kéri — a hét végére. A régi módszerrel ez 30 hangalámondás-foglalás, egy fordítóiroda, egy feliratszolgáltató és egy újraexport-sor, ami megeszi a sprinteket.

Ha jól csinálod, egyetlen mesteranyagból fut egy ismételhető pipeline. Egyszer fordítasz, nyelvenként egyszer szinkronizálsz, ajakszinkront adsz, lecseréled a képernyőn megjelenő szövegeket, és minden kimenetet ellenőrzőlistával QA-zol. A munka skálázódik, mert nem külön projektként kezeled a nyelveket, hanem egyetlen forrásból előállított renderekként.

Ez a gyakorlati kísérője a nagy kép áttekintésünknek: AI videó világszinten. Az elmagyarázza, miért készül a legtöbb AI (mesterséges intelligencia) videó már most is angolon kívül. Ez pedig pontosan megmutatja, hogyan szállíts mindegyik piacra.

Fő tanulságok

- Először építs egy lezárt mester videót; soha ne lokalizálj mozgó célpontra.

- Döntsd el előre nyelvenként a szinkron vs. felirat vs. hangklónozás stratégiát, még mielőtt egy szót is lefordítanál.

- A marketing sorokat transzkreáld — ne szó szerint fordítsd —, és igazítsd a képernyőszöveget és a kulturális utalásokat.

1. lépés: Zárd le a mester videót, mielőtt bármit lokalizálsz

A legnagyobb hiba a többnyelvű videós folyamatban az, ha úgy lokalizálsz, hogy a forrás még változik. Az angol mester minden egyes szerkesztése 30 kimenetre szorzódik.

Szóval fagyaszd be. A mester a jóváhagyott, végső vágás — lezárt kép, lezárt hang, lezárt timing. Kezeld a lezárás dátumát kemény kapuként: nincs új B-roll, nincs megvágott jelenet, nincs „gyors” szövegmódosítás ezután. Ha a mester változik, újrafuttatod a pipeline-t — és ez harmincszor drága.

Tartsd modulárisan a mestert. Válaszd szét a narrációs sávot a zenétől és a hanghatásoktól. Ha a narráció külön audio rétegen él, nyelvenként cserélheted anélkül, hogy a mixhez nyúlnál. A zenét egy stembe, a hangot egy másikba süsd bele.

Vedd ki a képernyőszöveget a képre égetésből. A videóképre égetett címkártyák, névfeliratok, captionök, calloutok mind 30 kézi újraszerkesztést jelentenek. Ahol csak lehet, tartsd a szöveget külön rétegen vagy sablonmezőben, hogy nyelvenként képkockát generálhass, ne kézzel renderelj újra.

Egy tiszta mester, szétválasztott hang-, zene- és szövegrétegekkel a különbség egy egynapos szétágazás és egy kéthetes robot között.

2. lépés: Készítsd elő és tisztítsd a forrásszöveget

Illustration: one master, thirty languages

A forgatókönyv a fordítások forrása, ezért itt javíts mindent, egyszer, mielőtt szétfut.

Írj lokalizálásra kész átiratot. Exportáld a pontos elhangzó szöveget timecode-okkal. Jelöld a jelenethatárokat, hogy a fordítók tudják, hol kell elférnie a soroknak. Ha egy mondatnak le kell zárulnia a 00:14-es kemény vágás előtt, jegyezd fel — ez a kényszer minden nyelvre átöröklődik.

Szedd ki az idiomatikus és lefordíthatatlan poénokat. A „hit it out of the park” a legtöbb nyelven semmit nem jelent, és csak pazarolja a transzkreátorok idejét. Jelöld a kultúrafüggő kifejezéseket, a szójátékokat, rímeket, poénokat, amelyek nem élnek túl arabra vagy vietnámi nyelvre váltva. Írd őket neutrálisra vagy jelöld „szabad transzkreálás” megjegyzéssel.

Zárd le a glosszáriumot. Terméknevek, funkciónevek, szlogen, jogi kifejezések — döntsd el, mi marad angolul és mi lokalizálódik, és írd le. Glosszárium nélkül a „Brand Kit” öt különböző kifejezéssé válik öt spanyol piac között. Egy kétoszlopos glosszárium (forrás kifejezés → jóváhagyott nyelvi megfelelő) 30 kimeneten át viszi a márkakonzisztenciát.

3. lépés: Fordítás vs. transzkreáció — soronként dönts

Nem minden sort kell egyformán kezelni; a „mindet fordítsuk le” hozzáállás 30 nyelven merev, robotikus marketinget eredményez.

Fordítsd a funkcionális részeket: instrukciók, UI-hivatkozások, tényszerű narráció, jogi kitételek. Itt a pontosság fontosabb, mint a csillogás, a szó szerinti megfeleltetés a helyes.

Transzkreáld a meggyőző részeket: hookok, szlogenek, cselekvésre ösztönzések, érzelmi csúcspontok. A transzkreáció a szándék és az érzet újrateremtése a célnyelven, még ha a szavak teljesen meg is változnak. Egy angolul működő CTA („Make it yours”) japánul szerkezetileg mássá válhat, hogy természetes legyen. Itt dől el, hogy AI videó marketinghez működik-e — egy lapos, fordított CTA rosszabbul konvertál, mint egy transzkreált.

A Vivideo AI video translator egy körben elvégzi az alappasszt mind a 30 nyelvre, szilárd első vázlatot adva nyelvenként. Ezután megjelölöd a videónként 5–10 nagy tétű sort, amelyek emberi transzkreációt igényelnek. A szöveg nagy része tisztán fordul; emberi energiát csak ott költesz, ahol a meggyőzés a tét.

4. lépés: Szinkron, felirat vagy hangklónozás — nyelvenként dönts

Ez nyelvenként üzleti döntés, nem alapértelmezés. Mielőtt hangot generálnál, hozd meg, mert minden downstream lépést befolyásol.

Teljes AI szinkron a beszélt sávot natívan hangzó célnyelvi hangra cseréli. Használd prioritáspiacokon, social-first tartalmaknál, és ott, ahol a nézők nem olvasnak feliratot (autoplay feedek, mobil, széles fogyasztói elérés). A Vivideo AI video dubbing az eredetire időzítve generálja az új hangsávot.

Csak felirat esetén az eredeti hang marad, és a fordított szöveg kerül a képernyőre. Használd hosszú farok nyelveknél, B2B közönségnél, akik elfogadják az olvasást, vagy olyan piacokon, ahol keresletet tesztelsz, mielőtt teljes szinkronba fektetnél. Gyorsabb és olcsóbb nyelvenként — észszerű alap 11–30. nyelvre.

Hangklónozás esetén a szinkron a te saját hangodon (vagy egy egységes márkahangon) szól minden nyelven, így egyetlen műsorvezető „30 nyelven beszél”. Használd, ha fontos a képernyőn szereplő tehetség vagy a márkahang-konzisztencia. Útmutatónk, hogy hogyan adj AI hangalámondást, részletesen bemutatja a klónozást és a hangválasztást.

Gyakorlati felosztás: teljes szinkron a top 8 piacra, hangklónozás, ahol van képernyős házigazda, a többire felirat. Írd be a döntést a projekttábládba, hogy később senki se találgasson.

5. lépés: Hang generálása és ajakszinkron

Illustration: dubbing, subtitles and voice cloning

Most előállítod a lokalizált hangot nyelvenként, és a képre illeszted.

Figyeld az időzítési driftet. A nyelvek „tágulnak” és „összehúzódnak”. A német és a vietnámi hosszabb lehet az angolnál; ugyanaz a mondat 20–30%-kal több szótag. Ha a szinkron túlcsúszik a jeleneten, beleütközik a következő vágásba. A Vivideo szinkron az eredetire időzíti az új sávot, de jelöld azokat a sorokat, amelyek látványosan hosszúak, hogy inkább a transzkreáción rövidíts, ne a hangot gyorsítsd „csipogóra”.

Adj ajakszinkront, ahol arc beszél. Beszélő fejes videóknál, avataroknál, vagy bármely szoros közelinél a nem passzoló szájmozgás zavaró és azonnal „rossz fordításnak” hat. Az AI lip-sync a szájmozgást a célnyelvi fonémákhoz igazítja. Ott alkalmazd, ahol arc látszik és beszél; hagyd ki a B-roll alatti narrációnál, ahol nincs mit szinkronizálni, és csak számítási erőforrás.

Hagyd érintetlenül a zene és SFX stemet. Mivel az 1. lépésben szétválasztottad a stemeket, az új hang minden nyelven ugyanarra az ágyra kerül. A mix konzisztens marad; csak a narráció változik.

6. lépés: Képernyőszöveg és kulturális hivatkozások adaptálása

A hang csak a fele a lokalizációnak. Amit a képernyőn látsz, annak is változnia kell — itt szoktak szétesni a sietős batch-ek.

Generáld újra a szöveges overlayeket nyelvenként. Címek, névfeliratok, captionök, gombfeliratok egy termékdemóban — mind kapja meg a fordított stringet. Húzd be a glosszáriumot, hogy a kifejezések konzisztensen maradjanak. Figyelj a hosszra: egy 12 karakteres angol gombcím francia nyelven lehet 22 karakter és kilóg a dobozából. Hagyj layout-tartalékot.

Kezeld tudatosan a jobbról balra olvasó (RTL) nyelveket. Arab, héber, urdu teljes elrendezés-fordítást igényel. A szöveg jobbra igazodik, az olvasási irány megfordul, és bármely UI-mockup vagy „előre” mutató nyíl most rossz irányba mutat. Az RTL a leggyakoribb néma hiba egy 30 nyelves batch-ben — teszteld expliciten.

A vizuált is lokalizáld, ne csak a szavakat. Pénznemszimbólumok, dátumformátumok (NN/HH vs. HH/NN), mértékegységek, telefonszám-formátumok és példa nevek igazodjanak a régióhoz. Egy amerikai dollárjel eurós piacra szánt videóban azt üzeni: „nem neked készült”. Cseréld a példaadatokat piaconként, ahol a képernyőn megjelennek.

Nézd meg a kulturális illeszkedést. Gesztusok, színek, ünnepek és képi utalások régiónként mást jelentenek. Egy „thumbs-up”, bizonyos kézjelek vagy szezonális utalások, amelyek egy piacon rendben vannak, máshol tévesek vagy sértők lehetnek. Jelöld a kultúrafüggő elemeket már a 2. lépésben (szöveg előkészítés), hogy mostanra meg legyen oldva.

7. lépés: QA minden nyelvre egy fix ellenőrzőlistával

Nem lehet 30 videóra „ránézni” és késznek tekinteni. Készíts egy ellenőrzőlistát, és mindegyik kimenetet azonosan futtasd végig rajta — így skálázódik a minőség ahelyett, hogy a 25. nyelvnél szétesne.

Nyelvenként ellenőrizd:

Kérj anyanyelvi ellenőrzést a prioritás nyelvekre. Az AI a munka 95%-át elvégzi; egy ötperces anyanyelvi review kiszúrja a esetlen megfogalmazást és a tónusbeli mellélövést, amit az automatikus QA nem. A top piacokon legyen emberi review; a hosszú farokban bízz az ellenőrzőlistában.

8. lépés: Fájlkezelés és szétágaztatás a mesterből

Illustration: shipping one video to the whole world

Harminc videó annyit jelent: harminc fájl, szorozva a platformonként szükséges formátumokkal. Rendszer nélkül a portugál változatot a lengyel csatornára fogod feltölteni.

Nevezd el következetesen a fájlokat. Használj mintát, pl. productdemo_v3_pt-BR_1080x1920.mp4 — kampány, verzió, lokálkód, képarány/méret. A lokálkód (pt-BR, es-MX, ar-SA) megelőzi a klasszikus brazil vs. európai portugál, illetve mexikói vs. kasztíliai spanyol keverést.

Tartsd a mestert egyetlen forrásként. Amikor a mester változik — és előbb-utóbb fog —, az 1. lépéstől futtatod újra a pipeline-t, nem 30 fájlt foltozol kézzel. Verziózd a mestert (v1, v2), hogy mindig tudd, melyik forrásból készült egy adott kimenet. Ez a lényeg: egy mester, egy pipeline, kiszámítható szétágazás.

Exportálj platformonként lokálon belül. Nyelvenként kellhet 16:9 YouTube-hoz, 9:16 Reels és TikTok-hoz, és 1:1 feedhez. Ezeket az oldalarányokat a kész lokalizált vágatból generáld, ne lokalizálj újra formátumonként.

Indítsd el az első többnyelvű csomagot

Kicsiben kezdd, hogy bizonyítsd a pipeline-t: fogj egy kész videót, zárd le mesternek, és told végig a nyolc lépésen három nyelvre — egy teljes szinkron, egy hangklónozás, egy csak felirat. Felszínre kerül minden időzítési, layout és RTL buktató kicsiben, mielőtt mind a 30-ra elköteleződnél.

Ha háromra tisztán fut, ugyanazok a lépések harmincra szinte gondolkodás nélkül kifutnak — csak több render. Hozd be a mestered az app.vivideo.ai felületre, futtasd át az AI video translator és az AI video dubbing megoldásokon, és szállítsd ugyanazt a videót az egész világnak.

Emir Göcen
Szerző

Emir Göcen

A Vivideo társalapítója gépi tanulás és számítógépes látás háttérrel, ő vezeti, hogyan értékeli és kombinálja a Vivideo a legjobb mesterséges intelligenciás videómodelleket.

Készítsd el az első mesterséges intelligenciával készült videódat ingyen

Tervezés, generálás, narráció, arculat és publikálás — 30+ modellen, percek alatt.

Próbáld ki a Vivideo-t ingyen