Formátum-kiskáté: mozgóképek

Rengeteg mozgókép-formátum létezik - a kavalkádban sokkal könnyebb választani, ha betekintést nyerhetünk a működésükbe és alapelveikbe. Hogy MPEG-4 vagy DV AVI, illetve bármi mást használjunk inkább, az a felhasználás jellegétől függ.

Kategóriák:

Szerző: Egri Imre 2011. szeptember 27.

következő oldal »

Tíz éve még csak keveseknek adatott meg, hogy mozgóképekkel dolgozhassanak PC-n. Nagyon drágák voltak a digitális – akkor még standard vagy kis felbontású videokamerák –, és az analóg eszközök sem voltak épp olcsók. Ha utóbbi eszközzel rendelkeztünk, akkor viszont szükség volt egy viszonylag drága digitalizálóhardverre (DV-kameráknál FireWire-portra) is, no és a szoftvert sem adták még ingyen akkoriban. De ha mellékelték is az eszközhöz, sokáig csak nehézkesen lehetett szerkeszteni a felvételeket, az akkori merevlemezek kapacitása és a processzorok teljesítménye is szűkös volt a feladathoz.

Azóta már nemcsak a PC, de a videós készülékek is fejlettebbek lettek, így viszonylag olcsón juthatunk memóriakártyás és merevlemezes videorögzítő eszközökhöz. Egy korábbi cikkünkből (Mozgóképrögzítés nem videokamerával) viszont az is kiderült, hogy bizony videózni lehet egy közepes telefonnal, fényképezőgéppel és táblagéppel is, nem is mindig rossz minőségben. Az új eszközök eleve digitális formátumokban rögzítenek, de milyenekben?

 


Kezdetben vala az AVI?

Az első igazán elterjedt videós fájltípus PC-s berkekben az AVI (Audio Video Interleaved) volt. A Microsoft által 1992-ben bevezetett konténerformátumot azóta is sok szoftver használja. Az elnevezése arra utal, hogy szinkronban le lehet játszani a bele csomagolt hangot és képet, mivel a különféle hang- és képfolyamok kis szeletekre bontva párhuzamosan nyerhetők ki a fájlból az olvasás során.

Konténer lévén a formátum csak keretet ad a tulajdonképpeni kódolt mozgókép- és hanganyagokhoz, a lejátszóprogram dolga, hogy ismerje a fejlécben megadott kódolást és ennek megfelelően képes legyen értelmezni az anyagot. Ezt sok lejátszóprogram a Video for Windows rendszerre bízza, amely be- és kikódoló modulokat, úgynevezett kodekeket (codes=coder/decoder) bocsát a program rendelkezésére. Ha az adott jelfolyam kodekje szerepel a rendszerben, akkor egy közönséges lejátszóprogram is fel tudja dolgozni a képet, illetve hangot. Több mai sikeres lejátszó (például VLC Media Player) nem fordul a rendszerhez a kikódolásért, hanem belső rutinjaival oldja meg a feladatot, így nem kell megvásárolnunk és feltelepítenünk a rendszerkodekeket, megkímélve a Windowst egy rakás rendszerleíró adatbázis-beli bejegyzéstől.

Léteznek úgynevezett kodekcsomagok is (codec pack), ezek azonban illegálisan a rendszerből kiemelt elemek és bejegyzések gyűjteményei. Sok modult tartalmaznak, de számos esetben hibás működést eredményezhetnek, így a használatuk nem javasolt. Legális módon legtöbbször valamilyen videoszerkesztő szoftverrel egyetemben kerülnek kodekek a számítógépünkre, illetve sok megvásárolható egyesével is. Az AVI mellett más konténerformátumok lejátszásakor is igénybe vehetők a rendszer dekódoló szolgáltatásai. Ez annál is inkább örvendetes, mivel az AVI sok modern kihívásra nincs felkészülve: nem tartalmazza a kép oldalarányát (aspect ratio), a pontos időkódok – ez a műsorszóró iparban alapvető igény – az AVI módosított formátumaiban alkalmazhatók. Nem képes változó képismétlés kezelésére, valamint a mozgások tömörítésében korlátozottak a lehetőségek.

Tömörített, de mennyire?

A Lumiére testvérek óta a mozgókép – analóg és digitális formáit tekintve is – állóképek sorozatából áll. Hogy a szem folyamatos mozgásként érzékelje a képváltásokat, ahhoz legalább 24 képkockát kell befogadnia másodpercenként (a képváltás mértékegysége az fps, azaz frame per second). Ez rengeteg információt jelent, hiszen egy kép standard felbontásban (PAL-tévérendszert alkalmazó területeken) 720×576 képpontból áll. Ha egyszerűen minden képpontra három színértéket (RGB) és ezzel három bájtot szánnánk, akkor egy egyórás mozgókép-anyag (csak a kép) az említett felbontásban, 25 képismétléssel és pixelenként három bájttal 720×576×25×3×3600 = 111 974 400 000 bájtnyi, azaz majdnem 112 gigabájtnyi tárterületet igényelne.

Ez megengedhetetlenül sok az adatátviteli sebesség korlátai miatt is, így nem véletlen, hogy mind a színinformációkat, a képkockán belül a részleteket, illetve a képkockák közötti változásokat tömörítik. Veszteségmentes videokódolás tehát nincs, a kérdés, hogy mennyit vesztünk.

 

Ma a jobb fogyasztói kamerák is csak 1080 soros felbontással dolgoznak, de a digitális mozaikban már rendelkezésre áll a 4K-s technológia is


Az emberi látás sokkal inkább érzékeny a világosság változásaira, mint a színre, sok mindennel elboldogulunk színvakon is, ezért már az analóg videózásban is kettéválasztják a képet világosságra és színjelekre, több sávszélességet, illetve tárterületet hagyva az előbbinek. A világosságadatok (Y) mellé kiegészítőként társulnak a színkülönbség-adatok (Cr és Cb, azaz a vörös és kék), e módszer valamilyen válfaja használatos a digitális, JPEG alapú (például DV, M-JPEG és mindegyik MPEG) videokódolás során is. Általában négy képponthoz a négy világosságinformáció mellett csak kevesebb színinformáció található.

A szín-mintavételezést rendszerint a világosságjel, a horizontális és vertikális színfelbontás arányának megadásával jellemzik (például 4:1:1 a DV-kamerák esetében, 4:2:2 a DVCPRO 50-nél, 4:2:0 a HDV és AVCHD esetében és akár 4:4:4, azaz teljes színfelbontás egyes H.264 és MPEG-4 AVC variánsoknál). Az átalakítások nem éppen egyszerűek, elég, ha tudjuk, hogy minél több színinformációt tárolunk, annál kevésbé lehetnek a tömörített képeken a kontúrok mentén színszellemképek, áthallások.

A legelső mozgóképes formátumok nem tettek mást, mint egy rakás (gyakorlatilag) JPEG-kódolással készült állóképet sorakoztattak fel egymás után. A JPEG-kódolás a képen belüli ismétlődéseket kihasználja tömörítéskor és – beállítástól függően – jelentős mennyiségű részletet elhagy. Ilyenek például a DV AVI és az M-JPEG (Motion JPEG), előbbivel a Digital8 és MiniDV szalagos kamerák felvételeiként, utóbbival analóg forrásból digitalizáló régebbi rendszerek esetében találkozhatunk. A csak képkockán belüli (intraframe) tömörítés előnye, hogy nincs szükség a következő kockák előolvasására és kis számítási teljesítményű számítógéppel (akár egy 1 gigahertzes, Pentium III-alapú PC-vel) is szerkeszthetők megfelelően fürge előnézettel. Hátránya, hogy a tömörítés nem terjed ki a közeli képkockákban található hasonlóságok kihasználására, így egy óra DV-felvétel (hanggal együtt) mintegy 13 GB tárterületet igényel.

 

Színminta-vételezések balról jobbra javuló minőség szerint rendezve. A bal oldali minta a DV-kamerák, a jobb oldali a H.264 High profillal készült kereskedelmi anyagok minőségét tükrözi


Sokkal kevésbé pazarlók azok a formátumok, amelyek ugyanazokat a blokkokat képesek az előző vagy következő képkockákon belül más pozícióban felhasználni, azaz a mozgásokat tömöríteni. Ez nagyon erőteljes megtakarítást tesz lehetővé, hisz ugyanazok a blokkok – például egy alak, arc, felirat – akár több száz képen keresztül is megjelenik a képen, csak másutt, esetleg minimális különbségekkel. Ilyenek az MPEG-1/2/4 és hasonló formátumok, például a MOV konténerekben is használatos H.264. Valamennyinek előnye a takarékosabb tömörítés, hátrányuk viszont, hogy a lejátszás és a kódolás még inkább erőforrás-igényes. Számos alfajuk létezik – például internetes lejátszásra vagy DVB-T műsorszórásra optimalizált –, és nagyon sok múlik a mozgások visszaadásában a kódolón.

Megjegyzendő még, hogy itt is, akárcsak a hangkódolók esetén, megkülönböztetnek fix és változó bitarányú kódolást (a bitarány mutatja meg, hogy másodpercenként hány kilobit tárterületre, illetve adatátviteli teljesítményre, sávszélességre van szükség a használathoz). A fix bitarány sokszor követelmény az olyan statikus átviteli teljesítményt nyújtó rendszereknél, mint a tévés műsorszórás vagy a DV-kamerák szalagos rögzítőegysége. Fix bitarány esetén a mozgalmasabb jelenetek leképezésénél sem lépheti túl a kódoló a határt és az abszolút eseménytelen, gyakorlatilag sávszélességet alig igénylő álló témáknál sem takaríthat meg semmit. A változó bitarány viszont igen, cserébe nagyfokú előolvasás szükséges hozzá, és – hacsak erre a videofolyamot nem készítik fel megfelelően – megnehezíti a „csévélést” is.

Cimkék: video, film, formátum, avi, videoszerkesztés

következő oldal »

Videoszerkesztő

Videoszerkesztő videó

formátum filmek galéria

Kapcsolódó tesztek

Corel VideoStudio Pro X4

Kommentek A hozzászóláshoz jelentkezzen be!

A hozzászólások a vonatkozó jogszabályok értelmében felhasználói tartalomnak minősülnek, értük a szerkesztőség és a szolgáltatás üzemeltetője semmilyen felelősséget nem vállal! A moderálási elvekbe ütköző hozzászólásokat szerkesztőségünk bármikor törölheti.