Hirdetés

Formátum-kiskáté: digitális hangok

|

Napjainkban a végfelhasználók túlnyomórészt MP3 zenékkel találkozhatnak, miközben az audio formátumok tárháza meglehetősen széles. Jelentős különbségek ráadásul nem csak a kiterjesztésekben lelhetőek fel.

Hirdetés

Összeállításunkat kezdjük a PCM-mel - teljes nevén pulzus-kód modulációval (Pulse-Code Modulation) -, amelynek története meglehetősen régre nyúlik vissza. A digitális hangtechnika alapjául szolgáló eljárást elsőként Alec Reeves írta le még 1937-ben. Ez fontos dátum jelen esetben, mivel a PCM nem más, mint az analóg hangnak a digitális, kettes számrendszerben megfogalmazott leképezése. Kódja két tulajdonságból áll össze: a mintavételi frekvenciából és a hang bitmélységéből.

 

 



Előbbi érték azt határozza meg, hogy a rögzítés során másodpercenként mennyiszer mérik meg egy hang amplitúdóját. Míg a bitmélység a mintavételi periódusban gyűjtött jelek pontosságát méri. Mivel olvasóink között bizonyára csak nagyon kevés hangmérnök van, engedtessék meg, hogy egy szemléletes példán keresztül mutassuk be, hogy pontosan miről is van szó.

A való életben a hang folyamatos, míg a digitális világban nem. Képzeljük el, hogy a mi analóg forrásunk egy csapból folyó vízsugár, amely lassan melegedni kezd. Ha szeretnénk lemérni a víz hőjének az emelkedését, akkor ezt csak úgy tehetjük meg, hogy az ujjunkat bedugjuk a folyam alá. Minél gyakrabban tesszük ezt, annál kisebbek lesznek a mintavételi különbségek. Amennyiben mindezt másodpercenként 44100 alkalommal tesszük meg, akkor az szinte már olyan, mintha kezünket folyamatosan a víz alatt tartanánk. A bitrátához pedig képzeljük el, hogy egy két állapotos mérőt teszünk a víz alá, ami csak hideget és meleget tud kimutatni, és azt hogy az 16 különböző értéket tud érzékelni.

A hangrögzítés ugyanígy működik, minél többször veszünk mintát, s azt minél pontosabban tudjuk rögzíteni az adatot, annál inkább közelítünk a valódi állapotokhoz. Ezt nagyjából a videofelvételekhez tudnánk hasonlítani, ahol valójában a mozgóképek mögött állóképek váltakoznak olyan sebességben, hogy azt az emberi szem nem tudja érzékelni. A digitális hangokat is így kell elképzelnünk, jelek gyors - számunkra nehezen érzékelhető - folyamaként. Erről egyébként mi is megbizonyosodhatunk, ha egy hangszerkesztőben teljesen belenagyítunk a dokumentumba. A PCM eljárás tehát a digitális hangrögzítés origója, ahonnan a többi variáns származik.

A formátum azonban önmagában nem használható és csak meglehetősen ritkán találkozhatunk vele formátumként. A való életben inkább Windows mellett a WAV, Macintosh mellett az AIFF fájlokon keresztül találkozhatunk vele, amelyek képesek veszteségmentesen rögzíteni a hangokat.

 

 

 



Tömörítésmentes formátumok: WAV, AIFF

A WAV (Waveform Audio File Format) a lineáris PCM formátumra épül, amelyet a Microsoft és az IBM közösen fejlesztett ki, és a mai napig is széles körben használatos. Az Apple által gründolt AIFF-hez (Audio Interchange File Format) hasonlóan tömörítetlen, veszteségmentes tárolásra képes, amennyiben a felhasználó nem csökkenti le manuálisan a mintavétel, vagy a bitráta értékét.

A két formátum képes a legjobb hangminőség biztosítására, és ezen okból a professzionális felhasználók túlnyomórészt tömörítetlen WAV és AIFF állományokkal dolgoznak. Ha hangrögzítésen gondolkodunk, mindenképpen ezen formátumokat használjuk, mivel azok könnyen szerkeszthetőek, és általában kodek és külön szoftver nélkül is lejátszhatóak (a platformok külön-külön támogatják őket). A tömörítetlen tulajdonság miatt azonban a hordozható lejátszók csak nagyon ritkán birkóznak meg a WAV és AIFF állományokkal. Ennek főként a helytakarékosság az oka, mivel egy veszteségmentes sztereó 44,1 kHz mintavételű, 16 bitmélységű (CD-minőségű) fájl 10 megabájt tárhelyet foglal el percenként.

Veszteségmentes tömörítések: FLAC, ALAC és APE

Ha szeretnénk spórolni a tárhellyel, ugyanakkor nem akarunk lejjebb adni a minőségből, akkor az ALAC ( Apple Lossless Audio Codec), az APE (Monkey's Audio) és a FLAC (Free Lossless Audio Codec) formátumokat érdemes választanunk, amelyek habár tömörítési eljárást használnak, mégis veszteségmentes produktum előállítására képesek. Egyedüli hátrányuk, hogy a kódolás és a dekódolás során erőforrást emésztenek fel.

Kezdjük bemutatásukat az Apple által kifejlesztett formátummal, amely nagyjából 40-60 százalékos tárhely spórolásra képes a FLAC-hoz hasonló lineáris tömörítési eljárást használva. Az adatok ezen esetben egy MP4-konténetben tárolódnak, .m4a kiterjesztéssel. Az ALAC hangokat az Apple eszközei (iPod és iPhone) képesek kezelni, valamint például a VLC lejátszó is megbirkózik ezen állományokkal. Utóbbi kijelentés a FLAC fájlokra is igaz, sőt utóbbi a veszteségmentes tömörítési formátumok közül talán a legszélesebb támogatással rendelkezik. A FLAC a PKZIP is által használt deflate eljárással dolgozik, azzal a nagy különbséggel, hogy speciálisan hangtömörítésre készítették fel. A csendes blokkokat és felesleges duplikátumokat kiszűrve 30-50 százalékos tömörítésre képes, úgy hogy a tömörített állományból később egy veszteségmentes WAV állomány is reprodukálható.

Végezetül érdemes megemlékeznünk a .APE kiterjesztésen tetten érhető Monkey's Audio formátummal is, amely egyes esetekben jobb tömörítésre képes, mint a FLAC. Ám az állományainak a dekódolási ideje sokkal lassabb, így hordozható készülékeken való használata nehézkes, ami az APE elterjedését komolyan gátolja.

Veszteséges tömörítések: MP3, AAC, WMA, Vorbis

A hétköznapokban túlnyomórészt veszteséges tömörítésű hangfájlokkal találkozunk. MP3 fájlok bizonyára majd minden olvasónk gépén megtalálhatóak, míg FLAC hangokat bizonyára jóval ritkább esetben találnánk. Habár a veszteségmentes tömörítések percenként körülbelül - 44,1 kHz mintavételű, 16 bitmélységű felvételek mellett - csupán 5 megabájtot foglalnak el, sok esetben nincs rájuk szükség.

A fülünk nem igazán érzi a veszteségmentes és a veszteséges tömörítés közötti különbséget, így tárhelyspórolási okok miatt inkább az utóbbiak felé billen általában a mérleg nyelve. Egy CD-minőségű MP3 például általában 1 megabájtot foglal el merevlemezünkön percenként, amely a WAV-hoz képest tízszeres, a FLAC-hoz képest ötszörös tömörítésnek felel meg. Ezen formátumok hátránya azonban, hogy veszteséges tömörítést használnak, azaz az algoritmusok által lebutított kódokat később nem tudjuk visszakódolni veszteségmentesen. A különböző eljárások a minőség jelölésére a bitsűrűséget használják, amely azt jelenti, hogy másodpercenként mennyi bináris számjegy írja le a hangot.

 

 

 



A leggyakrabban alkalmazott érték a 128 kbit/s. Minél nagyobb ezen összeg, annál jobb minőségű a felvétel, s persze annál több tárhelyet foglal az állomány. Ettől függően azt ne gondoljuk, hogy egy 192 kbit/s minőségű felvételt utólag elő lehet állítani egy 128 kbit/s-os zenéből. Lehet, de nem érdemes, mivel minőség javulást így nem tudunk elérni.

Ha magukat a formátumokat nézzük, akkor kétségtelenül az MP3 (MPEG 1 Audio Layer 3 ) a legelterjedtebb, amelyet szinte minden zenelejátszás alkalmas kütyü és médialejátszó képes lejátszani. Annak ellenére, hogy szabadalmi oltalmát a Thomson Consumer Electronics birtokolja, amely miatt minden MP3-képes eszköz után jogdíjat kell fizetni. Ingyenes alternatívája a Xiph.org Alapítvány által kifejlesztett szabad és nyílt Vorbis hangtömörítési eljárás, amelyet egyre több szoftver támogat (Winamp, zinf és JetAudio), és amelyet a játékipar is előszeretettel alkalmaz.

Az AAC (Advanced Audio Coding) tömörítési eljárást vélhetően sok PC-s tulajdonosnak be kell mutatni, míg az Apple rajongói ismerősként köszöntik az iTunes alapértelmezett kodekjét. Az AAC az MP3-nak a Dolby Laboratories által továbbfejlesztett változata, amely a népszerű társához képest átlagosan 30 százalékos helytakarékosságra képes azonos minőség biztosítása mellett. A tömörítési eljárás ezt a nem hallható hangok több mint 90 százalékának eltávolításával biztosítja, így az adatfolyamként való továbbítása is meglehetősen hatékony. Az AAC ráadásul a DRM-védelemre (digitális jogvédelem) is képes, ráadásul nem áll szabadalmi oltalom alatt, így érthető, hogy az Apple végül miért e formátum mellett tette le a voksát.

Hasonló képességekkel rendelkezik a Microsoft által kifejlesztett WMA (Windows Media Audio), amely az MP3-nál szintén hatékonyabb kódolást biztosít, mivel ugyanazon minőséget kisebb bitsűrűség mellett is tudja biztosítani. Például elméletben egy 96 kbit/s-os WMA CD-minőséget kínál, míg az MP3-nál ugyanez az érték 128 kbit/s. A redmondi szoftvercég megoldása a gyakorlatban mégsem igazán terjedt el, mivel a másolásvédelme miatt nem lett túl népszerű a felhasználók körében.

 

 

 



MP3 díjak

Meglepő tény, de az MP3 nem teljesen ingyenes. A kereskedelmi forgalomban kerülő termékek – szoftverek és hardverek – után licencdíjat kell fizetni. Az mp3licensing.com oldalon található információk szerint egy MP3-as dekóder után például 0,75 dollárt, míg a codec használatáért szoftverenként 2,5 és 5 dollár közötti összeget, hardver egységenként 1,25 dollárt kell kifizetni. A streaming szolgáltatóknak pedig a forgalmuk 2 százalékát kell ezen célra fordítaniuk.

Mit használjunk?

A fenti kérdésre nehéz egzakt választ adni, hiszen a válasz egy sor tényezőtől függ. Nem mindegy például, hogy a médialejátszóink mely formátumokat támogatják, hogy mennyire akarunk spórolni a rendelkezésünkre álló tárhelyünkkel, s persze az sem utolsó szempont, hogy mennyire jó a hallásunk. Utóbbira talán elsőként nem is gondolnánk, pedig nem mindegy, hogy a különbségeket mennyire képes megkülönböztetni a fülünk. Sok esetben például nehéz eltéréseket felfedezni egy zenei CD, egy 128 kbit/s-os minőségű MP3, vagy egy 96 kbit/s-os WMA zene között.

Fontos szerep jut a zenelejátszónak és a fülhallgatóknak is. Mivel minél jobb egy füles, annál jobban képes hangot adni a különbségeknek, míg egy olcsóbb eszközök sokszor a jobb minőségű hangokat is lebutítják. Általános tanácsként annyit tudunk javasolni, hogy hangrögzítéshez használjunk valamely tömörítésmentes eljárást, majd annak megtartásával tegyünk próbát a különböző formátumokkal.

 

Komolyabban érdekel az IT? Informatikai, infokommunikációs döntéshozóknak szóló híreinket és elemzéseinket itt találod.

Hirdetés
Hirdetés

Úgy tűnik, AdBlockert használsz, amivel megakadályozod a reklámok megjelenítését. Amennyiben szeretnéd támogatni a munkánkat, kérjük add hozzá az oldalt a kivételek listájához, vagy támogass minket közvetlenül! További információért kattints!

Engedélyezi, hogy a https://pcworld.hu értesítéseket küldjön Önnek a kiemelt hírekről? Az értesítések bármikor kikapcsolhatók a böngésző beállításaiban.