Mp3 a spol. aneb nejpoužívanější formáty |
autor: Kyselý Lukáš , publikováno 4.1.2005 |
Každá ztrátová komprese zvuku je založena na nedokonalosti lidského vnímání. Člověk totiž nedovede zpracovat všechny akustické signály, které se dostanou do jeho ucha. To dovede vnímat frekvence v rozsahu 20 Hz do 20 kHz. Ptáte se proč? Je to dáno jeho stavbou. Uvnitř se nachází hlemýžď s Cortiho ústrojím, které jsou složené z velmi citlivých buněk, z nichž každá je citlivá na jiné frekvence, asi do 40 kHz. Avšak při cestě středním uchem dojde k zredukování této frekvence na oněch 20 kHz. K dalším zkreslením pak dojde při vyhodnocování informací mozkem. Starší lidé ale už slyší třeba jen 80Hz až 16 kHz. Platí, že pokud si v mládí zničíme uši, např. posloucháním hodně hlasité hudby, tak ve stáří budeme nejen hluší, ale i neschopní rozlišovat různé zvuky.
Jak tedy komprese funguje? Vstupní signál je převeden do frekvenční oblasti a rozdělen do několika pásem odpovídajících lidskému sluchu. Signál je dále rozdělen na krátké pasáže, které jsou upravovány pomocí psychoakustického modelu lidského ucha. Dojde k zredukování velkého počtu monotónních pasáží na co nejmenší možný počet a k ořezání nejvyšších výšek a nejhlubších basů. Výsledná data jsou pak naformátována do bitového proudu. Kompresních ztrátových formátů je spousta, proto vyberu ty nejzajímavější, vzhledem k jejich podpoře současnými přenosnými přehrávači.
MP3 (MPEG-1 Layer III)
Snad každý z nás má ve svém počítači hudbu ve formátu MP3 a určitě vás taky napadla otázka odkud se vzaly? Plné označení je MPEG-1 Layer III, tudíž jak název napovídá pochází z rodiny videoformátů MPEG (Moving Picture Experts Group). Za kolébku můžeme považovat Fraunhofer Institut Integrierte Schaltungen (IIS), který leží v německém Erlangenu. Zde došlo v roce 1987 k vytvoření ztrátového kompresního algoritmu pro zvuková data.
Nejvýkonnější kompresní schéma Layer III, se objevilo v roce 1991 a jako ISO standart bylo přijato o tři roky později. Pokud bychom si hudbu ukládali jako audio CD, potřebovali bychom opravdu velký disk, neboť je potřeba datového toku 1400kbit/s. Pokud použijeme MPEG audio kódování, tak datový tok a výsledná velikost souboru se zmenší v poměru 1:12 při zachování kvality srovnatelné s CD, což je opravdu znát. Výsledkem je, že na jedno CD-R se vejde tolik MP3 hudby, jako na 10-12 audio CD.
Přestože se jedná o poměrně "starý" formát, představuje v současné době jednu z nejrozšířenějších variant pro ukládání a komprimování audia. Je však mnoho lidí, které můžeme nazvat audiofily, kteří nepovažují formát MP3 za dostatečně kvalitní, protože se děsí spojení ztrátová komprese, ale tento rozdíl je poznat jen na opravdu drahých audiosoustavách. Tím nemyslím bedničky k PC za 10 000.
Pokud nejste netopýr, tak MP3 soubory kódované při datovém toku 192kbit/s (a samozřejmě vyšším), je nemožné rozeznat od audio CD. Je pravda, že tomu dříve tak nebylo v závislosti na primitivních encoderech, ale v dnešní době je situace naprosto odlišná, protože psychoakustické modely jsou na velmi vysoké úrovni. Na internetu se ale vyskytují kvanta MP3 souborů o datovém tuku 128kbit/s, které jsou ještě kódované pomocí starých enkoderů a tudíž nevalné kvality. Stává se tedy často, že narazíme na hudbu, která je pro lidi s aspoň základním hudebním sluchem uširvoucí.
K vytvoření opravdu kvalitní MP3ky je potřeba dvou programů. Těmi jsou grabber a encoder(mp3kovač). Pomocí grabberu dochází ke zkopírování audio stop z CD a k jejich uložení ve formátu WAV, bez jakékoliv ztráty kvality. Pokud byste totiž použili obyčejné nahrávání z CD-ROMky, došlo by k převodu signálu na analogový, tím byste si ochutili hudbu šumem a teprve následně by došlo k digitalizaci pomocí zvukové karty. Pro tento účel patří mezi nejlepší Audiograbber, který grabne CD bez sebemenších potíží i pokud máte starší, či méně kvalitní mechaniky.
Dalším krokem, časově poněkud náročnějším, je vlastní tvorba MP3ky. Encoderů je mnoho a liší se svou kvalitou. Já osobně mám dobré zkušenosti s encodery LAME, jejichž vývoj jde rychle dopředu. Příjemná je možnost přidání encoderu Lame do již zmíněného programu audiograbber a to tak, že dll knihovnu zkopírujete do adresáře, kde máte nainstalovaný audiograbber, čímž vznikne plnohodnotný program na tvorbu MP3ek té nejvyšší kvality.
Pokud chcete mít hudbu opravdu kvalitní, tak volte bitraty od 160 do 256kbit/s. Nižší bitrate než 128kbit/s rozhodně nedoporučuji vzhledem k malé šířce pásma a větší než 256 kbit/s zabírají zbytečně moc místa. Pokud ale nahráváte přes zvukovku (například z kazety), tak vám můžou stačit i menší datové toky (96 nebo 112 kbit/s) .
OGG
Je jeden z nejnovějších. Je to formát, který vznikl prakticky od nuly, tudíž není zatěžkán zbytečnými licencemi. Pokud ho chcete využít, např. ve svém software, nemusíte se trápit složitou licenční politikou, která u MP3 rozhodně je. Pokud srovnáme OGG a MP3 tak pro vysoké hodnoty bitrate (192 - 320 kbit/s) jsou stejně kvalitní, avšak pro hodnoty 128 - 160 kbit/s je OGG kvalitnější. Majitele starších počítačů může zajímat, že OGG zatěžuje procesor o poznání více, proto zakódování hudby trvá podstatně déle.
Další předností OGG, alespoň pro méně zkušené uživatele, je nutnost nastavit pouze minimum parametrů před kódováním, které mají minimální vliv na výslednou skladbu. U MP3 je situace naprosto odlišná, jelikož lze nastavit spoustu hodnot, které mají zásadní vliv na výslednou kvalitu. Toto, spolu se stále se rozšiřující podporou výrobců přístrojů, může být značnou výhodou oproti MP3. K zakódování do OGG můžete použít například program FreeRIP, nebo na stránkách tvůrců nalézt úplně jiný.
WMA (Windows Media Audio)
WMA vyvinula společnost Microsoft a nalézt ho můžete v programovém vybavení Windows Media. Zvukově mírně překonává MP3, zvláště při nižších datových tocích. Tímto formátem Microsoft rozhodně udělal radost velkým nahrávacím společnostem, neboť splňuje podmínku licencování jednotlivých skladeb. Ve spojení s ASF - Advanced Streaming Format - může být WMA streamován, což je důvod proč se stal konkurentem formátu Real Audio. Microsoft tento formát dost drasticky prosazoval s tím, že chtěl vytlačit MP3, což se mu ovšem nepovedlo a s tímto formátem ani nepodaří.
AAC (Advanced Audio Coding)
AAC je součástí audio standardu MPEG-2 a MPEG-4. Hlavním nositelem licence je firma Dolby Labs, ovšem na vývoji se podílelo mnoho výzkumných firem. Největší předností je 48 audio kanálů a širší počet vzorkovacích frekvencí, než nabízí formát MP3. Samozřejmě při mnohem dokonalejší kompresi. K masovému rozšíření ale nedošlo, ačkoliv AAC posloužilo jako základ několika zabezpečených audio formátů. Programů na tvorbu AAC je velice málo. Jedním z nich je dBpowerAMP Music Converter, jenže k podpoře AAC je ještě třeba doinstalovat tento kodek.
VQF (Vector Quantization File)
Tuto technologii vyvinuli v Japonsku v institutu NTT Human Interface Laboratories. Pokud ji opět srovnáme se stařičkým formátem MP3, tak datový tok 80 kbit/s u VQF odpovídá 128 kbit/s u MP3. Kvalitou se naprosto rovnají, proto hlavní rozdíl bude opět ve velikosti výsledného souboru. VQF soubory jsou asi o 30% menší než MP3 při srovnatelné kvalitě. Cenou za tuto úsporu jsou zvýšené nároky na hardware, zvláště při kompresi. Vytvořit VQF skladbu trvá až 10 krát déle než klasickou MP3.
Jelikož se jedná spíše o komerční formát, k jeho masivnímu rozšíření zatím nedošlo a podle mého názoru ani nedojde, právě vzhledem k již uvedené hardwarové náročnosti. Pokud si ho chcete vyzkoušet, tak ke kompresi budete potřebovat již zmíněný dBpowerAMP Music Converter s nainstalovaným VQF kodekem.
Doufáme tedy, že jsme vám přinejmenším přiblížili nejvíce používané zvukové formáty s kterými se můžete setkat ve spojitosti s komprimovanou hudbou a tedy pro nás důležitými mp3 playery. Přestože těchto formátů je poněkud více a existuje možnost volby, mnoho lidí preferuje pouze jeden a na ostatní zcela zanevře, přičemž ani třeba netuší, jaké vlastnosti alternativy vůbec mají. Proto se o své zkušenosti s různými formáty můžete podělit s ostatními v diskuzi pod článkem. To by bylo tedy něco málo pro začátek, příště se již podíváme na pár pro začátek vybraných typů flashových mp3 playerů.
Redakce si vyhrazuje právo odstranit neslušné a nevhodné příspěvky. Případné vyhrady na diskuze(zavináč)pctuning.cz
1) EAC - sparvne nakonfigurovanej
2) Lame tusim 3.9.2 jako GUI Razorlame - a nastaveni "--alt-preset standard", ktere vytvari VBR. Toto nastaveni je dle cetnych flame a jinych diskuzi nejvhodnejsi pro lidi a netopyry ;-)
Jinak s tou kompresi do ogg potazmo ogm (video) to neni treba v pripade videa vubec jednoduche, po marnych pokusech v gordian knotu jsem zvolil xvid, ale to je jina pisnicka ...
Navic rozdil v kvalite mezi mp3 a CD propastny. To poznam i na soustave za 5k.
A zaujimalo by co je pravdy na tom, ze WMA je lepsie ako MP3.
http://www.softpedia.com/get/Multimedia/Audio/Audio-CD-Rippers-Encoders/LAME-ACM-Codec.shtml
Ale ani tak bych si netroufl tvrdit, že rozeznám kvalitně zakódovanou MP3 s vysokým bitratem od kvalitního CD. Nebo mě aspoň nenapadá reprosoustava, která by ty rozdíly dokázala přenést...
Rad bych vedel jak je kvalitni.
Kdybys vazne hodne spicoval usi na uplne nejlepsi mozne audiosoprave pro smrtelniky (20-50kkc), tak bys poznal, ze je to jiny. Ale stejne by tvuj mozek nedokazal rict, ktera ta stopa je kvalitnejsi, protoze v 99.99% neznas original hudby, kterou poslouchas a ani nevis, jak ma znit.
To ze MP3 je uz za zenitem je neco jinyho. MP3PRO je mnohem kvalitnejsi, bohuzel malo rozsirena - OGG i WMA jsou jasne lepsi (pri malych bitratech, coz pro me, jako pro majitele s "omezenou pameti" to rozhodujici).
Na zaklade tveho prizpevku doporucuju navstivit usniho doktora. Akutne.
The_mike
zesak Rotel RA-02, repro Martin Logan Clarity a to nemluvim o "snecich za milion" tak bych se vykaslal na kompresni formaty a poslouchal bych to z CD (pripadne audio DVD). Muj pripad to neni a tak pri dlouhych cestach (treba takovym vlakem) si klidne poslechnu "nekvalitni" hudbu ze svyho ENOXe v MP3(pro). Z tech chrastitek stejne slysite dost zkreslene a tahat sebou Porta Pro je vo nicem kdyz sou tak velkdy o proti spuntum. Proto sou mp3playery oblibeny. Muzu bejt kdy chci a porat mi neco hraje do ucha. Hluku kolem je hafo (SENNHEISERy si kvuli tomu kupovat nebudu) takze o ruchy je stejne postarano takze i kdyz mate bitrate na max stejne vam to nepomuze od rusivejch zvuku. Ja osobne proti "ocesanymu" zvuku nic nemam a drobny odchylky mi nevadej. Kdo bazi po nejvetsi kvalite at nekomprimuje. Komu staci kvalita neco jako z radia at komprimuje a je bez starosti.
Coz pro me, jako pro majitele zarizeni s omezenou kapacitou (512MB) to nejdulezitejsi.
=> me je vlastne jedno, jakou to ma kvalitu pri 256kbps, protoze to si nemuzu dovolit. Me i spoustu podobnych lidi zajimaji jen bitraty kolem 128kbps a tam se teprv ukazuje, kterej format je vyhodnejsi. A na napr. 92kbps MP3PRO nad MP3 jasne vede, at uz je to spraseny jakkoliv...
Nebo se ted strasne bavis, ze ti nekdo skocil na tak trapny pokus o flame? :-)
U me plati pravidlo ... kdyz uz mam poslouchat hudbu na nekvalitnich sluchatkach ... tak to radeji neposlouchat nic. Zkazim si tak naladu vice, nez kdyz nemuzu poslouchat vubec nic.
Pokud prehravac CDcko precte do te miry, ze spravne zafunguji opravne kody, tak slysite hudbu identickou s hudou z originalniho CDcka.
V pripade ruznych ochran CD se vam pochopitelne nemusi podarit vyrobit kopii CDcka a pri divokem grabovani muzete ziskat hudbu, ktera se opravdu bude od originalu lisit (napr. kdyz to prevzorkujete na 48kHz a zpet na 44.1 kHz).
Kazdopadne prasteni audiofilove porad vidi CDDA jako analogovy format a strkaji CDcka do lednice a mysleli, ze se kopirovanim ztraci kvalita uz davno pred vznikem prvnich ochran.
A jinak pokud nepoznas rozdil mezi 192mp3 a 192ogg zajdi si k usnimu... .) (mimochodem tim nemyslim, ze je mp3 uplne na nic.. jak jsem uz psal u prenosnejch zarizeni ti to stejne muze bejt jedno..)
No, beru to tak, že v 21. století se někteří lidé ještě nedokázali naučit ani telefonovat, tak jak jim vysvětlit, co to znamená "digitální data", když většinou nepochopí z návodu ani jak se ladí televize.
No, kdysi Bůh metal v bouřce blesky, dneska zase mění kvalitu CD. Jo jo, potřeba věřit v něco vyššího je holt věčná.
Možná byste někde mohl uvést konkrétní výsledky vašich vlasních měření, třeba by někdo přišel na to, kde soudruzi z NDR udělali chybu...
Ale spíš doporučuji na tyto příspěvky nereagovat, technicky gramotný se pouze rozčílí, a ostatní stejně hledají toho boha protože ... (doplňte dle potřeby)
Ale zpet k tomuto tematu: (jeste si dovolim jedno male rypnuti - pokud je kvalita CDDA 100%, jak muze klesnout o 200%? :o))) mate v podstate pravdu, muze k tomu dojit, ale je potreba "splnit" nekolik nasledujicich faktoru: 1. pouzit nekvalitni program, ktery nedokaze verne vygrabovat audio CD na disk - na toto, jak uz zde bylo zmineno, je jednoznacne nejlepsi Exact Audio Copy, ktery pouziva vyrazne vic moznosti jak dosahnout maximalne mozne stejne kopie nez jen C2 chyb z mechaniky (opakovane cteni, grabovani 2x a porovnani CRC); 2. pouzivat nekvalitni mechaniku, jejiz kvalita zapisu je diskutabilni; 3. pouzivat nekvalitni media. Pokud se alespon jedna z vyse uvedenych podminek splni, skutecne dojde k vytvoreni jine kopie (zamerne nerikam mene kvalitni, ale proste jine) - nebudu ted brat v potaz spatne prectene zdrojove CD nebo pripadny vznikly jitter, snad je jasne, ze tady k chybam (a tedy k pozmeneni nahravky) dojit muze a co proti tomu udelat, ale pouze body 2 a 3 (pripadne jejich kombinaci). Uz tady zaznelo, ze CDDA nema takove opravne mechanismy jako napr datove CD. Vezmeme-li vypalene audio CD, ktere neni na zrovna kvalitnim mediu nebo pripadne je vypalene v mene kvalitni vypalovacce, muze snadno dojit k tomu, ze jednotlive landy a pity na CD nejsou prehravacem spravne rozeznavany (vypalene CD ma vzdy prechody mezi landy a pity mene "ostre" nez lisovane CD). Tedy misto datoveho toku 1100101 prehravac precte 1101101 - takovychto zmen par bitu muze byt pomerne dost a D/A prevodnik uz takovy signal logicky zpracuje trochu jinak. Take z toho duvodu jsou nektere prehravace oznacovany jako CD-R kompatibilni - ne snad proto, ze by jejich starsi bratricci CD-R nenacetli (i kdyz ani to neni vyjimkou a dodnes jsou CD prehravace, zejmena vyssi tridy, ktere CD-R disky tvrdohlave odmitaji), ale prave pro jejich schopnost presnejsiho rozeznani jednotlivych pitu a landu na vypalenem disku.
ale pro lamicky s bakelitovejma bednama, nebo nejakym 5.1 systemem do 10K anebo sony sluchatkama k wallkmanu... to je mozna opravdu pouzivny format...
jak ma clovek neco lepsiho tak to chce vic ... 256kbps (mi pro klid duse staci)
JInak rozdil mp3 a CDDA normalne clovek neslisi ani na bednach za 30K
napriklad Dvojalbum Armstronga stoji cca 1000,- korun...
...
skoroprofesionalni ne....
tyhle domaci surroundy se subwooferem maj heskej stavnatej zvuk ale neni tam autenticka reprodukcni schopnost, trochu haprujou stredy... ale zni to krasne
profesionalni zvuk muzes dosahnout treba s nejakejma monitorama (napriklad alesis)... budou mit kvalitni reprodukci... ale nebudou mit tak stavnatej zvuk.. i kdyz si casto tu stavu tam ty reprosoustavy pridavaj
Ano, za techto okolnosti souhlasim, presto bych ale jeste zvazil ogg, precejen je principialne "cistci"
presety su pe ludi ktory si nevedia nastavit encoder a nemyslim ze by sa netopyry uspokojili s nastavenim --preset standard kde je VBR -V 0 a -q 3
a naco prosim ta pouzivas aj Razorlame ked mas EAC kde si mozes definovat vlastne nastavenie encodera a este ti to aj otaguje
http://www.hydrogenaudio.org/forums/index.php?showtopic=28123
http://www.hydrogenaudio.org/forums/index.php?showtopic=30284
Asi se v tom vyznáte líp a tak mi poraďte. Scháním přehrávač, který bude mít interní paměť(flash) + možnost přidání nějaké další, bude umět OGGy, bude se chovat jako flashdisk a bude co nejlevnější. Na designu mi nezáleží. Nemám to proto, abych s tim machroval před bárbínama, ale na poslech. Na velikosti interní paměti mi nezáleží. Kdyžtak odepisujte na email. Díky
Chces povedat, ze cd s kaktusom ti hra lepsie, ako kopia toho isteho cd bez kaktusu? Asi si anito neskusal, nieto este pocul.
Kde som ja pisal o OGG?
Co me ovsem dostalo je ona myslenka degradace AudioCD pri jeho kopirovani. K tomuto jevu skutecne dochazi, a je to vlivem jitteru (roztreseni) stopy pri vypalovani. Cim vyssi rychlost vypalovani, tim vetsi jitter stopy na AudioCD (proto je nejlepsi vypalovat kvalitni AudioCD rychlosti 1x ;-). A ted k cemu dojde pri cteni. Vzhledem k tomu ze stopa audioCD je jiz sama o sobe bez pridavnych informaci ktere by presne vedly hlavicku po stope a tato stopa je roztresena z vypalovani, dojde k nestejnym casovym prodlevam mezi ctenim jednotlivych pitu na CD protoze hlavicka od jednoho zapsaneho bitu k druhemu urazi jinou vzdalenost vlivem vyrovnavani nepresnosti stopy. Data potom nejdou do D/A prevodniku presne v ten cas, kdy by do nej mely jit, ale v ruznych casovych rozestupech. Tim dochazi k degradaci vysledneho audiosignalu na vystupu prevodniku. Tento jev byl meritelny v CD prehravaci v mericim bode zvanem RF signal. Tento signal vypada jako vice sinusovek najednou v sobe.
Toto vsak neplati pro jakekoliv prehravace s vyrovnavaci pameti ! Prehravac u nejz jdou data nejdrive do FIFO pameti a teprve pote jsou vycitana prevodnikem jsou vycitana v presnych casovych rozestupech a signal je rekonstruovan korektne.
Ovsem jev muze byt u vsech prehravacu jeste podporen prolezanim signalu vyrovnavani hlavicky do audiosignalu a zpusobovat tam ruseni.
Howg.
Moje zkusenost s kompresema je na kvalitnich bednach(3pasma, drevo - cena neznama - odhadem 20000) nasledovna:
MP3 192 a OGG 160 nedokazu rozpoznat od CD. Rozdil uz neni znatelnej jako zkresleni, ale spis nedostatek dynamiky(zvuk je takove placatej a neco mu proti originalu chybi).
Posluchejte si treba SACD na sestave za 5000000 nebo MP3 64kbit. Je mi to uplne ukradeny. Hlavne poslouchejte to co vam staci(preju Vam at to staci poslechove, ale asi musite vychazet z penezenky).
PS:ja ty kvalitni bedny nevlastnim, mam zdedeny drevo a na novy bych nemel ani za rok.
Kdysi sem to skoušel a narhrávka byla na obyčejné soustavě posluchatelná od bytratu 192 a výše.
S autorem bych souhlasil pouze pokud o by se o tom zmíňil u formátu Ogg.
Tam totiž opravdu v tomto případě postačí oněch 112-128
A ještě oproti Mp3 ušetřim nějaký to místo na HDD
OGG je prostě BEST!!!
Pokusne som jeden original stiahol (original bol cca 700MB~wav)na FLAC~q6~950kbps/OGG~10~400kbps,FLAC=501MB,OGG=257MB.Keby, ze mam dobru audio sustavu,a velku diskovu kapacitu,nemam problem si to uchovavat v tychto kvalitach,samozrejme nemam.
koniec koncov priemerne je to mp3~192kbps.Ten FLAC bol len pre prirovnanie,FLAC=bezstratova kompresia.vesele pocuvanie.
jinak Rammstein fur immer !!! :-)
Ještě bych zmínil, že pokud posloucháte hudbu přes PC a sluchátka, můžete zkusit Dolby Headphone (podporované např. v PowerDVD s přídavným AAC packem /přehraje pouze LC-AAC/) nebo prostorový efekt vytvořený ve sluchátkách na zvukové kartě Soundblaster X-fi. Zážitek z poslechu hudbu se tak zvětšuje.