Komprimerade ljudformat

Hur funkar tekniken bakom bra hifi?

Moderator: Redaktörer

Användarvisningsbild
Flint
Rör om i grytan!
 
Inlägg: 20456
Blev medlem: 2004-07-11

Komprimerade ljudformat

Inläggav Flint » 2007-01-23 14:33

Fick inspiration från en tråd för några månader sedan där mike34 visade vad olika komprimeringsformer la till av oljud. Jag har gjort något liknande men tittat vad som händer med brus och dist. Jag har alltså komprimerat originalet till mp3 och flac osv, och sen kodat tillbaka igen till wav. 16Bit och 44.1kHz genomgående .


Först originaltonen på 1kHz och -6dB rms. Filstorlek1723kB
Bild


Mp3 128k. Filstorlek 158kB
Bild


Mp3 192k. Filstorlek 236kB
Bild


Mp3 320k. Filstorlek 394kB
Bild


Wma 128k. Filstorlek 169K
Bild


Ogg 128k. Filstorlek 27kB
Bild



Ape normal. Filstorlek 232kB
Bild



Flac 5. Filstorlek 276kB
Bild


Thd kanske inte är helt rätt att utvärdera på det här sättet eftersom den verkar bestå av brus, men jag tog med den i alla fall bara för att se vad som händer.

Vad kan man läsa ut av det här, ni som kan er komprimering?


/

Användarvisningsbild
guldfisk
 
Inlägg: 3660
Blev medlem: 2005-10-11
Ort: Stockholm

Inläggav guldfisk » 2007-01-23 15:04

Vilken mp3-kodare? LAME 3.97?
...perspektiv...

Användarvisningsbild
Flint
Rör om i grytan!
 
Inlägg: 20456
Blev medlem: 2004-07-11

Inläggav Flint » 2007-01-23 15:10

Lame 3.93

Användarvisningsbild
guldfisk
 
Inlägg: 3660
Blev medlem: 2005-10-11
Ort: Stockholm

Inläggav guldfisk » 2007-01-23 15:17

Den versionen av LAME är tydligen misslyckad och de avråder från den på Hydrogenaudio.

http://www.hydrogenaudio.org/forums/ind ... =16&t=4455

Koda om i 3.97 istället.
...perspektiv...

Användarvisningsbild
Flint
Rör om i grytan!
 
Inlägg: 20456
Blev medlem: 2004-07-11

Inläggav Flint » 2007-01-23 15:22

OK.

Användarvisningsbild
silvervarg
 
Inlägg: 1228
Blev medlem: 2005-03-28
Ort: Linköping

Inläggav silvervarg » 2007-01-23 15:43

Ojdå, det här var inte lätt. Jag gör ett amatörförsök att tolka graferna.

Första som man kan utläsa är att losslessformaten, i detta fall Ape och FLAC förstör inte musiken alls. Precis som förväntat eftersom de är lossless. Dvs bitströmmen som kommer ut efter avkodaren är exakt samma som originalet.

På snålkodningsformaten så ser det mystiskt ut med nivån under 1kHz peaken på mp3-filerna. Jag har aldrig upplevt hörbara problem där, visserligen på drygt -50dB. Detta höjer upp THD så markant att vi tyvärr inte kan använda denna siffra för vidare analys.
Frågan är om det inte påverkar SNR också så att vi inte kan analysera vid desa siffror heller.
Troligen ett problem med kodaren, så vi bortser tills vidare från mp3:orna.

Mest illa brukar vassa spikar uppåt på kurvorna vara. Dvs det upplevs som mer störande. Värst ser spiken på ca 1.5kHz på Wma 128K ut att vara.
Svårt att avgöra hur puckeln runt 100Hz på Ogg 128K kommer att upplevas. Eftersom den ligger på ca -90dB så tror jag inte att den blir lika störande.

Sedan har vi ett ganska allvarligt problem till, nämligen att 1kHz tonen breddas i frekvens. I originalet så går 900Hz på ca -80dB. På OGG ca -60dB. På WMA ca -70dB, men då är andra problem värre på WMA-filen.

Användarvisningsbild
Flint
Rör om i grytan!
 
Inlägg: 20456
Blev medlem: 2004-07-11

Inläggav Flint » 2007-01-23 16:14

.

Lame 3.97.



Mp3 128k.
Bild



Mp3 192k
Bild



Mp3 320k
Bild

Användarvisningsbild
Flint
Rör om i grytan!
 
Inlägg: 20456
Blev medlem: 2004-07-11

Inläggav Flint » 2007-01-23 16:22

.

Real audio. 128k.

Bild



Mp3 128k. Zing encoder.
Bild



Dolby Ac3 128k.
Bild
Senast redigerad av Flint 2007-01-23 16:52, redigerad totalt 2 gånger.

Användarvisningsbild
Max_Headroom
Adventurer
 
Inlägg: 19296
Blev medlem: 2003-10-03
Ort: Metropolis, men passet är från Moskva

Inläggav Max_Headroom » 2007-01-23 16:34

Mycket intressant detta. Jag har nog kodat min sista mp3a...
Denna signatur är endast för privat bruk. Vänligen läs ej!

Användarvisningsbild
Bill50x
Trevlig prick
 
Inlägg: 32815
Blev medlem: 2004-07-15
Ort: Bromma-Stockholm

Inläggav Bill50x » 2007-01-23 17:49

Själv rippar jag numera allt i flac....

/ B

Användarvisningsbild
Belker
 
Inlägg: 5523
Blev medlem: 2003-07-16
Ort: Hill St. Pct

Inläggav Belker » 2007-01-23 17:58

Men vad säger detta egentligen? Mp3 t.ex är ju utvecklat för att koda komplexa musiksignaler med mänsklig hörsel i åtanke, inte en spik av en frekvens. Graferna säger ju inget om vad som låter bäst av de reducerande alternativen.

Fast ändå kul med dådakraft, Flint! :)

Användarvisningsbild
JB
 
Inlägg: 3672
Blev medlem: 2006-07-31
Ort: Övik

Inläggav JB » 2007-01-23 20:10

Det är väl självklart att kurvan ser helt körd ut för Mp3 när tex vid 192 kbit/sec, över 6/7 av all orginal data är borta.. det kan man väl räkna ut själv att kurvan måste förstöras ganska ordentligt...
Men vad gör det när man knappt kan höra skillnaden?
Men men... blir ändå inte förvånad, många här verkar ju bara gå efter kurvorna när dom köper högtalare också så...

Användarvisningsbild
guldfisk
 
Inlägg: 3660
Blev medlem: 2005-10-11
Ort: Stockholm

Inläggav guldfisk » 2007-01-23 20:20

JB skrev:Det är väl självklart att kurvan ser helt körd ut för Mp3 när tex vid 192 kbit/sec, över 6/7 av all orginal data är borta.. det kan man väl räkna ut själv att kurvan måste förstöras ganska ordentligt...


Vorbis, WMA m fl använder också förstörande komprimering.

---

När det gäller subjektiva tolkningar, gav följande test inget signifikant skillnad mellan AAC, Vorbis, MP3 och WMA vid ~140 kb/s:
http://www.listening-tests.info/mf-128-1/results.htm
...perspektiv...

Användarvisningsbild
Flint
Rör om i grytan!
 
Inlägg: 20456
Blev medlem: 2004-07-11

Inläggav Flint » 2007-01-23 20:21

Belker.
Äh, jag är bara nyfiken. Utvärderingen överlåter jag till var och en.
Jag bara testar för att det är kul.

Någon som har en förklaring till varför Mp3 "stannar" vid -50dB vid frekvenser lägre än mätfrekvensen?


Med 200Hz mätton har dynamiken i basen sjunkit ytterligare. Måste vara en följd av komprimeringen, att plocka bort "onödig" information.

Bild
Senast redigerad av Flint 2007-01-23 21:54, redigerad totalt 1 gång.

Användarvisningsbild
Bill50x
Trevlig prick
 
Inlägg: 32815
Blev medlem: 2004-07-15
Ort: Bromma-Stockholm

Inläggav Bill50x » 2007-01-23 20:29

JB skrev:Det är väl självklart att kurvan ser helt körd ut för Mp3 när tex vid 192 kbit/sec, över 6/7 av all orginal data är borta.. det kan man väl räkna ut själv att kurvan måste förstöras ganska ordentligt...
Men vad gör det när man knappt kan höra skillnaden?
Men men... blir ändå inte förvånad, många här verkar ju bara gå efter kurvorna när dom köper högtalare också så...


Du har en poäng här. Övertron när det gäller mätdata är stor. Oavsett om det gäller enskilda chip, rörförstärkare eller hela högtalare. Omvänt, apparater som mäter "perfekt" är självklart bäst, även om det råkar vara en 399:- dvd-spelare med snörrät frekvensgång...

Sedan är det förstås en annan sak om man vill förstöra råmaterialet. Hanterar man bilder brukar rådet vara att spara originalet och göra komprimerade kopior i de fall det behövs (tex vid distribution eller på en webbsajt).

Samma borde gälla musiken. Vad är det för vits med att köpa komprimerade mp3´or? Köp bästa möjliga istället och komprimera vid behov.

/ B

Användarvisningsbild
rikkitikkitavi
Good loudness
 
Inlägg: 12073
Blev medlem: 2003-07-16
Ort: Somewhere nice

Inläggav rikkitikkitavi » 2007-01-23 22:41

kan man inte säga att en mätning kan inte förklara varför något låter bra, men den kan förklara varför något INTE låter bra?

För övrigt väldigt intressant tråd.

/Rickard

Användarvisningsbild
Svante
Audiot!
 
Inlägg: 37552
Blev medlem: 2004-03-03
Ort: oakustisk

Inläggav Svante » 2007-01-23 22:47

Mja, såna här grafer blir ju meningslösa att tolka utan att förstå psykoakustiken bakom. Visst, det blir sämre SNR, men bruset som uppstår "sopas effektivt under mattan", dvs energin läggs där det maskeras som bäst. Vanlig spektralanalys fungerar inte som hörselintrycksmätare längre, eftersom snålkodningen är optimerad mot örats egenskaper.

Jag tycker man ska tolka dem som "oj är det så mycket brus och ändå hörs det inte" hellre än "oj är det så mycket brus, det kan inte låta bra".

...eller, ja ni förstår nog vad jag menar. Visst hörs det om det kodas för snålt, och speciellt i kaskad, men det hörs bra mycket mindre än vad mätningarna indikerar, rakt av.
Så länge har jag längat efter att loudness war skulle vara över. Nu börjar jag tro att vi faktiskt är där. Kruxet är att vi förlorade.

Användarvisningsbild
Flint
Rör om i grytan!
 
Inlägg: 20456
Blev medlem: 2004-07-11

Inläggav Flint » 2007-01-23 23:20

Svante skrev:Mja, såna här grafer blir ju meningslösa att tolka utan att förstå psykoakustiken bakom. Visst, det blir sämre SNR, men bruset som uppstår "sopas effektivt under mattan", dvs energin läggs där det maskeras som bäst. Vanlig spektralanalys fungerar inte som hörselintrycksmätare längre, eftersom snålkodningen är optimerad mot örats egenskaper.

Jag tycker man ska tolka dem som "oj är det så mycket brus och ändå hörs det inte" hellre än "oj är det så mycket brus, det kan inte låta bra".

...eller, ja ni förstår nog vad jag menar. Visst hörs det om det kodas för snålt, och speciellt i kaskad, men det hörs bra mycket mindre än vad mätningarna indikerar, rakt av.

Vilket kan vara nyttan med en sån här tråd. Att man får reda på varför det låter såpass bra ändå, och att man inte ska stirra sig blind på det vetenskapen tolkar som "fakta". Ett annat exempel på det är rörförstärkare som musikförmedlare.

Användarvisningsbild
JB
 
Inlägg: 3672
Blev medlem: 2006-07-31
Ort: Övik

Inläggav JB » 2007-01-24 04:06

guldfisk skrev:
JB skrev:Det är väl självklart att kurvan ser helt körd ut för Mp3 när tex vid 192 kbit/sec, över 6/7 av all orginal data är borta.. det kan man väl räkna ut själv att kurvan måste förstöras ganska ordentligt...


Vorbis, WMA m fl använder också förstörande komprimering.

---

När det gäller subjektiva tolkningar, gav följande test inget signifikant skillnad mellan AAC, Vorbis, MP3 och WMA vid ~140 kb/s:
http://www.listening-tests.info/mf-128-1/results.htm


Jo, tog bara Mp3 som exempel.

Men en sak jag funderar på när jag ser dom där värderna som oftast brukar ha en stor betydelse när många väljer förstärkare (om jag uppfattat rätt), om Mp3 distar så mycket, hur mycket skiljer det då i ljud mellan billiga och dyra förstärkare?
För jag tror inte att värst många förstärkare har ett THD värde på över 0.15% oavsett prisklass ;) (320 kbit mp3)
Och dom flesta kan ju inte höra skillnad mellan 320 kbit mp3 och wav

Användarvisningsbild
Svante
Audiot!
 
Inlägg: 37552
Blev medlem: 2004-03-03
Ort: oakustisk

Inläggav Svante » 2007-01-24 08:49

Flint skrev:Vilket kan vara nyttan med en sån här tråd. Att man får reda på varför det låter såpass bra ändå, och att man inte ska stirra sig blind på det vetenskapen tolkar som "fakta". Ett annat exempel på det är rörförstärkare som musikförmedlare.


Nja... Det är ju fakta att SNR är, var det 50 dB? Tolkningen ligger ju i hur man tolkar fakta, inte om det är fakta.

"Vetenskapen" vet nog bättre än att försöka mäta SNR på en MP3a. Man har förstått att man behöver undersöka hörbarheten med lyssnartest eftersom komprimeringsalgoritmerna är medvetet gjorda för att maximera transparensen med minimalt SNR.

En rörförstärkare däremot är det inte. Den bidrar med dist och brum och brus som de vanliga mätmetoderna är finfina på att detektera. Det kommer man också att märka om man utsätter dem för en F/E-lyssning.
Så länge har jag längat efter att loudness war skulle vara över. Nu börjar jag tro att vi faktiskt är där. Kruxet är att vi förlorade.

Användarvisningsbild
Flint
Rör om i grytan!
 
Inlägg: 20456
Blev medlem: 2004-07-11

Inläggav Flint » 2007-01-24 09:19

Svante skrev:"Vetenskapen" vet nog bättre än att försöka mäta SNR på en MP3a. Man har förstått att man behöver undersöka hörbarheten med lyssnartest eftersom komprimeringsalgoritmerna är medvetet gjorda för att maximera transparensen med minimalt SNR.

Vilket ger ett utmärkt tillfälle att diskutera definitionen för thd.

THD (Total Harmonic Distortion). "Harmonisk" brukar ju syfta till jämna övertoner men i thd ingår även de udda. Märkligt.

SAOL anser så här, citat:
harmonisk [-mo´-] adj. -t -a
som avser musikalisk harmoni el. harmonilära; samstämmande, välljudande; helgjuten


När man mäter thd utgår man från en mätton och mäter nivån på högre multipler av densamma. Underförstått att grundtonen har "skapat" dom. Eller snarare att mätobjektet har skapat dom pga. mättonen. Men i fallet Mp3 har vi istället någon form av brus på dessa mätpunkter, men också däremellan. Alltså finns inte tillskottet bara på mätpunkterna. Likt förbannat har bruset kommit av att vi har använt grundtonen som signal. Om vi tar bort mättonen har vi heller inget brus. Kan man då inte säga att bruset är att betrakta som thd, även om det i det digitala fallet har uppstått på ett lite annorlunda sätt än i det analoga. Om man tog bort bruset mellan multiplerna skulle ju förhållandet vara identiskt med en analog mätning.

Om man hårddrar det hela är ju situationen ännuvärre för Mp3 än vad distvärdet visar eftersom det också finns skräp mellan multiplerna. Jag utgår då från att programmet mäter signalen bara vid varje multippel. Tänker jag fel?


Återgå till Teknikforum


Vilka är online

Användare som besöker denna kategori: Google [Bot] och 11 gäster