24-192 bättre än 16-44?

av **Svante** » 2013-05-19 20:29

IngOehman skrev:
MagnusÖstberg skrev:Det där är väl ändå inte riktigt kontentan av det Svante skriver?

Och för att klargöra, anser du numera att CD-mediat kan förkastas till sophögen?

Nej verkligen inte.

På båda.

1. Det jag skriver är inte kontentan av det Svante skrev. Jag invände mot det Svante skrev.

IngOehman i en annan tråd skrev:Jag läser en text som någon annan skrivit, och jag försöker som
alltid förstå vad den som skrivit den menat.

Hrrm.

av **Svante** » 2013-05-19 20:39

IngOehman skrev:Slutligen är det inte ens riktigt att mikrofonbruset för det mesta är begrän-
sande faktor, för vid akustiska inspelningar är ofta lokalbruset större. Men
även där gäller - man bör inte göra system "så dåliga som möjligt", utan så
bra som möjligt.

Om du menar tekniskt bra så håller jag inte med.

Man bör göra tekniska system så bra som de behöver vara. En taxibil bör inte ha prestanda som en F1-bil. En personbil bör inte kunna transportera en last på 10 ton.

I "bra" bör man väga in allt, även sådant som kostnad och hanterbarhet och hur stor skillnad en egenskap gör givet det sammanhang som produkten ska användas.

Jag håller med om att det är klokt att ha viss marginal för framtida utveckling när man sätter en standard, men menar att den marginal som valdes när CD-standarden sattes räcker fortfarande.

...och du har fortfarande inte svarat på frågan: Tycker du att ditherbruset i mina exempel har en störande nivå? Kanske undviker du att svara på den frågan för att svaret du bör ge inte stämmer med linjen du har valt i den här tråden?

av **Svante** » 2013-05-19 20:45

JB skrev:Hur mycket lägre än 16/44 tror ni man kan gå med modernt mixad musik med runt 10 i crest innan man börjar höra försämring?

8 bitar räcker utmärkt, utom mellan låtarna då.

Jag gjorde ett exempel på det för ett tag sedan:

http://user.faktiskt.io/svante/quant/supervisor4tri.wav
http://user.faktiskt.io/svante/quant/supervisor6tri.wav
http://user.faktiskt.io/svante/quant/supervisor8tri.wav
http://user.faktiskt.io/svante/quant/su ... r10tri.wav
http://user.faktiskt.io/svante/quant/su ... r12tri.wav
http://user.faktiskt.io/svante/quant/su ... r14tri.wav

Siffran avspeglar amplitudkvantiseringen, räknat i bitar.

En reflexion man kan göra då är att det brus som CD-systemet ligger lika mycket lägre än det brus man kanske hör i 8-bitsversionen, än vad signalen gör i 8-bitsversionen. Alltså tänk er att ni bara hörde bruset i 8-bitsversionen och försökte höra ett brus som är lika mycket tystare än det.

av **Svante** » 2013-05-19 20:54

IngOehman skrev:Jag tycker debatten förtjänar att få innehålla även nyanserna. Om med dem inkluderade är CD-systemet bättre än många tror, men inte gått nog för de mest krävande fallen.

Har något exempel på något som har getts ut på CD som hade behövt större SNR än vad CD-systemet har? Eller är det bara testsignaler du pratar om?

av **IngOehman** » 2013-05-19 22:58

Svante: Om du är intresserad av en seriös diskussion så behöver du sluta
upp med den mycket låga nivån på retorik som du pysslar med i vartenda
ett av inläggen härovan. Mycket trist stil.

JB skrev:Hur mycket lägre än 16/44 tror ni man kan gå med modernt mixad musik med runt 10 i crest innan man börjar höra försämring?

Det är inget man behöver gissa om.

Man kan som regel gå ned till under 12 bitars upplösning utan att någon
reagerar om det rör sig om "normal-misshandlad" populär musik. Det finns
fall då det är svårt att höra även när man går ned till 8-10 bitars upplösning.

Men det säger mera om hur illa musik av idag är misshandlad, än om hur bra
CD-systemet är i jämförelse med vad som fordras om man vill kunna återge
även de mest krävande akustiska ljud som finns, som något kan tänkas vilja
kunna återge.

Men din fråga är intressant och befogad. För mig säger dock svaret framför-
allt att det är illa ställt med mycket av dagens populärmusik.

Vh, iö

av **MagnusÖstberg** » 2013-05-19 23:38

IngOehman skrev:
MagnusÖstberg skrev:Det där är väl ändå inte riktigt kontentan av det Svante skriver?

Och för att klargöra, anser du numera att CD-mediat kan förkastas till sophögen?

Nej verkligen inte.

På båda.

1. Det jag skriver är inte kontentan av det Svante skrev. Jag invände mot det Svante skrev.

2. Jag har åtskilliga gånger försvarat CD-systemet och försökt klargöra hur mycket bättre det är och hur mycket längre det räcker än vad många av systemets belackare tror och/eller hävdar.

Tack för ett utförligt och bra svar.

Jag tror dock att du inte riktigt förstod Svante, men det ser jag att han redan klargjort.

av **IngOehman** » 2013-05-20 00:06

Jag förstår honom fullständigt, men det betyder faktriskt inte att jag behöver
hålla med honom. Flera saker han skrivit är faktiskt direkt felaktiga.

Och om han sen ser CD som något som INTE behöver kunna hantera allt (både
F1-prestande och att flytta 10 ton) så får det stå för honom. Min synpunkt är
att CD-systemet inte är ett system som hade behövt vara kompromissbehäftat
alls, utan som faktiskt hade kunnat dimensioneras så att det klarar av att åter-
ge alla ljud som någon kan tänkas vilja återge.

Men så valde man inte. Man gjorde det med negativa marginaler, men tillräckligt
bra för att duga för det mesta (programmaterial/oftast).

Jag klagar inte på dem som gjorde dessa val, men jag motionerar min rätt att
ha en uppfattning i saken, och saken är den att jag önskar att de hade valt 20
bitars upplösning istället.

Men jag kommer självklart att fortsätta att försvara CD-systemet mot osakliga
angrepp. På samma sätt som osakliga hyllningar eller påståenden om tillräcklig-
het utan invändningar, bör kommenteras de också.

Vh, iö

av **Svante** » 2013-05-20 00:45

IngOehman skrev:Svante: Om du är intresserad av en seriös diskussion så behöver du sluta
upp med den mycket låga nivån på retorik som du pysslar med i vartenda
ett av inläggen härovan. Mycket trist stil.

Mm, detsamma. Att undvika frågor är ett klassiskt exempel på retorik. Ditt bokstavstolkande och dina avsiktliga missförstånd likaså.

Tycker du att ditherbruset i mina exempel är störande?

Har du något exempel på en utgiven CD som skulle ha behövt högre SNR än CD-mediet har?

av **IngOehman** » 2013-05-20 03:11

Du vet att jag talar om musiksignaler och du vet att jag undersökt de
här sakerna redan för nära 30 år sedan. Varför låtsas du något annat?

Missförstå mig inte - jag förnekar dig inte rätten att ställa låga krav, du
har lika rätt till din uppfattning som alla andra till sina. Men du måste av
samma skäl acceptera både att andra har samma rätt som du, och även
att du inte kan bevisa frånvaron av ett problem genom att exemplifiera
med ett fall där inte problemet visar sig...

Redan de gamla grekerna förstod dessa vetenskapliga fundamenta.

Vh, iö

av **PerStromgren** » 2013-05-20 06:55

För att kunna säga att CD-standarden inte är tillräcklig, duger ett enda exempel jättefint. Finns det någon kommersiell inspelning där så är fallet, dvs där 96 dB resp 22 kHz inte räcker? Jag tvivlar, men låter mig gärna övertygas om motsatsen.

av **Svante** » 2013-05-20 07:44

IngOehman skrev:Du vet att jag talar om musiksignaler och du vet att jag undersökt de
här sakerna redan för nära 30 år sedan. Varför låtsas du något annat?

Missförstå mig inte - jag förnekar dig inte rätten att ställa låga krav, du
har lika rätt till din uppfattning som alla andra till sina. Men du måste av
samma skäl acceptera både att andra har samma rätt som du, och även
att du inte kan bevisa frånvaron av ett problem genom att exemplifiera
med ett fall där inte problemet visar sig...

...vilket rimligen innebär att bevisbördan ligger hos dig?

Men ok, jag ska hjälpa dig med att plocka ut precis bara de frågor som du vägrar att besvara en gång till. FYI: Det är det undvikandet som gör att debatten går i cirklar.

Svante skrev:Tycker du att ditherbruset i mina exempel är störande?

Har du något exempel på en utgiven CD som skulle ha behövt högre SNR än CD-mediet har?

Sista frågan får du gärna exemplifiera, dvs inte bokstavstolka och bara svara ja/nej.

av **Harryup** » 2013-05-20 09:23

Finns det inga praktiskt hörbara skillnader på digitalsidan förutom brus?
Går det att höra andra skillnader mellan olika transporter?
Är teoretiska gränser och skillnader just teoretiska eller är finns det praktiska poänger som kan vara hörbara för till exempel dac-tillverkare där en 24/96 signal underlättar konstruktionen?

Mvh/Harryup

av **rikkitikkitavi** » 2013-05-20 09:24

IngOehman skrev:Du vet att jag talar om musiksignaler och du vet att jag undersökt de
här sakerna redan för nära 30 år sedan. Varför låtsas du något annat?

Missförstå mig inte - jag förnekar dig inte rätten att ställa låga krav, du
har lika rätt till din uppfattning som alla andra till sina. Men du måste av
samma skäl acceptera både att andra har samma rätt som du, och även
att du inte kan bevisa frånvaron av ett problem genom att exemplifiera
med ett fall där inte problemet visar sig...

Redan de gamla grekerna förstod dessa vetenskapliga fundamenta.

Vh, iö

Tittade du på CD mediat redan för 30 år sedan (1983) ?

(iofs dum fråga, jag tror många som arbetade med audio tittade på CD mediat när det var nytt eftersom det var ett paradigmskifte att gå från analog teknik till digital, jmfr oxfile/köttfärsdebatten

)

Det måste ha utvecklats enormt, på den tiden fanns inte översampling till någon reda och de analoga filtren var ju behäftade med stora fasfel mm. Dessutom hade många endast 14 bitars DACar (tekniska begränsningar).
Det förekom ju ett bit-race precis som ett Watt-race på förstärkare.

Här är lite historik, mycket fokuserat på Phillips såklart (Holländskt ursprung på hemsidan)

http://www.dutchaudioclassics.nl/the_ev ... ps-tda1541

Jag utgår givetvis att dina inlägg i tråden är baserade på mer aktuell teknik

av **Svante** » 2013-05-20 10:06

Harryup skrev:Finns det inga praktiskt hörbara skillnader på digitalsidan förutom brus?

Alltså, man får bestämma sig. Det finns inga praktiskt hörbara skillnader annat än bandbegränsning och brus som beror på samplingen.

Däremot finns det andra skillnader mellan praktiska implementationer, där jag skulle säga att den viktigaste är tonkurvepåverkan i passbandet. Ytterligare skillnader kan bero på jitter (vars betydelse jag tror har överdrivits kraftigt i de praktiska fall som finns idag), eller att det ligger olika produktioner på olika medier (masteringseländet).

Båda synsätten är viktiga, men ett uttalande som 24/96 är bättre än 16/44 baserat på att det ligger olika produktioner på de två medierna är olyckligt, eftersom det kan ändras när man undersöker nästa produktion, eller över tid.

Så, min åsikt är att 16/44 är tillräckligt bra, att den enda praktiska skillnaden mellan medierna är brusnivån, och att brusnivån endast är märkbart olika under överdrivet konstruerade förhållanden.

Vi har betydligt viktigare saker att lägga energin på.

Själv tycker jag att nästa steg i filformat/medier borde vara 32 bits flyttal. Inte så mycket för att sänka brusnivån som för att taknivån stiger till nästan oändligt. Det skulle tvinga fram en normering av medelnivån och tillåta hur mycket transientdynamik som helst.

I mediet alltså.

Flyttal infördes i miniräknarna någon gång på 70-talet. I DSP-världen började man använda flyttal i processorerna på 80-talet. I studiovärlden på 90-talet (fritt ur minnet). Frånvaron av dem i medierna är hela orsaken till loudness race. Det är på tiden att de kommer in även i ljuddistributionsmedier.

av **Svante** » 2013-05-20 10:13

IngOehman skrev:Missförstå mig inte - jag förnekar dig inte rätten att ställa låga krav

Fulretorik. Mina krav är inte låga. 96 dB SNR är mycket.

Mina krav är däremot lägre än dina. Om du vill ha 20 bitars upplösning så är det lägre krav än 24 bitar upplösning. Inte heller det är låga krav, men väl lägre.

Alla kan nog förstå att 24 är bättre än 16, men jag tror att få förstår hur mycket 96 dB SNR egentligen är. Jag tycker du rider på den okunskapen.

av **Harryup** » 2013-05-20 12:06

Jag som är född på vinyltiden ser helt andra problem med hur det kan låta än att bry sig om lite teoretisk brus. Om praktiskt brus skulle "låta" otrevligt till sin natur så kan det ju störa även om det inte är högt. Men en aning brus av normal inspeningsbruskaraktär känns inte så allvarligt om det ligger 96 dB ner.
Fast om inspelningen är högdynamisk så är det ju intressant om det finns någon Boleroeffekt där ett otrevligt låtande brus faktiskt kan vara hörbart i de tysta(ste) partierna.

mvh/Harryup

av **BertilAlving** » 2013-05-20 12:14

Först vill jag säga att för mig är det självklart att spela in med 24bit/96kHz och sedan utföra hela mixningen, redigeringen och mastringen i 32 bit float format (DSP processningen sker oftast med 64 bit float format) och bibehålla det ända fram till slutet då allt konverteras till CDn's 16bit/44,1kHz. Min åsikt, byggd på en stor mängd konkret erfarenhet och analyser, är emellertid att man inte tjänar något på att distribuera fonogrammet med högre upplösning än en med bästa teknik gjord konvertering från 96 kHz till 44,1 kHz och från 24 bitar till 16 bitar.

IngOehman skrev:Och mikrofonbruset bör vara vägt om man skall slippa sänka sina krav på
grund av lf-brus som inte har med saken att göra eftersom det inte kommer
att vara detta som ställer kraven. Det brus som betyder något är det som
man hör.

Det där tycker jag närmast är snömos. Som jag skrev i mitt förra inlägg så ligger mikrofonbrusets dominerande energi i samma område som musikens normala grundtonsområde. Varför då stirra sig blind på mikrofonens A-vägda brusnivå, det går inte att spela in något som ligger särskilt mycket lägre än mikrofonens och rummets störnivå vid varje enskild frekvens. Vet du egentligen hur mikrofonbrusets spektrala fördelning brukar se ut???

IngOehman skrev:Och dessutom så är mikrofonerna i normalfallet placerade betydligt närmare
musikerna än optimal lyssningsplats, vilket ger klart högre nivåer för direkt-
ljudet än de är på lyssningsplats. Mikrofonbruset kan därför som regel räknas
ned en faktor 10 dB för att motsvara lyssningssituationen. Det betyder att
det finns gott om mikrofoner som vid musikåtergivning med ursprungsnivå,
ger brus som ligger under hörtröskeln.

Slutligen är det inte ens riktigt att mikrofonbruset för det mesta är begrän-
sande faktor, för vid akustiska inspelningar är ofta lokalbruset större.

Jodo, jag tar hänsyn till att mikrofonen ofta placeras närmare musikerna än normal optimal lyssningsplats, vilket självklart är till fördel för mikrofonens S/N-ratio. Men lik förbaskat är störnivån från mikrofon plus inspelningslokal ett mycket större problem än mikförstärkare och AD-konverter, också med blygsamma 16 bitars kvantisering på slutprodukten.

IngOehman skrev:Du vet att jag talar om musiksignaler och du vet att jag undersökt de här sakerna redan för nära 30 år sedan.

Kan du då presentera för oss exakt hur du gjorde för 30 år sedan, vilken apparatur använde du och vill du vara så vänlig att visa oss mätningar och exempel på hur undersökningarna föll ut?

Okey, eftersom det tycks vara så svårt att tro på mitt påstående att mikrofonbruset är ett större problem än 16 bitars kvantiseringsbrus så ska jag nu visa några konkreta exempel.

Jag har utgått från en musikhändelse med ganska höga ljudtryck, det är från en skivinspelning med symfoniorkester, solister och kör. Tyvärr var vi tvungna att hålla till i en snustorr lokal som i princip bara rymde de c:a 100 medverkande musikerna (inspelat i Operahögskolan på KTH's område). Det är alltså en väldigt opuristisk inspelning som helt bygger på pålagd efterklang och diverse filtrering och andra DSP-manipulationer, alltså långt ifrån det sättet jag normalt arbetar på.

Först en kort snutt för att presentera vad för slags klangvärld det handlar om, exemplet är en ljudfil med 24bit/44,1kHz: Deck the hall

Så här ser en FFT-analys ut av inspelningens mikbrus + rumsstörnivå (ingen nivåförändring jämfört med musikexemplet), det är fortfarande 24 bitars upplösning:
Bild

Och så här ser störnivån ut utan audiosignal, kvantisering till 16 bitar och adekvat ditherbrus med en psykoakustiskt utformad spektral fördelning av ditherbruset som används bl.a. av Weiss (identisk parameterinställning vid FFT-analysen):
Bild

Helt enkelt en jäkla skillnad, så kom inte och säg att mikrofonbruset är ett mindre problem än 16 bits kvantiseringsbrus.

Här är en fil att lyssna på, först ligger 10 sekunder med mikbrus + rumsstörning från första FFT-analysen (man hör tydligt vissa diskreta frekvenser från ventilationen som också syns tydligt på analysen), sedan följer omedelbart 10 sekunder med 16 bitars kvantiserad digital tystnad med ditherbrus enligt den andra FFT-analysen. MEN OBSERVERA ATT JAG HÖJT NIVÅN MED 40 dB PÅ HELA DENNA 20 SEKUNDERS FIL (för att underlätta lyssningsutvärderingen). 10 sek mikbrus följt av 10 sek 16 bitars ditherbrus, allt nivåhöjt med 40 dB

Återigen, vad jag vill belysa är att det går inte att registrera några mikrodetaljer hos musiken om dessa ligger för lågt i förhållande till störnivån hos mikrofon + rum. Eftersom kvantiseringsbruset vid 16 bitar (och ett adekvat val av ditherbrus) ligger så pass mycket lägre så medger 16 bitar registrering av betydligt svagare signaldetaljer än vad som levereras av mikrofonen.

För att demonstrera 16 bits formatets förmåga att registrera extremt svaga signaler presenterar jag här en annan lyssningsfil, det är det ursprungliga avsnittet (24 bitars upplösning) som jag utsatt för en nivåsänkning med hela 90 dB!!! Därefter har jag kvantiserat denna ytterst svaga musiksignal till 16 bitar med adekvat ditherbrus. Denna 16 bits ljudfil har jag sedan nivåhöjt med hela 60 dB (för att underlätta lyssningsutvärderingen). Varsågoda och lyssna, ni som tror att 16 bitar inte räcker (och att man förlorar musikinformation under -96 dBFS) får nog en liten tankeställare... Deck the hall, sänkt 90 dB och sedan kvantiserad till 16 bitar, ljudfilen är sedan nivåhöjd med 60 dB

Mvh,
Bertil

EDIT: stavfel

av **IngOehman** » 2013-05-20 12:17

Svante skrev:
IngOehman skrev:Missförstå mig inte - jag förnekar dig inte rätten att ställa låga krav

Fulretorik. Mina krav är inte låga. 96 dB SNR är mycket.

Mina krav är däremot lägre än dina. Om du vill ha 20 bitars upplösning så är det lägre krav än 24 bitar upplösning. Inte heller det är låga krav, men väl lägre.

Alla kan nog förstå att 24 är bättre än 16, men jag tror att få förstår hur mycket 96 dB SNR egentligen är. Jag tycker du rider på den okunskapen.

Du har rätt att tycka det, men jag tycker att det är trist att du använder sådan
retorik när jag ju vet att du vet hur mycket jag skrivit om hur bra CD-systemet
är, jämfört med viss kritik som det har utsatts för.

Att påstå att jag rider på andras okunskap är fulretorik av dignitet.

- - -

Är dessutom inte så säker (som du) på att de som skriver här på faktiskt.se är
så okunniga i hur mycket 96 dB är som du antyder. Har nog inte sett ett enda
inlägg som har visat att någon har nollkoll därvidlag.

- - -

Däremot är jag lite förvånad över att det finns några som inte vill acceptera att
det finns ljud i verkligheten som är avsevärt mycket starkare än 96 dB och att
någon (t ex jag) kan vilja ha en standard som medger att sådana kan återges
utan att det system som signalen lagras via lägger till brus som ligger över hör-
tröskeln.

Varför inte bara acceptera att jag önskade detta av CD-systemet? Det spelar ju
ingen roll vad du skriver, jag vet bättre än du vilka önskemål jag har.

- - -

Och att 20 bitar är lågt jämfört med 24 håller jag med om, har jag skrivit något
annat? Men nu tycker jag att 20 bitar är acceptabelt och jag har inga problem
med om du vill kalla det för lågt. Du har rätt att göra den bedömningen om du
skulle vilja göra den.

Det är ju helt subjektivt vad man tycker är lågt eller högt. Du kan kalla 20 bitar
för både lägre än 24, och du kan även kalla det lågt om du vill - och jag kan på
samma grunder kalla 16 bitar för lågt.

Men att som du gör upphöja din uppfattning till fakta och säga att 96 dB S/N
är mycket och att dina krav inte är låga, är något helt annat. Det är inte fakta,
det är bara dina åsikter. Hur förvånad du än är över att någon kan ställa högre
krav eller ha önskemål om mera dynamikområde, är det inte fakta att 96 dB är
"mycket". Det är bara din åsikt, och du måste acceptera att den inte behöver
delas av alla andra.

- - -

Sen finns det en faktor till, nämligen vad man spelar in på och vad man ger ut
i för format. Och att spela in med bara 16 bitars upplösning duger faktiskt inte
i rätt många fall. Men det är en fråga för sig.

Vh, iö

av **bomellberg** » 2013-05-20 12:20

Underbara exempel, Bertil! Stort tack!

/Bosse

av **IngOehman** » 2013-05-20 12:32

BertilAlving skrev:Först vill jag säga att för mig är det självklart att spela in med 24bit/96kHz och sedan utföra hela mixningen, redigeringen och mastringen i 32 bit float format (DSP processningen sker oftast med 64 bit float format) och bibehålla det ända fram till slutet då allt konverteras till CDn's 16bit/44,1kHz. Min åsikt, byggd på en stor mängd konkret erfarenhet och analyser, är emellertid att man inte tjänar något på att distribuera fonogrammet med högre upplösning än en med bästa teknik gjord konvertering från 96 kHz till 44,1 kHz och från 24 bitar till 16 bitar.

IngOehman skrev:Och mikrofonbruset bör vara vägt om man skall slippa sänka sina krav på
grund av lf-brus som inte har med saken att göra eftersom det inte kommer
att vara detta som ställer kraven. Det brus som betyder något är det som
man hör.

Det där tycker jag närmast är snömos. Som jag skrev i mitt förra inlägg så ligger mikrofonbrusets dominerande energi i samma område som musikens normala grundtonsområde. Varför då stirra sig blind på mikrofonens A-vägda brusnivå, det går inte att spela in något som ligger särskilt mycket lägre än mikrofonens och rummets störnivå vid varje enskild frekvens. Vet du egentligen hur mikrofonbrusets spektrala fördelning brukar se ut???

IngOehman skrev:Och dessutom så är mikrofonerna i normalfallet placerade betydligt närmare
musikerna än optimal lyssningsplats, vilket ger klart högre nivåer för direkt-
ljudet än de är på lyssningsplats. Mikrofonbruset kan därför som regel räknas
ned en faktor 10 dB för att motsvara lyssningssituationen. Det betyder att
det finns gott om mikrofoner som vid musikåtergivning med ursprungsnivå,
ger brus som ligger under hörtröskeln.

Slutligen är det inte ens riktigt att mikrofonbruset för det mesta är begrän-
sande faktor, för vid akustiska inspelningar är ofta lokalbruset större.

Jodo, jag tar hänsyn till att mikrofonen ofta placeras närmare musikerna än normal optimal lyssningsplats, vilket självklart är till fördel för mikrofonens S/N-ratio. Men lik förbaskat är störnivån från mikrofon plus inspelningslokal ett mycket större problem än mikförstärkare och AD-konverter, också med blygsamma 16 bitars kvantisering på slutprodukten.

IngOehman skrev:Du vet att jag talar om musiksignaler och du vet att jag undersökt de här sakerna redan för nära 30 år sedan.

Kan du då presentera för oss exakt hur du gjorde för 30 år sedan, vilken apparatur använde du och vill du vara så vänlig att visa oss mätningar och exempel på hur undersökningarna föll ut?

Okey, eftersom det tycks vara så svårt att tro på mitt påstående att mikrofonbruset är ett större problem än 16 bitars kvantiseringsbrus så ska jag nu visa några konkreta exempel.

Jag har utgått från en musikhändelse med ganska höga ljudtryck, det är från en skivinspelning med symfoniorkester, solister och kör. Tyvärr var vi tvungna att hålla till i en snustorr lokal som i princip bara rymde de c:a 100 medverkande musikerna (inspelat i Operahögskolan på KTH's område). Det är alltså en väldigt opuristisk inspelning som helt bygger på pålagd efterklang och diverse filtrering och andra DSP-manipulationer, alltså långt ifrån det sättet jag normalt arbetar på.

Först en kort snutt för att presentera vad för slags klangvärld det handlar om, exemplet är en ljudfil med 24bit/44,1kHz: Deck the hall

Så här ser en FFT-analys ut av inspelningens mikbrus + rumsstörnivå (ingen nivåförändring jämfört med musikexemplet), det är fortfarande 24 bitars upplösning:

Och så här ser störnivån ut utan audiosignal, kvantisering till 16 bitar och adekvat ditherbrus med en psykoakustiskt utformad spektral fördelning av ditherbruset som används bl.a. av Weiss (identisk parameterinställning vid FFT-analysen):

Helt enkelt en jäkla skillnad, så kom inte och säg att mikrofonbruset är ett mindre problem än 16 bits kvantiseringsbrus.

Här är en fil att lyssna på, först ligger 10 sekunder med mikbrus + rumsstörning från första FFT-analysen (man hör tydligt vissa diskreta frekvenser från ventilationen som också syns tydligt på analysen), sedan följer omedelbart 10 sekunder med 16 bitars kvantiserad digital tystnad med ditherbrus enligt den andra FFT-analysen. MEN OBSERVERA ATT JAG HÖJT NIVÅN MED 40 dB PÅ HELA DENNA 20 SEKUNDERS FIL (för att underlätta lyssningsutvärderingen). 10 sek mikbrus följt av 10 sek 16 bitars ditherbrus, allt nivåhöjt med 40 dB

Återigen, vad jag vill belysa är att det går inte att registrera några mikrodetaljer hos musiken om dessa ligger för lågt i förhållande till störnivån hos mikrofon + rum. Eftersom kvantiseringsbruset vid 16 bitar (och ett adekvat val av ditherbrus) ligger så pass mycket lägre så medger 16 bitar registrering av betydligt svagare signaldetaljer än vad som levereras av mikrofonen.

För att demonstrera 16 bits formatets förmåga att registrera extremt svaga signaler presenterar jag här en annan lyssningsfil, det är det ursprungliga avsnittet (24 bitars upplösning) som jag utsatt för en nivåsänkning med hela 90 dB!!! Därefter har jag kvantiserat denna ytterst svaga musiksignal till 16 bitar med adekvat ditherbrus. Denna 16 bits ljudfil har jag sedan nivåhöjt med hela 60 dB (för att underlätta lyssningsutvärderingen). Varsågoda och lyssna, ni som tror att 16 bitar inte räcker (och att man förlorar musikinformation under -96 dBFS) får nog en liten tankeställare... Deck the hall, sänkt 90 dB och sedan kvantiserad till 16 bitar, ljudfilen är sedan nivåhöjd med 60 dB

Mvh,
Bertil

EDIT: stavfel

Ja, ungefär sådär kan det se ut.

Men när jag skriver mikrofonbrus så menar jag mikrofonbrus, och talar alltså
inte ljud i inspelningslokalen då.

Och jag kan tycka att ditt inlägg är skapligt motsägelsefullt när du argumen-
terar att 16 bitar duger, men ändå börjar med att berätta att det är en själv-
klarhet för dig att spela in med 24 bitars upplösning.

Men det sista är hur som helst glädjande, även om några system som har 24
bitars äkta upplösning väl inte existerar ännu (även om det närmar sig) men
sådan kvantifiering har de förvisso.

Sen är det förvisso ingen självklarhet vad som är upplösning i en brushaltig
situation. Man kan ju höra ljud under bruset i varje fall en bit ned. Det gäller
dock i väldigt liten grad korttidsmässigt (man kan höra en ton, men inte ett
klick som ligger under bruset).

Vh, iö

av **Bill50x** » 2013-05-20 13:19

IÖ & Svante:

Jag är inte moderator längre men detta är min tråd. Var snäll och håll diskussionen till tekniska och upplevelsemässiga parametrar och gnabbas via PM istället. Det blir så mycket intressantare då här i tråden.

Bertil:

Tack för intressant inlägg!

/ B

av **imac** » 2013-05-20 13:52

BertilAlving skrev:Först vill jag säga att för mig är det självklart att spela in med 24bit/96kHz

Kan man få en mer utförlig förklaring varför det är självklart för dig?

BertilAlving skrev:och sedan utföra hela mixningen, redigeringen och mastringen i 32 bit float format (DSP processningen sker oftast med 64 bit float format) och bibehålla det ända fram till slutet

Hur sker omvandlingen från 24/96 till 32 till 64 bit float (PCM?) o från 64 bit till 16/44,1?

av DL » 2013-05-20 14:48

Inspelning görs i 24-bitar gör man för att man skall ha headroom och inte riskera digital klippning vid minsta snedsteg med nivåerna, inte för att det nödvändigtvis låter bättre.

Att man behandlar signalen (dvs lägger på effekter, mixar och mastrar) med 32 eller 64-bitars float gör man väl för att ha högsta precision i alla beräkningar som sker och undvika avrundningsfel.

av **Svante** » 2013-05-20 15:50

BertilAlving skrev:Först en kort snutt för att presentera vad för slags klangvärld det handlar om, exemplet är en ljudfil med 24bit/44,1kHz: Deck the hall

Jag blev så glad när jag insåg att Gunnar hade hyrt in dig för inspelningen av den där

.

av **sebatlh** » 2013-05-20 15:56

Lysande exempel i denna tråd!

En grejj som jag inte förstår däremot är varför man ska ta i så man spricker med det här 24/192. Känns som 100% marknadsföring. Eller?
Jag menar nu i kontexten att man tar fram ett HD-format som ska klara "allt".
Är det något tänk med att man kan tillåta ett flackare lågpassfilter som gör att man går hela vägen upp till 192kHz samplingsfrekvens? Det är väl ändå en inspelingsgrejj?
*fattar noll*

av **Jocke** » 2013-05-20 16:01

Ända sedan .ogg har man väl snackat om flerkanaliga ljudfiler... kan det finnas någon förklaring där?

av **Svante** » 2013-05-20 16:04

imac skrev:
BertilAlving skrev:och sedan utföra hela mixningen, redigeringen och mastringen i 32 bit float format (DSP processningen sker oftast med 64 bit float format) och bibehålla det ända fram till slutet

Hur sker omvandlingen från 24/96 till 32 till 64 bit float (PCM?) o från 64 bit till 16/44,1?

Omvandlingen från fixtal (PCM) till flyttal (float) är trivial. Den sker typiskt förlustfritt från 24 bitars PCM till 32 eller 64 bit float. Åt andra hållet behöver man bestämma sig för en skalfaktor (=vad är full utstyrning), lägga på ditherbrus motsvarande kvantiseringsnivån och sedan trunkera. Det görs typiskt internt i ett program, hantverksmässigt är det bara att klicka på några knappar i programmet.

Not: Orden "floating point numbers" eller flyttal på svenska syftar till att decimalkommat är flytande. Man har alltså möjlighet att representera tal som 1,34 13,4 0,0000134 eller 134. De lagras som mantissa och en exponent. Det sista talet ovan skulle lagras som 1,34*10^3, eller siffrorna 1,34 och 3. I verkligheten lagras de binärt, men det spelar ingen roll för resonemanget. Fördelen med flyttal är att de kan representera ett väldigt stort talområde med en konstant relativ noggrannhet. Det gör i sin tur att man inte behöver bry sig om utstyrningen nästan alls.

av **BertilAlving** » 2013-05-20 16:59

IngOehman skrev:Men när jag skriver mikrofonbrus så menar jag mikrofonbrus, och talar alltså
inte ljud i inspelningslokalen då.

Men alldeles nyss skrev du:

IngOehman skrev:Slutligen är det inte ens riktigt att mikrofonbruset för det mesta är begrän-
sande faktor, för vid akustiska inspelningar är ofta lokalbruset större.

En sådan tumregel vill jag inte riktigt hålla med om, mikrofonbruset är alltid ett större problem än kvantiseringsbruset och ibland bidrar lokalen med ett märkbart tillskott av störnivå och ibland inte.

IngOehman skrev:Och jag kan tycka att ditt inlägg är skapligt motsägelsefullt när du argumen-
terar att 16 bitar duger, men ändå börjar med att berätta att det är en själv-
klarhet för dig att spela in med 24 bitars upplösning.

Det du skriver här är antingen ett retoriskt knep eller också påvisar det att du inte har förstått hur saker och ting fungerar.

IngOehman skrev:Men det sista är hur som helst glädjande, även om några system som har 24
bitars äkta upplösning väl inte existerar ännu (även om det närmar sig) men
sådan kvantifiering har de förvisso.

Trodde inte att du tillhörde dom som livnär myten om att upplösningen hos en digitalkonverter bara är en siffra på papperet och att inga system i praktiken lever upp till den nominella bitupplösningen. Under alla år, från det att 16 bitar var standard, har audiofilerna likt papegojor envist upprepat att "man tappar alltid några bitar av den nominella upplösningen" men tyvärr utan att själva förstå riktigt vad det handlar om. Vart tar dom i så fall dom bitarna vägen?...

Ända sedan jag var en av dom allra första att köpa Sony PCM-F1 under början av 1980-talet har jag undersökt om alla bitarna användes i praktiskt bruk, och det gör dom minsann! Sony's PCM-F1 kunde ställas in att konvertera till valfritt 14 eller 16 bits format, jag konstaterade genom mätningar att om man valde 16 bitar så levererade den 16 bitar, så det så!

Sen är det naturligtvis så att med dagens 24-bits konvertrar så uppnår man aldrig konverterns teoretiska S/N-ratio, det beror på att omvandlarens analoga elekronik brusar för mycket. Men om man gör en extremt högupplösande smalbandanalys så ser man att signaler konverteras ner till den lägsta kvantiseringsnivån långt ner under det totala brusgolvet.

IngOehman skrev:Sen är det förvisso ingen självklarhet vad som är upplösning i en brushaltig
situation. Man kan ju höra ljud under bruset i varje fall en bit ned. Det gäller
dock i väldigt liten grad korttidsmässigt (man kan höra en ton, men inte ett
klick som ligger under bruset).

Där håller jag med till 100%!!!

imac skrev:
BertilAlving skrev:Först vill jag säga att för mig är det självklart att spela in med 24bit/96kHz

Kan man få en mer utförlig förklaring varför det är självklart för dig?

BertilAlving skrev:och sedan utföra hela mixningen, redigeringen och mastringen i 32 bit float format (DSP processningen sker oftast med 64 bit float format) och bibehålla det ända fram till slutet

Hur sker omvandlingen från 24/96 till 32 till 64 bit float (PCM?) o från 64 bit till 16/44,1?

Problemen med DSP-bearbetning som skapar distorsion och aliasingprodukter i det hörbara området minskar när man bibehåller den högre upplösningen så länge som möjligt. Men vid den slutliga avspelningen räcker det med 16bit/44,1kHz. Både DL och Svante har redan givit bra svar på frågan.

När jag konverterar från 96 kHz till 44,1 använder jag en mjukvara som heter iZotope RX2 Advanced som har fullständiga inställningsmöjligheter av filtrets branthet, brytfrekvens och steglöst val från linear phase mode till minimum phase mode. Man kan alltså skräddarsy om man vill prioritera liten ringning eller minsta möjliga aliasing-produkter.

Även vid konverteringen av bitdjupet använder jag ditherfunktionen från iZotope.

Mvh,
Bertil

EDIT: skrev fel beteckning på mjukvaran (glömde bort att det är RX2 istället för bara RX)

av **hifikg** » 2013-05-20 18:37

Mycket intressant läsning Bertil. Kul att du skriver här. Jag upplever att (många av) de inspelningar jag har i 24/192 format ger mer av allt. Mer dynamik, större bredd, mer höjd och mer musik jämfört med samma verk i en lägre upplösning. Måhända är det som antyds i tråden, att man vid produktionen av 24/192 ljud adderar något. Vad tror du om det? Måste hitta på ett sätt att blindtesta mig själv, utifall det hela bara handlar om placebo, men det har jag svårt att tro och jag är en skeptisk f-n.

Lyssnade häromkvällen på konsthuvudsinspelningar och nog kan ni ljudtekniker trolla rejält om ni vill. Ett exempel på en "vanlig" skiva som poppar upp är Walk on the Wild Side där kören plötsligt omringar mig och jag kan slå vad om att körflickorna står bakom lyssningsfåtöljen. Och det redan med LP versionen. Hur mycket hyss har ni för er i studion? Finns det någon gräns för när det bör anges att ljudet är manipulerat, ungefär som man har när det gäller bilder i dagstidningar?

av **Max_Headroom** » 2013-05-20 18:41

Jag har inte orkat läsa hela tråden, men har en kort fråga:

Hur svårt är de att göra en inspelning av ett akustikt förlopp så bra att CD-formatet i sig är begränsningen vid uppspelningen?

Vi tänker oss alltså ett ljud som är bredbandigt och dynamiskt till sin natur som t.ex. ett storband eller en symfoniorkester.

Det är inte så att begränsnignen egentligen sitter i inspelningen?