Först vill jag säga att för mig är det självklart att spela in med 24bit/96kHz och sedan utföra hela mixningen, redigeringen och mastringen i 32 bit float format (DSP processningen sker oftast med 64 bit float format) och bibehålla det ända fram till slutet då allt konverteras till CDn's 16bit/44,1kHz. Min åsikt, byggd på en stor mängd konkret erfarenhet och analyser, är emellertid att man inte tjänar något på att distribuera fonogrammet med högre upplösning än en med bästa teknik gjord konvertering från 96 kHz till 44,1 kHz och från 24 bitar till 16 bitar.
IngOehman skrev:Och mikrofonbruset bör vara vägt om man skall slippa sänka sina krav på
grund av lf-brus som inte har med saken att göra eftersom det inte kommer
att vara detta som ställer kraven. Det brus som betyder något är det som
man hör.
Det där tycker jag närmast är snömos. Som jag skrev i mitt förra inlägg så ligger mikrofonbrusets dominerande energi i samma område som musikens normala grundtonsområde. Varför då stirra sig blind på mikrofonens A-vägda brusnivå, det går inte att spela in något som ligger särskilt mycket lägre än mikrofonens och rummets störnivå vid varje enskild frekvens. Vet du egentligen hur mikrofonbrusets spektrala fördelning brukar se ut???
IngOehman skrev:Och dessutom så är mikrofonerna i normalfallet placerade betydligt närmare
musikerna än optimal lyssningsplats, vilket ger klart högre nivåer för direkt-
ljudet än de är på lyssningsplats. Mikrofonbruset kan därför som regel räknas
ned en faktor 10 dB för att motsvara lyssningssituationen. Det betyder att
det finns gott om mikrofoner som vid musikåtergivning med ursprungsnivå,
ger brus som ligger under hörtröskeln.
Slutligen är det inte ens riktigt att mikrofonbruset för det mesta är begrän-
sande faktor, för vid akustiska inspelningar är ofta lokalbruset större.
Jodo, jag tar hänsyn till att mikrofonen ofta placeras närmare musikerna än normal optimal lyssningsplats, vilket självklart är till fördel för mikrofonens S/N-ratio. Men lik förbaskat är störnivån från mikrofon plus inspelningslokal ett mycket större problem än mikförstärkare och AD-konverter, också med blygsamma 16 bitars kvantisering på slutprodukten.
IngOehman skrev:Du vet att jag talar om musiksignaler och du vet att jag undersökt de här sakerna redan för nära 30 år sedan.
Kan du då presentera för oss exakt hur du gjorde för 30 år sedan, vilken apparatur använde du och vill du vara så vänlig att visa oss mätningar och exempel på hur undersökningarna föll ut?
Okey, eftersom det tycks vara så svårt att tro på mitt påstående att mikrofonbruset är ett större problem än 16 bitars kvantiseringsbrus så ska jag nu visa några konkreta exempel.
Jag har utgått från en musikhändelse med ganska höga ljudtryck, det är från en skivinspelning med symfoniorkester, solister och kör. Tyvärr var vi tvungna att hålla till i en snustorr lokal som i princip bara rymde de c:a 100 medverkande musikerna (inspelat i Operahögskolan på KTH's område). Det är alltså en väldigt opuristisk inspelning som helt bygger på pålagd efterklang och diverse filtrering och andra DSP-manipulationer, alltså långt ifrån det sättet jag normalt arbetar på.
Först en kort snutt för att presentera vad för slags klangvärld det handlar om, exemplet är en ljudfil med 24bit/44,1kHz:
Deck the hall
Så här ser en FFT-analys ut av inspelningens mikbrus + rumsstörnivå (ingen nivåförändring jämfört med musikexemplet), det är fortfarande 24 bitars upplösning:
Och så här ser störnivån ut utan audiosignal, kvantisering till 16 bitar och adekvat ditherbrus med en psykoakustiskt utformad spektral fördelning av ditherbruset som används bl.a. av Weiss (identisk parameterinställning vid FFT-analysen):
Helt enkelt en jäkla skillnad, så kom inte och säg att mikrofonbruset är ett mindre problem än 16 bits kvantiseringsbrus.
Här är en fil att lyssna på, först ligger 10 sekunder med mikbrus + rumsstörning från första FFT-analysen (man hör tydligt vissa diskreta frekvenser från ventilationen som också syns tydligt på analysen), sedan följer omedelbart 10 sekunder med 16 bitars kvantiserad digital tystnad med ditherbrus enligt den andra FFT-analysen. MEN OBSERVERA ATT JAG HÖJT NIVÅN MED 40 dB PÅ HELA DENNA 20 SEKUNDERS FIL (för att underlätta lyssningsutvärderingen).
10 sek mikbrus följt av 10 sek 16 bitars ditherbrus, allt nivåhöjt med 40 dB
Återigen, vad jag vill belysa är att det går inte att registrera några mikrodetaljer hos musiken om dessa ligger för lågt i förhållande till störnivån hos mikrofon + rum. Eftersom kvantiseringsbruset vid 16 bitar (och ett adekvat val av ditherbrus) ligger så pass mycket lägre så medger 16 bitar registrering av betydligt svagare signaldetaljer än vad som levereras av mikrofonen.
För att demonstrera 16 bits formatets förmåga att registrera extremt svaga signaler presenterar jag här en annan lyssningsfil, det är det ursprungliga avsnittet (24 bitars upplösning) som jag utsatt för en nivåsänkning med hela 90 dB!!! Därefter har jag kvantiserat denna ytterst svaga musiksignal till 16 bitar med adekvat ditherbrus. Denna 16 bits ljudfil har jag sedan nivåhöjt med hela 60 dB (för att underlätta lyssningsutvärderingen). Varsågoda och lyssna, ni som tror att 16 bitar inte räcker (och att man förlorar musikinformation under -96 dBFS) får nog en liten tankeställare...
Deck the hall, sänkt 90 dB och sedan kvantiserad till 16 bitar, ljudfilen är sedan nivåhöjd med 60 dB
Mvh,
Bertil
EDIT: stavfel
Verksam som freelance-inspelningstekniker åt diverse skivbolag med klassisk/akustisk musik som specialitet.