Alltså, så här är det.
En FFT lämnar data på linjär skala, dvs frekvensena för datapunkterna ligger tex på (0), 10, 20, 30, 40, 50 ... 22020, 22030, 22040, (22050).
Visar man det här på logskala så blir det väldigt mycket tätare mellan punkterna till höger. Bandbredden i det här exemplet är ett konstant antal Hz, någonstans i trakterna av 10 Hz.
På den gamla goda tiden när man hade en kurvskrivare som hade en begränsad skrivhastighet och man körde med logsvep, så fick man en filterverkan som fick en bandbredd som blev proportionell mot frekvensen. Bandbredden var kanske 10 Hz vid 20 Hz, men 100 Hz vid 200 Hz och 1000 Hz vid 2000 Hz. Bandbredden var ett visst antal delar av en oktav, tex 1/3.
Det där gamla sättet att visa en kurva är rätt trevligt, men passar illa med en FFT, och därför har man med viss rätt implementerat den filtrering som fanns i de gamla kurvskrivarna.
Så till mitt exempel med nollpaddningen då. Om man lägger till nollor som jag beskrev det så kommer var fjärde punkt att bli som i den korta FFTn och punkterna däremellan blir runt och mjukt interpolerade (med sincar faktiskt). Förmodligen är den interpolationen bättre än bara räta linjer mellan datapunkterna i den meningen att de förmodligen ligger närmare det verkliga värdena mellan punkterna. Nackdelen är att man inte ser datapunkterna lika tydligt.
Så här:
I den andra bilden är det ju mycket snyggare och förmodligen riktigare runt 200 Hz, men förädiskt lätt att tolka som att mikrofonen i fråga har ett kraftigt basfall. Det har den inte, fönstret är för kort bara.
Så länge har jag längat efter att loudness war skulle vara över. Nu börjar jag tro att vi faktiskt är där. Kruxet är att vi förlorade.