Angående vektorfält
Ett vektorfält är en tilldelning av en vektor till varje punkt i en delmängd av rummet som kallas linjärt rum. Se bild nedan.
Exempel: Gradienten är en vektorvärd funktion och därmed finns ett vektorfält som består av gradienter. Tryckgradienten är således en vektorvärd funktion som beror av tryckförändringar där variabeln tryck i sig är en skalär storhet. Tryck i sig är inte en funktion, utan det är en skalär variabel som ingår i en funktion d v s Gradienten och funktionen är vektorvärd och är relaterat till en riktning i en rumslig dimension.
Finns det tryckskillnad mellan 2 skalära punkter i ett linjärt rum, så kan man räkna ut tryckgradienten mellan dessa punkter. Gradienten är en vektor och har riktning.
Gradienten uttrycks smidigast med den så kallade Nablaoperatorn, som är en differentialoperator, betecknad med symbolen ∇, som används inom vektoranalysen.
Grad f = ∇ f = (∂f/∂x (i),∂f/∂y (j),∂f/∂z (k))
Där f är en funktion, grad f är gradienten, ∇ är nablaoperatorn och i, j, k är enhetsvektorerna i riktningarna för x, y respektive z.
Symbolen ∇ är ett kortare och bekvämare tecken för den vektorlika operatorn i tre dimensioner med kartesiska koordinater.
Det är skillnad på "tryck i sig", som är en skalär storhet i ett skalärfält kontra tryckgradienten som är en vektorvärd funktion i ett vektorfält. En funktion av flera variabler, bl.a. tryck.
I begreppet ljudintensitet ingår partikelhastighet och hastighet i sig är en vektorstorhet. Därmed är ljudintensitet en vektorstorhet. Den baseras dock även på tidsderivata; ∂f/∂t.
För hörselns vidkommande så kan man i princip glömma storheten Intensitet. Vi har simulerat en hel del gällande Intensitet och inte sett något samband för hörselns vidkommande gällande detektion av Intensitet. Den är dessutom lite lömsk, tycker jag.
Det finns ytterligare en vektorvärd funktion som ofta appliceras på skalärer som ljudtryck för att få riktning när sådan finns och det finns det i en fortskridande våg enligt vågekvationen som matematiskt skiljer sig mellan plana vågor i plan vågutbredning och sfärisk vågutbredning.
Vi kan kalla funktionen för ett vågfrontsfält med vågfronter och ortogonal riktning på fronten.
En Vågfront är exempelvis definierad som en samling av sammanhängande punkter (linje eller yta) där en våg har samma fas. Vågnormalen är riktningen vinkelrät/ortogonalt mot vågfronten i respektive punkt.
Det kan se ut som på bilden nedan. Ljudkällan är i detta fall en och endast 1 högtalare. Det finns 3 högtalare inritade i bilden (
små fyrkanter) men i denna bild är det noll ljud ur 2 av dessa. Sedan kan man fördela ljudet mellan dessa 3 högtalare och simulera. Sätter man 0 ljud i Centern så är det vanlig stereo med 2 högtalare som simuleras. Tar man med Centerhögtalare så kan man variera rätt mycket.
På X-axeln vid 0 finns en röd cirkel inritad runt Y=0. Se det som en slags lyssnare där det finns 2 mikrofoner på ett avstånd om 18 cm dem emellan. Båda mikrofonerna är alltid på samma Y-koordinat och på X-axeln +/- 9 cm. I detta fall är X = 0 således medianaxeln som skär stereoaxeln mitt emellan högtalarna d v s det man kallar sweet spot. Det är ren sinus som ton och i detta fall 800 Hz. Ljudkällan är en punktkälla med sfärisk vågutbredning. Cirklarna motsvarar iso-ljudtryck (
inom väderlek kallas det konstant tryck för isobar, i vårt fall är det iso-ljudryck i logaritmisk värdeskala med enheten dB) som med linjär skala minskar till halva värdet med dubbla avståndet enligt avståndslagen för sfäriska ljudvågor. med logaritmisk skala är det i stället 6 dB.
Det man ser i bilden är ett vektorfält som är i normalens riktning från isoljudtryckskurvorna d v s ortogonalt mot isoljudtryckskurvorna.
Den gröna stjärnan är en virtuell ljudkälla som kan placeras godtyckligt i det linjära rummet d v s vektorrum.
Om den blå vektorn från lyssnaren/mikrofonerna pekar i riktning mot den gröna stjärnan, så har korrekt riktning registrerats och avkodats.
Den blå vektorn är tryckgradienten vid huvud/ljudmottagaren. I detta simuleringsfall finns inget riktigt huvud med utan endast 2 mikrofoner på X-axeln där y=0. X-axeln är också 0 i den punkten och därmed har vi valt negativa värden till vänster och positiva värden till höger d v s +/- 9 cm.
Sedan kan vi lägga på HRTF och få med huvud och öron i mottagaren. Då kan man se skillnaden i ITD och ILD mellan vad den gröna stjärnan skulle ge kontra vad återgivning med 2 eller 3 högtalare ger.
I detta fall ser det enkelt ut med 1 rundstrålad ljudkälla och 2 mikrofoner. Nu kan man fördela ljudet mellan 2 högtalare eller mellan 3 högtalare och räkna ut isoljudtryckskurvorna i vektorrummet och då utför man vektoraddition i varje punkt i vektorfältet till skillnad från annan gängse addition av ljudvågor. Då får man fram nya vektorer och ett vektorfält som ser helt annorlunda ut.
Sedan kan man lägga in HRTF i mottagaren och detta för alla inkommande vinklar hos vektorerna och analysera hur hörseln lyckas detektera den nya sammansatta vektorn som faktiskt är en fysikalisk verklig storhet. Detta är väsensskilt från fantomprojicering.
Jag uppskattar att vi redan nu har flera tusen olika simuleringar. Det görs i batcher med olika högtalarvinklar: +/- 22,5 grader, +/- 30 grader, +/- 45 grader och +/- 60 grader och olika frekvenser och olika högtalarkonfigurationer med stegad olika procentuella fördelningar mellan center och sidohögtalare.
Nu kan vi förflytta den gröna stjärnan till alla möjliga olika punkter och göra simuleringar i varje punkt samt förflytta lyssnaren off sweetspot till höger respektive vänster. Då fås intressanta resultat.
Vi stegar från 25 Hz till 800 Hz på frekvensskalan. I varje mätpunkt plockar vi fram en ganska stor mängd olika data, t.ex. vektorbaserade ”fantom”-tonkurvor (fast det i denna analys inte är fantomprojicerade ljudkällor utan reella vektorbaserade ljudkällor).
Efter det att HRTF lagts in så får vi en helt ny uppsättning kurvor. OBS! det handlar än så länge endast om direktljud d v s utan reflexer. Vi kan lägga in både löptidsstereofoni eller koincidensteknik eller en mix mellan ICTD och ICLD (
IC=Inter-Channel) som kallas ekvivalensstereo. Det handlar om stereofonisk kodning kontra binaural avkodning/decoding och hur högtalaråtergivning med 2 högtalare kontra 3 högtalare klarar att återskapa ett sådant vektorfält som hörseln har enklast att avkoda på ett korrekt sätt.
En annan sak man kan tänka på är hur vektorfältet ser ut med högtalare som t.ex. har 3 eller flera loober horisontellt sett där t.ex. looberna varierar frekvensmässigt. Då blir vektorfältet helt korrupt eftersom normalen mot looberna pekar åt alla håll och kanter, t.ex. med en centerhögtalare MTM.
Loobning inträffar också med stereo och 2 högtalare men även med 3 högtalare, dock på ett helt annat sätt. Då HRTF läggs in så kommer vi förhoppningsvis finna ut hör hörseln som mikrofoner och mätinstrument handskar med högtalarloober.
Här är en bild från en simulering. Alla gröna pilar representerar vektorfältet. Den blå pilen är detektion av tryckgradienten på lyssnarplats. Den gröna stjärnan är en godtyckligt placerad tänkt ljudkälla som i detta fall är placerad i en verklig ljudkälla, nämligen vänster högtalare. Om den blå pilen pekar mot grön stjärna så har full lokalisation åstadkommits i ett vektorbaserat system. Som man kan se, så innebär detta att mottagaren av ljudfronten kan placeras var som helst i vektorfältet och den blå gradienten kommer alltid peka mot den gröna stjärnan.
Nu kan man godtyckligt placera den gröna stjärnan (ljudkälla i inspelningen) var som helst och anpassa ljudet från 2 eller 3 högtalare där högtalarnas placering är konstant fixerat i rummet och se om den nya från flera högtalare sammansatta summerade vektorbaserade ljutrycksfronten fortfarande har en intakt tryckgradient på lyssnarposition så att den blå pilen alltid pekar mot grön stjärna oavsett placering av grön stjärna. Vi har redan all data tillgänglig där lyssnaren befinner sig på den axel som kallas sweet spot d v s på ekvidistans mellan höger och vänster högtalare och med olika öppningsvinklar mellan högtalarna. Vid första anblick ser ljudfrontsfältet helt tokigt ut, men den blå vektorn/gradienten pekar ändå alltid mot grön stjärna och detta oavsett stjärnans placering i vektorrummet. Placeras lyssnaren vid sidan av sweet spot så brakar helvetet löst med 2 högtalare, vilket det även gör i ett skalärfält och i verkligheten med stereo och 2 högtalare. Men med 3 högtalare och Bremens algoritmer så . . .

- Bremen3D SPL-fält @ 800Hz 1.png (221.3 KiB) Visad 9707 gånger
Inom fysiken används skalärer för att representera en fysikalisk kvantitet, något som har en storlek, men inte någon riktning.
Vektorer, till skillnad från skalärer, är matematiska storheter som har både storlek (magnitud) och riktning. De används för att beskriva fysikaliska storheter eller funktioner med magnitud och riktning i rummet. Exempel på vektorer är: kraft, hastighet, acceleration, elektriskt fält och magnetfält. Sådana vektorer kallas även rumsvektorer eller geometriska vektorer.
OBS! Märk att fart/speed = skalär, medan hastighet/velocity = vektor! Rent strikt blir det lite ologiskt att översätta speed of sound med ljudhastighet. Ljudhastighet borde vara en vektor och speed of sound borde vara en skalär.
En ortsvektor är en vektor som representerar en punkt P i förhållande till en godtycklig punkt O i ett givet koordinatsystem. En ortsvektor kan betecknas med r och svarar mot en rät linje mellan punkterna O och P.
För ljud kommer man ofta in på sfäriska koordinater.
Sfäriska koordinater används i en form av tredimensionella koordinatsystem för att bestämma en punkts position med ett avstånd och två vinklar. Koordinaterna betecknas vanligen med r, φ och θ.
Läs gärna mina inlägg tidigare i denna tråd angående koordinatsystem och sfäriska koordinater.
Som man kanske redan förstått, så är detta ett sätt att räkna ut en ny stereofonisk vektor som faktiskt är en entydig fysikaliskt objektiv storhet i vektorrummet, godtyckligt placerad mellan högtalarna, men även bortom högtalarna eller framför högtalarna till höger eller vänster om medianplanet (
åstadkommes i vissa inspelningar t.ex. med Q-sound på någon Amused to Death), trots att ingen högtalare finns i den virtuella/fantom-punkten för virtuell/fantom-ljudkälla.
Wiki skrev:Q-Sound is essentially a filtering algorithm. It manipulates timing, amplitude, and frequency response to produce a binaural image. Systems like QSound rely on the fact that a sound arriving from one side of the listener will reach one ear before the other and that when it reaches the furthest ear, it is lower in amplitude and spectrally altered due to obstruction by the head. However, the ideal algorithm was arrived at empirically, with parameters adjusted according to the outcomes of many listening tests.
Egentligen har jag och lilltroll i och med vektoranalys och vektorfält och vektoraddition avskaffat fantomljudkällan med dess konstiga betydelse och i stället infört en riktig reell fysikalisk ny vektorbaserad ljudkälla som hörseln har till uppgift att detektera. Det är alltså inte att lura hörseln som fantomprojicering av ljudkällor har till uppgift att göra. Det är inte att hjärnan skall på något finurligt sätt måla upp något som fysikaliskt inte finns mellan högtalarna. Tittar man enkom på skalärfält så existerar det ingen fysikalisk ”ljudbild” med stereofoni. Det krävs att en människa placerar sig i sweet-spot och luras att höra en slags metafysisk värld som inte existerar i den fysikaliska världen. Med 2 högtalare skall man försöka få fram input på trumhinnorna som är så beskaffad att man skall luras att höra en sångare mitt emellan högtalarna och instrument utplacerade i en imaginär ljudbild uppmålad av hjärnan och detta på grund av ILD och ITD, då dessa parametrar kan extraheras av hörseln genom korrekt kodning av Inter-Channel Difference i inspelningen.
I stället söker jag att på ett matematiskt analytiskt sätt skapa vektorbaserade algoritmer som kodar godtycklig placering av ljudkällor i euklidiskt rum och avkodar dessa inspelade vektorer i ljudåtergivningen med 2 eller 3 högtalare för att återskapa korrekta vektorer i ett vektorfält vid ljudåtergivning. Går detta, så kan man förflytta sig i vektorfältet och höra korrekt riktning på varje inspelat instrument eller röst.
I ett skalärfält blir allt sådant en empirisk uppgift och det är samma uppgift hos inspelningstekniker, även Bertil Alving. Inget ont i det. Bra inspelningar kräver sin man med erfarenhet i botten. Det är "a Piece of Art". Respekt!
Det kan kanske komma att ses som en form av styggelse att ersätta en fin konstart med matematiska algoritmer. men vi får se hur vi lyckas med den totala uppgiften.
Det gängse är att se stereo som fantomljudkällor i ett skalärfält, eftersom ingen ljudkälla finns fysikaliskt på plats på given fantomprojicering. Men i ett vektorfält med vektoraddition från 2 eller 3 eller fler högtalare frångår man detta synsätt gällande fantomljudkällor och får i stället virtuella, eller, som jag ser det, snarast reella faktiska fysikaliska ljudkällor på respektive önskad plats även där det inte finns någon högtalare. Detta är styrkan att se kodning och avkodning som vektoraddition mellan flera vektorer i ett vektorfält.
Avslutningsvis vill jag säga att då direktljudet passerat hörseln så återstår alla reflexer och det är enkom inspelningslokalens första reflexer i inspelningen som kan betraktas som vektorer och därmed ge en akustisk/fysisk närvaro i den inspelade akustiska lokalen. Allt annat kan betraktas som ett skalärfält där hörseln faktiskt integrerar ljudet under en viss tidsperiod. Tiden mellan övriga reflexer som uppstår vid ljudåtergivningen saknar därmed betydelse, d v s om man vid ljudåtergivningen kan se till att få 1a reflexerna från sitt eget lyssningsrum så sent som möjligt, men med samma frekvensgång som direktljudet.
Mer vill/kan/bör jag inte förtälja. Hela baletten med Bremens lösningar bör faktiskt kunna vara patenterbara.
MvH
Peter
VD Bremen Production AB + Ortho-Reality AB; Grundare av Ljudbutiken AB; Fd import av hifi; Konstruktör av LICENCE No1 D/A, Bremen No1 D/A, Forsell D/A, SMS FrameSound, Bremen 3D8 m.fl.