Maarten skrev:petersteindl skrev:Maarten skrev:Utöver Peters svar med mikrofonkaraktäristik, så tolkar jag att följande mening från I-or ger svaret:
Jag antar att det finns ett flertal överföringsfunktioner som "överlagras", t ex:
1: Rummet där musiken framförs och position där inspelningen upptas (vilket ger en viss frekvensgång i lyssningspositionen, superpositionerad utifrån direktljud och reflektioner)
2: Mikrofonkarakteristik (vilket ger en viss frekvensgång)
3: Högtalare och rum vid uppspelning inkl position av lyssnare (vilket ger en viss frekvensgång i lyssningspositionen, superpositionerad utifrån direktljud och reflektioner)
4: Lyssnarens individuella anatomi (vilket ger en viss frekvensgång vid trumhinnan)
Eller är det något mer?
5: Ytterligare en punkt är förstås kognitionen men det är psykologi och "utöver" ovan 4 punkter.
Alla 4 punkter ovan bör väl kunna beskrivas matematiskt och i slutändan är låter det rimligt att det är ljudtrycket vid trumhinnan som återskapas i mer eller mindre troget originalhändelsen, ie frekvensgångsavvikelser och tidsskillnader.
Punkt 3 ovan rör väl trådens ämne?
Och punkterna 1-3 själva återgivningskedjan.
Vad är originalhändelsen? Hur definieras originalhändelsen?
Innan detta är klart definierat så kan det du skriver tolkas hur som helst.
Mvh
Peter
Förslagsvis kan man definiera originalhändelsen som det ljudfält som förelåg vid vid en viss tidpunkt och som man vill återge. (Möjligt att man kan hamna i ett cirkelresonemang men man måste ju bestämma sig).
Om vid en viss tidpunkt (t1) och kan återskapa detta vid ett senare tillfälle (t2) så kan man säga att man har återgivit originalhändelsen (som här är skeendet vid t1). Problemet är väl att det är mycket svårt att tillräckligt exakt reproducera ett ljudfält över tid och rum? (I-or nämnde MIMO-system som ju är vanligt inom radiokommunikation och liknande lösningar kommer väl alltmer inom HF RF, t ex med 5g?).
Finessen med att istället utgå från ljudtrycket i trumhinnan är ju att det är gränssnittet mellan den fysikaliska domänen och den perceptuella domänen. Framförallt minskar man antalet frihetsgrader, vilket gör målet lättare att uppnå.
I-or svarade ovan på olika vägar att uppnå det. Här tänker jag (rätt eller fel?) att I-ors propagerande för ekvalisering blir en följdriktig konsekvens av den senare ansatsen.
Jag har läst ditt inlägg några gånger och jag får inte ihop det. Jag förstår inte vad du menar.
Vad är själva originalhändelsen?
Du definierar den som ett Ljudfält vid tidpunkten t1. Det låter ju fint, men vad är detta för något?
Hur definierar du Ljudfält?
Var i hela kedjan från musikinstrumentet till konsumentens hörselupplevelse lägger du t1?
Vad menar du representerar Ljudfältet i t1?
I-or är ganska stringent i sitt svar och jag tänker återkomma till hans inlägg.
Du introducerar ytterligare en sak du kallar gränssnitt mellan den fysikaliska domänen och den perceptuella domänen.
Varför nämner du dessa båda domäner såsom de vore åtskilda separata domäner?
Jag ser det inte så alls. Jag ser torso, huvud, ytteröron, trumhinnor, mellanöra och delen av inneröron ända fram till hårcellerna som del av den fysikaliska domänen. Gränsen mellan det akustiska fysikaliska och det mentala ligger i hårcellerna och det gäller både de yttre och de inre hårcellerna. De inre hårcellerna är dörren från det akustiska till det mentala och de yttre hårcellerna är dörren från det mentala till det fysikaliska akustiska. Det är en dörr in och en dörr ut och dessa båda dörrar möts i organet Corti på basilarmembranet. Basilarmembranet hör också till den akustiska domänen.
Respektive trumhinna är tryckkännande. På grund av tryckutjämning i mellanörat så kommer atmosfärstrycket råda på båda sidor av membranet trumhinnan. Det får till följd att membranet känner en ögonblicksbild av ljudtrycksnivå SPL hos akustiska ljudvågor som vi har en logaritmisk dB-skala som både enhet och storhet på. Atmosfärstrycket mäts i Pascal Pa. Detta atmosfärstryck är alltid på positiv planhalva och därigenom uppfyller det krav för kvotskala, 0 Pa är vacuum. Ljudtrycksnivå uppfyller inte det kravet och är därför inte kvotskala. SPL är intervallskala.
Nu kommer vi till finessen. Tryck och ljudtryck är skalära storheter. Det är således inga vektorstorheter. I och med detta existerar ingen riktning i storheten Ljudtryck! Jag upprepar. Det finns ingen riktning i ljudtryck. Ljudtryck representeras i skalärfält. Det är inte vektorfält.
Ljudfält som du nämner i sammanhanget gäller propagerande våg. Det är definitionen. Då finns storheten hastighet med och hastighet är vektor och har riktning, den riktning varmed vågen utbreder sig. Detta representeras i vektorfält.
Så, ljudtryck vid trumhinnorna är skalära storheter och kan inte registrera hastighetskomponenten d v s vektorn hos den propagerande ljudvågen i Ljudfält.
Trumhinnorna registrerar inte Ljudfält. Skulle trumhinnorna registrera ljudfält så fallerar I-or:s resonemang. Hans resonemang bygger på att man har 2 skalära storheter, en på respektive trumhinna. För då räcker det med att återskapa 2 skalära storheter som registreras. Därefter överlåts det till hjärnan att göra resten.
Men, eftersom hörseln faktiskt hör riktning så betyder det att riktningen fås fram i neurala processer i den mentala domänen.
I klartext, i den mentala domänen fås riktning och därmed är det entydigt så att det i neurala processer uppnås vektorer och vektorfält framtagna ur kodade skalärer nämligen ljudtryck.
Koden för detta ligger inte i hastighet på trumhinnorna utan det ligger i frekvensdomän d v s tonkurva samt i tidsdomän d v s tidsskillnad mellan trumhinnorna.
(Som tillägg kan jag nämna att Sennheiser och Bruel&Kjær har mikrofoner med flera tryckkännande mikrofonkapslar som var och en registrerar skalärt ljudtryck, men där mjukvara ingår som beräknar riktning med korrekta vektorer. Jag har förevisats sådana av Sennheiser och det var häpnadsväckande otroligt, med banbrytande resultat.)
Så, med perfekt korrekt registrerad tid på respektive trumhinna och perfekt korrekt frekvensgång på respektive trumhinna som båda innefattar den kod som behövs för mental vektorprojicering, d v s då kan hjärnans neurala nätverk avkoda inkommande signal på perfekt korrekt sätt. Hjärnan jobbar med differens vid avkodning, inte summering, åtminstone vid just denna spatiala avkodning.
Hade du istället för ljudfält skrivit ljudtryck så hade det varit korrekt samt inte använt uttrycket perceptuell domän som en slags motsats till fysikalisk domän med ett slags gränsland dem emellan så hade det blivit en logisk stringens som kan följas.
Det är alltså så jag ser på saken. Det är efter den devisen/teorin jag konstruerar högtalare och applicerar mitt systemtänk för att möjliggöra för korrekt avkodning i hjärnan för att åstadkomma så korrekta mentala vektorprojiceringar som möjligt för att åstadkomma densamma ljudbild man skulle ha om man lyssnade live på ljudeventet före mikrofonerna.
Detta går inte att åstadkomma från något befintligt fonogram återgivet med 2 högtalare.
Däremot kan man med stormsteg närma sig korrekt mental avkodning med 3 högtalare L/R/C fram och det är enbart under förutsättning att man beräknar respektive högtalares insignal enligt givna algoritmer som jag funnit fram redan 1989/90 och sedan dess hemlighållit. Det kan användas på samtliga av dagens befintliga stereoinspelningar.
Fortfarande är det så att Originalljudhändelsen entydigt måste specificeras. Kan man inte specificera vilken händelse det är så kan man inte ge hörseln korrekt kod som input så att hörseln kan avkoda korrekt och därmed kunna återprojicera den ljudhändelsen.
Jag har tydligt preciserat vad jag menar med Originalljudhändelsen i min bild som jag vid flera tillfällen lagt ut på Faktiskt.
Men om man istället skulle kalla Originalljudhändelsen som den ljudändelse som uppstår i monitorlyssning av suspekt ljudtekniker med t.ex. godtyckliga in-ear lurar så är det bara att själv skaffa motsvarande godtyckliga in-ear lurar och se glad ut.
Men det är inget för mig.
Jag nöjer mig sådär i detta inlägg.
MvH
Peter