I ditt inlägg finns en mix av frågor, hypoteser, slutsatser och konstateranden. För att få någon rätsida, så byter jag rader i citatet nedan. Då fås 6 stycken. Då kan man bättre syna relevansen i varje stycke.
JM skrev:När ett potentiellt byte eller hotande rovdjur avger direktljud med tillhörande reflexljud kan vi avgöra om ljudobjektet är nära eller långt borta.
Med transienta/prominenta ljud utan störande reflexer kan vi likt elefanten exakt lokalisera ett potentiellt byte eller hotande rovdjur i horisontalplanet.
Vid en viss mix av direktljud och reflexljud upplever vi maximal spatial upplevelse. Ljudobjektet får inte vara för nära eller för långt borta i en viss optimal kontext.
Vid optimalt spatialt hörande verkar precedence effekten var maximal?
Här borde reflexernas maskering vara minimal? Korrekt?
Inflytandet av "image shift" och eko är är vid optimalt spatialt hörande minimalt i given kontext.
Detta bör ske någonstans mellan mellan ca 1 ms respektive 50 ms för tal.
Vilken evolutionära nytta ger denna maximala spatiala upplevelse?
JM
I stycke 1: Förhållandet mellan reflexer och direktljud är det dominanta attributet i ljudinformationen för avståndsbedömning med hörseln. Det finns dock även andra attribut i ljudinformationen som är betydelsefulla vid avståndsbedömning.
Stycke 2: Har inga invändningar eller något att tillföra.
Stycke 3: Det är två meningar. Antingen är de hypoteser eller konstateranden i form av fakta. Den första meningen har jag inget att anföra mot. I den andra meningen skulle jag stryka ordet ”optimal” och därmed vidga första meningens betydelse.
Stycke 4: Den består av 2 frågor. Den första frågan är bra och befogad. På den skulle jag svara ja. Jag vill dock tillägga att ljudkällor har sällan rundstrålad vågutbredning över dess frekvensområde. Då är det på sin plats att hörseln integrerar de attribut som motsvarar den sammanlagda klang som ljudkällans totala utstrålande energi medför. Tag exempelvis violiner. De har specifika komplexa utstrålningsmönster i deras olika olika frekvensintervall och låter helt olika i olika riktningar om första reflexer är för svaga eller inte finns med. Dessutom kommer därigenom precedence att gälla utan att maskering tillkommer eftersom ljuden är så olika i olika riktningar. Finns violinernas tidiga reflexer från olika riktningar med, så kommer hörseln integrera violinens totala utstrålade energi och då upplevs deras klang som ganska vacker. I vissa riktningar har de inte vacker klang. Det kan vara aggresiv och spretig klang. Det är bara ett exempel.
Stycke 5: Mening 1 verkar ok. Mening 2 ser jag som felaktig på det sätt jag förstår meningen. Menar du att image shift för tal bör ske mellan 1-50 ms? I så fall skulle ju rösten hoppa omkring för varje tillkommande förstareflex. Jag vill hävda att det inte alls bör ske och att precedence-effekten därför bör ha möjlighet att gälla i minst 100 ms och därefter skall i så fall maskering ske. Ljudkällans reella position bör detekteras av hörseln samt inte ändras då reflexer tillkommer. Tidsintervall på precedence är som jag ser det möjligtvis beroende på lokalens storlek. Optimal efterklangstid för tal i större lokaler har jag för mig är 1-1,2 sekunder. I mindre lokaler kan nog tiderna minskas till halva värdet.
Stycke 6: Jag tror inte på Darwins evolutionslära och definitivt inte vad gäller olika levande djurarter. Nyttan med precedence och maskering ser jag dock som maximal och till och med som absolut och totalt livsnödvändigt.
Mvh
Peter
Edit: Sekunder istället för ms i stycke 5.
VD Bremen Production AB + Ortho-Reality AB; Grundare av Ljudbutiken AB; Fd import av hifi; Konstruktör av LICENCE No1 D/A, Bremen No1 D/A, Forsell D/A, SMS FrameSound, Bremen 3D8 m.fl.