petersteindl skrev:Jag vill kommentera både JMs inlägg och janschs. Inte för att kommentera något som jag anser skulle vara felaktigt. Men om information skall åskådliggöra något och öka en kunskapsnivå, så bör informationen förstås och tillfoga ny kunskap som tillför insikt och förklaring som leder till förståelse.
Varje använt ord blir då viktigt att definieras, dels för att ordet inte skall tolkas olika av olika personer dels för att ordets innebörd skall få korrekt betydelse i sammanhanget. I min förra mening har jag använt ordet ’tolka’. I det sammanhanget räknar jag med att läsarna förstår ordet ’tolka’. I det här fallet är innebörden att olika personer skulle kunna ge samma ord olika betydelse och i så fall blir vissa tolkningar felaktiga. Det kan bero på att budskapet inte är entydigt. I sådana fall kan missförstånd lätt uppstå. Det råder då tvetydighet.
I andra fall kan ordet ’tolka’ betyda ungefär samma som att översätta från ett språk till ett annat. Man kan exempelvis tolka en text från Tyska till Svenska. Ofta säger man istället att en tolk har översatt Tysk text Svenska.
Men vad menas med att ljud tolkas? Det är en aspekt man tilldelar hjärnan. Det är någon form av fysiologisk process som skall till som bygger på igenkänning och därmed utnyttjar minnesfunktion i CNS eller snarast i hjärnan gällande ljud.
T.ex. Jag hör en violin och en trumpet. Det betyder att violinens toner kan separeras från trumpetens toner. För att kunna definiera violinens toner som en violin och trumpetens toner som en trumpet, så innefattar det att man vet hur en violin respektive en trumpet låter. Det betyder att man har tidigare erfarenhet av ljudet från båda instrumenten och denna ljuderfarenhet måste finnas i någon form av minne i hjärnan. Det är en fysiologisk egenskap som kallas igenkänningsprocess. Här skulle man kunna säga att man tolkar det som en trumpet och som en violin. Men, är det verkligen rätt uttryckt? Tolkar man trumpeten som en trumpet? Kan det vara så att personen bredvid tolkar ljudet från trumpeten som en cello och ljudet från violinen som en klarinett?
Ofta används ordet ’tolka’ i samband med hjärnans processer, men jag gillar verkligen inte det ordet i samband med ljud och igenkänning av ljudkällor.
Sedan har vi riktningshörandet. Man kan exempelvis höra att violinen är 15 grader till höger och trumpeten 15 grader till vänster. Men är det så att man tolkar att violinen befinner sig 15 grader till höger? Jag säger definitivt nej till det. Det är överhuvudtaget inte fråga om någon tolkningsprocess vid riktningshörande d v s lokalisation av ljudkällor.
Hur är det med avståndsbedömning till ljudkälla. Är det en tolkningsprocess? Även om det skulle kunna vara eller är en inlärningsprocess, är det en tolkningsprocess? Här måste man sätta upp definitioner på vad en tolkningsprocess är.
Om detta kan man skriva en hel bok om. Avståndsbedömning till ljudkällor är svårt och skiljer sig markant mellan frifält kontra i rum med reflexer.
Trumpeten får sitt reflexmönster hos lyssnaren och violinen får sitt. Man hör violinens direktljud och varje reflex från violinens ljud summeras till violinen och varje reflex från trumpetens ljud summeras till trumpeten, åtminstone 1a reflex men även 2a reflex. Med efterklangen är det inte riktigt så.
På trumhinnorna d v s i den akustiska domänen summeras allt ljud, från alla instrument och alla direktljud och reflexer.
Det blir som en slags akustisk blender på respektive trumhinna. Matematiskt säger man att de akustiska ljudvågorna summeras enligt summationsprincipen i respektive punkt i rummet, exempelvis på trumhinnorna. Sätter man en mikrofon på en plats i rummet och spelar in musikinstrumenten där de spelar samtidigt och låter någon annan analysera inspelningen utan att lyssna och utan att veta vad det är, så är det nästintill eller troligtvis en helt omöjlig uppgift. Vilka tekniska analyseringsprocesser skulle i så fall användas för att veta vad som ingår i totalsumman av de olika ljuden? Jag kan inte se att det finns någon teknisk process som klarar en sådan analys. Det går helt enkelt inte. Vilken del av SPL tillhör trumpeten? Eller violinen, eller klarinetten eller valthornet osv? Och var befinner sig respektive okänd ljudkälla någonstans? Hur kan man med objektiva mätinstrument mäta på den inspelade akustiska ljudsumman? Jag kan inte se att det finns någon som helst möjlighet. Där kommer objektiva fysikaliska tekniska mätinstrument till korta.
Spelar man upp den inspelade orkestern i högtalare och istället använder hörseln som mätinstrument så kan man på några hundra millisekunder analysera ljudet och respektive instrument och respektive instruments placering, trots att allt ljud summerats på respektive trumhinna.
Här är hörseln triljarders gånger bättre än vilket objektivt tekniskt mätinstrument som helst och analysen går blixtsnabbt och med väldigt lite förbrukad energi med hörseln som mätinstrument.
Går det överhuvudtaget att bygga ett tekniskt fysikaliskt objektivt mätinstrument som klarar denna uppgift?
Jag tror det går, men då krävs det AI och simulerade neurala nätverk i datorn/mätinstrumentet och det krävs någon form av häftig dator som analyserar under viss tid. Hur bra sådant mätresultat skulle bli i förhållande till hörseln vet jag inte.
Men mitt och lilltrolls lilla experiment med inspelad musik på CD, det var Yves Montand live at Olympia. Lilltroll skrev mjukvara för AI och beräknade olika saker. Då kunde vi filtrera bort allt publikljud från rösten som applåder. Vi kunde separera olika instrument ur 2-kanalsinspelningen och lägga in dessa i separata kanaler och vi kunde göra en ny mix där vi exempelvis kunde variera avstånd till respektive instrument och sångare och sedan lägga på publikljud som vi ville. Sedan kunde vi placera musikinstrument och sångare var vi ville ha dem i ljudbilden. Vi kunde ändra på förhållandet mellan direktljudet och reflexer i inspelningen för att få distinktare rytm och större närhet till sångare med högre detaljrikedom på röster eller musikinstrument. OBS! Vi ändrade ingen frekvensgång. Ingen EQ.
[ YouTube ]
Från början trodde vi att det var en totalt omöjlig uppgift. Inte ens lönt att börja. Men med AI och lilltrolls programmering så kunde häpnadsväckande resultat uppnås. Jag vågar nog påstå att med AI så kan man leka och prova sig fram och analysera och lära sig hjärnans arbetsuppgifter då det gäller att exekvera ljudinformation. Det är nästan kusligt och innebär revolution i förståelse och i att kunna handskas med ljud.
Vi fixade med en annan låt, babes in the wood med Mary Black. Jättefin låt.
[ YouTube ]
Här kunde vi separera instrument och röster och vi kunde variera förhållandet mellan direktljud och reflexer på hennes röst och separat på instrumenten. På så sätt kunde vi få betydligt distinktare beat och klarare röst. Vi kunde få taktmarkeringarna distinktare och allt detta utan EQ.
Det bygger på att simulera neurala nätverk och då måste man förstå vilka som är de ingående fysiologiska processerna då hjärnan exekverar information. Vi har hyfsat koll på läget. Det var en intressant resa och vi var tagna och förvånade över resultaten och vad som går att göras, som tycktes vara en omöjlig uppgift.
Det går att skriva en mängd saker om hur hjärnan bearbetar inkommande ljudsignaler och det går att använda många ord för olika företeelser och processer.
Ordens betydelse måste dock definieras d v s det är nödvändigt villkor med krav på definition på varje enskilt ord som används för att beskriva processer och företeelser.
AI är framtidens lösningar på vissa problemställningar. Man kan se hjärnan som en sorteringsmaskin. För att sortera information så de går i rätt neurala kanaler så krävs igenkänning och därmed minne. Direktljudet går i sina kanaler och tidiga reflexer går i sina, allt beroende på skilda infallsvinklar. Dessutom går de olika frekvenserna i sina specifika celler och neuroner från de inre hårcellerna i innerörat och behåller denna relativa position i förhållande till varandra genom hjärnan och tillbaka till de yttre hårcellerna som fungerar som ett återkopplat neuralt system.
AI bygger dels på en inlärningsprocess där resultaten blir mer korrekta över en viss inlärningstid dels på flera andra komplicerade processer. Frågan är om jag vill använda ordet tolkning. Jag är inte säker på det. Ordet är förföriskt att använda i brist på annat eller för att slippa gå in på processer i detalj.
I ljudåtergivning ser jag det som att låta hela det akustiska skeendet från högtalare via rum till lyssnare, vara en process där man förbereder ljudfältet i rummet fram till öronen så att hjärnan kan sköta sorteringsarbetet så korrekt som möjligt för att höra korrekt perspektiv och ljudbild och korrekt klang på ett sådant sätt att lyssnaren befinner sig på plats vid det musikaliska inspelade skeendet.
Jag har inte korrekturläst. Hinner inte det.
Mvh
Peter