Hur använda resultatet av en F/E-lyssning?

av **Svante** » 2011-09-02 08:29

En sak klarnade just i min lilla hjärna.

Om det vore så att lyssnaren med hög precision kunde svara lika på ett givet stimulus som ligger över tröskeln, varje gång, då skulle man alltid få svarsserien "alla rätt". Väntevärdet bleve 100%. Om det låg under tröskeln så skulle svarsserien ha väntevärdet 50%.

Det vore omöjligt att få de andra värdena däremellan, annat än som resultatet av slumpen som blir när man gissar en serie. Väntevärdet skulle bli antingen 50 % eller 100 %.

Anledningen att värdena däremellan ändå tillför ett mervärde är att lyssnaren INTE har oändligt hög precision. Om man jämför med sampling så skulle man kunna säga att man har tillfört ett ditherbrus när man stör lyssnaren, spelar musik som inte är optimal, eller om lyssnaren blir trött.

Man kan alltså göra följande modell:

Lyssnaren har en inre tröskel, under vilken man överhuvudtaget inte kan detektera objektet. Vi undersöker om apparaten ligger under den tröskeln. Det är önskvärt att "instrumentet" eller försöksuppställningen om man så vill så gott som möjligt ger lyssnaren möjlighet att använda den inre tröskeln. En perfekt sådan uppställning kommer att ge väntevärdena 50% eller 100 % detektion.

Om uppställningen inte är perfekt utan lyssnaren drabbas av en störning kommer han ibland att misslyckas, trots att objektet egentligen är hörbart. Man kan se detta som att vi tillför en störsignal, ett ditherbrus om vi så vill.

Det som är bra med detta är att det ger oss en möjlighet att gradera hur hörbar förstärkaren är. Ett problem med graderingen är dock att den beror direkt av hur stor störningen är; för en given störningsamplitud finns det ändå en påverkan som genererar 100% rättsvar. Skalan som jag pratar om ovan gäller därmed bara en given uppställning (inklusive FP).

Ett annat problem som störningen tillför är att ditherbruset inte ligger symmetriskt kring nollan, det har en DC-komponent som inför ett systematiskt fel. Med en outtröttlig lyssnare kan det hanteras genom att öka antalet lyssningar. Fast sådana lyssnare finns ju inte.

Om man söker svar på frågan om apparatens hörbarhet understiger den absolut minsta tröskeln som FP har, bör man därför försöka minska störnivån, så att bias blir så liten som möjligt. En konsekvens av detta blir dock att möjligheten att gradera apparatens påverkan minskar, i en perfekt uppställning får man ett binärt svar.

Jag vet inte om ovanstående hjälper någon mer än mig att förstå något, men för mig är de här parallellerna med signalteori tämligen upplysande. F/E-lyssningen är som en enbits A/D-omvandlare, och ditherbrus kan linjärisera den. Och sampling är ju snudd på samma sak som mätning.

Kärnan i detta är "ditherbruset". Väldigt mycket av skillnaderna mellan olika uppställningar kan modelleras med dess fördelningsfunktion.

av **Svante** » 2011-09-02 08:37

Nattlorden skrev:Vad är en serie? Är det en unik person, eller är det bara en av någon identifierad stopp-punkt?

Om man har 4 fel av 12 först och någon säger "nu är serien slut", nu gör vi en ny. och man i den andra har 8 fel av 12... så måsta jag nog tycka att man har 12 fel av 24... inte 8/12 rätt i båda, för att någon statisktiskt flippat den ena serien.

En serie i upplägget som beskrivits ovan är bara för en enda person. När serien ska avslutas är bestämt enligt i förväg uppställda villkor. Man lyssnar tills man har fått 9 av 9, 12 av 13, 14 av 16, 17 av 20, eller fyra fel (eller rätt).

Det du beskriver sedan är min punkt 1. Ingen av serierna ger ju signifikans. Där är jag tämligen klar över att om man vill byta rätt-fel, så måste man byta på samma sätt med samtliga svar i serien.

Men den här diskussionen tenderar att blockera det jag egentligen vill diskutera i den här tråden, nämligen om andelen rättsvar kan ses som ett graderat mått på hörbarheten.

av **sebatlh** » 2011-09-02 10:29

Svante skrev:Om man söker svar på frågan om apparatens hörbarhet understiger den absolut minsta tröskeln som FP har, bör man därför försöka minska störnivån, så att bias blir så liten som möjligt. En konsekvens av detta blir dock att möjligheten att gradera apparatens påverkan minskar, i en perfekt uppställning får man ett binärt svar.

Jag fortsätter med lite svammel här

Olika personer har olika hörtröskel.
Så en gradering kan fås genom att låta panelen ge individuella svar om apparaten är för lätt att detektera.
Igen så blir det problem med att lyssningspanelen inte är en konstant i tiden/mellan lyssningar; Det blir problem att jämföra olika lyssningar relativt varandra.

Men panelen kankalibreras genom att göra en kontrollserie på en känd, lagom dålig förstärkare. En som brukar ge ungefär 75% rätt eller liknande.
Men då kommer lyssningströttheten in igen...

Olika lyssnares "prestanda" vid tidigare lyssningar borde också gå att använda för att få ut information om hur bra apparaten är.
Men vid det här laget så är det fingervisningar det handlar om.
Om det inte var det från början? Hur bestämmer man ditherbrusets storlek/utseende i Svantes modell ovan?
Det är väl den springande punkten?
(Det jag skrev förde alltså inte diskussionen frammåt, utan in på ett sidospår av självklarheter

)

av **DQ-20** » 2011-09-02 15:43

Det stora problemet med f/e-lyssning som mätning är hur man skall attribuera resultaten. Om man gör JND-mätningar brukar man ju* använda kända, kvantifierade och kalibrerade stimuli för att utvärdera lyssnarens gräns för hörbarhet. När detta är gjort är det ganska tydligt vem som "äger" resultatet, nämligen lyssnaren. Man kan i princip trycka upp en testrapport att lägga i plånboken och ta fram vid festliga tillfällen i sällskap med likasinnade.

Om man mäter på en förstärkare med exempelvis ett Audio Precision-system får man också en tydlig koppling mellan mätetal och det man mätte på. Man kan på ett tämligen entydig sätt beskriva hur maximal effekt och distorsion har mätts och under vilka omständigheter. Det är också så att "man" på ett tydligt sätt uppfattar att apparaten "äger" sina mätetal och att dessa är lika när man packar och öppnar lådan eller mäter med ett annat AP-system i en annan del av världen. Därför kan man med fördel trycka upp en testrapport och lägga med i lådan såsom brukligt med dyra och välingenjörade produkter.

I båda fallen är utfallet en konsekvens av det totala sammanhanget vid mätningen men jag tror att de flesta ser det (rätteligen) som att det finns en stor "portabilitet" (mitt hittepå-ord) hos resultaten pga av att andra men liknande mätsituationer kan förväntas ge likvärdiga resultat. Resultaten följer till mycket stor grad apparaten.

När man lyssnar F/E förutsätter vi* att samma mekanismer som vi mätte med olika stimuli och noterade JND för finns tillstädes och kan utnyttjas för att detektera skillnader mellan F och E. Men man vänder förstås på steken. Mättekniskt kan man säga att lyssnarna inte är kalibrerade - dvs. de är inte JND-mätta på alla parametrar och kombinationer därav som kan fälla utslag. Vi kan med F/E-lyssning inte lätt inferera vilka stimuli som triggar responsen utan endast att de gör det. Vi kan alltså inte utesluta om det är andra mekanismer än de som vi skulle kunna mäta upp med JND-mätningar som påverkar utfallet utan det kan vara i princip okända mekanismer som fäller avgörandet.

Utfallet är alltså beroende av lyssnarnas JND-nivåer för de parametrar som man kan mäta samt ett okänt antal andra nivåer som man inte har mätt. Vidare är utfallet beroende av vilka stimuli i form av ljudsignaler, effektnivåer och annat som används för att ge utslaget. Kunskapen om dessa är inte sådana att de med lätthet går att kvantifiera mer än att de tycks vara utslagsgivande. Mättekniskt är F/E-tester alltså problematiska på olika plan. Egenskaper i förstärkaren kan inte kopplas till utslaget utan ytterligare mätningar och egenskaperna hos panelen är inte helt kända eller ens möjliga att ta reda på. Dessa problem kan vi analysera mättekniskt och diskutera i termer av t.ex. validitet och reliabiliet och säkert en massa annat också som jag inte känner till. Vi kommer då att finna att problemen, ur ett mätteoretiskt perspektiv, är många.

Den stora fördelen är dock att F/E-lyssning har stor validitet. Vi undersöker/mäter nämligen direkt och utan att inferera om en transmissionlänk påverkar signalen hörbart, givet en viss lyssningspanel, en viss kringutrusting och vissa stimuli. Genom att ha en tränad panel, bra kringutrustning och ljudsignaler som av erfarenhet visat sig utslagsgivande ökar man chansen för att "icke-detektionen" skall "stå sig" under andra förhållanden. Att med hjälp av annan mätteknisk utrustning och uppmätta JND-nivåer försöka inferera hörbarhet hos ett apparat är inte alls lika direkt och "twice removed" från det man verkligen vill få fram.

Allt nog och medan. Jag tror att den stora faran med att kalla "F/E-lyssning" för "F/E-mätning" är hur ordet mätning uppfattas i detta sammanhang, inte om det är en mätning eller inte. Som jag tidigare var inne på är alla mätningar beroende av de förutsättningar under vilka man genomförde mätningarna. Vanligt förekommande mätningar på t.ex. förstärkare (dist, max effekt osv. ) har en stor "portabilitet" som gör att mätetalen kan upprepas med sådan precision för ett visst apparatexemplar att man kan skicka med ett testprotokoll i lådan. Men att dessutom skicka med resultaten från en F/E-lyssning skulle jag dock vara mycket skeptisk till. Anledningen till detta är den bristande graden av "portabiliet": resultatet "ägs" nämligen i mindre och till viss del okänd, grad av själva apparaten utan delar resultatet på ett påtaligt sätt med lyssningpanel och övriga omständigheter kring testet. Egenskaperna på lappen med testresultat från AP och från LTS F/E-test är inte kopplade till apparaten på samma sätt.

Av tradition är mätningar på elektroniska apparater av den karaktären att de är betydligt mindre bundna till en viss unik mätsituation än F/E-tester. Om man då missleds av ordet "mäta" och överför sina förväntningar från t.ex. AP-mätningar till F/E-mätningar gör man ett tankefel på grund av de uppenbara mätteoretiska skillnaderna och tillmäter F/E-lyssningen mer "portabilitet" (eller kanske vanliga hederliga "generaliserbarhet") än man bör. Min slutsats är att problemet med att kalla F/E-lyssningar à la LTS för "mätningar" ligger inte i att det inte "är" en mätning utan den stora faran ligger i hur resultaten tolkas och kopplas till apparaten, givet hur andra typer av mätningar på apparater brukar genomföras.

/DQ-20

*) Jag vill göra klart att man för att vara på den säkra sidan gott kan förutsätta att jag inte kan ett dugg om t.ex. psykoakustik, audiologi, JND och till dessa relaterade testmetoder.

av **Almen** » 2011-09-02 15:51

Svante skrev:Men den här diskussionen tenderar att blockera det jag egentligen vill diskutera i den här tråden, nämligen om andelen rättsvar kan ses som ett graderat mått på hörbarheten.

Tror det stora problemet är att du inte vet något om anledningen till andelen felsvar. Lite okoncentration, någon som skrapar med en stol - "fel" programmaterial, "fel" volymnivå; ett eller flera felsvar behöver inte säga något alls om färgningens storleksgrad.

Som jag ser det har du dessutom redan all information, redan innan du börjar räkna: de subjektiva utlåtandena. Där har du kvalitativa värden (som förvisso med kompletterande mätningar kan kvantifieras) som berättar både om hur färgningen yttrar sig och hur stor den var.

P.S. Såg DQ-20s inlägg nu. Svårt att inte hålla med om det mesta.

P.P.S. Skulle, som jag sagt tidigare i andra diskussioner, gärna se att fler mätningar gjordes på testobjektet (med konstlasten inkopplad) för att på så sätt kunna relatera typ och grad av färgning till mätvärden.

av **petersteindl** » 2011-09-02 16:08

Almen skrev:
Svante skrev:Men den här diskussionen tenderar att blockera det jag egentligen vill diskutera i den här tråden, nämligen om andelen rättsvar kan ses som ett graderat mått på hörbarheten.

Tror det stora problemet är att du inte vet något om anledningen till andelen felsvar. Lite okoncentration, någon som skrapar med en stol - "fel" programmaterial, "fel" volymnivå; ett eller flera felsvar behöver inte säga något alls om färgningens storleksgrad.

Som jag ser det har du dessutom redan all information, redan innan du börjar räkna: de subjektiva utlåtandena. Där har du kvalitativa värden (som förvisso med kompletterande mätningar kan kvantifieras) som berättar både om hur färgningen yttrar sig och hur stor den var.

Om färgningens storleksgrad varierar så varierar också tröskeln för detektering. Det må vara ett problem, men den typen av problem har man i alla typer av mätningar där perception finns med. Dessa problem utesluter dock inte mätningen som görs anses såsom varandes en mätning. Det är därför man redan i mätuppställningen på förhand väljer testprocedur på sådant sätt att risken för fel minimeras. Dessutom väljer man mätuppställning på så sätt att de resultat man anser vara intressanta att särskilt studera också kommer med i mätresultatet.

Om det är så att problemen blir så stora att inget vettigt resultat kan uppnås så undrar jag varför man ens orkar bry sig att göra sådana mätningar d v s F/E-lyssningar. Dessutom är jag tämligen övertygad om att metodiken går att förfina så att mycket mer info går att få fram. De problem man har är mätnoggrannhet eller snarast Onogrannhet samt reproducerbarhet.

MvH
Peter

av **DQ-20** » 2011-09-02 16:29

Almen skrev:
Svante skrev:Men den här diskussionen tenderar att blockera det jag egentligen vill diskutera i den här tråden, nämligen om andelen rättsvar kan ses som ett graderat mått på hörbarheten.

Tror det stora problemet är att du inte vet något om anledningen till andelen felsvar. Lite okoncentration, någon som skrapar med en stol - "fel" programmaterial, "fel" volymnivå; ett eller flera felsvar behöver inte säga något alls om färgningens storleksgrad.

Som jag ser det har du dessutom redan all information, redan innan du börjar räkna: de subjektiva utlåtandena. Där har du kvalitativa värden (som förvisso med kompletterande mätningar kan kvantifieras) som berättar både om hur färgningen yttrar sig och hur stor den var.

Jag kan inte uppfatta det som annat än trivialt att man med F/E-lyssning har svårt att veta vad andelen rätta svar ("detektion") beror på. Man vet ju inte vilka egenskaper testpersonerna använder sig av för att identifiera F och E. Visste man det skulle man inte längre behöva F/E-lyssning som metod. Men visst påverkar det möjligheter att dra generella slutsatser.

Vad Svante skriver är ju om det är ett "graderat", dvs. kvantifierat mått som är korrelerat med hur svårt det "verkligen" är att detektera en apparat i ett F/E-test, givet samma premisser, t.ex. nivåer och programmaterial. Skrapande stolar eller en tillfällig svacka i koncentrationen är stokastiska variationer som främst påverkar variansen och inte väntevärdet. (Väl?) Värdet av ett mått som de som Svante skissar på ökar ju lägre andel rätta svar som avges. Anekdotiskt verkar informationen i de kvalitativa omdömena gå mot noll när andelen rätta svar sjunker och villkoras från subjektens sida ofta med att man är osäker eller kanske inbillar sig. Man får lätt in massor av den kognitiva bias som man vill slippa i ett blindtest så att säga bakvägen när man bygger slutsatserna på kvalitativa omdömen.

Bästa hälsningar,

/DQ-20

av **IngOehman** » 2011-09-02 17:13

Svante skrev:Ja, låt mig då deklarera från början att jag inte avser denna tråd som en fortsättning på den andra "F/E-lyssnings-mätningstråden", jag vill helst att man har accepterat ATT det kan vara bra att se F/E-lyssning som en mätmetod innan man skriver här.

Skeptiker uppmanas titta på för att kanske se om det ändå finns något positivt att lära ur resonemangen när de får pågå ostört.

Har man inte accepterat synsättet fortsätter man lämpligen debatten i den andra tråden, eller startar en alternativtråd till denna.

If you please.

Jag skulle vilja reda ut vad som egentligen händer om man tolkar en svarsserie enligt nedan.

Förutsättningar:

Säg att man från början bestämde sig för en 9-13-16-20-design. Det innebär att man bryter lyssningen efter 9 rätt av 9, 12 rätt av 13, 14 rätt av 16, 17 rätt av 20.

Det spelar ingen roll för resonemanget, men antag också att endast riktiga svar räknas, bortse från möjligheten "många fel" som detektion.

Säg vidare att man bestämmer sig för att låta andelen riktiga svar vara ett mått på hur svårt det var att höra påverkan. Rimligen var det svårare om man måste lyssna många gånger och om man gjorde fel ibland.

Antag också att lyssnarna är tidsinvarianta.

Med en simulering kan man visa att försöksdesignen ger mer än 99 %-ig konfidens ATT man kan detektera objektet om man får en serie med färre än fyra fel (dvs högst tre fel, 17 av 20).

Mätresultaten man kan få då är:

1. Man svarar 9 av 9 rätt. Andelen riktiga svar är 100%.
2. Man svarar 12 av 13 rätt. Andelen är 92 %.
3. Man svarar 14 av 16 rätt. Andelen är 88 %.
4. Man svarar 17 av 20 rätt. Andelen är 85 %.
5. Man svarar fler än fyra fel. Andelen riktiga svar är mindre än 85 %

Min tolkning är då, i samtliga fall utom 5 att man med 99 % konfidens har visat att skillnad föreligger. Vi har också ett estimat av hur stor andel av svaren som lyssnaren skulle svara rätt om han gjorde oändligt många lyssningar under de givna förutsättningarna. De estimaten kan ha värdena 100, 92, 88 eller 85 %.

Fall 5 är svårare att värdera, men gör det troligt att FP inte kan detektera objektet med 85 % riktiga svar. Man skulle kunna uppnå 99 % konfidens med en annan försöksdesign som fortsätter även efter 4 fel, men en sådan skulle inte ge fler än 85 % riktiga svar (vilket inte är riktigt sant, det går att välja designer som motsäger det, men det vore dumt).

Det jag nu undrar är, kan vi säga något om felen i estimatet av andel riktiga svar? Alltså, hur säkert är det att lyssnaren skulle svara just 88 % rätt om han gjorde oändligt många serier om resultatet var 14 rätt av 16? Är det rätta värdet egentligen 89 %?

-----------

Jag tycker mig känna igen resonemanget från andra undersökningar, vad ska vi hitta på, tex om man undersöker effekten av en medicin på antal leverfläckar. Steg 1 är att visa ATT det finns en effekt, och OM man gör det så har man också ett estimat på hur mycket antalet leverfläckar minskade. Det bästa estimatet är rimligen medelantal före minus medelantal efter. Men hur noggrant är det estimatet?

Tappert, ni som orkade läsa hit. Orkar ni skriva något också?

Jag har just upptäckt den här tråden, och blir mycket förbryllad av första
inlägget.

Du skriver att man för att få skriva i tråden måste acceptera att det är bra
att se F/E-lyssning som en mätmetod.

Resten av ditt inlägg går ut på att du frågar dig om man kan mäta med en
F/E-lyssning...

Så man måste alltså ha och erkänna en förutfattad mening, för att man
skall få delta i en diskussion som får ut på att ifrågasätter samma mening?

Vidare finns i ditt förstainlägg ett antal konstigheter, som t ex att du skriver:

Svante skrev:Min tolkning är då, i samtliga fall utom 5 att man med 99 % konfidens har visat att skillnad föreligger. Vi har också ett estimat av hur stor andel av svaren som lyssnaren skulle svara rätt om han gjorde oändligt många lyssningar under de givna förutsättningarna. De estimaten kan ha värdena 100, 92, 88 eller 85 %.

Det får mig att tro att du inte förstår vad statistisk signifikans betyder, och
att du inte heller förstår att en lyssnare inte är en stabil maskin. Nio rätt av
nio betyder 100% rätt, men ABSOLUT inte att det är ett rimligt estimat att
samma lyssnare kommer att fortsätta att svara rätt i all framtid.

Det är något man bara kan gissa om. Är detektorn en människa (om det
är en lyssning det gäller) så går det inte ens att göra en statistisk beräkning
på ramarna (vars gränsvärden är statistiska) för ett estimat. Du försöker
att använda statistiken ett steg längre än vad som är tillåtet, tycker jag det
ser ut som.

Kan det vara så att du tänker dig att "12 rätt av 13" är en serie där felet
bara kan få ha funnits i någon av de första 9 gissningarna? Med det upp-
lägg som du talar om, så kommer det naturligtvis att vara så, att så alltid
kommer att vara fallet, men jag hoppas att du inser att en tänkbar 13-
serie kan se ut t ex RRR RRR RRR FRRR - och nu måste du bestämma dig
om det verkligen är rimligt att göra ett estimat, om det blir helt olika som
funktion av var felet kommer av de tretton gissningarna. Eller menar du att
det du kallar ett estimat är en godtycklig ansats bara? Om så hoppas jag
vi är överens om att det inte är rimligt att kalla ansatsen för en mätning.

Vad jag vill säga är helt enkelt att 88% rätt betyder 88% rätt, och 100%
rätt betyder 100% rätt, inte att det är ett rimligt estimat att det kommer
att bli 100% rätt även 1000 svar senare, ens med oändligt outtröttliga
lyssnare.

Samma sak kan man kanske uttrycka: 100 % rätt genom 9 av 9, är en
serie som är så kort att dess osäkerhet blir så hög, att ett rimligt estimats
ramar väl inrymmer de estimat som de längre serierna renderar.

Eller med andra ord: Serien: RRR RRR RRR FRRR bär inte en annan infor-
mation än serien, RRF RRR RRR RRRR. Att det verkar så om du avbryter
efter 9 i första fallet, är bara en konsekvens av din metods konstruktion.
Det behöver man förstå för att förstå att slutsatsen att felet är mindre i
fallet 9 av 9 än i fallet 12 av 13, är felaktig. Felet är inte mindre för att
man inom en serie gissat rätt i början, än om man gjort det i slutet.

- - -

Egentligen så finns det ett tiotal andra saker jag skulle vilja kommentera i
ditt inlägg, men jag nöjer mig med detta enda, tills jag fått svar på vad du
menar med att man måste ha en förutfattad mening för att få diskutera
om samma förutfattade mening är relevant. Eller jag kanske missförstod
vad du menade helt och hållet.

Vh, iö

av **IngOehman** » 2011-09-02 17:27

PS. I en serie om en gissning är chansen att den blir rätt 50% om man
defakto inte hör någon skillnad utan bara gissar. Så säg att man bara
gissar en gång, och gissar rätt. Det ger en statistisk signifikans om 50%.

Det är så dåligt som det kan bli. Gissar man mera fel än så, så ökar den
statistiska signifikansen för att gissningarna inte beror på slumpen igen,
eftersom den samvariation man behöver se för att tro på svaren beror
på objektet och inte slumpen, visas av svarens konsekventhet (oavsett
polaritet) inte av deras riktighet.

Och...

Gissar man FRFRFRFRFRFRFR så är också det en statistisk signifikans om
50%. Detsamma gäller FFFFFFRRRRRR. Att man gissade ett rätt när man
gissade en gång (alltså 100% rätt) betyder inte att det finns skäl att tro
att felet som man försöker detektera, är större då.

För att man skall kunna mäta sakers storlek med en teknik som liknar det
som Svante beskriver, krävs att man har en redan från början bestämd,
och mycket lång serie. Men ändå måste man vara varse att ett fel som är
bara väldigt lite över hörtröskeln - kan vara tillräckligt för att man skall
kunna svara rätt gång, på gång, på gång...!

Det är därför det är så viktigt att förstå att man inte man se det som ett
värde på apparatens felstorlek - ens om man lyssnar i 100-serier och tar
fasta på ALLA serier med tillräcklig SS och sen bedömer hörbarhet från
utfallet i var och en av dem - när tröskeln för detektion i sig har en osäk-
erhet (/kan röra sig flera gånger mer) som är mycket större än det lilla
område som annars skulle gå att gradera.

- - -

Skillnaden mellan 70R/30F och 100R av 100 (båda har hög statistisk sig-
nifikans), kan vara med råga täckt in av hur väl eller illa man sov natten
innan. Så att det lilla intervall man kan "mäta" i sig är mycket mindre än
felmarginalen för detektionströskeln, gör det omöjligt att dra några slut-
satser från det.

Vill man veta något användbart om hur stort felet är, så behöver man där-
för prata med lyssnarna, eller på annat sätt få dem att gradera sina upp-
levelse. Men en skala är en väldigt dålig metod när felen har så många
flera dimensioner än ett försök att förenkla dem till en "storlek". I vissa
fall kan man dock istället för storlek be lyssnare att beskriva felets allvar-
lighet, i form av hur mycket det förstör. Det kan i vissa fall vara användbar
information.

- - -

Allt detta ovanstående är också skälet till att man i studier där man vill ha
något som liknar mätdata på lyssnarnas upplevelser givet den specifika
stuationen (vilket är det enda man kan mäta - man kan inte mäta något
som är generellt för objektet, bara saker som gör det lättare att gissa om
det) så har man ALDRIG från felprocent till något annat än att veta om
man skall godkänna eller underkänna lyssnarnas omdömen. I varje fall
inte i några seriösa studier som jag tagit del av (t ex de som gjort sv SR).

Felstorlekar kan bara bedömas genom att be lyssnarna redogöra för dem.
DS.

-------------------------------------------------------------------------------

PPS. Nu skall jag ge läsa fler inlägg i tråden än bara det första, och se vad
ni kommer fram till. Väntar sen på kommentar från Svante om vad som
ger legintimitet att delta i den här diskussionen.

Jag förmodar att det är undertecknad, Almen, Nattlorden, i, e, möjligen
även den klurige DQ-20 (som så skickligt undviker att ta ställning) och
kanske några till som Svante avsett "blir av med", det vill säga som inte är
välkomna?

Men jag hoppas på klartext med avseende på om man alltså inte för vara
med och diskutera hur det är, utan att först ha deklarerat att man redan
bestämt sig för hur det är.
DSI.

av **IngOehman** » 2011-09-02 17:50

DQ-20 skrev:Det stora problemet med f/e-lyssning som mätning är hur man skall attribuera resultaten. Om man gör JND-mätningar brukar man ju* använda kända, kvantifierade och kalibrerade stimuli för att utvärdera lyssnarens gräns för hörbarhet. När detta är gjort är det ganska tydligt vem som "äger" resultatet, nämligen lyssnaren. Man kan i princip trycka upp en testrapport att lägga i plånboken och ta fram vid festliga tillfällen i sällskap med likasinnade.

Om man mäter på en förstärkare med exempelvis ett Audio Precision-system får man också en tydlig koppling mellan mätetal och det man mätte på. Man kan på ett tämligen entydig sätt beskriva hur maximal effekt och distorsion har mätts och under vilka omständigheter. Det är också så att "man" på ett tydligt sätt uppfattar att apparaten "äger" sina mätetal och att dessa är lika när man packar och öppnar lådan eller mäter med ett annat AP-system i en annan del av världen. Därför kan man med fördel trycka upp en testrapport och lägga med i lådan såsom brukligt med dyra och välingenjörade produkter.

I båda fallen är utfallet en konsekvens av det totala sammanhanget vid mätningen men jag tror att de flesta ser det (rätteligen) som att det finns en stor "portabilitet" (mitt hittepå-ord) hos resultaten pga av att andra men liknande mätsituationer kan förväntas ge likvärdiga resultat. Resultaten följer till mycket stor grad apparaten.

När man lyssnar F/E förutsätter vi* att samma mekanismer som vi mätte med olika stimuli och noterade JND för finns tillstädes och kan utnyttjas för att detektera skillnader mellan F och E. Men man vänder förstås på steken. Mättekniskt kan man säga att lyssnarna inte är kalibrerade - dvs. de är inte JND-mätta på alla parametrar och kombinationer därav som kan fälla utslag. Vi kan med F/E-lyssning inte lätt inferera vilka stimuli som triggar responsen utan endast att de gör det. Vi kan alltså inte utesluta om det är andra mekanismer än de som vi skulle kunna mäta upp med JND-mätningar som påverkar utfallet utan det kan vara i princip okända mekanismer som fäller avgörandet.

Utfallet är alltså beroende av lyssnarnas JND-nivåer för de parametrar som man kan mäta samt ett okänt antal andra nivåer som man inte har mätt. Vidare är utfallet beroende av vilka stimuli i form av ljudsignaler, effektnivåer och annat som används för att ge utslaget. Kunskapen om dessa är inte sådana att de med lätthet går att kvantifiera mer än att de tycks vara utslagsgivande. Mättekniskt är F/E-tester alltså problematiska på olika plan. Egenskaper i förstärkaren kan inte kopplas till utslaget utan ytterligare mätningar och egenskaperna hos panelen är inte helt kända eller ens möjliga att ta reda på. Dessa problem kan vi analysera mättekniskt och diskutera i termer av t.ex. validitet och reliabiliet och säkert en massa annat också som jag inte känner till. Vi kommer då att finna att problemen, ur ett mätteoretiskt perspektiv, är många.

Den stora fördelen är dock att F/E-lyssning har stor validitet. Vi undersöker/mäter nämligen direkt och utan att inferera om en transmissionlänk påverkar signalen hörbart, givet en viss lyssningspanel, en viss kringutrusting och vissa stimuli. Genom att ha en tränad panel, bra kringutrustning och ljudsignaler som av erfarenhet visat sig utslagsgivande ökar man chansen för att "icke-detektionen" skall "stå sig" under andra förhållanden. Att med hjälp av annan mätteknisk utrustning och uppmätta JND-nivåer försöka inferera hörbarhet hos ett apparat är inte alls lika direkt och "twice removed" från det man verkligen vill få fram.

Allt nog och medan. Jag tror att den stora faran med att kalla "F/E-lyssning" för "F/E-mätning" är hur ordet mätning uppfattas i detta sammanhang, inte om det är en mätning eller inte. Som jag tidigare var inne på är alla mätningar beroende av de förutsättningar under vilka man genomförde mätningarna. Vanligt förekommande mätningar på t.ex. förstärkare (dist, max effekt osv. ) har en stor "portabilitet" som gör att mätetalen kan upprepas med sådan precision för ett visst apparatexemplar att man kan skicka med ett testprotokoll i lådan. Men att dessutom skicka med resultaten från en F/E-lyssning skulle jag dock vara mycket skeptisk till. Anledningen till detta är den bristande graden av "portabiliet": resultatet "ägs" nämligen i mindre och till viss del okänd, grad av själva apparaten utan delar resultatet på ett påtaligt sätt med lyssningpanel och övriga omständigheter kring testet. Egenskaperna på lappen med testresultat från AP och från LTS F/E-test är inte kopplade till apparaten på samma sätt.

Av tradition är mätningar på elektroniska apparater av den karaktären att de är betydligt mindre bundna till en viss unik mätsituation än F/E-tester. Om man då missleds av ordet "mäta" och överför sina förväntningar från t.ex. AP-mätningar till F/E-mätningar gör man ett tankefel på grund av de uppenbara mätteoretiska skillnaderna och tillmäter F/E-lyssningen mer "portabilitet" (eller kanske vanliga hederliga "generaliserbarhet") än man bör. Min slutsats är att problemet med att kalla F/E-lyssningar à la LTS för "mätningar" ligger inte i att det inte "är" en mätning utan den stora faran ligger i hur resultaten tolkas och kopplas till apparaten, givet hur andra typer av mätningar på apparater brukar genomföras.

/DQ-20

*) Jag vill göra klart att man för att vara på den säkra sidan gott kan förutsätta att jag inte kan ett dugg om t.ex. psykoakustik, audiologi, JND och till dessa relaterade testmetoder.

Eftersom jag effektiviserade min scanning av tråden, började jag med att
läsa bakifrån, och dessutom först bara de inlägg som jag förmodade var
intressanta, och med det menar jag de som författas av människor som
jag sedan tidigare har sett, har visat stort förstånd/att de kan tänka.

Vilket betyder att jag startade med ett av DQ-20!

Förvisso räknar jag både Almen och några till till samma kategori, men dels
så väntade jag mig inte att hitta några inlägg av dem i tråden (givet det
som Svante skrev i förstainlägget) och dessutom har jag väntat med att
läsa dessas inlägg, eftersom jag ju redan vet att de inte bara förstår, utan
att de även har tagit ställning i frågan på ett sätt som jag ju sympatiserar
med.

DQ-20 däremot har varit skicklig på att vakta sin tunga...

Därför måste jag, efter att ha läst hans oavstående inlägg, som ju säger
mer eller mindre exakt det som jag hävdat, med en dåres envishet, om
och om igen i den andra tråden, fråga honom om han håller med om det?

Gör du det, DQ-20?

Talar alltså inte om ordet mätning (som jag motsätter mig endast för att
jag vet vilka missförstånd bruket av det i sådana här sammanhang (läs;
dragande av otillåtna slutsatser) alltid leder till) utan jag talar bara om de
mekanismer* som man bör förstå, för att inte dra felaktiga slutsatser från
en F/E-lyssning.

Vh, iö

- - - - -

*Som det är uppenbart, även av denna tråd, att trådstartaren inte insett
den fulla betydelsen av, i varje fall inte när han skrev förstainlägget.

av **DQ-20** » 2011-09-02 18:05

IngOehman skrev:Det får mig att tro att du inte förstår vad statistisk signifikans betyder, och
att du inte heller förstår att en lyssnare inte är en stabil maskin. Nio rätt av
nio betyder 100% rätt, men ABSOLUT inte att det är ett rimligt estimat att
samma lyssnare kommer att fortsätta att svara rätt i all framtid.

Proportionen i stickprovet är "BLUE", best linear unbiased estimator, av proportionen i populationen. Att gissa att populationens medelvärde är det samma som stickprovets medelvärde ger den minsta sum-of-squares vid upprepade försök och skattning blir varken systematiskt för liten eller för stor. Vill man uppskatta den teoretiska långsiktiga proportionen (hypotetiskt alltså, vilket innebär att lyssnarna blir inte trötta eller lär sig mer av att lyssna fler gånger) utifrån ett stickprov gör man det bäst med stickprovets proportion. Detta är trivialt. MEN, frågan är ju om det är meningsfullt vid korta serier när felmarginalerna är stora. Det enda man kan säga, om man vill tala om proportioner, är att en population experiment med den underliggande proportionen 0.5 (slump) kan ge samtliga dessa resultat i 0,5% av alla stickprov (testserier) med en viss storlek. Man kan alltså utifrån stickproven inte dra några som helst växlar på att det skulle handla om olika populationer (med olika underliggande proportion). Men OM man hade tillräckligt stora stickprov (testserier) med tillräckligt små felmarginaler skulle man faktiskt det. Jag tror det är denna hypotetiska situation som Svante funderar över. Som om, alltså. Men om om inte fanns vore katten kung kanske man skall tillägga.

/DQ-20

av **IngOehman** » 2011-09-02 18:10

Nej, det du skriver stämmer inte när utfallet varit 100 %.
Alltså om man isolerar de fallen.

Varken praktiskt eller statistiskt, eller någonting annat. Det
är bara "nästan sant" om man slår samma alla sådana app-
roximationer. Hoppas jag lyckades uttrycka mig begripligt.

Vh, iö

av **Micke23** » 2011-09-02 18:46

IngOehman skrev:Nej, det du skriver stämmer inte när utfallet varit 100 %.
Alltså om man isolerar de fallen.

Varken praktiskt eller statistiskt, eller någonting annat. Det
är bara "nästan sant" om man slår samma alla sådana app-
roximationer. Hoppas jag lyckades uttrycka mig begripligt.

Vh, iö

"Nästan begripligt!"

av **IngOehman** » 2011-09-02 19:12

Det får duga.

Vh, iö

av **Svante** » 2011-09-02 19:19

IngOehman skrev:Det får mig att tro att du inte förstår vad statistisk signifikans betyder

Ja, som jag och flera andra tidigare har sagt tappar man all lust att debattera med dig när du konstant recensera vad jag förstår, som om det vore en självklarhet att du själv förstår. I fallet med signifikans blir det närmast larvigt.

Jag nöjer mig därför med att tipsa dig om att flera av dina frågor kan förklaras med de premisser som jag har satt upp för modellen av mätningen.

Tex står det att instrumentet vi diskuterar i den här tråden innehåller en tänkt tidsinvariant lyssnare.

Vill du inte diskutera med de premisserna får du gärna starta en alternativtråd.

av **IngOehman** » 2011-09-02 19:27

Trist med dina retoriska personpåhopp.

Men åter till sakfrågorna:

Vad är det som gör att du pekar på att du utgått ifrån en tidsinvariant
lyssnare*?

Vad i det jag skrivit är det som får dig att tro att du behöver påpeka det?

Har du några sakinvändningar mot det jag skrev?

Förstår du vad det är som gör att du fick mig att tro att du inte förstår vad
statistisk signifikans betyder/lyckades jag få fram det?

Förstår du varför jag ville att du skulle veta vad dina formuleringar gav mig
för intryck?

Men framförallt - läste du resten av mitt inlägg?
Förstod du det?
Höll du med om det?

Vh, iö

- - - - -

*En sådan utgångspunkt gör det ju HELT omöjligt att använda svaren till
att få något mått på felstorleken. Det är ju just problem med detta som
jag tagit upp om och om igen, som skäl till att det inte går att dra några
andra slutsatser än "SS för det som upplevts av lyssnarna".

Att en verklig lyssnare byts mot en tidsinvariant gör det helt omöjligt att
detektera några sådana informationer från svarsserien. Och man kan, om-
än med vissa reservationer, påstå att det gör hela din hypotes (om utfall)
omöjlig.

Givet att du postulerar en tidsinvariant lyssnare så VET man ju att ALLA
svarsserier som inte är rätt från början till slut, visar att det är slumpen
som kommer in. Det är liksom en utgångspunkt som inte är tillåten, om
du vill diskutera SS för utfallet.

Eller menade du att apparaten ändrar sig slumpmässigt under lyssningen?

av **petersteindl** » 2011-09-02 19:37

IngOehman skrev:Trist med dina retoriska personpåhopp.

Men åter till sakfrågorna:

Vad är det som gör att du pekar på att du utgått ifrån en tidsinvariant
lyssnare*?

Vad i det jag skrivit är det som får dig att tro att du behöver påpeka det?

Har du några sakinvändningar mot det jag skrev?

Förstår du vad det är som gör att du fick mig att tro att du inte förstår vad
statistisk signifikans betyder/lyckades jag få fram det?

Förstår du varför jag ville att du skulle veta vad dina formuleringar gav mig
för intryck?

Men framförallt - läste du resten av mitt inlägg?
Förstod du det?
Höll du med om det?

Vh, iö

- - - - -

*En sådan utgångspunkt gör det ju HELT omöjligt att använda svaren till
att få något mått på felstorleken. Det är ju just problem med detta som
jag tagit upp om och om igen, som skäl till att det inte går att dra några
andra slutsatser än "SS för det som upplevts av lyssnarna".

Att en verklig lyssnare byts mot en tidsinvariant gör det helt omöjligt att
detektera några sådana informationer från svarsserien. Och man kan, om-
än med vissa reservationer, påstå att det gör hela din hypotes (om utfall)
omöjlig.

Då man gör mätningar där perception ingår så lägger man som testledare upp mätsituationen på så sätt att kontinuitet och invarians är inbakat i den totala mätsituationen.

Därför utformar man t.ex. mätsignaler och mätskalor så att invarians föreligger.

MvH
Peter

av **Svante** » 2011-09-02 19:37

IngOehman skrev:Jag förmodar att det är undertecknad, Almen, Nattlorden, i, e, möjligen även den klurige DQ-20 (som så skickligt undviker att ta ställning) och kanske några till som Svante avsett "blir av med", det vill säga som inte är välkomna?

Men jag hoppas på klartext med avseende på om man alltså inte för vara med och diskutera hur det är, utan att först ha deklarerat att man redan bestämt sig för hur det är.

Jag vill ogärna utesluta personer ur den här tråden, och jag har heller ingen makt att göra det. Det kan bara bli en vädjan.

Anledningen till att den här tråden finns är dock att de frågor jag vill diskutera blir omöjliga att diskutera när tråden blir helt nedklottrat med annat.

Den är helt enkelt en tråd där jag ställer upp ett antal premisser som man i sig kan ha synpunkter på vid något annat tillfälle, men bestämmer sig för att ignorera. Givet de premisserna undersöker man vad som händer. Det är en mycket vanlig metod i vetenskapligt arbete för att lära sig något om "renodlade" fall.

Därför ber jag er som envisas med att det inte GÅR att se F/E-lyssning som en mätning att hålla er borta. Då diskuterar ni något annat än vad tråden handlar om. Ni är OT, för att prata forumspråk.

Av de personer du listar är det bara du själv och kanske Nattlorden som jag har farhågor om, men jag vill inte utesluta er ur debatten som tråden handlar om. Speciellt DQ-20 är extra välkommen, och tycker liksom du att han är skicklig i debatten, men av helt andra anledningar än du.

Och jag vill heller inte hindra den debatt som du vill föra, den pågår ju redan i den andra tråden och räcker inte den är det lätt att skapa flera trådar. Vill du exkludera min ståndpunkt ur den så lovar jag att respektera det.

av **IngOehman** » 2011-09-02 19:43

Tack för förtydligande!

Självklart GÅR det att se en F/E-lyssning som en mätning. Men det är
mycket dumt bara, på alla sätt, tror jag.

- - -

Eller är det kanske inte så dumt som jag tror?

Har du isåfall lust att argumentera för detta?

Vh, iö

- - - - -

PS. Det är mig oändligt främmande att exkludera din synpunkt, i något
sammanhang. Jag tror inte på sådant. Och jag tror inte du vet om de
skäl jag ser för att respektera DQ-20s insatser, är samma som dina,
eller några andra.

Jag ser, att han ser och förstår det jag tjatat om sedan förra trådens
begynnelse. Det jag inte tror att jag nått fram med till dig. Men det är ju
bara ett av skälen till att jag tycker att han förtjänar största respekt.
Han brillierar ju på alla flanker, för tusan!

petersteindl skrev:
IngOehman skrev:Trist med dina retoriska personpåhopp.

Men åter till sakfrågorna:

Vad är det som gör att du pekar på att du utgått ifrån en tidsinvariant
lyssnare*?

Vad i det jag skrivit är det som får dig att tro att du behöver påpeka det?

Har du några sakinvändningar mot det jag skrev?

Förstår du vad det är som gör att du fick mig att tro att du inte förstår vad
statistisk signifikans betyder/lyckades jag få fram det?

Förstår du varför jag ville att du skulle veta vad dina formuleringar gav mig
för intryck?

Men framförallt - läste du resten av mitt inlägg?
Förstod du det?
Höll du med om det?

Vh, iö

- - - - -

*En sådan utgångspunkt gör det ju HELT omöjligt att använda svaren till
att få något mått på felstorleken. Det är ju just problem med detta som
jag tagit upp om och om igen, som skäl till att det inte går att dra några
andra slutsatser än "SS för det som upplevts av lyssnarna".

Att en verklig lyssnare byts mot en tidsinvariant gör det helt omöjligt att
detektera några sådana informationer från svarsserien. Och man kan, om-
än med vissa reservationer, påstå att det gör hela din hypotes (om utfall)
omöjlig.

Då man gör mätningar där perception ingår så lägger man som testledare upp mätsituationen på så sätt att kontinuitet och invarians är inbakat i den totala mätsituationen.

Därför utformar man t.ex. mätsignaler och mätskalor så att invarians föreligger.

MvH
Peter

Tänk hårdare.

Behöver du svarsserier och beräkningar av SS överhuvudtaget om du
har lyssnare som är tidsinvarianta?

Och viktigare: Var kan man beställa sådana?

(Jo en sort finns förstås, de helt döva.)

Vh, iö

av **Svante** » 2011-09-02 19:47

IngOehman skrev:Trist med dina retoriska personpåhopp.

Men åter till sakfrågorna:

Vad är det som gör att du pekar på att du utgått ifrån en tidsinvariant
lyssnare*?

Vad i det jag skrivit är det som får dig att tro att du behöver påpeka det?

Detta:

IngOehman skrev:... och att du inte heller förstår att en lyssnare inte är en stabil maskin. Nio rätt av nio betyder 100% rätt, men ABSOLUT inte att det är ett rimligt estimat att samma lyssnare kommer att fortsätta att svara rätt i all framtid.

IngOehman skrev:Givet att du postulerar en tidsinvariant lyssnare så VET man ju att ALLA
svarsserier som inte är rätt från början till slut, visar att det är slumpen
som kommer in. Det är liksom en utgångspunkt som inte är tillåten, om
du vill diskutera SS för utfallet.

Eller menade du att apparaten ändrar sig slumpmässigt under lyssningen?

Som jag förtydligade i något av de första inläggen till Nattlorden:

Svante skrev:
Nattlorden skrev:I och med att du postulerat att lyssnarna är tidsinvarianta så borde det väl vara 100% säkert att det blir 88% rätt?

Hmm. Bra synpunkt. Det jag avsåg med tidsinvariant är att det är en tidsinvariant stokastisk process som styr deras eventuella felsvar.

Med vanliga ord: de blir inte trötta eller plötsligt mer skärpta av att de dricker kaffe ed. Man byter heller inte musiksnutt. Osv.

Innan du börjar prata om att jag inte förstår så kan du väl läsa vad jag skriver och kanske slå upp vad en tidsinvariant stokastisk process är.

Det ser så illa ut för dig annars.

Alternativt går du in med en lite ödmjukare ton i debatten, kanske tom du kan lära dig något.

<slut kommentarer i hopp om att tråden kan få vara i fred>

av **IngOehman** » 2011-09-02 19:54

Tagga ned. Jag har inte läst de inlägg du hänvisar till. Och de hade under
alla avseenden inte skrivits när DU skrev ditt första inlägg, som var det
som jag kommenterade. Eller hur?

Så jag vet inte varför du skriver sådant där. Fulretorik är det.

Vad en tidsinvariant stokastisk process är, är jag väl bekant med, men
det var inget du skrivit i det första inlägget, som jag kommenderade, så
även där - var lite mindre arrogant, plz.

Ber att få återkomma om resten, kanske med en del av mitt första inlägg
som du inte inkluderade i ditt citat (läste du det ens?). Jag tar hur som helst
upp BÅDE fallet att lyssnarens stabilitet är så hög att det är ett problem, och
när den är så låg att det är ett problem (för den som vill extrahera info om
felstorlek från svarsserien). Det sistnämnde lade jag faktiskt mest krut på,
så jag förstår inte varför du kommenterar det första som om jag inte hade
berört båda.

Vh, iö

Edit/rättelse: Det var i första inläggets PS (som jag av längdskäl gjorde till
ett eget inlägg) som jag tog upp problemen med att man inte får ut någon
användbar kvalitetsinfo om steget från svarsserien, på grund av att lyssnar-
ens stabilitet under lyssningen är så stor att det "mätbara området" (det
man hittar mellan "alla rätt" och "random-resultat") är så litet att det är
försumbart jämfört med instabiliteten från gång till gång - och att det är
just därför som man därför bara kan få ut en vettig info om testobjektets
eventuella karaktärer - genom att fråga lyssnarna.

av **Nattlorden** » 2011-09-02 20:03

Svante, det hade varit mer intressant om anledningen till frågan vore känd. Känner du dig osäker på om testserierna använda varit långa nog, eller försöker du hitta ett sätt att korta ned det för att effektivisera framtida lyssningar?

Om det inte är lyssnarna du försöker mäta, utan apparat under testande, så finns de ( i min mening ) bara ett mätvärde, nämligen "färgar hörbart". Om inte detta mätvärde uppstår finns inget alternativ då man inte kan konstatera "färgar inte hörbart" utan enbart konstatera att man misslyckats mäta. Det denna tråden handlar om är ju bara det enda möjliga mätvärdets trovärdighet, eller hur

Och denna trovärdighet äger väldigt liten, snarare ingen, validitet för att användas som något kvalitetsmått på testapparaten, då det inte går att utesluta att konfidensen hade kunnat bli mycket högre med annat lyssningsmaterial.

av **IngOehman** » 2011-09-02 20:05

Ja, så är det.

Och man behöver förstå att "ett" är en sorts "noll", eftersom man varken
vet hur mycket "färgar" betyder, eller kan utesluta att misslyckad detektion
kan ske trots en större färgning än så.

Man måste helt enkelt komma ihåg att det in invävt en massa omätbarheter,
som gör upplevelsen av mätbarhet, till en skimär.

Men det finns andra värden än mätvärden, och F/E-lyssningarna är fulla av
dem! Mjuka värden. hetereså?

Vh, iö

- - - - -

PS. Men för protokollet - det hindrar inte att det GÅR det att se en F/E-lyss-
ning som en mätning. Men man bör då inse att ingen kan veta vet vad den
visar.

av **petersteindl** » 2011-09-02 20:44

Nattlorden skrev:Svante, det hade varit mer intressant om anledningen till frågan vore känd. Känner du dig osäker på om testserierna använda varit långa nog, eller försöker du hitta ett sätt att korta ned det för att effektivisera framtida lyssningar?

Om det inte är lyssnarna du försöker mäta, utan apparat under testande, så finns de ( i min mening ) bara ett mätvärde, nämligen "färgar hörbart". Om inte detta mätvärde uppstår finns inget alternativ då man inte kan konstatera "färgar inte hörbart" utan enbart konstatera att man misslyckats mäta. Det denna tråden handlar om är ju bara det enda möjliga mätvärdets trovärdighet, eller hur

Och denna trovärdighet äger väldigt liten, snarare ingen, validitet för att användas som något kvalitetsmått på testapparaten, då det inte går att utesluta att konfidensen hade kunnat bli mycket högre med annat lyssningsmaterial.

IngOehman skrev: Ja, så är det.

Och man behöver förstå att "ett" är en sorts "noll", eftersom man varken
vet hur mycket "färgar" betyder, eller kan utesluta att misslyckad detektion
kan ske trots en större färgning än så.

Man måste helt enkelt komma ihåg att det in invävt en massa omätbarheter,
som gör upplevelsen av mätbarhet, till en skimär.

Men det finns andra värden än mätvärden, och F/E-lyssningarna är fulla av
dem! Mjuka värden. hetereså?

Vh, iö

- - - - -

PS. Men för protokollet - det hindrar inte att det GÅR det att se en F/E-lyss-
ning som en mätning. Men man bör då inse att ingen kan veta vet vad den
visar.

Alltså, det där som Nattlorden och IngOehman skriver har jag ju redan för några dagar sedan skrivit i den andra mättråden.

petersteindl skrev:...Det är alla dessa förmodade mätpunkter som enligt den statistiska modellen skall utkristalliseras om det endast var slumpmässigt brus eller en faktisk detektering. Är det slumpmässigt brus så har ingen mätning lyckats. Man har lyssnat men inte hört. Är det däremot en detektering så föreligger en lyckad mätning med hörseln och det centrala nervsystemet och hjärnan och medvetandet som hjälp. Man har lyssnat och hört. Det man hört visade sig vara korrekt och detektering har skett med hjälp av hörseln och medvetandet som mätinstrument. Mätningen var lyckad...

MvH
Peter

petersteindl skrev: ...Detekteras det, så är det en mätning. Detekteras det inte så är resultatet slumpmässigt. För att resultatet inte alltid skall bli slumpmässigt så vill det till att förutsättningarna för detektion höjs.
...

MvH
Peter

Jag argumenterar för att man kan se F/E-lyssning som en mätning.

Vad jag kan se så verkar ni tycka så också. Vad det sedan kallas för hör inte hit, vilket jag också tidigare skrivit.

MvH
Peter

av **Nattlorden** » 2011-09-02 20:48

petersteindl skrev:Jag argumenterar för att man kan se F/E-lyssning som en mätning.

Vad jag kan se så verkar ni tycka så också. Vad det sedan kallas för hör inte hit, vilket jag också tidigare skrivit.

Nej, men med tanke på hur tråden är uppsatt får man ju ta seden dit man kommer. Så det du markerat är bara skrivet så för Svantes tankero.

av **IngOehman** » 2011-09-02 20:56

Peter: Då missförstår du nog mitt inlägg fullständigt.

Vad jag skriver är bara att man (vem som helst) KAN välja att se
vad som helst, som vad som helst (men att det ibland är dumt att
göra det - som jag t ex tycker det är i det här fallet, med att se en
F/E-lyssning som en mätning).

Men - att man håller med om att man kan VÄLJA att se det så, är
ett villkor för att få skriva i den här tråden.

Och - jag kan faktiskt tycka att det är helt okej att villkora på det
viset! Det här ju inte handlar om huruvida man håller med eller inte,
utan bara om man är villig att undersöka/titta från, en infallsvinkel.

Och om man skulle vägra att göra det, så går det ju inte. Jag delar
gärna en startpostion, bara jag inte behöver dela en åsikt och vara
låst i vart jag skall tycka att argument (eventuella) drar.

- - -

Så - jag är helt med på Svantes premiss. Men det betyder inte att
jag är med på det förnuftiga i infallsvinkeln.

Det sker inte med automatik, utan kräver att någon kan formulera
något argument som talar för någon poäng. Men som sagt - jag
tar gärna den betraktningsvinkeln, om det behövs för att kunna
synkroniera bättre med den som försöker (eller kommer att för-
söka, hoppas jag) ta fram något argument i ljuset.

Jag väntar nyfiket.

Vh, iö

- - - - -

PS. Det här med infallsvinklar är ju varbara, på ett helt annat sätt än
t ex en tro. Man kan inte välja att tro något, som man inte tror, men
här handlar det bara om att ta en position, och se om den går att
försvara, istället för att ta en annan, och se om den är bättre än den
där andra.

Det tycker jag absolut man bör ställa upp på. Jag ser det som ett litet
experiment, som Svante gör, som kräver att vi alla som skriver i den
här tråden, ställer upp på det. Annars testas inte hans hypotes (om hur
kommunikationen kan vinna på att starta i en given position, kanske,
ungefär) och det vore väl onödigt?

av **IngOehman** » 2011-09-02 21:24

Svante skrev:En sak klarnade just i min lilla hjärna.

Hurraaa!!!

Tror jag (utan att säkert veta vad som hände därinne).

Och då undrar jag förstås:

Finns det fortfarande något specifikt som du fortfarande inte håller med
mig om - av det som vi diskuterade i en förra tråden?

Talar då inte om begreppet "mätning"s applicerbarhet, utan om allt det
där andra som jag skrivit, om omöjligheten att från en F/E-lyssning få
veta något vetligt, alltså bedömbart med första eller andra ordningens
säkerhet*, alltså på något annat sätt än att involvera en människa med
intuition som "känner av" vad han eller hon skall tro - använder sitt för-
nuft (men som förstås har hjälp av kunskapen från SS - om risken för
att slumpen är framme).

*Antingen känna till, eller känna till med en osäkerhet som man känner till,
eller i värsta fall känna till med en osäkerhet som man inte känner till, men
som man känner till säkerheten för. Inte känna till med en osäkerhet som
man inte känner till, det vill säga inte känna till.

Svante skrev:Om det vore så att lyssnaren med hög precision kunde svara lika på ett givet stimulus som ligger över tröskeln, varje gång, då skulle man alltid få svarsserien "alla rätt". Väntevärdet bleve 100%. Om det låg under tröskeln så skulle svarsserien ha väntevärdet 50%.

Det vore omöjligt att få de andra värdena däremellan, annat än som resultatet av slumpen som blir när man gissar en serie. Väntevärdet skulle bli antingen 50 % eller 100 %.

Anledningen att värdena däremellan ändå tillför ett mervärde är att lyssnaren INTE har oändligt hög precision. Om man jämför med sampling så skulle man kunna säga att man har tillfört ett ditherbrus när man stör lyssnaren, spelar musik som inte är optimal, eller om lyssnaren blir trött.

Man kan alltså göra följande modell:

Lyssnaren har en inre tröskel, under vilken man överhuvudtaget inte kan detektera objektet. Vi undersöker om apparaten ligger under den tröskeln. Det är önskvärt att "instrumentet" eller försöksuppställningen om man så vill så gott som möjligt ger lyssnaren möjlighet att använda den inre tröskeln. En perfekt sådan uppställning kommer att ge väntevärdena 50% eller 100 % detektion.

Om uppställningen inte är perfekt utan lyssnaren drabbas av en störning kommer han ibland att misslyckas, trots att objektet egentligen är hörbart. Man kan se detta som att vi tillför en störsignal, ett ditherbrus om vi så vill.

Det som är bra med detta är att det ger oss en möjlighet att gradera hur hörbar förstärkaren är. Ett problem med graderingen är dock att den beror direkt av hur stor störningen är; för en given störningsamplitud finns det ändå en påverkan som genererar 100% rättsvar. Skalan som jag pratar om ovan gäller därmed bara en given uppställning (inklusive FP).

Ett annat problem som störningen tillför är att ditherbruset inte ligger symmetriskt kring nollan, det har en DC-komponent som inför ett systematiskt fel. Med en outtröttlig lyssnare kan det hanteras genom att öka antalet lyssningar. Fast sådana lyssnare finns ju inte.

Om man söker svar på frågan om apparatens hörbarhet understiger den absolut minsta tröskeln som FP har, bör man därför försöka minska störnivån, så att bias blir så liten som möjligt. En konsekvens av detta blir dock att möjligheten att gradera apparatens påverkan minskar, i en perfekt uppställning får man ett binärt svar.

Jag vet inte om ovanstående hjälper någon mer än mig att förstå något, men för mig är de här parallellerna med signalteori tämligen upplysande. F/E-lyssningen är som en enbits A/D-omvandlare, och ditherbrus kan linjärisera den. Och sampling är ju snudd på samma sak som mätning.

Kärnan i detta är "ditherbruset". Väldigt mycket av skillnaderna mellan olika uppställningar kan modelleras med dess fördelningsfunktion.

Njae...

En nollbits skulle jag snarare kalla det, eller något liksom mitt emellan.

Biten kan inte säga "1" och "0" - bara "1" och "jag vet inte".

Och dessutom har 1 okänd bitvikt...

Och!!! - dessutom tillhör värdet "lyssnaren och hela situationen", så inte
nog med att vikten är okänd, dessutom vet man inte hur korrelationen
till apparaten ser ut, med avseende på det där som man alltså inte heller
känner till....

Vh, iö

av **DQ-20** » 2011-09-02 21:26

IngOehman skrev:Därför måste jag, efter att ha läst hans ovanstående inlägg, som ju säger
mer eller mindre exakt det som jag hävdat, med en dåres envishet, om
och om igen i den andra tråden, fråga honom om han håller med om det?

Gör du det, DQ-20?

Ja, alltså, jag vet inte riktigt vad jag skall svara. Det borde vara väl känt att jag ogärna svarar ja eller nej på en fråga.

Jag står ju för innehållet i inlägget så visst håller jag med om synsättet. S/n-förhållandet i andra tråden var ju inte direkt lysande så jag har nog försökt så gott det går att sila fram signalen ur bruset och skapa en syntes där till synes olika ståndpunkter kan ges mening inom samma tankefigur. Jag vill inte överdriva min roll i att skapa det tankegods som inlägget bygger på, men heller inte förringa det.

Anledning till att inlägget ligger i den här tråden är att det passar bra här. S/n är hittills bättre här, inlägget utgår från att mätteori på ett fruktbart sätt kan användas för att förstå F/E-lyssning (dvs. att man kan se F/E-lyssning som en mätning utan att världen nödvändigtvis går under) samtidigt som det innehåller synpunkter på gränserna för hur man kan använda resultaten från en f/e-lyssning.

/DQ-20

av **IngOehman** » 2011-09-02 21:27

Är mer än nöjd med det svaret.

Respekterar självklart din "diplomatiska vilja" och din vänlighet att för-
svara "alla synsett".

Frågan om ordet är inte viktig i diskussionen, som jag ser det.

Men väl i den praktiska verkligheten - efter att ha sett hur både ofta och
hur fruktansvärt fel den synen leder folk, att tro att det är en mätning som
är "som en vetenskaplig mätning" (i brist på bättre ord) när de saknar den
insikt som behövs (nästa alla) för att inse när det inte finns någon faktisk
substans i "mätvärdena" och att det enda som "mäts" hör till lyssnarna.

Vh, iö

- - - - -

PS. Och nota bena, jag talar inte bara om människor som läst MoLt nu,
eller människor här på faktiskt, eller människor som har något med hifi att
göra alls - utan om akademiska forskare som av sin tanke att de mäter,
förleds att dra förfärligt felaktiga slutsatser.

av **Svante** » 2011-09-02 21:31

Nattlorden skrev:Svante, det hade varit mer intressant om anledningen till frågan vore känd. Känner du dig osäker på om testserierna använda varit långa nog, eller försöker du hitta ett sätt att korta ned det för att effektivisera framtida lyssningar?

Nej, jag vill nog inte göra något med testseriernas längder. Jag ser det som att lyssningarnas främsta uppgift är att avgöra om det alls går att höra objektet.

Däremot är jag intresserad av att veta hur mycket man kan utläsa av den extra information som finns i seriernas längd. Rimligen har det varit svårare att höra skillnaden om man behövde 17 av 20 än om man tog 9 på raken.

Syftet är inte i första hand att ändra på något i den befintliga processen, utan att förstå den.

Nattlorden skrev:Om det inte är lyssnarna du försöker mäta, utan apparat under testande, så finns de ( i min mening ) bara ett mätvärde, nämligen "färgar hörbart". Om inte detta mätvärde uppstår finns inget alternativ då man inte kan konstatera "färgar inte hörbart" utan enbart konstatera att man misslyckats mäta. Det denna tråden handlar om är ju bara det enda möjliga mätvärdets trovärdighet, eller hur

Det är apparaten jag tänker mig mäts. Den här tråden handlar om huruvida man kan utläsa något extra av försöksseriernas längd, tex vad det bästa estimatet av andel rättsvar i en oändligt lång serie skulle vara.

Det du pratar om tvekar jag att gå in på, eftersom vi har ältat det förut, men alternativet till detektion är ickedetektion. Liksom detektionen är den inte säker. Skillnaden, som jag förmodar gör att du säger att ickedetektionen inte finns som mätvärde, är att ickedetektionens signifikans vilar tungt på mätmetodens upplösning.

Likafullt har ickedetektionen använts historiskt av bla Ingvar som ett tungt argument för att en förstärkare är bra. Fritt ur minnet* (var det Brystonsteget jag tänker på, tro) var han dock väldigt noga med att betona att de verkligen hade gjort allt för att detektera apparaten, men ändå inte lyckats. Han var alltså, med all rätt, tvungen att bedyra värdet av ickedetektionen. Detta är ju mycket svårare, men låter sig ändå göras i brist på bättre.

Nattlorden skrev:Och denna trovärdighet äger väldigt liten, snarare ingen, validitet för att användas som något kvalitetsmått på testapparaten, då det inte går att utesluta att konfidensen hade kunnat bli mycket högre med annat lyssningsmaterial.

Nej, man kan heller inte utesluta att man har gissat 9 rätt i rad. Och man kan inte utesluta att en voltmeter är trasig när man mäter med den.

Nollrisker finns inte, det finns bara olika stora risker. Jag skulle gissa att risken är liten att de förstärkare som man INTE har lyckats höra i LTS F/E-lyssningar ändå är hörbart färgande ändå. Jag kan inte säga hur liten, men jag vågar ändå dra den slutsatsen. Jag tar den risken för att det ändå är det intressantaste resultatet av en lyssning, och för att det inte finns något alternativ.

*Jag slog sedan upp testet i MoLt och texten som beskriver hur det låter är ungefär en hel sida med beskrivningar av upprepade misslyckanden att höra objektet, och ett avslut med stycket:

Ingvar i MoLt 2 2007 skrev:Detta ger inte testen någon ytterligare vetenskaplig vikt, men huruvida detta är en indikation på apparatens låga färgning eller inte, får var och en bedömma själv. Uppenbart drabbar det nämnda scenariet näppeligen någon apparat som färgar mycket. Så ett tecken på goda återgivningsegenskaper är det tvivelsutan.

Detta är en precis riktig redovisning och slutsats av testet. Ickedetektion har ett värde om man har ansträngt sig mycket för att leta efter detektion.

Hur använda resultatet av en F/E-lyssning?

Re: Hur använda resultatet av en F/E-lyssning?

Re: Hur använda resultatet av en F/E-lyssning?

Re: Hur använda resultatet av en F/E-lyssning?

Re: Hur använda resultatet av en F/E-lyssning?