pepe skrev:petersteindl skrev:Almen skrev:pepe skrev:Hör en på miljonen en skillnad så betyder det att det finns en skillnad, ja om det inte finns risk att det är ett slumpmässigt resultat.
Sannolikheten att en rad med sju av sju rätt uppträder av slump i en serie på en miljon är ganska stor. Eller ja,
väldigt stor.

Det händer ju i Lotto ganska ofta, i alla fall.

Tack

Ni tycks bortse från förutsättningen. Men det är ju lätt att bluddra bort genom att komma dragandes med populistiska ankedoter som Lotto. Hur många gånger anser ni att man måste vinna på Lotto för att det inte längre skall vara en slump? En gång, två gånger, fyra gånger eller 8 gånger?
När blir det enligt er fastslaget att det inte längre är ett slumpmässigt resultat? Så kör på det antalet då, det är skitsamma för mitt påstående - är det utom allt tvivel klart att någon hör en skillnad som inte kan anses slumpmässig så finns det en skillnad även om miljoner andra inte hör den.
Sen att det kanske i sig är ett bevis på att skillnaden är så liten att den kan anses oändligt betydelselös är en annan fråga. Men skillnad finns.
Tjaffsar ni inte om självklarheter för tjaffsandets skull nu?
Hej pepe
Det är just förutsättningen jag syftar på och förutsättningen jag diskuterar är 1 000 000 testsubjekt i ett LTS F/E-lyssningstest. Det går alltså inte att fastställa att någon hör en skillnad som inte kan anses slumpmässig då det är många testsubjekt med.
Svante skrev:Lyssningstestet måste repeteras så många gånger att man uppnår tillräckligt hög statistisk säkerhet, eller konfidens. Det finns ju en risk att man med rena gissningar kan svara rätt, tom flera gånger i rad. Frågan är hur många rätt i rad som behövs för att risken ska vara tillräckligt liten.
Beroende på vad man anser skall vara för resultat så är det antingen 7 rätt av 7 eller 8 rätt av 8 som man behöver för 99 % sannolikhet att det inte är slumpen som avgör. Denna skillnad har IngOehman förklarat bra i ett tidigare inlägg i denna tråd.
Svante skrev:Om man nu har gjort blindtest, vad ska man redovisa? I vetenskaplig mening måste alla försök som man skulle ha godtagit som positiva redovisas även om de blev negativa. Därför är det viktigt att i förväg bestämma om en lyssning får ingå i testet. Man får inte göra 100 testserier med krav på 99% konfidens i varje enskilt test och bara redovisa den enda testserie som råkade ge 7 rätt i rad. Om ingen av de andra testserierna visade på en skillnad så är sannolikheten mycket stor att detta enskilda test gav 7 rätt av en slump, eftersom man gjorde så många tester. Upprepade tester sänker tydligen konfidensen.
Om det finns 1 subjekt som är med i testen och gränsen går vid 8 konsekutiva rätt av 8 möjliga för att det med 99 % sannolikhet inte är slumpen som avgör att man kryssat i rätt svar så innebär det att resultatet med 1 % sannolikhet är rätt på grund av slumpen. Om det finns 2 subjekt som är med i testet så kan båda med slumpens hjälp kryssa i rätt eller så kan en av dessa två kryssa i rätt med slumpens hjälp och det är detta alternativ som står till buds eftersom testet avbryts då en har svarat rätt på en i förväg bestämd serielängd.
Det betyder att med 2 deltagare så ökar sannolikheten för ett slumpmässigt korrekt resultat från 1 % till 2 %. Om det är 3 deltagare med i testen så ökar sannolikheten ytterligare att en av dessa har fått rätt med slumpens hjälp. Alla tre har ju möjligheten att ha fått en serie helt rätt på grund av slumpen och då ökar sannolikheten för att en av dem får en serie slumpmässigt rätt. Är det 4 stycken så är det 4 stycken och att en av dessa kan få en slumpmässigt rätt serie ökar ytterligare.
Svante skrev:Om man gör upprepade försök så sjunker alltså konfidensen. Om man tex gör två försök med 99% konfidens, blir sannolikheten 0,992=0,9801 eller ungefär 98% att ingen av försöksserierna ger positivt utfall av en slump. Konfidensen har alltså sjunkit till 98%. Gör man fem försök sjunker konfidensen till 0,995=0,951 eller ungefär 95%.
Det betyder att ju fler som är med i testet, desto större blir sannolikheten att en av testsubjekten får en serie helt rätt med slumpens hjälp. Har du 1 000 000 testsubjekt som är med i testen så minskar konfidensen med 0,99^1 000 000. Det blir inte mycket konfidens kvar. Sannolikheten för att nollhypotesen i sådant fall skall gälla blir nästan total d v s sannolikheten för att en av 1 000 000 människor skall få in en serie med slumpens hjälp är övervägande

(Understatement) Med 10 000 testsubjekt blir konfidensen 2,24877*10 upphöjt till -44. Det är ett litet tal. Mindre tal än så klarar inte mina kalkylatorer av.
Svante skrev:Hur hög konfidens som behövs varierar med frågeställningen. I vetenskapliga sammanhang brukar man inte rapportera resultat som signifikanta om konfidensen är under 95%. Själv tycker jag att 99% är rimligt för enskilda lyssningstest inom hifiområdet, eftersom det lämnar utrymme för upp till fem upprepade försök utan att 95%-gränsen nås.
Det blir lite lurigt med många inblandade personer i lyssningstesten. I LTS F/E-lyssningsförfarande räcker det med att 1 subjekt når fram och då kan testet avslutas. Men är det 1 000 000 som är med, så blir sannolikheten stor för att 1 av denna miljon testobjekt får en serie rätt på grund av slumpen och sedan bryts testet av. Då blir det sannolikt för en person av dessa att få hela serien rätt d v s det är högst osannolikt att ingen av dessa 1 miljon testobjekt inte skulle få en serie rätt. Men om 1 person gör testen och får rätt serie och gör om testen och då också får rätt på en serie och gör om testen igen och får rätt på en serie och igen och igen, så är det så att denne person klarade vid fler tillfällen att visa att nollhypotesen var felaktig och om andra personer i lika tester inte klarar så spelar det ingen roll för denne persons testresultat.
Man kan gå ett steg längre längre och ta hela jordens befolkning och postulera att det är så att ingen någonsin kommer höra skillnad på F och E på en speciell förstärkare och det är definitionsmässigt så under alla förutsättningar, vad de än vara må. Vad skulle i så fall vitsen vara med att söka bättre än så?
Låt oss också för ett ögonblick postulera att denne person som lyckades höra skillnad dog i samma ögonblick som han klarade serien så att man med fullkomlig säkerhet vet att ingen levande människa någonsin kommer att höra skillnad utom just denna gång då han som klarade det men dog en millisekund därefter. Hur relevant blir då resultatet för resterande befolknings inköp? Man kan vränga till många extravaganta konstigheter som man anser att man är helt och hållet tvungen att rätta sig efter. Det beror på hur nitisk man är.
MvH
Peter
VD Bremen Production AB + Ortho-Reality AB; Grundare av Ljudbutiken AB; Fd import av hifi; Konstruktör av LICENCE No1 D/A, Bremen No1 D/A, Forsell D/A, SMS FrameSound, Bremen 3D8 m.fl.