Svante skrev:Men man kan aldrig veta. En ickedetektion är ju bara en icke-detektion.
Det enda man kan veta säkert är att vi misslyckades med det vi försökte; att bevisa att förstärkaren var hörbart färgande.
Ovanstående är en subjektiv utsaga och utgör en tolkning av statistiken, inte en statistisk "sanning".
Även en "icke-detektion" i statistiska sammanhang bär information. Själva uttrycket "icke-detektion" bygger på tillämpandet av en godtycklig gräns för p-värdet som saknar objektiv grund.
Givet styrkan* hos det statistiska testet kan man fortfarande uttala sig (probabilistiskt) om andelen rätta svar i en hypotetisk oändlig population av försök. Man kan alltså på grundval av ett försök med "icke-detektion" forma uttalanden som "Andelen rätta svar ligger under 0,6 med p-värde på XX%". Man kan också förklara det som att man gör ett konfidensintervall runt proportionen rätta svar. Att 0,5 omfattas av den undre gränsen hindrar ju inte att man också kan titta på den övre. Den övre gränsen kan dock aldrig bli 0,5 vilket reflekterar den grundläggande obalansen mellan att statistiskt visa skillnader jämfört med "icke-skillnader". Jag bedömer dock att LTS test har låg statistisk styrka, dels beroende på den höga signifikansnivån, dels på att testen är konstruerade för att kräva ett minimalt antal försök givet ett visst p-värde. Båda dessa faktorer påverkar testets statistiska styrka* negativt. Testen prioriterar skydd mot fel av typ 1 framför fel av typ 2. Vilket är vettigt
tycker i alla fall jag.
En "detektion" i statistiska sammanhang är ALLTID probabilistiska antaganden byggt på ett subjektivt satt gränsvärde och ingenting sannolikt kan någonsin bli sant i filosofisk mening. Och för det enskilda experimentet kan man inte säga någonting säkert alls. Gör man det börjar det lukta omvänd (subjektiv) sannolikhet lång väg och Ed Jaynes vädrar morgonluft.
Jag skulle också vilja yppa en försiktig invändning mot den "Fisherianska" markeringen "failure" i LTS nuvarande testprogram. Det skulle vara mer informationsrikt i att även redovisa det exakta p-värdet. Det tydliggör (tror jag) också den subjektiva (om än välgrundade) beslutsregel som LTS tillämpar. Eller så motverkar det bara syftet. Vad vet jag.
Brasklapp: Ovanstående inlägg är troligen relevant för någon men för de flesta inte. Det skall verkligen inte misstolkas som något "grundskott" mot LTS testmetod. Det är i slutändan mest finlir.
För övrigt tycker jag att statistiken är ganska ointressant. Det viktiga ligger i det test som skall ge upphov till det statistiska underlag. Att mäta temperatur med känseln är mindre exakt än att köra med kaliberade termometrar. Data från temperaturmätningar med hjälp av känslen är tämligen ointressanta i förhållanden till de som man gör med termometrar hur sofistikerade statistika metoder man än använder.
/D
*statistisk styrka=statistical power. Det är ingen kvalitetsindikator och skall verkligen inte tolkas i ordens allmänna betydelse.