Moderator: Redaktörer
Kaffekoppen skrev:Det ultimata vore ju förståss fortfarande om samma gäng som tidigare fortsatte och gjorde testerna på ett sätt som tilltalade samtliga inblandade och som gjorde att de alla tyckte att det var kul.
Morello skrev:Varför inte skriva protokoll så här:
Svante Morello
1 F R
2 F R
3 F R
4 R R
5 F R
6 F R
7 R R
8 F R
9 R F
R=rätt, F=fel, fetstil=svarade först
Kan någon göra en analys av resultatet?
Med vilken konfidensnivå kan man göra gällande att jag de facto hörde skillnad på signalerna?
OM testledaren vill bortse från svar som inkommit efter det första är han fri att göra det.
Morello skrev:Testledaren avbröt testet. Någon bestämd längd på serien fanns inte.
Något mer ni undrar?
Thomas_A skrev:Morello har 7/7, Svante 2/2. Att M har svarat först i de allra flesta fall är också en indikation säkerhet, dock bara en indikation.
Sammanlagt 9/9, p-värden finns sen tidigare i tråden.
De som svarat först räknas, övriga svar kan inte garanteras vara oberoende. Ska man göra en individuell analys kan man först göra ett antagande, att de är oberoende av varandra:
Fisher's test mellan Morello och Svante: 8/1 resp 3/6; p=0.04977375565610897, two-tailed. Alltså är det osannolikt (p<0.05) att deras resultat har slumpats fram, även om det är på gränsen (nära 0.05). Det kan vara så att S har svarat tvärtom, men det kan man inte anta i detta fall (n är för litet för att bedöma).
P beräknad på Ms första serie.
Svante skrev:Thomas_A skrev:Morello har 7/7, Svante 2/2. Att M har svarat först i de allra flesta fall är också en indikation säkerhet, dock bara en indikation.
Sammanlagt 9/9, p-värden finns sen tidigare i tråden.
De som svarat först räknas, övriga svar kan inte garanteras vara oberoende. Ska man göra en individuell analys kan man först göra ett antagande, att de är oberoende av varandra:
Fisher's test mellan Morello och Svante: 8/1 resp 3/6; p=0.04977375565610897, two-tailed. Alltså är det osannolikt (p<0.05) att deras resultat har slumpats fram, även om det är på gränsen (nära 0.05). Det kan vara så att S har svarat tvärtom, men det kan man inte anta i detta fall (n är för litet för att bedöma).
P beräknad på Ms första serie.
Utgår du ifrån att man i förväg har bestämt att man ska lyssna 9 ggr? Om det hade funnits två Svantar till med liknande resultat, hade p blivit större?
Thomas_A skrev:Svante skrev:Thomas_A skrev:Morello har 7/7, Svante 2/2. Att M har svarat först i de allra flesta fall är också en indikation säkerhet, dock bara en indikation.
Sammanlagt 9/9, p-värden finns sen tidigare i tråden.
De som svarat först räknas, övriga svar kan inte garanteras vara oberoende. Ska man göra en individuell analys kan man först göra ett antagande, att de är oberoende av varandra:
Fisher's test mellan Morello och Svante: 8/1 resp 3/6; p=0.04977375565610897, two-tailed. Alltså är det osannolikt (p<0.05) att deras resultat har slumpats fram, även om det är på gränsen (nära 0.05). Det kan vara så att S har svarat tvärtom, men det kan man inte anta i detta fall (n är för litet för att bedöma).
P beräknad på Ms första serie.
Utgår du ifrån att man i förväg har bestämt att man ska lyssna 9 ggr? Om det hade funnits två Svantar till med liknande resultat, hade p blivit större?
Du får förklara närmare vad du menar med två Svantar till, men naturligtvis blir det lägre signifikans om flera personer är med pga kombinatoriken. Ju fler som är med ju större sannolikhet att hitta någon med siffror som Morello av en slump. Detta om man i efterhand selekterar två av fyra med vetskap om resultaten. Väljer några att delta i lyssningen men inte "lämna in" sina resultat kan de aldrig heller medräknas som en till Svante. De som svarat och lämnar in är de som gäller. Icke-resultat kan inte selekteras i efterhand. Jag förväntar mig att dessa två serier inte är i efterhand selekterade serier.
Ang "i förväg bestämt" så antar jag att testseriens resultat inte påverkar testledarens beslut när han ska avbryta, exempelvis genom att inte veta de rätta svaren under testens gång, eller att man bestämt sig för 9 stycken. Det är iofs som jag sagt tidigare väldigt lågt med 9 omgångar. Skulle man tro att testet är styrt efter Morellos svar så kan det inte sägas vara styrt om han har 9/9 rätt vid stoppet (i hans sista exempel).
För övrigt:
Ang. att skilja två personer åt med en förväntad pi=0.5 resp 0.9 krävs n=24 från varje grupp för en power på 80%. Så om man antar att Svante inte är förmögen att höra skillnad (pi=0.5) men M är det (pi=0.9), krävs det alltså n=24 svar från varje. Det faktiska Fisher-resultatet ovan har således låg power, med dessa antaganden.
Thomas_A skrev:Du får förklara närmare vad du menar med två Svantar till,
Thomas_A skrev:men naturligtvis blir det lägre signifikans om flera personer är med pga kombinatoriken. Ju fler som är med ju större sannolikhet att hitta någon med siffror som Morello av en slump. Detta om man i efterhand selekterar två av fyra med vetskap om resultaten. Väljer några att delta i lyssningen men inte "lämna in" sina resultat kan de aldrig heller medräknas som en till Svante.
Thomas_A skrev:De som svarat och lämnar in är de som gäller. Icke-resultat kan inte selekteras i efterhand. Jag förväntar mig att dessa två serier inte är i efterhand selekterade serier.
Ang "i förväg bestämt" så antar jag att testseriens resultat inte påverkar testledarens beslut när han ska avbryta,
Thomas_A skrev:exempelvis genom att inte veta de rätta svaren under testens gång, eller att man bestämt sig för 9 stycken. Det är iofs som jag sagt tidigare väldigt lågt med 9 omgångar. Skulle man tro att testet är styrt efter Morellos svar så kan det inte sägas vara styrt om han har 9/9 rätt vid stoppet (i hans sista exempel).
För övrigt:
Ang. att skilja två personer åt med en förväntad pi=0.5 resp 0.9 krävs n=24 från varje grupp för en power på 80%. Så om man antar att Svante inte är förmögen att höra skillnad (pi=0.5) men M är det (pi=0.9), krävs det alltså n=24 svar från varje. Det faktiska Fisher-resultatet ovan har således låg power, med dessa antaganden.
Thomas_A skrev:Och så en fråga. Jag undrar om det är en skillnad om man väljer att avbryta ett test i förtid även om alla svar är rätt?
Man väljer att ha 12 omgångar. Man avbryter efter 10 då testpersonen haft 10 rätt av 10 möjliga. Skiljer sig p åt om man i förväg valt 10 omgångar? Jag tror det endast skiljer sig då man fått ett eller fler fel under testets gång. I Morellos sista exempel hade han 9 av 9 möjliga, det som komplicerar det är Svante's serie, om den möjligen kunnat påverka då hans två förstasvar var korrekta.
Thomas_A skrev:Svante,
i ditt papper så har du skrivit fel anser jag. Andelen med tre rätt i rad för provomgång 1, 2, 3 är 4/32 i fem-testserien, vilket ger konfidensen 87.5%, exakt som i fallet med 3-serien. Alla serier kan fortsättas i det oändliga med okända svar, även om man bestämt sig för ett fixed värde.
Thomas_A skrev:Svante,
jag var för trött för konditional testing.
Thomas_A skrev:Äh, glöm det förresten. Jag tar tillbaka mina senaste frågor och påståenden. Jag skulle helst vilja att man inte har några konditionella tester med alls under testets gång, som jag sagt från början. Samt att ha n>20.
Thomas_A skrev:I desingen har man bestämt sig för n=12 men avslutat vid 10/10 för varje omgång.
Thomas_A skrev:Min tanke var ju att det var ett stickprov vi pratar om och då är alla n man väljer ett avbrott. Ponera följande, man bestämmer sig för följande n=10.
I fall 1 får man 10/10
I fall 2 får man 8/10
10/10 är signifikant skilt från pi=0.5 men inte 8/10.
Man bestämmer sig för att öka n med ytterligare 10 och får:
fall 1: 8/10
fall 2: 10/10
Summar i båda fallen är 18/20 vilket är signifikant skilt från pi=0.5
Nu, skiljer sig p mot en serie av 20 i rad jämfört med ändringen att öka n i strävan att minska risken för fel? Skiljer sig p i de två fallen där man har 18/20 men där den första serien i sig är signifikant skilt från slumpen men där man i första fallet fick ett signifikant utfall och i andra fallet inte fick det.
Det var väl det jag menade med att serierna bara är stickprov ur en längre serie.
I slutändan kanske man gjort 200 tester och fått 181 positiva. Varken 10/10 eller 8/10 skiljer sig mot denna signifikant, men det är väldigt väldigt skilt från 100/200, dvs slumpen.
Dahlqvist skrev:Utan att vara trivial så gäller inte den centrala frågeställningen hur man behandlar matematiken utan vilket utfallsrum man skall räkna på. En utomstående betraktare kan inte skilja IÖ:s anstängningar att öka känsligheten hos experimentet från att post hoc dra nytta av slumpmässiga variationer. Och där i ligger dilemmat.
Thomas_A skrev:Jo men eftersom man inte visat att 10/10 är skilt från 8/10 pga av för låg n så kan man anta att de inte skiljer sig åt signifikant.
Thomas_A skrev:Inom biologin använder man sig ofta av konsekutivt val eftersom det inte är att välja i efterhand. I ovanstående fall antas de båda serierna vara konsekutiva, alltså ej selekterade i efterhand.
Svante skrev:Thomas_A skrev:Inom biologin använder man sig ofta av konsekutivt val eftersom det inte är att välja i efterhand. I ovanstående fall antas de båda serierna vara konsekutiva, alltså ej selekterade i efterhand.
Ok, det vet jag ju ingenting om, men menar du att man väljer att generera en andra testserie, beroende på utfallet i den första?
I sådana fall vill jag ifrågasätta om de kan betraktas som slumpvisa urval.
Svante skrev:Thomas_A skrev:Jo men eftersom man inte visat att 10/10 är skilt från 8/10 pga av för låg n så kan man anta att de inte skiljer sig åt signifikant.
Nej verkligen inte! Jag har inte visat för dig att min bil är grön. Kan vi då anta att den är det?
Användare som besöker denna kategori: Inga registrerade användare och 22 gäster