Moderator: Redaktörer
IngOehman skrev:En klassiker, ja. Fast det var väl dörrar.
Vh, iö
IngOehman skrev:Fast skall man vara noga, och det skall vi väl här på faktiskt.se, så duger det inte att som du skrev
"ta bort ett av alternativen och fråga om man vill byta". Då ökar nämligen inte chansen av att byte
ett endaste någe.
Om målet var att peka ut den som är olika och testledaren däremot visar eller pekar ut ett av dem
som är lika efter att man valt, så förbättras oddsen om man byter till den andra. om det är ett slump-
spel vill säga. Den som hörde tydligt vilken som var annorlunda (och inte inbillade sig) förbättrar inte
några odds genom att byta i den situationen. Det måste vara ett slumpspel.
Vh, iö
grafpro skrev:Tråd ur spår. Tänka sig. Verkligen ingen som kan besvara frågan?
Almen skrev:grafpro skrev:Tråd ur spår. Tänka sig. Verkligen ingen som kan besvara frågan?
DQ-20 gjorde ett försök, men det såg du kanske inte: http://www.faktiskt.io/phpBB3/viewtopic.php?p=1657973#p1657973
Dessutom ställde jag en fråga till dig: http://www.faktiskt.io/phpBB3/viewtopic.php?p=1657113#p1657113
DQ-20 skrev:grafpro skrev:---
Slumpresutatet är därmed 1/3 i stället för 1/2 - hur ska då en testserie för 99% konfidens se ut?
...OM det är en sannolikhet på 1/3 att svara rätt är det väl bara att multiplicera på tills man når under 0.01, dvs.i det här fallet 5 gånger.
grafpro skrev:Almen skrev:grafpro skrev:Tråd ur spår. Tänka sig. Verkligen ingen som kan besvara frågan?
DQ-20 gjorde ett försök, men det såg du kanske inte: http://www.faktiskt.io/phpBB3/viewtopic.php?p=1657973#p1657973
Dessutom ställde jag en fråga till dig: http://www.faktiskt.io/phpBB3/viewtopic.php?p=1657113#p1657113
Ser faktiskt inget svar i något av dessa inlägg. Frågan löd:
För att nå 99% säkerhet i tester där testpersonen har två alternativ gäller först 9 lyssningar. Med 9 rätt är då saken klar. Med färre rätt fortsätter man. 12 rätt av 13 ger också 99%, liksom 14 rätt av 16 eller 17 rätt av 20.
Hur ser motsvarande serie ut i upplägg med tre alternativ?
Nu har jag inte sett just det programmet men triangle tests används en del när det gäller smaker så vitt jag förstår det.Almen skrev:grafpro skrev:Nu en konkret fråga som det alldeles säkert finns ett konkret svar på.
---
Möjligen är jag den siste i världen att inse att ett annat upplägg finns (jag såg det i ett nyhetsinslag om forskning på människors förmåga att känna skillnad på dofter): Lyssnaren får tre alternativ att välja på, där två i själva verket är detsamma. Frågan som ställs är "Vilken är annorlunda?".
Vad skulle förbättras i detektionsavseende menade man i programmet i fråga?
LasseA skrev:Nu har jag inte sett just det programmet men triangle tests används en del när det gäller smaker så vitt jag förstår det.Almen skrev:grafpro skrev:Nu en konkret fråga som det alldeles säkert finns ett konkret svar på.
---
Möjligen är jag den siste i världen att inse att ett annat upplägg finns (jag såg det i ett nyhetsinslag om forskning på människors förmåga att känna skillnad på dofter): Lyssnaren får tre alternativ att välja på, där två i själva verket är detsamma. Frågan som ställs är "Vilken är annorlunda?".
Vad skulle förbättras i detektionsavseende menade man i programmet i fråga?
http://en.wikipedia.org/wiki/Discrimina ... g#Triangle
Almen skrev:grafpro skrev:Nu en konkret fråga som det alldeles säkert finns ett konkret svar på.
---
Möjligen är jag den siste i världen att inse att ett annat upplägg finns (jag såg det i ett nyhetsinslag om forskning på människors förmåga att känna skillnad på dofter): Lyssnaren får tre alternativ att välja på, där två i själva verket är detsamma. Frågan som ställs är "Vilken är annorlunda?".
Vad skulle förbättras i detektionsavseende menade man i programmet i fråga?
grafpro skrev:Jämfört med AB eller FE eller ABX behöver man alltså bara köra fyra lyssningar istället för nio för att nå så långt.
grafpro skrev:Almen skrev:grafpro skrev:Nu en konkret fråga som det alldeles säkert finns ett konkret svar på.
---
Möjligen är jag den siste i världen att inse att ett annat upplägg finns (jag såg det i ett nyhetsinslag om forskning på människors förmåga att känna skillnad på dofter): Lyssnaren får tre alternativ att välja på, där två i själva verket är detsamma. Frågan som ställs är "Vilken är annorlunda?".
Vad skulle förbättras i detektionsavseende menade man i programmet i fråga?
Ingen aning. Det var var ett kort nyhetsinslag om näsans förmåga, inte ett program. Sådana aspekter var nog långt utanför inslagets ambitionsnivå.
Men nu har vi ändå två små framsteg. Artikeln på wikipedia ger två namn åt metoden - "triangle" eller "XXY". Gott så, men inget svar på frågan alls.
Därtill en beräkning av sannolikheten att få alla rätt i en serie. Så långt är det hyggligt enkelt att beräkna. (1/3)^4 ger 1/81, vilket är 0,0123456. Alltså 98,7654% sannolikhet att det inte skedde av en slump vid fyra rätt av fyra. (Fem rätt av fem ger 99,588% säkerhet, för den klentrogne.) Det är ju mycket trevligt. Jämfört med AB eller FE eller ABX behöver man alltså bara köra fyra lyssningar istället för nio för att nå så långt.
Om vi nöjer oss med den nivån, hur ser då den fortsatta serien ut? Alltså för den som har tre rätt av fyra och vill fortsätta, etc. Det är fortfarande själva frågan.
Svante skrev:Man kan därför jämföra 5 lyssningar enkelsidigt med trevalsmetoden med 8 lyssningar dubbelsidigt med tvåvalsmetoden, båda ger <1% felrisk.
Almen skrev:Svante skrev:Man kan därför jämföra 5 lyssningar enkelsidigt med trevalsmetoden med 8 lyssningar dubbelsidigt med tvåvalsmetoden, båda ger <1% felrisk.
Och eftersom varje lyssning i trevalsmetoden egentligen är (minst) tre, och varje lyssning i tvåvalsmetoden är (minst) två, så har man att ställa 5*3 emot 8*2, d.v.s. 15 jämfört med 16.
grafpro skrev:Tråd ur spår. Tänka sig. Verkligen ingen som kan besvara frågan?
grafpro skrev:Alltså 98,7654% sannolikhet att det inte skedde av en slump vid fyra rätt av fyra.
grafpro skrev:Om vi nöjer oss med den nivån, hur ser då den fortsatta serien ut? Alltså för den som har tre rätt av fyra och vill fortsätta, etc. Det är fortfarande själva frågan.
Svante skrev:(Dög det, DQ?)
DQ-20 skrev:... de punkter i serien där man kan stanna när man har nått ett tillräckligt högt p-värdet
Almen skrev:DQ-20 skrev:... de punkter i serien där man kan stanna när man har nått ett tillräckligt högt p-värdet
Tillräckligt högt?
Svante skrev:Almen skrev:DQ-20 skrev:... de punkter i serien där man kan stanna när man har nått ett tillräckligt högt p-värdet
Tillräckligt högt?
Han menar nog när konfidensen är tillräckligt hög...
DQ-20 skrev:Svante skrev:(Dög det, DQ?)
Ja. Du har härmed benäget tillstånd att fortsätta skriva i den här tråden.![]()
Och det är precis som du säger. Vill man ha ett entydigt p-värde associerat med en viss serie måste man räkna ut stopp-villkor. I praktiken förslår jag att man gör som du gjort, nämligen bestämmer sig för hur lång den längsta serien får vara och räknar ut de punkter i serien där man kan stanna när man har nått ett tillräckligt lågt p-värde (dvs. tillräckligt hög statistisk signifikans), GIVET den maximala längden på serien. Det är alltså stopp-villkor man räknar ut, inte "fortsättningsvillkor".
/DQ-20
Almen skrev:Precis, det är ju lätt att tänka konfidens när man inte är så insatt.
DQ-20 skrev:Almen skrev:Precis, det är ju lätt att tänka konfidens när man inte är så insatt.
Du, den där smileyn, var inte den lite väl ironisk? Halvvägs mellan frontalangreppet <ingen smiley> och.
Men som sagt: jag bjuder.![]()
/DQ-20
Svante skrev:Almen skrev:Svante skrev:Man kan därför jämföra 5 lyssningar enkelsidigt med trevalsmetoden med 8 lyssningar dubbelsidigt med tvåvalsmetoden, båda ger <1% felrisk.
Och eftersom varje lyssning i trevalsmetoden egentligen är (minst) tre, och varje lyssning i tvåvalsmetoden är (minst) två, så har man att ställa 5*3 emot 8*2, d.v.s. 15 jämfört med 16.
Ja, och att jämföra tre med varandra känns dessutom klurigare än att jämföra två med varandra. Mentalt blir det tre jämförelser, svårare att hålla reda på i huvudet vilken man lyssnar på, det borde ta minst dubbelt så lång tid att komma fram till ett vettigt svar.
Besläktat med trevalsidén är annars ABX-test. Jag gillar inte den heller.
Användare som besöker denna kategori: Inga registrerade användare och 7 gäster