Moderator: Redaktörer
Kaffekoppen skrev:Så en genomlyssning med 4 lyssnare och n=10 ger n=40 vilket torde vara mer än vad som behövs?
Hur tolkar man 4 lyssnare och N=7 ... ---> N= 28?
Kaffekoppen skrev:Utökar man till n=8, n=9, n=10 .. hur blir siffrorna då?
Svante skrev:När jag skrev detta:Svante skrev:IngOehman skrev:1. Du Svante, som varit med på några av LTS lyssningstester, har du NÅGON ENDA GÅNG stött på ett resultat som du vet inte ger en statistisk signifikans om >99%, men som ändå kommit i MoLt och påståtts ha en statistisk signifikans högre än 99%?
Nej. Detta måste dock ses i ljuset av att frånvaro av fynd inte betyder att fyndet inte finns att göra. Tre saker försvårar undersökning av frågan. Det första är att jag endast har närvarat vid tre testkvällar, det andra att eftersom metoden inte finns beskriven så är den svår att validera, den tredje är att rådata inte är sparade så det finns inget att kontrollräkna på.IngOehman skrev:2. Det vill säga: Finns det någon grund, i form av ett faktiskt fall (där det blivit fel) för dig att ifrågasätta om jag tagit mitt ansvar att upprätthålla en adekvat vetenskaplig hantering av mätdata?
Ja, samtliga fall jag har sett. Det är praxis i vetenskapliga sammanhang att spara rådata, i många fall i tiotals år, och definitivt till dess att slutsatserna är publicerade. Det har mig veterligen inte skett. Vid samtidigt avgivna svar har mig veterligen ingen notering om detta förts till protokollet, vare sig om att de har avgivits samtidigt, eller i vilken ordning. Vidare är det vetenskaplig praxis att behandla statistiska data med tidigare väl beskrivna metoder och tala om vilken man har använt, alternativt att använda en icke dokumenterad metod som man själv beskriver. Den referensen eller beskrivningen har jag heller inte sett. Det är förstås möjligt att det står en pärm med rådata och/eller metodbeskrivning någonstans som motbevisar det jag säger, men jag tror inte det.IngOehman skrev:3. Eller handlar det bara om att just du inte tycker dig kunna bedöma signifikansen på plats, som jag har gjort? (Utöver att jag förstås kontrollräknat i de fall det finnits minsta tveksamhet.)
(Denna sista kräver följdfrågor, som jag ställer strax...)
Ja. Eller nej. Alltså jag kan inte svara för alla andra, men det beror på att jag inte kan bedömma signifikansen, vare sig på plats eller långt senare. Metoden Ingvar använder är extremt svår att beräkna en exakt konfidens med, den innehåller många faktorer vars storlek måste bedömmas eller gissas fram. Pga detta och att han inte kan dokumentera hur han gör förstår jag inte hur han räknar. Frågan är dock retorisk i den meningen att den flyttar fokus från att Ingvar inte har lyckats beskriva sin metod till att det kanske är jag som är så dum att jag inte förstår hur han räknar.IngOehman skrev:4. Är det sant att du vid ett antal tillfällen kommit med (enligt dig "svårbedömda") exempel på fall till mig, där jag ombetts att uttala mig om den statistiska signifikansen - och att jag svarat dig ögonblickligen, med antingen ett exakt svar, eller med worst case-svar (">X%")?
Nja. Jo, det är det. Betyder det att ditt svar har varit rätt?Jag har annars för vana att börja mina förklaringar med enkla exempel (dvs alla har inte varit svåra) för att förtydliga en ståndpunkt, men du verkar inte tänka som vanligt folk gör, så det har funkat ganska dåligt.
...så blev det detta som citat:IngOehman skrev:Svante skrev:Jahaja, det är tydligt att man måste ha bandbredd för att delta på faktiskt... Fasen vad mycket svårare det är att hänga med i svängarna via WAP och långsamt modem.Speciellt när man vill vara lite noga med sina svar. Att svara på nedanstående, retoriska frågor med enbart ja eller nej är liksom inte möjligt.
IngOehman skrev:1. Du Svante, som varit med på några av LTS lyssningstester, har du NÅGON ENDA GÅNG stött på ett resultat som du vet inte ger en statistisk signifikans om >99%, men som ändå kommit i MoLt och påståtts ha en statistisk signifikans högre än 99%?
Nej. VAD SAKNAS HÄR?
Tack för rakt svar!
Svante skrev:IngOehman skrev:2. Det vill säga: Finns det någon grund, i form av ett faktiskt fall (där det blivit fel) för dig att ifrågasätta om jag tagit mitt ansvar att upprätthålla en adekvat vetenskaplig hantering av mätdata?
Ja, samtliga fall jag har sett. VAD SAKNAS HÄR?
Hupp!
Det där var ju liksom en checkkodsfråga till fråga 1 - en koll att du förstått implikationen... Ditt svar renderar felaktig checkkod.![]()
Jag måste förmoda att du läst frågan slarvigt. Missade du månne:"...i form av ett faktiskt fall (där det blivit fel)..."? Jag tror nästan det, så läs igen och återkom med rätt svar, eller rättar jag det bara här, så checkkoden blir rätt: Det vill säga ändrar ditt svar till ett rungande: NEJ.![]()
Svante skrev:IngOehman skrev:3. Eller handlar det bara om att just du inte tycker dig kunna bedöma signifikansen på plats, som jag har gjort? (Utöver att jag förstås kontrollräknat i de fall det finnits minsta tveksamhet.)
(Denna sista kräver följdfrågor, som jag ställer strax...)
Ja. Eller nej.
Vet du inte vad du själv kan bedöma?
Svante skrev:Alltså jag kan inte svara för alla andra, men det beror på att jag inte kan bedömma signifikansen, vare sig på plats eller långt senare. VAD SAKNAS HÄR?
Det var ju det jag frågade om!
Nåja... där kom svaret i varje fall, och dessutom ett någotsånär rakt svar (även om JA varit rakare. Du inte tycktes vilja skriva just bokstäverna JA...).
Du svarar alltså JA! Tack.
Svante skrev:IngOehman skrev:4. Är det sant att du vid ett antal tillfällen kommit med (enligt dig "svårbedömda") exempel på fall till mig, där jag ombetts att uttala mig om den statistiska signifikansen - och att jag svarat dig ögonblickligen, med antingen ett exakt svar, eller med worst case-svar (">X%")?
Nja. Jo, det är det. VAD SAKNAS HÄR?
Ett intressant och slingrigt sätt att skriva ett rakt: JA…
Trots slinger: Tack för svaret!![]()
<snip>
Trots att jag inledde med:Svante skrev:Att svara på nedanstående, retoriska frågor med enbart ja eller nej är liksom inte möjligt.
så valde du att klippa bort förtydligandena. Att tvinga fram förenklade svar på ledande frågor är verkligen inte din stil. Ändå gör du det här.
Frågorna är både ledande och retoriska, de fyller ett retoriskt syfte eftersom de för fokus bort från det som egentligen är min kritik och skenbart gör att det ser ut som att du har rätt, trots att de var en avledande manöver för att undvika sakfrågan. Ren retorik.
Detta måste dock ses i ljuset av att frånvaro av fynd inte betyder att fyndet inte finns att göra....
Men återigen, frånvaro av exempel kan bero på många saker...
Men frånvaro av bevis betyder inte att din metod är bra...
Svante skrev:...Pga detta och att han inte kan dokumentera hur han gör förstår jag inte hur han räknar...
dimitri skrev:Kaffekoppen skrev:Utökar man till n=8, n=9, n=10 .. hur blir siffrorna då?
vid 4 x 8/10 blir p=0.009
vid 4x 9/10 blir p=0.0002
vid 4 x 10/10 blip p=0.0000009
Observera att p aldrig blir 0 helt och hållet.
Återigen så tycker jag att (jag tror att det är i överensstämmelse med Ingvars tankegångar) det är resultat från de allra duktigaste lyssnarna som bör ingå i statistiken. Jag håller helt med honom att valet av "guldöron" förenklar proceduren avsevärt.
Anta att
2 pers uppnår 4/10
2 pers uppnår 10/10
p för alla dvs 28/40 blir 0.11
medan p för bara de 2 med 10 rätt blir 0.001
Som Ingvar påpekar det är inte testdeltagarna som testas utan apparat(er). Känner man dessa 2 (de som hör 10/10) personer sedan tidigare som duktiga lyssnare så behöver man inte fundera särskilt länge för att inse att det är dessas resultat som är gällande och inte alla fyras.
Morello skrev:Pojkar, tråden hamnade på rätt köl - låt det få vara så ett tag till.
perstromgren skrev:Finns det verkligen ingen som läst något i ämnet och kan citera en text som inte författats av en faktiskt-medlem? Ni må tycka att det är naivt, men inte fasiken är detta första gången någon analyserar ett försök av denna typ, och denne någon inte är en faktiskt-medlem?
Jag vägrar att tro att detta inte är väl studerat och dokumenterat. Ni som forskar, har ni verkligen ingen stat-bok i hyllan som diskuterar detta? Snart stegar jag själv iväg till bibblan och letar, om ni som sitter i soppan vägrar. Att slå varann i huvet med argument ger inget när respekten för den andres kunskap saknas. Därför vore det trevligt med några opartiska, för en gångs skull.
perstromgren skrev:Finns det verkligen ingen som läst något i ämnet och kan citera en text som inte författats av en faktiskt-medlem? Ni må tycka att det är naivt, men inte fasiken är detta första gången någon analyserar ett försök av denna typ, och denne någon inte är en faktiskt-medlem?
Jag vägrar att tro att detta inte är väl studerat och dokumenterat. Ni som forskar, har ni verkligen ingen stat-bok i hyllan som diskuterar detta? Snart stegar jag själv iväg till bibblan och letar, om ni som sitter i soppan vägrar. Att slå varann i huvet med argument ger inget när respekten för den andres kunskap saknas. Därför vore det trevligt med några opartiska, för en gångs skull.
n3mmr skrev:Fråga om flerstegstester:
Om man testar N olika, okorrelerade, egenskaper i N olika testserier (fast vid samma tillfälle, eller åtminstone fölr samma objekt med samma testomständigheter i övrigt), måste testserierna läggas samman då?
Tänk att man testar lågbasegenskaper (där man då klart hör skillnad) resp diskantegenskaper.
Antag att man då hittar att objektet färgar i lågbastestet, med 99% konfidens, men att man i diskanttestet inte lyckas säkerställa nån färgning alls, alltså identrifikationen vid diskanttestet är obefintlig eller helt slumpmässig.
Har man då identifierat en färgning med 99% konfidens eller är konfidensen lägre p g a att man måste räkna in båda serierna i en enda?
Svante skrev:n3mmr skrev:Fråga om flerstegstester:
Om man testar N olika, okorrelerade, egenskaper i N olika testserier (
Jag kan iofs tycka att det kan vara ok att göra testerna separat om de är få och egenskaperna man testar är väl åtskilda, men då måste man vara noga med att tala om hur man har gjort, vilket inkluderar att redovisa även serier som inte gav 99% konfidens.
n3mmr skrev:Svante skrev:n3mmr skrev:Fråga om flerstegstester:
Om man testar N olika, okorrelerade, egenskaper i N olika testserier (
Jag kan iofs tycka att det kan vara ok att göra testerna separat om de är få och egenskaperna man testar är väl åtskilda, men då måste man vara noga med att tala om hur man har gjort, vilket inkluderar att redovisa även serier som inte gav 99% konfidens.
Jag tänkte mig att en meningsfull redovisning skulle vara att säga.
I basen hörde vi skillnad, och vi har stor tilltro till det resultatet.
I diskanten hörde vi ingen skillnad.
men om man sa att
Vi hörde skillnad, men det var inte så väldigt säkert, konfidensen var låg
så ljög man
Men jag kanske helt missuppfattar vad konfidens är: Jag tänker mig att konfidensen kommer in, bl a, i prediktion, dvs det är den tilltro man har till att man skulel få samma resultat nästa gång med samma test.
Nu visste jag redan vad Svante ansåg om detta, så jag vill nog gärna ha nån annans syn, också.
Morello skrev:Pojkar, tråden hamnade på rätt köl - låt det få vara så ett tag till.
Mozarello skrev:Med vilken konfidensnivå kan man göra gällande att jag de facto hörde skillnad på signalerna?
Kaffekoppen skrev:Svante,
Även om du må tycka att resultaten som redovisats på tre testtillfällen som du deltagit i Svante har framkommit på ett mindre exemplariskt vis, TROR du att resultatet hade blivit annorlunda med en annan metod/tillvägagångssätt?
Kaffekoppen skrev:Varför är det intressant för dig att veta det?
Kaffekoppen skrev:Om du vill veta är du välkommen att kontakta mig direkt. Det har inget med tråden att göra.
Användare som besöker denna kategori: Inga registrerade användare och 17 gäster