Vad är en mätning?

av **Svante** » 2011-08-27 16:10

phloam skrev:Om denna diskussion kan anses nödvändig eller signifikativ för arbetet med F/E-myttning, så känns det (för mig som amatör) nästan som om det är nåt jag helst vill undvika. Detta är inte hifi som hobby för mig. Jag bildar mig hellre en egen uppfattning med egna öron om det ska vara så här. Företrädare för och entusiaster kring LTS borde fundera på ett sånt här debackel är vad man vill lyfta fram. Bråka om lyssning vs mätning? Jag går snart och köper en ormoljekabel för barnbidraget, bara för att balansera upp det hela

Jag kan meddela att tanken har slagit mig

.

Jag kan också meddela att samtliga i LTS styrelse närvarar här på Faktiskt i egenskap av privatpersoner, utom i undantagsfall.

LTS bör och kan inte lägga munkavle på oss, utan det är upp till oss själva att agera med så gott omdöme som det krävs.

Det är klart att urspårade debatter mellan medlemmar i LTS styrelse inte ser bra ut för LTS, och kanske behöver vi skärpa oss. Men jag önskar ändå att folk kan skilja på våra roller där. Annars skulle vi bli färglösa typer som bara pratar PK. Då skulle jag behöva ett andra Faktiskt-nick.

Om jag uttalar mig för LTS räkning så talar jag om det.

Bara så att ni vet.

av **IngOehman** » 2011-08-27 16:50

Håller med om allt det där.

Vh, iö

av **IngOehman** » 2011-08-27 17:06

Svante skrev:Jag lovar, vore det så att jag kände mig inmålad i ett hörn så skulle jag, släppa det och säga att jag har fel. Jag lovar. Och detta trots att det är outgrundligt svårt att medge det i en debatt med dig eftersom varje sådan medgift gnuggas i näsan direkt och åratal efteråt av dig.

Fascinerande prestige-demonstration.

Och lika fascinerande vanföreställningar.

Svante skrev:Här är det inte så. Det skulle vara NOLL prestigeförlust för mig att säga "Aha, du menar så" om jag plötsligen insåg något smart som du hade sagt. Jag skulle tvärtom bli glad.

Härligt motsägelsefullt.

Och det du behöver visa är dessutom inte att du förstår det jag skriver,
utan att det står i motsatsförhållande till det du skrivit. Det du påstått
om grundvalarna för detektion är fel. De har bara haft med SS att göra
i de F/E-lyssnningar som LTS ar gjort, och då jag vet att du vet det, har
jag svårt att förstå att du inte kan skriva det.

Men okej, det är tydligen outgrundligt svårt för dig att medge det, av
prestigeskäl, såsom du anfört.

Svante skrev:Med detta sagt, kan du låta bli att försöka "vinna" diskussionen genom att konstant hänvisa till att det är något som jag måste förstå, som du har vetat hela tiden? Även om det är så, vilket ingen av oss vet i detta läge eftersom vi har så olika ståndpunkter, så har du ingenting att tjäna på att konstant referera till min intelligens i förklemande ordalag. Eller att jag skulle ljuga.

Utom möjligen att jag slutar skriva i tråden.

Är det så du vill vinna diskussionen?

Det finns inga vinnare i diskussioner, annat än den som haft fel och insett
det. Ditt sätt att tänka är mig helt främmande.

Tyvärr blir många förlorare om den som insett att han eller hon haft fel
inte medger det och är tydlig med det, eftersom alla de som inte har eget
förstånd utan bara går på sin förmodan om auktoritet, då riskerar att leva
vidare i sina villfarelser.

Svante skrev:
IngOehman skrev:Och även om vi skulle ha försökt att bedöma avståndet till JND med
hjälp av svarsseriernas utseende så får man inte ett svar som relaterar
till testobjektets egenskaper, utan bara till den kompletta situationen, där
inte bara lyssnaren utan även t ex programmaterialet spelar mycket stor
roll.

En mätning av JND kan heller inte ske med statisk felnivå, och det
är en mätning av hur situationen relaterar till en hörselegenskap
och inte en mätning av en apparategenskap.

Ovanstående är självklarheter.

Bra/äntligen!

Vh, iö

av **MagnusÖstberg** » 2011-08-27 17:20

IngOehman skrev:
Svante skrev:Här är det inte så. Det skulle vara NOLL prestigeförlust för mig att säga "Aha, du menar så" om jag plötsligen insåg något smart som du hade sagt. Jag skulle tvärtom bli glad.

Härligt motsägelsefullt.

Jag resonerar precis på samma sätt och hur jag än vänder och vrider på det ser jag inget motsägelsefullt i det.

Förstår du vad Svante skriver?

av **IngOehman** » 2011-08-27 17:23

Är rätt trött på alla skit du skrivit i den här tråden. Men jag skall göra ett
undantag och kommentera ditt inlägg: Läs stycket han skrev precis före.

Vh, iö

av **Dartman** » 2011-08-27 17:25

Nu har jag följt den här debatten lite från sidan. Jag har inget att tillföra till sakfrågan per se, men har en liten fundering om sättet det debatteras på. Jag är naturligtvis färgad av den jag är, och påstår mig på intet sätt vara objektiv.

men

som jag ser det tycker jag det är synd när man så ihärdigt skriver om personer, och inte om sakfrågor. Det gör mig lite beklämd.

Likaså är det för mig lite beklämmande att människor inte kan inse (och acceptera) att man kan ha olika betraktelsesätt. Det kan finnas flera "rätt". Jag menar inte att man behöver ge vika från sin ståndpunkt, men det kan vara bra om man kan inse att den inte (nödvändigtvis) är den enda rätta.

Man kommer då kanske rätt mycket längre än då man påstår att den andra minsann kommer att ändra sig när denne så att säga "ser ljuset".

Jaja.

/Jonas

Edit: Felstavning

av **MagnusÖstberg** » 2011-08-27 17:32

IngOehman skrev:Är rätt trött på alla skit du skrivit i den här tråden. Men jag skall göra ett
undantag och kommentera ditt inlägg: Läs stycket han skrev precis före.

Vh, iö

Tack, nu var det ju bara ett undantag som gällde just dig, och han medger ju öppet att han har skitsvårt att förhålla sig normalt mot dig - men anstränger sig som fan.

av **IngOehman** » 2011-08-27 17:32

Ja, det skriver han. Men det gör inte prestigen till ett mindre problem.

Utan den hade tonen sett helt annorlunda i tråden. Jag deltar aldrig i
diskussioner om jag redan från början vet att den jag talar med inte
kommer att vara mottaglig för några argument, eller kommer att stå
för det han själv skrivit.

Helt enkelt på grund av att det då inte finns några förutsättningar som
gör att det går att nå konsensus, ens om det fanns en, att nå. Kanske
borde jag vetat bättre, och givit upp mycket tidigare i tråden, eller till
och med innan den startade.

Men jag har svårt att ge upp andra människor.

- - -

Dartman: Helt okej. Jag förstår att det ser ut så från din horisont.

Vh, iö

av **MagnusÖstberg** » 2011-08-27 17:34

Dartman skrev:Nu har jag följt den här debatten lite från sidan. Jag har inget att tillföra till sakfrågan per se, men har en liten fundering om sättet det debatteras på. Jag är naturligtvis färgad av den jag är, och påstår mig på intet sätt vara objektiv.

men

som jag ser det tycker jag det är synd när man så ihärdigt skriver om personer, och inte om sakfrågor. Det gör mig lite beklämd.

Likaså är det för mig lite beklämmande att människor inte kan inse (och acceptera) att man kan ha olika betraktelsesätt. Det kan finnas flera "rätt". Jag menar inte att man behöver ge vika från sin ståndpunkt, men det kan vara bra om man kan inse att den inte (nödvändigtvis) är den enda rätta.

Man kommer då kanske rätt mycket längre än då man påstår att den andra minsann kommer att ändra sig när denne så att säga "ser ljuset".

Jaja.

/Jonas

Edit: Felstavning

Håller med till fullo!

>> The Real IDM >> Spotify playlist · av **phloam** » 2011-08-27 17:44

IngOehman skrev:Det finns inga vinnare i diskussioner, annat än den som haft fel och insett
det. Ditt sätt att tänka är mig helt främmande.

Så om flera personers tänkande är dig helt främmande, finns möjligheten att även du kan bli en vinnare!

av **IngOehman** » 2011-08-27 18:28

Din slutsats har så vitt jag kan se inget med det jag skrev att göra.

Vet inte om du kanske missförstod det på något vis.

Vh, iö

av **Svante** » 2011-08-27 18:28

IngOehman skrev:
Svante skrev:Jag lovar, vore det så att jag kände mig inmålad i ett hörn så skulle jag, släppa det och säga att jag har fel. Jag lovar. Och detta trots att det är outgrundligt svårt att medge det i en debatt med dig eftersom varje sådan medgift gnuggas i näsan direkt och åratal efteråt av dig.

Fascinerande prestige-demonstration.

Ja, verkligen...

Du fetar den del av texten som handlar om dig, tolkar den som att den handlar om mig, ignorerar att det står "trots" framför, ignorerar mitt löfte och ignorerar min förklaring till varför det är svårt att debattera med dig.

Resten av inlägget fortsätter på samma sätt. Leta fel och gnugga. Oavsett om du hittar något eller inte.

Men du lyckas bra med att ta fokus från det som tråden borde handla om. Grattis!

av **IngOehman** » 2011-08-27 18:33

Varför skriver du att det jag fetat handlar om mig?

Vad DU har svår att medge handlar om dig. Om DU får svårt att medge
att du haft fel på grund av mig, så är det fortfarande dig det handlar om.
ATT du har det problemet, och att du har föreställningar om mig - som
inte stämmer för fem öre.

Men ditt perspektiv är ju helt omvända världen.

Ur mitt perspektiv är det att du INTE medger det som är generande.
Att ha fel är mänskligt men att inte kunna stå för det är svagt.

Det handlar bara om att stå för det DU skrivit. Och det du försöker proji-
cera på mig är ju bara det som du har spunnit och snärjt in dig i, alldeles
själv. Allt jag skrivit beror på det som du skrivit. Om du finner det vara
besvärande så behöver du kanske snärja in dig mindre illa nästan gång.
Det är ditt eget nät.

I min värld är det som någon tar avstånd ifrån borta sedan. Men det man
inte tar avstånd ifrån fortsätter man att stå för.

- - -

Och vad denna tråd (nuförtiden) handlar om är om vi mäter någon egen-
skap hos apparaterna när vi F/E-lyssnar. Det gör vi inte. Det du har för-
sökt få till en mätning av detektion (1/0) är bara ett annat sätt att ange
om SS kommit över 99%. Det vill säga att risken för att något som upp-
levs, har mindre än en 1% risk att bero på slumpen. Det är det kvalitets-
krav vi ställer - för att publicera beskrivningen av hur stark och på vilket
sätt som påverkan upplevs.

Men SS för någons upplevelserapport, är INTE en mätning av någon
egenskap hos apparaten.

Vh, iö

av **Svante** » 2011-08-27 18:46

IngOehman skrev:Varför skriver du att det jag fetat handlar om mig?

Vad DU har svår att medge handlar om dig. Om du får svårt att medge
att du haft fel på grund av mig, så är det fortfarande dig det handlar om. ATT du har det problemet.

Nej, jag skrev att "det är". Inte att "jag har". Meningen handlar om att din debatteknik gör det svårt för vem som helst att medge att man har fel, eftersom man strax efter och långt senare får höra att man har haft fel.

Inte jag. Man. Meningen handlar om dig och de effekter du har på dina meddebattanter.

Trots detta har jag inga problem med att medge OM jag skulle finna mig inmålad i ett hörn. Verkligen. Och det är skönt att känna den egenskapen komma med ökande ålder.

När jag inser mina misstag talar jag om det. Vill du tro att jag håller fast vid något felaktigt fast jag förstår att det är fel så får du väl tro det då.

av **IngOehman** » 2011-08-27 18:55

Svante skrev:
IngOehman skrev:Varför skriver du att det jag fetat handlar om mig?

Vad DU har svår att medge handlar om dig. Om du får svårt att medge
att du haft fel på grund av mig, så är det fortfarande dig det handlar om. ATT du har det problemet.

Nej, jag skrev att "det är". Inte att "jag har". Meningen handlar om att din debatteknik gör det svårt för vem som helst att medge att man har fel, eftersom man strax efter och långt senare får höra att man har haft fel.

Det sistnämnda är något som du hittat på alldeles själv. Det förstnämda
är en spekulation om att ALLA har prestige-problem. Jag tror du har fel.
Eller vet.

Jag känner många som inte har några som helst problem att medge att
de har fel, utan som till och med gör det med emfas och glädje. Menar
till och med att det är det naturliga sättet att reagera, eftersom man inte
vill vara kvar i "fel" utan byta till det man nu förstår är rätt.

Jag brukar alltid göra en stor sak av när jag haft fel, just så att ingen skall
tro att jag fortfarande hävdar det felaktiga.

Och att jag påpekar att du har fel har ju ett värde bara så länge som du
själv förnekar det. Det handlar ju bara om att det finns ett värde i att inte
sprida vrångföreställningar - som t ex att ditt 1/0 (detektion/icke-detek-
tion) skulle vara något annat än mer eller mindre än 99% SS.

Om du fortsätter att förneka det så behöver jag ju säga att du har fel, så
ingen skall få en vrångföreställning om LTS' F/E-lyssningsförfarande.

Svante skrev:Trots detta har jag inga problem med att medge OM jag skulle finna mig inmålad i ett hörn. Verkligen. Och det är skönt att känna den egenskapen komma med ökande ålder.

När jag inser mina misstag talar jag om det. Vill du tro att jag håller fast vid något felaktigt fast jag förstår att det är fel så får du väl tro det då.

Bra.

Vh, iö

av **Svante** » 2011-08-27 18:55

IngOehman skrev:Och vad denna tråd (nuförtiden) handlar om är om vi mäter någon egen-skap hos apparaterna när vi F/E-lyssnar. Det gör vi inte. Det du har för-sökt få till en mätning av detektion (1/0) är bara ett annat sätt att ange om SS kommit över 99%. Det vill säga att risken för att något som upp-levs, har mindre än en 1% risk att bero på slumpen. Det är det kvalitets-krav vi ställer - för att publicera beskrivningen av hur stark och på vilket sätt som påverkan upplevs.

Men SS för någons upplevelserapport, är INTE en mätning av någon
egenskap hos apparaten.

Sk*tsnack.

Skrevs det inte en artikel om NAD208 där det stod att ni hade misslyckats med att detektera apparaten? Möjligen var det efter modd?

Resultatet <detektion>/<ickedetektion> publiceras. Det är en väsentlig del av F/E-lyssningen och den används för att avgöra om en förstärkare är hörbar eller inte.

Och alldeles oavsett om det publiceras eller inte: JAG tycker att det är fördelaktigt att se den formella delen av av F/E-lyssningen som en mätning av apparatens hörbarhet. Många andra i den här tråden verkar hålla med mig, och en del ganska tunga namn.

Det gör att F/E-lyssningen i praktiken används som en hörbarhetsmätare.

Då är det klokt att studera vilka fel den har, betraktat som en mätning, och med den metodik som finns för att studera mätningar.

av **Svante** » 2011-08-27 19:01

IngOehman skrev:... att ditt 1/0 (detektion/icke-detektion) skulle
vara något annat än mer eller mindre än 99% SS.

Ja, det är en jämförelse med lyssnarens JND. Hur svårt är det att förstå?

Du har flera gånger svarat på det med att vi aldrig har mätt JND i LTS, och fine, så kan det vara. Det hindrar inte att det är den vi jämför med.

av **IngOehman** » 2011-08-27 19:03

Det där får stå i sak nästan okommenterat.

Jag ser inte att det finns något som jag kan skriva som kan få dig att göra
det du borde. Jag känner mig rätt så säker på att jag nått fram, och det
får duga att du själv förstått.

Du skriver nu i varje fall äntligen att du vet att vi aldrig har mätt JND. Det
var ditt sista halmstrå för vad det var vi mätte.

Men jag svarar på det här också:

Svante skrev:
IngOehman skrev:Och vad denna tråd (nuförtiden) handlar om är om vi mäter någon egen-skap hos apparaterna när vi F/E-lyssnar. Det gör vi inte. Det du har för-sökt få till en mätning av detektion (1/0) är bara ett annat sätt att ange om SS kommit över 99%. Det vill säga att risken för att något som upp-levs, har mindre än en 1% risk att bero på slumpen. Det är det kvalitets-krav vi ställer - för att publicera beskrivningen av hur stark och på vilket sätt som påverkan upplevs.

Men SS för någons upplevelserapport, är INTE en mätning av någon
egenskap hos apparaten.

Sk*tsnack.

Skrevs det inte en artikel om NAD208 där det stod att ni hade misslyckats med att detektera apparaten? Möjligen var det efter modd?

Resultatet <detektion>/<ickedetektion> publiceras. Det är en väsentlig del av F/E-lyssningen och den används för att avgöra om en förstärkare är hörbar eller inte.

Och alldeles oavsett om det publiceras eller inte: JAG tycker att det är fördelaktigt att se den formella delen av av F/E-lyssningen som en mätning av apparatens hörbarhet. Många andra i den här tråden verkar hålla med mig, och en del ganska tunga namn.

Det gör att F/E-lyssningen i praktiken används som en hörbarhetsmätare.

Då är det klokt att studera vilka fel den har, betraktat som en mätning, och med den metodik som finns för att studera mätningar.

Och?

Att misslyckas med att detektera en apparat betyder som jag så många
gångar har skrivit - att inte lyckas uppnå tillräcklig statistisk signifikans.

Det är inte ett mått på apparaten. Det är en sorts mått på att det som
något eventuellt tycks sig höra är tillräckligt pålitligt och därför kan få bli
publicerat.

Skall jag verkligen behöva skriva detta flera gånger?

Vh, iö

av **Svante** » 2011-08-27 19:12

Arrghh!

Ok, du vinner på utmattning.

Var det så du ville vinna?

av **IngOehman** » 2011-08-27 19:14

Nej.

Jag ville inte vinna alls. Jag ville att DU skulle vinna.

Tror och hoppas att du gjort det också, även om du inte vill skriva det.

Tycker det är lite synd eftersom ditt ord betyder så mycket för många.
Så din vinst blir ju mångas.

Vh, iö

av **KarlXII** » 2011-08-27 19:27

Gratulerar.

av **steveo1234** » 2011-08-27 19:29

KarlXII skrev:

Gratulerar.

shonie carter är för skön

av **DQ-20** » 2011-08-27 23:44

IngOehman skrev:Att misslyckas med att detektera en apparat betyder som jag så många gångar har skrivit - att inte lyckas uppnå tillräcklig statistisk signifikans.

Det är inte ett mått på apparaten. Det är en sorts mått på att det som
något eventuellt tycks sig höra är tillräckligt pålitligt och därför kan få bli
publicerat.

Skall jag verkligen behöva skriva detta flera gånger?

Vh, iö

Jag begriper första styckets tolkningen av statistisk signifikans ur en strikt statistisk synvinkel och håller med. Men jag begriper inte riktigt hanteringen beslutsregler gällande de implicita hypoteserna. Och jag begriper det ännu mindre med tanke på hur resultat från f/e-lyssning omskrivs eller har omskrivits i MoLT. Nedan står en hel del självklarheter men jag skriver dem ändå för att så långt som möjligt undvika missförstånd. Min slutsats är att man måste ta hänsyn till hantverkets kvalitet i bedömningen av icke-signifikanta resultat. Detta är statistiskt problematiskt men vetenskapligt tilltalande. Det betyder dock att man flyttar lite av tilltron till statistikens förmenta kraft över till testledarens utformning av experimentet.

Vanligen uttrycker sig forskare sig lite kortfattat så att man "förkastar nollhypotesen" när man får ett statistiskt signifikant resultat. I brist på annat får man då hålla till godo med sin alternativa hypotes. I f/e-lyssning handlar ett signifikant resultat om att man ser det som mycket osannolikt att det subjektiva intrycket att objektet som testas ger en hörbar förändring av ljudet skulle bero på ren slump. Att testa nollhypoteser utan att upprätta en alternativhypotes är i det närmaste nihilsm. Så långt den vetenskapliga processen med statistiskt signifikanta resultat.

Tolkningen av ett icke-signifikant resultat är mer problematiskt. Ofta när man läser metodlitteratur kan man få för sig att ett icke-signfikant resultat inte betyder något alls men det gör det ju, både statistiskt och i praktiken. Det är nämligen skillnad på signifikanstest och signifikanstest. Jag tror att alla inser att ett f/e-test som LTS genomför på Studio Blue har större möjligheter att ge statistiskt signifikanta utslag än ett test man meckar ihop hemma på studentkammaren. LTS testet är helt enkelt mer utslagskraftigt av olika orsaker: lyssnarträning, tillgänglig bandbredd och dynamiskt omfång, lyssnarpanel, val av stimuli, möjligheter till snabba växlingar och loopning samt lång praktiskt erfarenhet av själva förfarande är saker som verkar vara viktiga för att öka möjligheterna att hitta hörbara skillnader mellan före och efter. Men om man nu med uppbådande av varje tänkbar list för att ge ett statistiskt signfikant utslag ändå skändligen misslyckas, bör man då inte fästa någon som helst värde vid ett icke-signfikant resultat? Är det ingen skillnad i värdet mellan ett f/e-test på en "vanlig" anläggning i glada vänners lag (om någon sådan nu någonsin genomförts) och den som LTS använder. Är alla "icke-signifikanta" resultat "icke-resultat" och därmed lika lite värda? Nej, så är det naturligtvis inte. Syftet med att skapa utslagsgivande testmetoder är, ur statistisk synvinkel, att driva upp andelen rätta svar till en nivå där den ger utslag i signifikanstest även i mycket korta serier (små stickprov). Andelen rätta svar i den hypotetiska oändliga population av experiment som man samplar ifrån måste ha en sannolikhet för rätt svar som är >>0,5. För dessa ansträngningar finns dock inget statistiskt mått. Det finns emellertid statistiska mått på ett signifikanstests förmåga att ge utslag på små skillnader. Detta kallas "statistical power". I princip anger denna sannolikheten för att ge utslag i ett signifikanstest givet en viss effektstorlek och signifikansnivå. Det säger sig själv att ett signifikantest som endast ger utslag i 20% av alla test trots att det finns en effekt inte är mycket att hänga i julgran och att tolkningen av ett icke-signifikant test är problematiskt. Har man "statistical power" på 95% kan man däremot känna sig lite säkrare på att man med signifikanstestets hjälp borde ha hitta en hypotetiserad effekt om den fanns.

I f/e-testerna är signifikansnivån givetvis känd liksom den typiska serielängden men den långsiktiga nivån på andelen rätta svar känner vi inte till. Det är dock något som man genom att vässa testerna upplägg försöker höja. Statistical power riskerar under alla förhållanden att bli usel i LTS tester pga av de korta serierna (stickprovens storlek) och man måste därför arbeta hårt med andra medel för att signifikanstesten skall ge utslag. Det enda alternativet till att öka effektstorleken är att utöka testserierna längd men denna väg tycks stängd eftersom den del av testets känslighet som inte låter sig beskrivas i statistiska termer försämras pga av utmattning av lyssnarpanelen.

En accepterad nollhypotes i fall där man har signifikanstest med hög statistisk känslighet är mer än ett "icke-resultat" även statistiskt. Vad man kan säga är att OM det fanns en effekt så var den under alla omständigheter så liten att man med till buds stående medel inte kan få den att ge utslag i ett signifikanstest med en kritiska sannolikheten p<0,01 och med "statististical power" XX%. När det gäller implikationer blir dock skillnaden mot ett statistiskt signifikant resultat ännu mindre. För om vi accepterar implikationerna av en förkastad nollhypotes måste i rimligen ta den på allvar och låta den påverka våra beslut när vi accepterar den. Något tredje alternativ finns ju inte.

När det sedan gäller praktiska beslut och handlingar blir skillnaden ännu mindre mellan "sann" och "inte osann" och vi får använda nollhypotesen som om den vore sann. I dina egna apparattester i MoLT (som ur min synvinkel har varit en del av guldkanten i min ljudtekniska tillvaro sedan 1991) har frånvaron av signifikanta resultat eller åtminstone de svårigheter med att vilka statistiskt signifikanta resultat kunna uppnås framhållits som indikatorer på apparaterna kvalitet (eller snarare brist på fel). Det gäller från de första tester jag läste (Sentecs sista transistoriserade serie) till Pioneers 668. Och det tycker jag är bra eftersom det tyder på en insikt att en strikt statistik tolkning av icke-signfikanta resultat som icke-resultat är olämplig. Vad skulle annars resultaten betyda ur praktiskt synvinkel. I valet mellan nollhypotes och alternativ hypotes kan man inte välja ett tredje. Att det handlar om just interrimssanning tycker jag också illustreras av testet av Pioneer 668 och jämförelsen med Sentecs Diana. Detta är inte bara "helt okej" utan det enda sätt på vilken sann kunskap utvecklas. Vi låter kunskapen blir "sannare och sannare" i takt med att vi rensar ut det som inte är sant så gott som vi för tillfället kan.

Detta inlägg handlar inte om den ursprungliga frågan om "mätning" utan om detektion eller icke-detektion i ett f/e-test skall tas som ett resultat i sig. Jag vill säga att det måste det under alla omständigheter, även om det inte skulle handla om en "mätning". Att man svårligen kan ge subjektiva beskrivningar av en skillnad man inte har anledning att tro finns säger sig själv.

Det här inlägget blev längre än vad jag hade tänkt och min mening är inte att skriva någon på näsan. Det blev mer tänkande än jag tänkte mig. Det är inom normalvetenskaper relativt ovanligt att det är de icke-signfikanta resultaten som är de mest intressanta som i fallet med f/e-test. Bland de som håller på med statistik i sin profession finns det i min erfarenhet väldigt få som kan ta till sig en frågeställning där det handlar om att visa på inga eller försumbara skillnader/effekter. Man är helt enkelt inte van att leta efter annat än skillnader. Ibland tror jag faktiskt att signifikanstestning styr de substansiella frågeställningarna mot att hitta skillnader även om det skulle vara likheter som är av verkligt intresse.

Puuh,

DQ-20

av **Dartman** » 2011-08-28 00:02

Du är klok du, DQ-20.

/Jonas

av **Laila** » 2011-08-28 01:01

DQ-20 skrev: Ett av de bättre inlägg, som jag har
haft förmånen att läsa, på länge . . . puss o kram !

av **Svante** » 2011-08-28 01:15

DQ-20 skrev:Det här inlägget blev längre än vad jag hade tänkt och min mening är inte att skriva någon på näsan. Det blev mer tänkande än jag tänkte mig. Det är inom normalvetenskaper relativt ovanligt att det är de icke-signfikanta resultaten som är de mest intressanta som i fallet med f/e-test. Bland de som håller på med statistik i sin profession finns det i min erfarenhet väldigt få som kan ta till sig en frågeställning där det handlar om att visa på inga eller försumbara skillnader/effekter. Man är helt enkelt inte van att leta efter annat än skillnader. Ibland tror jag faktiskt att signifikanstestning styr de substansiella frågeställningarna mot att hitta skillnader även om det skulle vara likheter som är av verkligt intresse.

Jag tror som du att många hellre gör studier där man får en trygg siffra på signifikansen, även om det egentligen är andra resultat som är intressantare och som man hellre borde söka.

Jag drar mig till minnes gamla diskussioner oss emellan här på Faktiskt där jag hade Ingvars nuvarande ståndpunkt. Efter dem mjuknade jag och lät icke-detektionen få det värde som den förtjänar och som jag inte vågade ge den tidigare. Jag tillät mig nöja mig med att när man har gjort allt man kan och ändå inte har hittat något, så är det rätt ok att anta att det inte finns något.

Trots att man som sifferneurotiker egenligen vill ha en siffra på hur säker man är.

För trots allt är ju de intressantaste resultaten från F/E-lyssningen de där man testar apparater som inte färgar.

Jag väntar med spänning på hur Ingvar ska bemöta ditt inlägg (men har inte för avsikt att gå i debatt med honom mer).

Det skjuter ju faktiskt hans "första vetenskapliga tes" i sank, helt och hållet.

av **DQ-20** » 2011-08-28 02:09

Svante skrev:Det skjuter ju faktiskt hans "första vetenskapliga tes" i sank, helt och hållet.

På det skulle jag vilja svara "njae" eller "det vet jag väl kanske inte..." Det beror ju på vilken nivå man lägger det eller vad man har tänkt använda den till. Att försöka bevisa icke-existens är under alla omständigheter mycket mer problematiskt än att påvisa existens, om jag säger så. Ett probabilistiskt synsätt förändrar en del men ändå inte så mycket i sak som man kan tro. Tror jag. Här gäller det tydligt att vara passande vag så att man kan hålla sig väl med alla.

Men allvarligt. Poppers exempel med svarta svanar får merparten av sin sprängkraft av att det verkligen finns svarta svanar. Att vi har facit. Om de inte fanns, om man aldrig i världshistorien sett svarta svanar trots idoget spanande och heller inte hade någon större anledning att tro att det fanns några, är jag övertygad om att istället för en illustration av falsifieringsmetodens logiskt tvingande förträfflighet hade man sett det kloka i att fortsätta anta och agera som om svarta svanar inte fanns. Har man inte något skäl till att tro att de finns så får man nog tänka sig att på goda grunder betrakta dem som icke-existerande. Åtminstone i praktiken. Man får dock hålla dörren öppen för förändring på den punkten om man råkar vara ornitolog med vetenskapliga böjelser. För helt säker kan man ju inte vara.

Eller?

DQ-20

Bonusillustration om skillnaden mellan en probabilistisk ontologi och en probabilistisk epistemologi. From the late great Mitch Hedberg: "I think Bigfoot is blurry, that's the problem. It's not the photographer's fault. Bigfoot is blurry, and that's extra scary to me. There's a large, out-of-focus monster roaming the countryside. Run, he's fuzzy, get out of here."

av **80-talet** » 2011-08-28 10:01

Extremt bra inlägg DQ-20!

av **Svante** » 2011-08-28 10:55

Jo, sant.

De svarta svanarna har inte Ingvar uppfunnit.

Här var det magiska sökordet som gör att man hittar "den första vetenskapliga tesen" utanför Faktiskt.
http://sv.wikipedia.org/wiki/Falsifierbarhet

Återstår att ta reda på om namnet "den första vetenskapliga tesen" är hittepå av Ingvar eller inte, men företeelsen finns iaf beskriven på annat håll.

Men, tiotusenkronorsfrågan blir ändå: vad är värdet av en icke-detektion i en F/E-lyssning?

Wikipedia skrev:Popper ansåg att en utsaga bara är vetenskaplig ifall den (1) är falsifierbar och (2) har bekräftats av någon sorts observation[1]. Detta har kritiserats, eftersom påståendet i sig är en utsaga som inte är möjlig att falsifiera.[källa behövs] Ändå hävdade Popper att icke falsifierbara teorier trots allt har en funktion i vetenskapen förutsatt att de har underlättat för formuleringen av precisa falsifierbara teorier[1].

Popper själv gick alltså emot sin åsikt, och lite så är det väl. De svarta svanarna sätter fokus på ett vetenskapligt dilemma, men när man har funderat lite över det så måste man ändå komma till beslut. Det probabilistiska synsättet, som du säger är ett sätt att hantera det.

Det är ju så, att inte heller en detektion är ett hundraprocentigt säkert bevis för att påverkan finns. Även om man pekar ut objektet 10 ggr i rad så finns det en liten risk att man har lyckats av en slump. Den risken kan beräknas och göras så liten att man känner sig trygg med den. Men noll blir den aldrig.

Icke-detektionen är inte heller ett hundraprocentigt bevis på att påverkan inte finns. Även om man använder de skarpaste lyssnarna i världen och den mest avslöjande kringutrustningen, och den mest avslöjande musiken, så behövs det bara en detektion (visserligen med hundraprocentig konfidens) för att bevisa motsatsen. Risken för detta är inte beräkningsbar på samma sätt (fast här brukar du komma dragandes med "power", så den kanske är det ändå, givet oändliga resurser) så här måste vi lita till en bedömning av testförutsättningarna för att känna oss trygga med icke-resultatet. Man får försöka göra förutsättningarna tillräckligt bra så att risken blir så liten att man känner sig trygg med nollresultatet. Men noll blir aldrig risken att det ändå finns en hörbar påverkan.

Ingendera (vare sig detektion eller ickedetektion) är alltså hundraprocentigt säkra. Båda har dock ett vetenskapligt värde om man lägger ett probablilistiskt synsätt på försöket.

Detta kan ställas i kontrast till Poppers svanar. Den "första vetenskapliga tesen" bör kanske användas med viss försiktighet, eftersom den i någon mening bygger på hundraprocentiga sannolikheter, dvs bevis. Om man inte kräver hundra procent, utan något mindre så kan man kringgå tesen. Óm man nöjer sig med "bortom allt rimligt tvivel" i stället för "bevis" så blir man så mycket mer handlingskraftig. Testerna får ett större värde.

Och utfallet av en F/E-lyssning blir binärt.

F*n, det är nyttigt att fundera på det här. Du skrev nog just det här, men efter att jag har fått smälta det vill jag formulera det ändå. F/E-lyssningarna är konstruerade framför allt för detektion med hög konfidens. Vi föredrar en försöksserie med tex nio rätt i rad. Vore det bara detektion med hög konfidens vi var ute efter så skulle vi kunna kräva just nio rätt i rad och förkasta alla andra resultat. Vi säger dock att även 12 av 13 är ok, eller 14 av 16 (jag minns nu inte siffrorna exakt). Hmm.

Om man i stället skulle designa försöket för maximal detektion av ohörbarhet så skulle man göra ett mycket stort antal lyssningar (hundratals) och se om antalet riktiga svar blev 50 %. Då kunde man med statistikens hjälp kanske säga att de 51 % rätta svaren med 99 % konfidens betyder att objektet är hörbart. Det uppenbara problemet med det upplägget är lyssnartrötthet, men fördelen är att även om hörbarheten är statistiskt säkerställd så vet man att det bara ger 51 % riktiga svar. Hörbarheten är alltså bevisad men så liten att den är betydelselös.

Sådär gör vi inte i LTS F/E, men det att vi tillåter FP att göra några fel i sina svarsserier är ändå att gå åt det hållet. Vi jämför inte mot ett JND på 100 %-nivån om inte FP klarar 100 %, utan vi nöjer oss med JND på ungefär 87 %-nivån (tex 14 av 16 se tidigare inlägg). Och detta påstår jag, är just för att icke-detektionen ska bli mer värdefull. Vore vi inte intresserade av att göra icke-detektionen värdefull så skulle vi stanna vid kravet nio rätt i rad.

Man kan tänka sig "andel riktiga svar" som ett mått på hörbarhet. 50% skulle då vara synonymt med ohörbart och 100% skulle vara fullständigt hörbar. Alla nivåer däremellan skulle gå att säkerställa med 99 % konfidens, och 100 %-nivån är den som skulle kräva färst lyssningar. 60 %-nivån skulle kräva ruskigt många lyssningar om man ville ha 99 % konfidens och vid 50 % går det mot oändligt många lyssningar.

Den där nivån (50-100 %) är då ett mått på hörbarheten.

Det faktum att vi tillåter felsvar ner till 87 %-nivån gör att vi faktiskt gör en mätning på andelrättskalan, men att den slutar vid 87 %. Mätningen vi gör är inte ens binär, den har fyra lägen. Ett lätt hörbart objekt får 100 % (9 av 9) Ett som är svårare att höra får 92 % (12 av 13), och en som är ytterligare svår att höra får 87 % (14 av 16). Sen klumpar vi ihop resten i en kategori < 87 %.

Vad är det om inte en mätning.

Ursäkta det långa tänkahögtinlägget.

Tack DQ!

Edit: snavfel

av **Svante** » 2011-08-28 10:58

80-talet skrev:Extremt bra inlägg DQ-20!

Instämmer!