Den stora tråden om STATISTIK

Hur funkar tekniken bakom bra hifi?

Moderator: Redaktörer

Användarvisningsbild
IngOehman
 
Inlägg: 48470
Blev medlem: 2003-09-28
Ort: K-PAX via Tellus

Re: Den stora tråden om STATISTIK

Inläggav IngOehman » 2014-06-18 15:20

Svante skrev:
Almen skrev:
Svante skrev:Man kan därför jämföra 5 lyssningar enkelsidigt med trevalsmetoden med 8 lyssningar dubbelsidigt med tvåvalsmetoden, båda ger <1% felrisk.

Och eftersom varje lyssning i trevalsmetoden egentligen är (minst) tre, och varje lyssning i tvåvalsmetoden är (minst) två, så har man att ställa 5*3 emot 8*2, d.v.s. 15 jämfört med 16.


Ja, och att jämföra tre med varandra känns dessutom klurigare än att jämföra två med varandra. Mentalt blir det tre jämförelser, svårare att hålla reda på i huvudet vilken man lyssnar på, det borde ta minst dubbelt så lång tid att komma fram till ett vettigt svar.

Besläktat med trevalsidén är annars ABX-test. Jag gillar inte den heller.

IngOehman skrev:Håller med om allt det där.

In i minsta detalj faktiskt.

- - -

Men - vad som är passande metod beror ju även på vad det är man undersöker, och därmed vilken frågan som
ställs och söks svar på är.

Om frågan är "är dessa samma?", så får man en sorts svar. Om den som får frågan svarar ja varje gång så är
det en indikation på att de låter rimligt lika, med just det använda programmaterialet, och samma sak gäller
om man i en triangellyssning inte lyckas säga vilken som skiljer sig, men det betyder inte ens nästan att det
som testats är två bra mojänger eller dimensioneringar eller vad det nu är man testar.

Det kan vara två som är dåliga, rejält dåliga till och med, men rätt så lika dåliga.

- - -

Om en är en referens för hur den andra skall vara (av något skäl, t ex att man vet att man redan gillar den)
är det frestande att studera kvaliteten genom att ställa "vilken gillar du bäst?", och även om svaret faller på
den ena varje gång så betyder det inte att det är den bättre återgivningen, det kan ju vara den som:

1. Passar bäst ihop med de kombinerade felen som resten av anläggning + inspelningen har,

vilket om inspelningen är perfekt kan betyda;

1b. Passar bäst ihop med de fel som resten av anläggningen har,

eller om anläggningen är perfekt;

1c. Passar bäst ihop med de fel som inspelningen har,

eller det kan rent av handla om vilken som,

2. Passar bäst ihop med lyssnarens smak, vilket även kan skrivas; den som subjektivt föredras.

Hur det än faller ut om det faller ut enligt någon av de ovanstående, så kan man inte veta om kan får sam-
ma utfall med annan inspelning eller med annat programmaterial. Ej heller om någon av apparaterna eller
vad det nu är som har undersökts, kanske hur något har dimensionerats, presterar i mera objektiva termer.
Alltså om det som kommer ut är ursprungstroget.

- - -

Där kommer F/E-lyssningen in!

Om frågan däremot (som den kan vara i en F/E-lyssning) är "vilket av alternativen är E?" så VET lyssnaren
att man jämför före och efter, och målet är bara att bestämma vilket man tror har passerat testobjektet.

Är färgningen från testobjektet rimligt hörbar (och man får öva lite) så är det vanligt att man kan pricka
in när signalen passerat testobjektet, varje gång. Färgningen påverkar ju signalen på samma sätt i princip
oavsett programmaterial. Det är en av styrkorna med F/E-lyssning: Varken programmaterial eller kringut-
rustning behöver det ställas extrema krav på (dock rimliga) för att man skall kunna undersöka testobjektets
egenskaper. Både bör vara rimligt bredbandiga och välbetedda, men hur de samverkar eller motverkar de
eventuella felen hos testobjektet är av ringa betydelse - skillnaden mellan E och F består. :)

Även om man gissar fel varje gång (kanske för att man föredrar E-ljudet) så visar det ändå skiljbarhet, och
då F alltid är referens så har en serie av idel felgissningar samma värde som en med idel rättgissningar. Båda
visar (med samma emfas) att apparaten färgar hörbart.

Så även om jag inte är en fan av varken ABX-tester eller triangeltester så är huvudskälet att de sällan gör
det man vill göra - om man vill undersöka ett färgande objekts absoluta egenskaper. Alltså få svar på HUR
det påverkar musiksignalen, snarare än hur man gillar denna påverkan i det ena eller andra sammanhanget.

Att de utöver det på statistiska grunder kan beskyllas för att inte spara något egentlig testansträngning är ju
möjligen generande för dem, men det är alltså inte mitt huvudskäl till att föredra en vanlig tvåvalssituation.

De andra testmetoderna fokuserar inte på att beskriva själva egenskaperna hos testobjektet, och det är ju
ofta det man (i varje fall jag) vill göra när jag studerar ett testobjekt.


Gissar man slumpmässigt rätt/fel mellan F och E i en F/E-lyssning så betyder det endera att man:

1. Inte klara att höra någon skillnad mellan F och E, vilket betyder att det färgar så lite att det blivit svårt
att höra dess påverkan.

eller att man,

2. Har för dåligt minne för att minnas hur testobjektet påverkade ;) Har man så dåligt minne så hjälper det
ju inte att man hör en skillnad för att veta vilken som troligen är E. Men då skall man kanske heller inte vara
lyssnare i en F/E-lyssning.

Dock är det faktiskt vanligare än man tror att själva blindheten påverkar lyssnarna så mycket att de, trots att
de lyssnat in sig öppet och vet hur testobjektet påverkar (och projicerar denna färgning som något negativt)
omvärderar färgningen för att de gillar den, och gissar konsekvent fel blindt! :)

Det gör som sagt inget, för det är ett konsekvent svarande som ger statistiskt växande skäl att tro att en skill-
nad (påverkan) finns.


Vh, iö


DQ-20 skrev:Tack för det inlägget IÖ. Det handlar ju om det som kallas metod, och det är så mycket mer än statistik. Man får inte bättre svar än data medger. Man kan dribbla hur mycket man vill med matematiken men om man inte har god validitet i metoden (mäter det man egentligen vill mäta) blir statistiken meningslös. Och det är här praktisk kunskap från det specifika området måste till - de räcker inte med generell kunskap om testmetoder, även om det ju inte är något hinder.

/DQ-20


Tack för tack!

Jag måste erkänna att jag var lite orolig för att jag skulle få en knäpp på näsan för att inlägget
inte var tillräckligt fokuserat på just statistiken, men jag tyckte ändå att det var en viktig del i
sammanhanget att man måste veta VAD man vill ha statistik om fö'nått.

Att via statistiken kunna vara jättesäker på något som inte spelar någon roll eller inte har något
att göra med det som man undrar över, kan ju kanske vara kul, men det leder inte framåt.

Glad att inlägget föll i god jord.


Vh, iö
Fd psykoakustikforskare & ordf LTS. Nu akustiker m specialiteten
studiokontrollrum, hemmabiosar & musiklyssnrum. Även Ch. R&D
åt Carlsson och Guru, konsult åt andra + hobbyhögtalartillv (Ino).

Användarvisningsbild
Almen
Hilbert
 
Inlägg: 18454
Blev medlem: 2005-01-01
Ort: Göteborg

Re: Den stora tråden om STATISTIK

Inläggav Almen » 2014-06-18 16:13

Jag är väldigt glad om det kan föras diskussioner precis så här, när man relaterar teori till praktik.
"Nämn tre av de köttätande växter som vid mässan i Hannover med hull och hår slukade den då ditresta gosskören. Svara!"

Användarvisningsbild
Almen
Hilbert
 
Inlägg: 18454
Blev medlem: 2005-01-01
Ort: Göteborg

Re: Den stora tråden om STATISTIK

Inläggav Almen » 2014-08-14 13:06

Jaa, grafpro, är du nöjd med svaren?

Jag hittade detta på nätet: http://www.statisticsdonewrong.com/

Har inte läst, bara skummat innehållsförteckningen, men det kanske kan vara intressant för de som frekventerar den här tråden?

Statistics Done Wrong is a guide to the most popular statistical errors and slip-ups committed by scientists every day, in the lab and in peer-reviewed journals. Many of the errors are prevalent in vast swathes of the published literature, casting doubt on the findings of thousands of papers. Statistics Done Wrong assumes no prior knowledge of statistics, so you can read it before your first statistics course or after thirty years of scientific practice.


Han dristar sig alltså att i svepande ordalag klaga på forskares, naturvetenskapares och vetenskapliga publikationers kunskaper i statistik! perstromgren! Säg till honom på skarpen!
"Nämn tre av de köttätande växter som vid mässan i Hannover med hull och hår slukade den då ditresta gosskören. Svara!"

Användarvisningsbild
Svante
Audiot!
 
Inlägg: 37552
Blev medlem: 2004-03-03
Ort: oakustisk

Re: Den stora tråden om STATISTIK

Inläggav Svante » 2014-08-14 18:02

Almen skrev:
Statistics Done Wrong is a guide to the most popular statistical errors and slip-ups committed by scientists every day, in the lab and in peer-reviewed journals. Many of the errors are prevalent in vast swathes of the published literature, casting doubt on the findings of thousands of papers. Statistics Done Wrong assumes no prior knowledge of statistics, so you can read it before your first statistics course or after thirty years of scientific practice.


Han dristar sig alltså att i svepande ordalag klaga på forskares, naturvetenskapares och vetenskapliga publikationers kunskaper i statistik! perstromgren! Säg till honom på skarpen!


Nja, förutsatt att källan även har en underbyggnad som är redovisad så ska den inte skarpsägastilll om inte underbyggnaden är fel.

Jag tror dessvärre att den finns och är rätt. Notera dock att textsnutten inte säger något om HUR vanliga felen är. Och den säger verkligen inte att alla gör felen.
Så länge har jag längat efter att loudness war skulle vara över. Nu börjar jag tro att vi faktiskt är där. Kruxet är att vi förlorade.

Användarvisningsbild
IngOehman
 
Inlägg: 48470
Blev medlem: 2003-09-28
Ort: K-PAX via Tellus

Re: Den stora tråden om STATISTIK

Inläggav IngOehman » 2014-08-16 13:14

Håller med, och menar att författaren tar upp ett viktigt ämne, och att medvetenheten om vilka ovetenskapliga tokigheter som förekommer i den akademiska världen (men ändå kallas vetenskap på grund av att akademisk och vetenskaplig ständigt landas ihop och/eller sätts likhetstecken mellan) verkligen behöver ökas.

Och jag tror dessutom att Almen skojade lite. ;)

Om jag får ha en åsikt om vanligheten av fel i avhandlingar (av typen otillåtna slutsatser har dragits, ofta baserat på feltolkning av statisken) så är det att det handlar om så hög förekomst att det är sannolikare att man hittar en avhandling som har fel än en som saknar fel.

Men det sagt betyder det ju inte att en avhandling som har fel behöver ha fel i allt. Så är det förstås inte. Problemet är dock att den form som allmänhet, och i vissa fall även forskarkollegor, tar del av resultatet inte gör det möjligt att dra egna säkra slutsatser. För mycket information har gått förlorad från forskningen till det att det kom på papper, nästan alltid.


Vh, iö
Fd psykoakustikforskare & ordf LTS. Nu akustiker m specialiteten
studiokontrollrum, hemmabiosar & musiklyssnrum. Även Ch. R&D
åt Carlsson och Guru, konsult åt andra + hobbyhögtalartillv (Ino).

Användarvisningsbild
Svante
Audiot!
 
Inlägg: 37552
Blev medlem: 2004-03-03
Ort: oakustisk

Re: Den stora tråden om STATISTIK

Inläggav Svante » 2014-08-16 14:33

IngOehman skrev:Håller med, och menar att författaren tar upp ett viktigt ämne, och att medvetenheten om vilka ovetenskapliga tokigheter som förekommer i den akademiska världen (men ändå kallas vetenskap på grund av att akademisk och vetenskaplig ständigt landas ihop och/eller sätts likhetstecken mellan) verkligen behöver ökas.

Och jag tror dessutom att Almen skojade lite. ;)

Om jag får ha en åsikt om vanligheten av fel i avhandlingar (av typen otillåtna slutsatser har dragits, ofta baserat på feltolkning av statisken) så är det att det handlar om så hög förekomst att det är sannolikare att man hittar en avhandling som har fel än en som saknar fel.

Men det sagt betyder det ju inte att en avhandling som har fel behöver ha fel i allt. Så är det förstås inte. Problemet är dock att den form som allmänhet, och i vissa fall även forskarkollegor, tar del av resultatet inte gör det möjligt att dra egna säkra slutsatser. För mycket information har gått förlorad från forskningen till det att det kom på papper, nästan alltid.


Vh, iö


Nej, just, halten sanning är långt högre i akademiska/vetenskapliga artiklar än i övriga typer av publikationer. Den ligger nog solklart i topp. Man ska också komma ihåg att möjligheten att bedöma sanningshalten är mycket högre i dessa artiklar eftersom det är kutym att redovisa hur slutsatserna man har dragit är underbyggda. Det kan också vara så att man väljer att publicera trots att man vet att data eller analys innehåller någon typ av fel, men att man ändå bedömer att det är värt att publicera eftersom det är svårt eller omöjligt att utföra studien felfritt.
Så länge har jag längat efter att loudness war skulle vara över. Nu börjar jag tro att vi faktiskt är där. Kruxet är att vi förlorade.

Användarvisningsbild
PerStromgren
 
Inlägg: 28410
Blev medlem: 2005-03-25
Ort: Karlstad

Re: Den stora tråden om STATISTIK

Inläggav PerStromgren » 2014-08-16 14:53

Almen skrev:Jaa, grafpro, är du nöjd med svaren?

Jag hittade detta på nätet: http://www.statisticsdonewrong.com/

Har inte läst, bara skummat innehållsförteckningen, men det kanske kan vara intressant för de som frekventerar den här tråden?

Statistics Done Wrong is a guide to the most popular statistical errors and slip-ups committed by scientists every day, in the lab and in peer-reviewed journals. Many of the errors are prevalent in vast swathes of the published literature, casting doubt on the findings of thousands of papers. Statistics Done Wrong assumes no prior knowledge of statistics, so you can read it before your first statistics course or after thirty years of scientific practice.


Han dristar sig alltså att i svepande ordalag klaga på forskares, naturvetenskapares och vetenskapliga publikationers kunskaper i statistik! perstromgren! Säg till honom på skarpen!


Han är doktorand. Sådana lyssnar inte!
... tycker jag!

Per

Användarvisningsbild
Svante
Audiot!
 
Inlägg: 37552
Blev medlem: 2004-03-03
Ort: oakustisk

Re: Den stora tråden om STATISTIK

Inläggav Svante » 2014-08-16 16:40

PerStromgren skrev:Han är doktorand. Sådana lyssnar inte!


...än.
Så länge har jag längat efter att loudness war skulle vara över. Nu börjar jag tro att vi faktiskt är där. Kruxet är att vi förlorade.

Användarvisningsbild
IngOehman
 
Inlägg: 48470
Blev medlem: 2003-09-28
Ort: K-PAX via Tellus

Re: Den stora tråden om STATISTIK

Inläggav IngOehman » 2014-08-17 01:39

Svante skrev:
IngOehman skrev:Håller med, och menar att författaren tar upp ett viktigt ämne, och att medvetenheten om vilka ovetenskapliga tokigheter som förekommer i den akademiska världen (men ändå kallas vetenskap på grund av att akademisk och vetenskaplig ständigt landas ihop och/eller sätts likhetstecken mellan) verkligen behöver ökas.

Och jag tror dessutom att Almen skojade lite. ;)

Om jag får ha en åsikt om vanligheten av fel i avhandlingar (av typen otillåtna slutsatser har dragits, ofta baserat på feltolkning av statisken) så är det att det handlar om så hög förekomst att det är sannolikare att man hittar en avhandling som har fel än en som saknar fel.

Men det sagt betyder det ju inte att en avhandling som har fel behöver ha fel i allt. Så är det förstås inte. Problemet är dock att den form som allmänhet, och i vissa fall även forskarkollegor, tar del av resultatet inte gör det möjligt att dra egna säkra slutsatser. För mycket information har gått förlorad från forskningen till det att det kom på papper, nästan alltid.


Vh, iö


Nej, just, halten sanning är långt högre i akademiska/vetenskapliga artiklar än i övriga typer av publikationer. Den ligger nog solklart i topp. Man ska också komma ihåg att möjligheten att bedöma sanningshalten är mycket högre i dessa artiklar eftersom det är kutym att redovisa hur slutsatserna man har dragit är underbyggda. Det kan också vara så att man väljer att publicera trots att man vet att data eller analys innehåller någon typ av fel, men att man ändå bedömer att det är värt att publicera eftersom det är svårt eller omöjligt att utföra studien felfritt.

Halten av sanning i vetenskapliga artiklar är alltid 100 %, för är den inte det så är de ju inte vetenskapliga.

Min poäng var att begreppen "akademisk" och "vetenskaplig" oftast blandas samman. Kanske är det i gemene mans ögon samma sak rent av, och reflexion över orden saknas därför? Jag får ibland det intrycket.

Det är olyckligt - både när det leder till att någon underförstår att något som står i en avhandling är vetenskapligt, och när någon märker att det som står inte stämmer och klandrar vetenskapen som princip.


Vh, iö
Fd psykoakustikforskare & ordf LTS. Nu akustiker m specialiteten
studiokontrollrum, hemmabiosar & musiklyssnrum. Även Ch. R&D
åt Carlsson och Guru, konsult åt andra + hobbyhögtalartillv (Ino).

Användarvisningsbild
Svante
Audiot!
 
Inlägg: 37552
Blev medlem: 2004-03-03
Ort: oakustisk

Re: Den stora tråden om STATISTIK

Inläggav Svante » 2014-08-17 10:04

IngOehman skrev:Halten av sanning i vetenskapliga artiklar är alltid 100 %, för är den inte det så är de ju inte vetenskapliga.


Med semantikdiskussionsrisk: Nej, det är väl klart att det kan smyga sig in fel även i en vetenskaplig artikel. Det upphör inte att vara en vetenskaplig artikel för det. Och det kan vara så att hela mänskligheten har fel och publicerar vetenskapliga artiklar med den (felaktiga) förkunskapen. De artiklarna upphör inte att vara vetenskapliga bara för att de innehöll fel. Tvärtom var de förmodligen en del i att driva kunskapen framåt. "Vetenskaplig" betyder inte "sann". Vetenskaplighet har med metoden, inte med resultatet att göra, även om resultatet blir en högre sanningshalt om man använder vetenskapliga metoder.

IngOehman skrev:Min poäng var att begreppen "akademisk" och "vetenskaplig" oftast blandas samman. Kanske är det i gemene mans ögon samma sak rent av, och reflexion över orden saknas därför? Jag får ibland det intrycket.

Det är olyckligt - både när det leder till att någon underförstår att något som står i en avhandling är vetenskapligt, och när någon märker att det som står inte stämmer och klandrar vetenskapen som princip.


Jo, jag förstod att du menade det, och jag fyllde på med poängen med akademin; att det finns en kontrollapparat som kontrollerar vetenskapligheten. En akademisk vetenskaplig artikel smäller högre än en som är bara vetenskaplig i det att arbetena är granskade och att de som skriver akademisk/vetenskapliga artiklar är införstådda med det och därför utsätter sitt arbete för möjlighet till granskning.

Man har skäl att vara betydligt mer misstänksam mot ett arbete som inte är framtaget i akademin; att någon säger att arbetet är vetenskapligt ger ju ingen garanti alls.

Se bara på allt "vetenskapligt underlag" som åsyftas i reklamen.

Nu är inte den akademiska modellen vattentät heller, och eftersom ekonomiska och personliga drivkrafter tillåts verka även där så slipper det ibland igenom fel som inte borde ha släppts igenom.
Så länge har jag längat efter att loudness war skulle vara över. Nu börjar jag tro att vi faktiskt är där. Kruxet är att vi förlorade.

Användarvisningsbild
IngOehman
 
Inlägg: 48470
Blev medlem: 2003-09-28
Ort: K-PAX via Tellus

Re: Den stora tråden om STATISTIK

Inläggav IngOehman » 2014-08-17 10:35

Det är svårt att diskutera när du vill urholka begreppen, och när du på det underförstår att det inte är själva innehållet utan auktoritetstro (där auktoriteten skall vara den akademiska världen) som är grunden för vad man skall lita på så känns det även rätt så meningslöst att diskutera saken. Men du får ha din syn på saken. Bara så du inte tror något annat.

Och jag hoppas du inte tar det jag skriver personligt, representant för den akademska världen som du är. Jag har inte kritiserat dig, bara nämnt att ytan (att en skrift kommer från den akademiska världen) inte är en garant för kvalitet på innehållet, det är själva innehållet som bestämmer kvaliteten på arbetet. Kort sagt - förstår man det inte på egna grunder så finns det inget skäl att tro något om kvaliteten på det. Auktoritetstro, majoritetstro och tumregler suger, i princip alltid.


Vh, iö
Fd psykoakustikforskare & ordf LTS. Nu akustiker m specialiteten
studiokontrollrum, hemmabiosar & musiklyssnrum. Även Ch. R&D
åt Carlsson och Guru, konsult åt andra + hobbyhögtalartillv (Ino).

Användarvisningsbild
grafpro
 
Inlägg: 529
Blev medlem: 2009-03-21
Ort: Växjö

Re: Den stora tråden om STATISTIK

Inläggav grafpro » 2014-08-17 17:00

IngOehman skrev:Det är svårt att diskutera när du vill urholka begreppen, och när du på det underförstår att det inte är själva innehållet utan auktoritetstro (där auktoriteten skall vara den akademiska världen) som är grunden för vad man skall lita på så känns det även rätt så meningslöst att diskutera saken. Men du får ha din syn på saken. Bara så du inte tror något annat.

Och jag hoppas du inte tar det jag skriver personligt, representant för den akademska världen som du är. Jag har inte kritiserat dig, bara nämnt att ytan (att en skrift kommer från den akademiska världen) inte är en garant för kvalitet på innehållet, det är själva innehållet som bestämmer kvaliteten på arbetet. Kort sagt - förstår man det inte på egna grunder så finns det inget skäl att tro något om kvaliteten på det. Auktoritetstro, majoritetstro och tumregler suger, i princip alltid.


Vh, iö


Svårt att förstå att båda dessa herrar är forskarutbildade. Grundläggande vetenskapsteoretisk terminologi borde väl ändå vara vedertagen av alla.
Drev HiFi-butik med Sonabprodukter, byggde studio- och orkesterelektronik och gav ut vinylinspelningar i ett tidigare liv. Gillar modern konstmusik. Är sannolikt tondöv.

Användarvisningsbild
Svante
Audiot!
 
Inlägg: 37552
Blev medlem: 2004-03-03
Ort: oakustisk

Re: Den stora tråden om STATISTIK

Inläggav Svante » 2014-08-17 22:08

IngOehman skrev:Det är svårt att diskutera när du vill urholka begreppen, och när du på det underförstår att det inte är själva innehållet utan auktoritetstro (där auktoriteten skall vara den akademiska världen) som är grunden för vad man skall lita på så känns det även rätt så meningslöst att diskutera saken. Men du får ha din syn på saken. Bara så du inte tror något annat.


Njaej, alltså det akademin står för är en mekanism som gör det möjligt för utomstående att bedöma kvaliteten på arbetet. Man kan göra ett arbete som är hur vetenskapligt korrekt som helst, men om man inte publicerar det, eller om man inte publicerar hur man har kommit fram till det man har kommit fram till så är det ju inte möjligt att vara kritisk.

Det jag skriver om är inte auktoritetstro, utan ett uttryck för att mekanismerna som används inom akademin höjer den vetenskapliga kvaliteten. Det är också en fråga om effektivitet, läser man en akademisk vetenskaplig publikation så vet man att åtminstone 2-3 oberoende forskare inom samma fält har läst artikeln utan invändningar i sak. Det betyder inte att man själv inte kommer att hitta fel, men det minskar sannolikheten.

IngOehman skrev:Och jag hoppas du inte tar det jag skriver personligt, representant för den akademska världen som du är. Jag har inte kritiserat dig, bara nämnt att ytan (att en skrift kommer från den akademiska världen) inte är en garant för kvalitet på innehållet, det är själva innehållet som bestämmer kvaliteten på arbetet. Kort sagt - förstår man det inte på egna grunder så finns det inget skäl att tro något om kvaliteten på det. Auktoritetstro, majoritetstro och tumregler suger, i princip alltid.


...men de är effektiva om man vill ha något vettigt gjort och om man inte vill göra allt jobb själv. Det måste vara jobbigt att inte kunna lita på att någon annan gör sitt jobb. Att alltid behöva göra allt själv. Man kan ju nästan tro att du inte vågar använda en dammsugare eller mikrovågsugn utan att skruva isär den och kolla att de har kopplat rätt.

Har man en hög med 10 000 publikationer (tex på Internet) så behöver man ett sållningsverktyg för att få fram de artiklar som kan tänkas vara intressanta. Det är omöjligt att läsa alla artiklarna, eller i varje fall ineffektivt. Om man kan hitta en mekanism som väljer ut de 100 mest intressanta, tex mha att andra rekommenderar dem, eller att de har fått publiceras i akademin så kan man kanske leva med att man missar en artikel som var intressant. Det skulle man ju ha gjort ändå när man dog av uttröttning vid artikel nr 3529.

Edit: en sak till: att en skrift publicerats akademiskt ÄR en garant för kvaliteten. Garanti betyder dock inte att varan inte är behäftad med fel, utan att felen åtgärdas om man klagar. Det gäller inte för icke-akademiska publikationer.

...fast nu är jag grovt OT, och ber DQ om ursäkt.
Så länge har jag längat efter att loudness war skulle vara över. Nu börjar jag tro att vi faktiskt är där. Kruxet är att vi förlorade.

Användarvisningsbild
IngOehman
 
Inlägg: 48470
Blev medlem: 2003-09-28
Ort: K-PAX via Tellus

Re: Den stora tråden om STATISTIK

Inläggav IngOehman » 2014-08-18 01:32

grafpro skrev:
IngOehman skrev:Det är svårt att diskutera när du vill urholka begreppen, och när du på det underförstår att det inte är själva innehållet utan auktoritetstro (där auktoriteten skall vara den akademiska världen) som är grunden för vad man skall lita på så känns det även rätt så meningslöst att diskutera saken. Men du får ha din syn på saken. Bara så du inte tror något annat.

Och jag hoppas du inte tar det jag skriver personligt, representant för den akademska världen som du är. Jag har inte kritiserat dig, bara nämnt att ytan (att en skrift kommer från den akademiska världen) inte är en garant för kvalitet på innehållet, det är själva innehållet som bestämmer kvaliteten på arbetet. Kort sagt - förstår man det inte på egna grunder så finns det inget skäl att tro något om kvaliteten på det. Auktoritetstro, majoritetstro och tumregler suger, i princip alltid.


Vh, iö


Svårt att förstå att båda dessa herrar är forskarutbildade. Grundläggande vetenskapsteoretisk terminologi borde väl ändå vara vedertagen av alla.

Ja, det borde den kanske. Borde.

Det handlar ju inte heller bara om terminologi, utan i större grad om metodologi, t ex för eventuella experiment, men i ännu högre handlar det om hur dragandet av slutsatser går till, och hur dessa redovisas, om de redovisas. Även det senare är en metodologisk fråga. Vetenskaplighet handlar i själva verket mycket mindre om hur man studerar något, och väldigt mycket mera om hur man drar slutsatser från det man erfarit.


Vh, iö
Fd psykoakustikforskare & ordf LTS. Nu akustiker m specialiteten
studiokontrollrum, hemmabiosar & musiklyssnrum. Även Ch. R&D
åt Carlsson och Guru, konsult åt andra + hobbyhögtalartillv (Ino).

Användarvisningsbild
Almen
Hilbert
 
Inlägg: 18454
Blev medlem: 2005-01-01
Ort: Göteborg

Re: Den stora tråden om STATISTIK

Inläggav Almen » 2014-08-18 07:45

Ja, mitt lilla skämt var inte menat att dra igång en metadiskussion. Hoppas vi kan sätta punkt för den här.
"Nämn tre av de köttätande växter som vid mässan i Hannover med hull och hår slukade den då ditresta gosskören. Svara!"

Användarvisningsbild
DQ-20
Skum fogare
 
Inlägg: 8579
Blev medlem: 2003-12-03
Ort: ografi

Re: Den stora tråden om STATISTIK

Inläggav DQ-20 » 2014-10-14 11:35

grafpro skrev:Svårt att förstå att båda dessa herrar är forskarutbildade. Grundläggande vetenskapsteoretisk terminologi borde väl ändå vara vedertagen av alla.


Tre sanningar med modifikation

a) Forskarutbildad = utbildad inom högskoleväsendet för att kunna bedriva egen forskning så som den definieras av forskarsamhället. Ett annat ord är doktorandstudier. En fullt genomförd utbildning ger en doktorsexamen. Skämt: Vad kallar man den som skrev världens sämsta doktorsavhandling? Svar: Doktor.
b) Det råder inte full konsensus om vetenskaplig terminologi. Terminologi är en artefakt som skapats av människor och det MÅSTE råda en viss oenighet som i alla andra sociala sammanhang.
c) Detta handlar inte om statistik med inriktning på F/E-test.

/DQ-20
I try to change the formality and everything about it
People killing people for a reason
You make mistakes
You don't regret
So make a conclusion
.

- Infected Mushroom: Change the formality

Användarvisningsbild
Almen
Hilbert
 
Inlägg: 18454
Blev medlem: 2005-01-01
Ort: Göteborg

Re: Den stora tråden om STATISTIK

Inläggav Almen » 2015-05-22 07:48

Eftersom grafpro verkar nöjd med de utförliga svar han fick, så jag tänkte gå vidare med lite frågor.

1. "statistical power"
Hur kan man räkna ut det i fallet F/E-lyssning? Känns som att det beror på vilka lyssnare som är tillstädes, hur man uppskattar mängden och graden av färgning hos testobjektet, etc.. Snuddar detta vid en bayesiansk prior?

2. "multiple comparisons"
Detta har möjligtvis snuddats vid i "Le grande fil", men here goes. Upprepade test ökar p-värdet eftersom ju fler test man gör, desto större sannolikhet att man får en slumpmässig träff. I F/E-fallet finns kanske fyra lyssnare, två lämnar fullständiga lyssningsserier (varav en t.ex. 11 av 11 och en 7 av 11), en slutar gissa efter fem, och den sista lämnar inga svar alls. Hur räknar man?

Och om man sedan tar ytterligare en lyssning med bara den lyssnare som hade 11 och 11, med samma resultat, räknas detta också som "upprepade test"? För mig känns det som att resultatet stärks...

I princip kan väl det specifika testet även ses som ett i en oändlig rad tester och då blir ju resultatet inte mycket att ha i det avseendet. Men teoretiskt sett, när börjar man från scratch?
"Nämn tre av de köttätande växter som vid mässan i Hannover med hull och hår slukade den då ditresta gosskören. Svara!"

Användarvisningsbild
IngOehman
 
Inlägg: 48470
Blev medlem: 2003-09-28
Ort: K-PAX via Tellus

Re: Den stora tråden om STATISTIK

Inläggav IngOehman » 2015-05-22 12:27

Man kan räkna väldigt noga, och att sätta upp ekvationen kan vara ett grannlaga arbete, men det är inte alltid man behöver.

Ibland är det så att man nöjer sig med att konstatera att man har en konfidens högre än XX%.

Och i sådana fall kan problemet att räkna ut hur säker man kan vara på att det resultat som verkar finnas inte beror på slumpen, förenklas väldigt. I många fall kan man t ex nöja sig med att konstatera att en del av studien ger 99%, och att den andra delen stärker och inte försvagar resultatet. Extra svårt blir det att räkna om man anser att folk inte har påverkat varandra - trots att det inte går att utesluta att de har det. Därför så utgick jag, under den tid jag ansvarade för tekniksektionen i LTS, ifrån att olika lyssnare ALLTID påverkade varandra. Och testerna lades även upp således att det var okej att så var fallet.

Det vill säga, femton lyssnare allihopa svarar rätt 9 gånger av 9, räknas som en.

Men som jag varit inne på tidigare är det även viktigt att veta vad det är man vill ha svar på. När man skall räkna statistik i sådana här fall så är det t ex viktigt att veta om det man undrar över är "kan någon människa detektera detta", eller "kan de flesta detektera detta". I LTS-fallet så handlade det oftast om att närma sig den absoluta gränsen, och då är multipla lyssnare något som fördunklar resultatet. Men icke desto mindre kan man behöva starta med lyssnare nog många för att hitta den goda lyssnaren...

Ofta är det nog bäst att anpassa strategin efter resultatet. Närmare bestämt att göra tester i flera steg där de tidiga stegen mest finns till för att finslipa strategin.

Men ett entydigt svar på hur man bör göra finns inte. Inte om målet är att lära sig så mycket som möjligt.


Vh, iö
Fd psykoakustikforskare & ordf LTS. Nu akustiker m specialiteten
studiokontrollrum, hemmabiosar & musiklyssnrum. Även Ch. R&D
åt Carlsson och Guru, konsult åt andra + hobbyhögtalartillv (Ino).

Användarvisningsbild
DQ-20
Skum fogare
 
Inlägg: 8579
Blev medlem: 2003-12-03
Ort: ografi

Re: Den stora tråden om STATISTIK

Inläggav DQ-20 » 2015-05-23 14:21

Almen skrev:1. "statistical power"
Hur kan man räkna ut det i fallet F/E-lyssning? Känns som att det beror på vilka lyssnare som är tillstädes, hur man uppskattar mängden och graden av färgning hos testobjektet, etc.. Snuddar detta vid en bayesiansk prior?


Ja, JAG kan inte räkna ut det utan ta ta fram böckerna och hålla på och handräkna eller programmera. MEN, det gör inte så mycket eftersom det är meningslöst. Den statistiska känsligheten (power) för signifikanstest i normala F/E-test är så låg att det i princip bara är "alla rätt" som gäller även när man kravet att effektstorleken skall vara större än 0,5 (bättre än slumpen). Statistical power har inget med en bayesiansk prior att göra. Vad begreppet anger är sannolikheten att få ett statistiskt signifikant resultat i ett visst signifikanstest givet 1. uppskattad effektstorlek, 2. vald signifikansnivå för det statistiska testet och 3. antal fall/försök. Ju högre känslighet, desto större chans att få ett statistiskt signifikant resultat, givet 1, 2 och 3.

Almen skrev:2. "multiple comparisons"
Detta har möjligtvis snuddats vid i "Le grande fil", men here goes. Upprepade test ökar p-värdet eftersom ju fler test man gör, desto större sannolikhet att man får en slumpmässig träff. I F/E-fallet finns kanske fyra lyssnare, två lämnar fullständiga lyssningsserier (varav en t.ex. 11 av 11 och en 7 av 11), en slutar gissa efter fem, och den sista lämnar inga svar alls. Hur räknar man?

Och om man sedan tar ytterligare en lyssning med bara den lyssnare som hade 11 och 11, med samma resultat, räknas detta också som "upprepade test"? För mig känns det som att resultatet stärks...

I princip kan väl det specifika testet även ses som ett i en oändlig rad tester och då blir ju resultatet inte mycket att ha i det avseendet. Men teoretiskt sett, när börjar man från scratch?


Jag vet att jag har skrivit det förut. Principen är att för varje ny testserie så har slumpen möjlighet att påverka resultatet. Gör man "n" serier så får slumpen "n" chanser. Den enklast korrektionen är sk. Bonferroni korrigering och innebär att om man har n försök och är intresserad av en total signifikansnivå på p så blir kravet på varje enskild serie p/n. Det finns andra korrigeringsmetoder som tar hänsyn till korrelation mellan resultaten men det är ofta inga större skillnader. Alltså, gör man 5 serier och man söker en total signifikansnivå p<0,05 så blir kravet på varje enskilt test p<0,01. Om någon av serierna ligger över p<0,01 kommer man inte uppfylla kravet på p<0,05 för det sammanlagda resultatet för de 5 försöksserierna.

/DQ-20
I try to change the formality and everything about it
People killing people for a reason
You make mistakes
You don't regret
So make a conclusion
.

- Infected Mushroom: Change the formality

Användarvisningsbild
IngOehman
 
Inlägg: 48470
Blev medlem: 2003-09-28
Ort: K-PAX via Tellus

Re: Den stora tråden om STATISTIK

Inläggav IngOehman » 2015-05-23 17:40

Svårast är väl att bestämma hur man skall se på resultatet när det testas runt hela världen...

Säg att någon effekt studeras och de som studerar den finner att effekten upplevs finnas som funktion av det som man tänkte sig utlöste effekten. Nio gånger av nio svaras det rätt på när den utlösade faktorn slumpmässigt har varit med eller inte.

De stoppar där. Och man kan räkna ut hur sannolikt det är att slumpen fick dem att gissa rätt. En statistiker får uppdraget att göra det.


Men dagen efter så får man veta att samma studie har gjort på 6 ytterligare platser runt jorden, och alla de andra så fick man slumpresultat. Den statistiker man frågar vet dock inte om detta. Problemet blir filosofiskt. Är det svar man får från statistiken riktigt?

Man kan även tänka sig att det går en vecka tills saken testas på olika platser runt jorden. Är de det som statistikern räknat fram sant fram till det att man får veta resultaten från de andra studierna?


Vh, iö

- - - - -

PS. Svar - det statistikern säger är aldrig sant eller falskt. Ett påstående om att sambandet finns är alltid 100 % sant, eller 100% falskt. Det som statistiker i förekommande fall bråkar om, är hur säker man kan vara. Det vill säga de bråkar om hur lite man vet, vilket kvalitet på data man har tillgång till. ;)

Ingenting annat. Det är det som ÄR statistik. Att räkna ut hur osäker det finns skäl att vara.

- - -

Vad är det för chans att vinna på ett lotteri med bara en vinstlott och 1 000 000 lotter?

Svar - antingen 100%, eller 0%.

Den som säger 1 på 1 000 000 säger inte att det inte är 100% eller 0%, utan bara att man inte vet förrän man kollat lotten.

- - -

Om en himlakropp är på väg mot jorden och en forskare säger att det är 15% risk att den skall träffa jorden, medan en annan säger att risken är 50%, vem har rätt?

Svar - ingen. Antingen kommer den att träffa, eller också kommer den inte att träffa. Det är 100% eller 0%.

De som säger 10% respektive 50% slåss egentligen bara om en sak - hur bra (eller rättare sagt hur dåliga) data de har. Det handlar båda om vad data säger och om man kan lita på detta... Men själva händelsen, verkligheten, den är som den är. Antingen som träffar den, eller också träffar den inte.
Fd psykoakustikforskare & ordf LTS. Nu akustiker m specialiteten
studiokontrollrum, hemmabiosar & musiklyssnrum. Även Ch. R&D
åt Carlsson och Guru, konsult åt andra + hobbyhögtalartillv (Ino).

Användarvisningsbild
DQ-20
Skum fogare
 
Inlägg: 8579
Blev medlem: 2003-12-03
Ort: ografi

Re: Den stora tråden om STATISTIK

Inläggav DQ-20 » 2015-05-23 21:27

IngOehman skrev:Svårast är väl att bestämma hur man skall se på resultatet när det testas runt hela världen...

Säg att någon effekt studeras och de som studerar den finner att effekten upplevs finnas som funktion av det som man tänkte sig utlöste effekten. Nio gånger av nio svaras det rätt på när den utlösande faktorn slumpmässigt har varit med eller inte.

De stoppar där. Och man kan räkna ut hur sannolikt det är att slumpen fick dem att gissa rätt. En statistiker får uppdraget att göra det.

Men dagen efter så får man veta att samma studie har gjort på 6 ytterligare platser runt jorden, och alla de andra så fick man slumpresultat. Den statistiker man frågar vet dock inte om detta. Problemet blir filosofiskt. Är det svar man får från statistiken riktigt?

Man kan även tänka sig att det går en vecka tills saken testas på olika platser runt jorden. Är de det som statistikern räknat fram sant fram till det att man får veta resultaten från de andra studierna?


Vh, iö


Det du tar upp är ju sk. meta-analys. Sådant brukar forskare göra när de på ett systematiskt sätt försöker bilda sig en uppfattning om kunskapsläget i ett forskningsfält. Det är normalt sett inget som "äkta" statistiker vill ta i med tång* av den enkla anledning att det inte går att ta fram några vettiga antaganden om fördelningar. Ingen fördelning - ingen statistik. Men man får försöka så gott man kan med de verktyg som står till buds och det kan innefatta både statistiska "resonemang" och bedömingar. Men man måste ha klart för sig att signifikansnivåer inte är ett bevis för någonting. Det är bara en indikation om att något statistiskt ovanligt har skett givet vissa antaganden. Om det är slumpen eller en verklig effekt kan vi aldrig veta med visshet i det enskilda fallet.

IngOehman skrev:---/snip/---

Vad är det för chans att vinna på ett lotteri med bara en vinstlott och 1 000 000 lotter?

Svar - antingen 100%, eller 0%.

Den som säger 1 på 1 000 000 säger inte att det inte är 100% eller 0%, utan bara att man inte vet förrän man kollat lotten.


Jag förstår vad du menar men jag skulle inte uttrycka det som "chans" eftersom "chans" är den positiva varianten av "risk", dvs. ett sannolikhetsmått. Att efter försöket ange utfallet som 100% och 0% innebär att procentsatserna byter "filosofisk" status och är inte längre mått på sannolikhet. Det blir mest ett sätt att ange utfallsrummet vinst/inte vinst. Efter man har dragit har man ju visshet i det enskilda fallet och då är inte sannolikhet längre särskilt relevant. Sannolikhet, tolkat som relativ frekvens, är ju något som gäller för en oändlig mängd upprepade försök. Även med en klassisk definition av sannolikhet (antalet "fördelaktiga" utfall/antalet möjliga utfall) blir värdet detsamma: en på miljonen.

IngOehman skrev:Om en himlakropp är på väg mot jorden och en forskare säger att det är 15% risk att den skall träffa jorden, medan en annan säger att risken är 50%, vem har rätt?

Svar - ingen. Antingen kommer den att träffa, eller också kommer den inte att träffa. Det är 100% eller 0%.

De som säger 10% respektive 50% slåss egentligen bara om en sak - hur bra (eller rättare sagt hur dåliga) data de har. Det handlar båda om vad data säger och om man kan lita på detta... Men själva händelsen, verkligheten, den är som den är. Antingen som träffar den, eller också träffar den inte.


Jag har ju gått igenom detta tidigare i tråden vad sannolikhet ("risk";"chans") innebär och här är det lätt att blanda ihop sannolikhetsbegreppen. En statistiker av normalsnitt avser relativ frekvens dvs. limes för andelen när antalet försök går mot oändligheten. Om den statistiskt lagde astrofysikern säger "15%" så avses "i 15% av alla fall som är identiskt med detta kommer himlakroppen att träffa jorden". Nu är det inte det svaret vi är ute efter utan en subjektiv sannolikhet för chansen att något inträffar i just det här fallet. Men se det får vi inte, för relativ frekvens är en egenskap hos fördelningen och är inte tillämpbar i det enskilda fallet. Sedan kan man spekulera i varför man har så pass "dålig" mätprecision för ett fysikaliskt förlopp där Newton räcker ganska långt, men det är kanske en annan fråga som leder från ämnet statistik.

/DQ-20

*) En hel del statistiker vill helst inte ta i empiriska data med tång överhuvudtaget utan föredrar simulerade data med kända statistiska egenskaper.
I try to change the formality and everything about it
People killing people for a reason
You make mistakes
You don't regret
So make a conclusion
.

- Infected Mushroom: Change the formality

Användarvisningsbild
Svante
Audiot!
 
Inlägg: 37552
Blev medlem: 2004-03-03
Ort: oakustisk

Re: Den stora tråden om STATISTIK

Inläggav Svante » 2015-05-24 01:57

IngOehman skrev:- - -

Vad är det för chans att vinna på ett lotteri med bara en vinstlott och 1 000 000 lotter?

Svar - antingen 100%, eller 0%.

Den som säger 1 på 1 000 000 säger inte att det inte är 100% eller 0%, utan bara att man inte vet förrän man kollat lotten.

- - -

Om en himlakropp är på väg mot jorden och en forskare säger att det är 15% risk att den skall träffa jorden, medan en annan säger att risken är 50%, vem har rätt?

Svar - ingen. Antingen kommer den att träffa, eller också kommer den inte att träffa. Det är 100% eller 0%.

De som säger 10% respektive 50% slåss egentligen bara om en sak - hur bra (eller rättare sagt hur dåliga) data de har. Det handlar båda om vad data säger och om man kan lita på detta... Men själva händelsen, verkligheten, den är som den är. Antingen som träffar den, eller också träffar den inte.


??? Nu verkar det som att du inte alls har förstått vad sannolikhet är. Du verkar blanda ihop sannolikhet för ena eller andra utfallet med utfallen själva.
Så länge har jag längat efter att loudness war skulle vara över. Nu börjar jag tro att vi faktiskt är där. Kruxet är att vi förlorade.

Användarvisningsbild
IngOehman
 
Inlägg: 48470
Blev medlem: 2003-09-28
Ort: K-PAX via Tellus

Re: Den stora tråden om STATISTIK

Inläggav IngOehman » 2015-05-24 11:26

Det är just det jag inte gör. Jag blandar isär dem.

DQ-20 skrev:
IngOehman skrev:Svårast är väl att bestämma hur man skall se på resultatet när det testas runt hela världen...

Säg att någon effekt studeras och de som studerar den finner att effekten upplevs finnas som funktion av det som man tänkte sig utlöste effekten. Nio gånger av nio svaras det rätt på när den utlösande faktorn slumpmässigt har varit med eller inte.

De stoppar där. Och man kan räkna ut hur sannolikt det är att slumpen fick dem att gissa rätt. En statistiker får uppdraget att göra det.

Men dagen efter så får man veta att samma studie har gjort på 6 ytterligare platser runt jorden, och alla de andra så fick man slumpresultat. Den statistiker man frågar vet dock inte om detta. Problemet blir filosofiskt. Är det svar man får från statistiken riktigt?

Man kan även tänka sig att det går en vecka tills saken testas på olika platser runt jorden. Är de det som statistikern räknat fram sant fram till det att man får veta resultaten från de andra studierna?


Vh, iö


Det du tar upp är ju sk. meta-analys. Sådant brukar forskare göra när de på ett systematiskt sätt försöker bilda sig en uppfattning om kunskapsläget i ett forskningsfält. Det är normalt sett inget som "äkta" statistiker vill ta i med tång* av den enkla anledning att det inte går att ta fram några vettiga antaganden om fördelningar. Ingen fördelning - ingen statistik. Men man får försöka så gott man kan med de verktyg som står till buds och det kan innefatta både statistiska "resonemang" och bedömingar. Men man måste ha klart för sig att signifikansnivåer inte är ett bevis för någonting. Det är bara en indikation om att något statistiskt ovanligt har skett givet vissa antaganden. Om det är slumpen eller en verklig effekt kan vi aldrig veta med visshet i det enskilda fallet.

IngOehman skrev:---/snip/---

Vad är det för chans att vinna på ett lotteri med bara en vinstlott och 1 000 000 lotter?

Svar - antingen 100%, eller 0%.

Den som säger 1 på 1 000 000 säger inte att det inte är 100% eller 0%, utan bara att man inte vet förrän man kollat lotten.


Jag förstår vad du menar men jag skulle inte uttrycka det som "chans" eftersom "chans" är den positiva varianten av "risk", dvs. ett sannolikhetsmått. Att efter försöket ange utfallet som 100% och 0% innebär att procentsatserna byter "filosofisk" status och är inte längre mått på sannolikhet. Det blir mest ett sätt att ange utfallsrummet vinst/inte vinst. Efter man har dragit har man ju visshet i det enskilda fallet och då är inte sannolikhet längre särskilt relevant. Sannolikhet, tolkat som relativ frekvens, är ju något som gäller för en oändlig mängd upprepade försök. Även med en klassisk definition av sannolikhet (antalet "fördelaktiga" utfall/antalet möjliga utfall) blir värdet detsamma: en på miljonen.

IngOehman skrev:Om en himlakropp är på väg mot jorden och en forskare säger att det är 15% risk att den skall träffa jorden, medan en annan säger att risken är 50%, vem har rätt?

Svar - ingen. Antingen kommer den att träffa, eller också kommer den inte att träffa. Det är 100% eller 0%.

De som säger 10% respektive 50% slåss egentligen bara om en sak - hur bra (eller rättare sagt hur dåliga) data de har. Det handlar båda om vad data säger och om man kan lita på detta... Men själva händelsen, verkligheten, den är som den är. Antingen som träffar den, eller också träffar den inte.


Jag har ju gått igenom detta tidigare i tråden vad sannolikhet ("risk";"chans") innebär och här är det lätt att blanda ihop sannolikhetsbegreppen. En statistiker av normalsnitt avser relativ frekvens dvs. limes för andelen när antalet försök går mot oändligheten. Om den statistiskt lagde astrofysikern säger "15%" så avses "i 15% av alla fall som är identiskt med detta kommer himlakroppen att träffa jorden". Nu är det inte det svaret vi är ute efter utan en subjektiv sannolikhet för chansen att något inträffar i just det här fallet. Men se det får vi inte, för relativ frekvens är en egenskap hos fördelningen och är inte tillämpbar i det enskilda fallet. Sedan kan man spekulera i varför man har så pass "dålig" mätprecision för ett fysikaliskt förlopp där Newton räcker ganska långt, men det är kanske en annan fråga som leder från ämnet statistik.

/DQ-20

*) En hel del statistiker vill helst inte ta i empiriska data med tång överhuvudtaget utan föredrar simulerade data med kända statistiska egenskaper.

Jag håller med om vartenda ord du skriver, men känner att jag måste förtydliga min poäng.

Min poäng handlar om att man ofta talar om sannolikheter, även efter att ett val är gjort, och man kan argumentera både för att göra det, och mot att göra det.

Låt oss ta fallet med lotten - om man frågar vilken sannolikheten att vinna genom att ta den enda vinstlotten är, om man tar en slumpmässig lott av 1 000 000 lotter, så är det ju 1:1000 000, alltså 0,0001%.

Men vilken är sannolikheten om man redan valt lott?

Då är sannolikheten 100% eller 0%. Inget annat. Man vet fortfarande inte svaret, men det som 0,0001% är applicerbart är inte längre lotten, den är ju vad den är, utan 0,0001% gäller nu bara vad vi vet om den.

Det blir kanske ännu tydligare när det gäller en himlakropp som är på väg mot jorden i rymden. Det är ingen tvekan om att den antingen kommer att träffa, eller att den kommer att missa. Där görs sannolikhetsbedömningarna inte på enkla statistiska grunder, utan de vilar mot graden av okunskap om himlakroppens läge, riktning och hastighet. Men att vi inte känner dem noga nog påverkar inte om den kommer att träffa eller inte.

Och med det sagt så gäller faktiskt samma sak för lotten. Den är redan vald, och sannolikheten berättar om graden av okunskap om huruvida det är vinstlotten eller inte. Det blir såklart samma siffra (0,0001%) men den berättar inte längre direkt (bara indirekt) om processen att slumpmässigt välja en lott, för valet är redan gjort. Nu berättar den om hur vad vi vet om utfallet. Då ovetbarheten i sig vilar på slumpprocessens mekanismer så blir det såklart samma siffra, men filosofiskt sett är det inte samma sak.

Och när jag skrivit allt detta så börjar jag undra om det finns någon poäng alls i det jag skriver. :) Det vill säga, det gör det förstås, men finns det någon mening med poängen?


Vh, iö
Fd psykoakustikforskare & ordf LTS. Nu akustiker m specialiteten
studiokontrollrum, hemmabiosar & musiklyssnrum. Även Ch. R&D
åt Carlsson och Guru, konsult åt andra + hobbyhögtalartillv (Ino).

Användarvisningsbild
Svante
Audiot!
 
Inlägg: 37552
Blev medlem: 2004-03-03
Ort: oakustisk

Re: Den stora tråden om STATISTIK

Inläggav Svante » 2015-05-24 12:03

IngOehman skrev:Min poäng handlar om att man ofta talar om sannolikheter, även efter att ett val är gjort, och man kan argumentera både för att göra det, och mot att göra det.

Låt oss ta fallet med lotten - om man frågar vilken sannolikheten att vinna genom att ta den enda vinstlotten är, om man tar en slumpmässig lott av 1 000 000 lotter, så är det ju 1:1000 000, alltså 0,0001%.

Men vilken är sannolikheten om man redan valt lott?

Då är sannolikheten 100% eller 0%. Inget annat. Man vet fortfarande inte svaret, men det som 0,0001% är applicerbart är inte längre lotten, den är ju vad den är, utan 0,0001% gäller nu bara vad vi vet om den.


Fast begreppet sannolikhet är inte bundet till före-efter. Felet här är att det inte är tydligt vilken sannolikhet man frågar efter. Det du tar upp är två olika frågor:

1. Vad är det för chans att vinna på ett lotteri med bara en vinstlott och 1 000 000 lotter?
2. Vad är det för chans att den här vinstlotten (alt nitlotten) som jag just drog är en vinstlott?

Du var dock ganska tydlig i ditt första inlägg:

Vad är det för chans att vinna på ett lotteri med bara en vinstlott och 1 000 000 lotter?
Svar - antingen 100%, eller 0%.


Där är det solklart att sannolikheten är 0,0001%. Sannolikhet definieras som antalet gynnsamma utfall delat med antalet möjliga utfall. Det är fullt möjligt att prata om sannolikheten även efter att man har tittat på lotten. "Jag vann på lotteriet, vilken tur, chansen att man ska få vinstlotten är ju bara 0,0001%."

I fall två däremot har man en betingad sannolikhet, hur stor är chansen att få vinstlotten, givet att man har fått vinstlotten. Lite krystat kan man säga att statisktikern skriver det som P(B|A)=P(A∩B)/P(A), här är både A och B händelsen att få vinstlotten, och då blir P(A∩B)=P(A)=0,0001% och P(B|A)=1. I alternativa fallet är A händelsen att inte få vinstlotten och då blir B=icke-A, dvs P(A∩B)=0 och P(B|A)=0. Det var nog det du menade, men inte det du skrev.
Så länge har jag längat efter att loudness war skulle vara över. Nu börjar jag tro att vi faktiskt är där. Kruxet är att vi förlorade.

Användarvisningsbild
DQ-20
Skum fogare
 
Inlägg: 8579
Blev medlem: 2003-12-03
Ort: ografi

Re: Den stora tråden om STATISTIK

Inläggav DQ-20 » 2015-05-24 23:53

Det känns lite som vi hamnat utanför sannolikhetsbegreppet lite här. Det finns inga andra teoretiska möjligheter än att en lott antingen är en vinstlott eller en nitlott. Därför byter 1 (eller 0) i räkneexemplet status från "almost surely" till "sure". I så fall är sannolikheten för att få en vinstlott när man får en vinstlott är inte 1 (almost surely), även om det är esoteriskt finlir.

/DQ-20
I try to change the formality and everything about it
People killing people for a reason
You make mistakes
You don't regret
So make a conclusion
.

- Infected Mushroom: Change the formality

Användarvisningsbild
Svante
Audiot!
 
Inlägg: 37552
Blev medlem: 2004-03-03
Ort: oakustisk

Re: Den stora tråden om STATISTIK

Inläggav Svante » 2015-05-25 12:55

Det där förstod jag inte. Menar du att sannolikheten att man får en vinstlott, betingat att man redan har fått en vinstlott, inte är 1?
Så länge har jag längat efter att loudness war skulle vara över. Nu börjar jag tro att vi faktiskt är där. Kruxet är att vi förlorade.

Användarvisningsbild
DQ-20
Skum fogare
 
Inlägg: 8579
Blev medlem: 2003-12-03
Ort: ografi

Re: Den stora tråden om STATISTIK

Inläggav DQ-20 » 2015-05-25 21:37

Svante skrev:Det där förstod jag inte. Menar du att sannolikheten att man får en vinstlott, betingat att man redan har fått en vinstlott, inte är 1?


Ja, ungefär så. Det är liksom inte meningsfullt att definiera väntevärdet på ett säkert utfall (sure) i probabilistiska termer. Det är det däremot om det är "almost sure". Väntevärdet för ett utfall som är "almost sure" är P[E]=1 men om man sätter P[E]=1 för ett utfall som är "sure" så blir det ju identitet mellan "almost sure" och "sure" trots att "sure" är "mer sannolikt". För "almost sure" finns det ett "limes-tänkande" med i bilden, för "sure" så finns det inte det. Fast jag är osäker på vad det har med F/E-test att göra...

/DQ-20
I try to change the formality and everything about it
People killing people for a reason
You make mistakes
You don't regret
So make a conclusion
.

- Infected Mushroom: Change the formality

Användarvisningsbild
Svante
Audiot!
 
Inlägg: 37552
Blev medlem: 2004-03-03
Ort: oakustisk

Re: Den stora tråden om STATISTIK

Inläggav Svante » 2015-05-25 23:24

...fast ligger inte detta limes redan i sannolikhetsbegreppet? Jag menar om jag säger at p=0,9, alltså inte "ungefär lika med", så har jag ju redan gjort gränsvärdesberäkningen med oändligt många utfall. Och då blir det bara tal man räknar med och P(B|A)=P(A∩B)/P(A)=1 eftersom P(A∩B)=P(A). Det skumma som du syftar på finns nog redan i sannolikhetsbegreppet, inte i räknandet med sannolikheterna (som ju är tal)?

Hmm.
Så länge har jag längat efter att loudness war skulle vara över. Nu börjar jag tro att vi faktiskt är där. Kruxet är att vi förlorade.

Användarvisningsbild
DQ-20
Skum fogare
 
Inlägg: 8579
Blev medlem: 2003-12-03
Ort: ografi

Re: Den stora tråden om STATISTIK

Inläggav DQ-20 » 2015-05-26 09:33

Svante skrev:...fast ligger inte detta limes redan i sannolikhetsbegreppet? Jag menar om jag säger at p=0,9, alltså inte "ungefär lika med", så har jag ju redan gjort gränsvärdesberäkningen med oändligt många utfall. Och då blir det bara tal man räknar med och P(B|A)=P(A∩B)/P(A)=1 eftersom P(A∩B)=P(A). Det skumma som du syftar på finns nog redan i sannolikhetsbegreppet, inte i räknandet med sannolikheterna (som ju är tal)?

Hmm.


Ja, jag säger det samma. Hmmm... Jag tänker att "grejen" är att när något är "sant" så är det inte längre "sannoLIKT" utan just "sant". Händelsen byter "ontologisk skepnad". Men återigen - sannolikheter är något som är en "repeated sampling property" (dvs. gäller en fördelning av händelser) när det gäller objektiv sannolikhet (klassisk; relativ frekvens) och gäller inte enskilda fall. Så jag TYCKER inte man skall tillämpa dessa sannolikhetsbegrepp i enskilda fall. I ditt exempel räknar du just på en betingad sannolikhet i ett enskilt fall och det är det som gör att jag tycker att det blir "lite konstigt" även om matematiken är korrekt. Om man tittar på Bayes teorem så blir det pannkaka när man sätter en P[prior]=0. Då blir även P[posterior]=0 oavsett data. Praktisk tolkning: oavsett vad du har för empiriska bevis tror jag ändå inte på det. Jag brukar använda det som argument att för att det är ovetenskapligt att säga att något är omöjligt (i meningen "never"). Därför: jag kan mycket väl ha fel med tanke på att jag är amatör och statistisk känslomänniska.

/DQ-20 km från F/E
I try to change the formality and everything about it
People killing people for a reason
You make mistakes
You don't regret
So make a conclusion
.

- Infected Mushroom: Change the formality

Användarvisningsbild
IngOehman
 
Inlägg: 48470
Blev medlem: 2003-09-28
Ort: K-PAX via Tellus

Re: Den stora tråden om STATISTIK

Inläggav IngOehman » 2015-05-28 22:46

DQ-20 skrev:Men återigen - sannolikheter är något som är en "repeated sampling property" (dvs. gäller en fördelning av händelser) när det gäller objektiv sannolikhet (klassisk; relativ frekvens) och gäller inte enskilda fall. Så jag TYCKER inte man skall tillämpa dessa sannolikhetsbegrepp i enskilda fall.

Exakt. Det är precis det det handlar om.

En SPECIFIK himlakropp kommer endera att kollidera med jorden, eller också gör den det inte.

Om någon anger en sannolikhet för kollision, så projicerar de bara sin osäkerhet (det är informationen kvalitet och kvanitet de redovisar, sin osäkerhet) på himlakroppen, som dock inte har någon sannolikhet att träffa. Det finns bara en sanning. Även om den är okänd.

Samma sak gäller en lott, som blir specifik samma ögonblick som den har blivit vald.

DQ-20 skrev:Om man tittar på Bayes teorem så blir det pannkaka när man sätter en P[prior]=0. Då blir även P[posterior]=0 oavsett data. Praktisk tolkning: oavsett vad du har för empiriska bevis tror jag ändå inte på det. Jag brukar använda det som argument att för att det är ovetenskapligt att säga att något är omöjligt (i meningen "never"). Därför: jag kan mycket väl ha fel med tanke på att jag är amatör och statistisk känslomänniska.

/DQ-20 km från F/E

Du har såklart rätt.

Att påstå att något är omöjligt faller på att det inte går att generera argument för det*, då det faller på den första vetenskapliga tesen.

Men kan i ett experiment i bästa fall påvisa någots närvaro (ting eller egenskap) men inte bevisa alltings (ting och egenskaper) frånvaro.

För att kunna bevisa att inget finns måste man först känna allt det som man påstår inte finns, och bara sådant som finns kan man känna... Kort sagt - det man inte känner vet man inte om det finns.


Vh, iö

- - - - -

*Och därmed påstod jag just att något var omöjligt... Det kan verka motsägelsefullt men är det faktiskt inte. ;)
Fd psykoakustikforskare & ordf LTS. Nu akustiker m specialiteten
studiokontrollrum, hemmabiosar & musiklyssnrum. Även Ch. R&D
åt Carlsson och Guru, konsult åt andra + hobbyhögtalartillv (Ino).

FöregåendeNästa

Återgå till Teknikforum


Vilka är online

Användare som besöker denna kategori: Bing [Bot] och 2 gäster