Här kommer mina kommenterar till resten:
Svante skrev:Sen har jag hittat på några frågor till som kanske någon har:
Kan man lita på de tester som utförts hittills i LTS regi?
Trots det ovanstående är min bedömning att man kan det. Jag kan säga det eftersom jag tror att Ingvar drivs av en uppriktig vilja att undersöka hur apparaterna presterar. Däremot tycker jag att det är tråkigt att man måste lita på min, Ingvars eller någon annans bedömning av det. Det vore bättre om jag kunde lägga fram fakta så att den som begriper statistik själv kan undersöka om data har behandlats vettigt.
Jag tycker du letar efter problem som inte finns. Detta är idéellt arbete. Det är svårt nog att få någon att ställa upp och göra det, redan utan att man klagar på deras insats offentligt.
Svante skrev:Tror jag att Ingvar kan beräkna konfidensen i testerna, så som de har utförts hittills?
Nej. Jag tror däremot att han kan däremot uppskatta konfidensen med någon viss säkerhet. Genom att ”ta höjd”, dvs utsätta lyssnarna för fler lyssningar än nödvändigt, så kan han göra det troligt att konfidensen ändå är större än 99%.
Jag är mera intresserad av fakta än av dina spekulationer. Är glad för de bekräftanden av FAKTA-förhållanden som dina sex svar gav. Tack.
Vilken är då min kritik?
Min kritik är framför allt att den statistiska metoden inte finns dokumenterad. Det gör den svårvaliderad. Resultaten i testerna står och faller med tilliten till Ingvars förmåga att bedömma svarssekvenserna. I denna kritik ligger också att flera personer tillåts svara samtidigt, med kännedom om varandras svar. Ingvar menar att han kan väga in samtidiga svar i den statstiska behandlingen, något som för mig förefaller svårt utan att göra antaganden om hur stark korrelationen är mellan de samtidigt avgivna svaren eller kräva onödigt många lyssningar.
Det är inte svårt alls. Man utgår ifrån att korrelationen är stark, eftersom den
kan vara det. Ibland tror jag nästan du glömmer att det är APPARATEN som testas, och inte lyssnarna. Att låta folk båda samtala och svara som de vill (utan facit dock nota bene - det vill säg blindt) påverkar förvisso ibland möjligheten att "testa" en enskild lyssnare, men det är inte det jag velat undersöka. Det är apparaterna som vi vill lära oss saker om.
Det må vara så att det inte vid ett enda tillfälle har påståtts att konfidensen har varit högre än den verkligen är. Oavsett hur det är med det är det dålig försöksdesign om man inte kan redovisa hur beräkningen av konfidensen går till. Det är dåligt av flera anledningar.
Jag vill påminna om syftet med testerna: Det handlar om att berätta om olika hifi-apparater för LTS' medlemmar. Arbetet görs idéellt, och ju mera information vi kan extrahera per nedlagt arbete, desto större är chansen att testerna alls blir av!

Denna nonsensdebatt har lamslagit testverksamheten fullständigt.
Svante skrev:1. Eftersom det inte går att tala om hur beräkningarna utförs så går det inte att säga hur stor konfidensen egentligen är. I strikt mening blir det svårt att garantera att den är över 99%. Det man kan göra är att ”ta höjd” så att det blir troligt att man har kanske 99,8% konfidens, så att man är nästan säker på att man har 99% konfidens. Det här blir någon sorts konfidensintervall på konfidensen. Om man kan sätta siffror på de bedömningar man gör under analysens gång kan man möjligen räkna ut hur stor den slutliga konfidensen blir, men det blir bökigt. Ingvar kanske kan göra det i huvudet, själv kan jag inte ens göra det på papper.
Old News...
Du blandar dock ihop hård och mjuk information. Det gör aldrig jag - konfidensen beräknas bara från hård information. Däremot måste man blanda i redovisningen (i artikeln).
Och kom ihåg: Den signifikans man anger gäller
bara för den specifika sak man anger! Svårare än så är det inte.
Svante skrev:2. Att behöva ”ta höjd” medför med nödvändighet att man behöver utsätta lyssnarna för fler lyssningar än vad som egentligen behövs, de blir alltså mer uttröttade än om man vet exakt när 99% konfidens har uppnåtts och kan bryta då.
I praktiken är det tvärtom. Enstaka extra svar är ett marginellt besvär jämfört med att sätta upp en massa regler som förstör detektionströskeln.
Svante skrev:3. Trovärdigheten. Att inte kunna redovisa hur man har gjort gör att metoden kan ifrågasättas utan att den går att försvara med sakargument.
4. Till sist, och detta är nog det allvarligaste: Eftersom metoden är så komplicerad att den är omöjlig att skriva ner på papper så blir det mycket svårt att byta testledare. Det blir också mycket svårt för någon annan att ta över eller duplicera/anamma LTS testmetodik. Testerna är alltså knutna till Ingvar, vilket knappast kan vara en fördel för LTS, vilket är högaktuellt just nu när han väljer att lämna LTS tekniksektion.
Lite av ett cirkelbevis det där va? Du ser till att du får rätt genom att verka för min avgång...

Helt ok om du tar över verksamheten.
I övrigt vidhåller jag värdet av att använda den bästa möjliga metoden. Det är därför jag valt att göra det. Att jag skulle välja en sämre metod bara för att någon skall kunna ta över ansvaret är ologiskt. Det går ju utmärkt att byta till en sämre metod då istället.
Svante skrev:Gör man något bra, så ska man underlätta för andra att göra samma sak om man vill att det som är bra ska leda till en positiv utveckling.
Du har mycket åsikter om vad andra skall göra, men du vill inte göra det själv. Trist. Tycker du att det du åstadkommit är en positiv utveckling?
Svante skrev:Hur vill jag att testdesignen ska förändras?
Jag vill att man i förväg bestämmer vilka avbrottsvillkor som ska gälla. Hur detta kan gå till finns beskrivet i min statistikartikel i MoLT 1/2006. Det som inte finns beskrivet där är hur man hanterar flera samtidigt närvarande lyssnare. Vid samtidigt avgivna svar måste alla utom det första bortses ifrån, eller så avges de i konsensus. Alternativet är att man ser avgivna svarsserier som individuella, och då måste man höja konfidenskraven eftersom det då rör sig om upprepade tester (lika många som antalet försökspersoner). Hursomhelst måste multipla, möjligen korrelerade svar hanteras på ett dokumenterat sätt och det dokumentet måste finnas innan försöket startar. Det finns också en del tekniska lösningar för avgivande av flera samtidiga svar som jag hade velat testa, det är möjligt att de inte ger något, men det är också möjligt att de nästanlöser problematiken med korrelation mellan samtidigt avgivna svar. Jag ska också villigt erkänna att jag inte har en färdig lösning på hur testerna bör gå till, framförallt map hanteringen av samtidiga lyssnare. Där behöver man experimentera för att hitta en lösning som är acceptabel både för lyssnarna och ur databehandlingssynpunkt. Till sist skulle jag också vilja att testerna vore dubbelblinda, inte enkelblinda som nu.
Jag har ingen kommenter till det ovanstående (annat än de invändningar på den sjunkande test-kvaliteten som jag framfört till dig, utan att få någon respons), men jag kan kontatera att det du skriver är rätt oanvändbart om det inte finns någon som vill ta ansvaret för ett användande av den metoden.
Jag vill det inte, och du vill det inte. Vem är det som skall göra det?
Svante skrev:Allt behöver inte lösas på en gång, det vore dumt att göra avbrott i testandet för detta, men på lite sikt menar jag att en förändring är önskvärd.
"Önskvärd" låter som om du ser det som ett allmänt accepterat objektivt faktum. Det är dock bara din åsikt, eller hur?
Svante skrev:En personlig reflexion:
När jag påbörjade den här diskussionen för något år sedan var mina synpunkter närmast reflexmässiga att ”så här gör man inte”. Med min akademiska skolning så var och är det främmande att höfta konfidensen på det sätt som gjordes genom att väga in en massa svårmätta företeelser, trots att man tog höjd för den osäkerhet som man trodde sig ha.
Höfta är ditt ordval. Jag har aldrig höftat någon konfidens. Ej heller påstått att sådana metoder har använts.
Den statistiska signifikansen
beräknar man. Bara för att jag ibland gjort det i huvudet är det inte gissningar. Du har haft frihet att gå hem och kontrollräkna hur mycket du vill, jag har inte hindrat dig.
Svante skrev:I det läget kom diskussionerna att handla väldigt mycket om huruvida man måste känna till konfidensen exakt. Ju mer vi har diskuterat desto mer har jag insett att det inte är konfidensnivån i sig som är viktig, utan dokumentationen av hur den beräknas. I akademiska sammanhang är dokumentation och arkivering så självklart att man sällan reflekterar över det. Den här debatten har fått mig att fundera över hur värdefull dokumentation och ifrågasättande är för reproducerbarhet och den vetenskapliga kvaliteten och det har varit nyttigt och utvecklande att påminnas om det.
Ok.
Svante skrev:LTS är en förening som säger sig stå på vetenskaplig grund. Enligt mitt synsätt innebär det att man ska låta sina metoder nagelfaras helt öppet. Det finns ingenting att vinna på att lämna delar av metoden dold annat än om man vill att den ska framstå som svårförstådd/avancerad eller mystisk.
Det finns MASSOR att vinna på att inte redovisa annat än de resultat som varit studiens syfte att få fram! Arbetsinsatsen för att formulera beskrivningen, och det därefter obligatoriska deltagandet i den oändliga debatten, är bara två saker.
Svante skrev:Det fina med att vara helt öppen är att många personer blir delaktiga i utformningen och att man därmed konvergerar mot en metod som inte bara en person tycker är bäst, utan flera.
Eftersom 100 000 000 000 flugor inte kan ha fel menar du?
Det är mig
fullständigt främmande att skrota jakten på bästa sättet att nå sanningen, till förmån för en meningslös dröm om en halvsunkig konsensus bland människor som inte ens ser hela problemet.
Vissa kompromisser kan möjligen vara vettiga, men att kompromissa sönder så här viktiga saker har jag noll intresse av att vara ansvarig för.
Svante skrev:Dessutom kommer flera personer att kunna använda samma metod och troligen få samma resultat. Öppenheten innebär förstås att personer som inte kan eller vill förstå får möjlighet att klämma på de svaga punkterna, men om man verkligen har minimerat dem till antal och storlek så bör en sådan debatt vara ganska snart vara avklarad, om man bara är lite smidig.
Vem är det som skall vara smidig då? Du vill inte ta ansvaret. Och menar du på allvar att bara
svaga punkter kommer att kritiseras?
Svante skrev:En odokumenterad metod får dock, hur bra den än är, begränsad möjlighet att vara till nytta för andra. Den enda nyttan blir genom de resultat som kommer ur att uppfinnaren själv använder metoden och trovärdigheten blir densamma som trovärdigheten för uppfinnaren, eftersom metoden inte kan granskas. Det binder testverksamheten till uppfinnaren, som därmed blir oumbärlig.
Varför det? Ansvaret och valet av metoder för testverksamheten kan väl bytas med den ansvarige?
Svante skrev:Till sist vill jag också säga att F/E-lyssning i sig är en väldigt bra metod. Den har enligt min uppfattning förutsättningar att detektera upplevbara fysikaliska skillnader som är långt mindre än vad man kan höra vid öppna lyssningar eller vid ett typiskt apparatbyte hemma. Den kringutrustning som används vid LTS tester är av mycket hög klass och borgar för att det knappast är troligt att man skulle lyckas höra storleksmässigt mindre skillnader med annan utrustning.
Där håller jag nog med dig. I själva verket har detektionsnivån visat sig vara LÅNGT under vad man kan läsa sig till i "vetenskaliga" böcker* om hörseln...
*Eftersom jag har en vetenskaplig världsbild måste jag dock underkänna de böcker som anger en detektionsnivå (oavsett vilken) eftersom sådana anspråk strider mot vetenskapens första tes...
Svante skrev:Mina anmärkningar gäller bara försöksdesignen och den aningen slafsiga behandlingen av statistiska data. Sett i perspektivet av andra populära hifi-skrifters lyssningstester är min kritik petimetersaker, det är en milsvid skillnad i kvaliteten på LTS tester och blaskornas, men även bra saker bör förbättras. Faktum är väl att det är just de som är intressantast att förbättra. Och som sagt, LTS har ju ambitionen att göra vetenskapligt hållbara undersökningar och det är det jag har försökt hjälpa till med.
LTS (eller rättare sagt min ambition som teknikansvarig) har varit att agera vetenskapligt. Det har ingenting med akademisk redovisningspraxis att göra.
Min ambition har varit att säkerställa att det som står i tidningen är sant och att de fynd och besrkivningar av egenskaper vi gör håller för en vetenskaplig granskning, inte att själva redovisningen till ingen nytta skall följa akademisk praxis. Den som är intresserad av redovisningen och inte av apparaternas egenskaper, bör söka andra tidksrifter, vars syfte är att erbjuda sådant.
Svante skrev:Allra sist vill jag ställa en retorisk fråga till Ingvar (jag har ju redan formulerat mitt svar på den ovan). Jag gör min blå.
Vilken metod tycker du att LTS ska använda för behandling av statistiken nu när du har avgått från LTS tekniksektion?
Det har jag ingen åsikt om, men jag hoppas att den inte blir så betungande att resultaten försunkas, eller att de som tvingas göra jobbet tappar lusten. Det måste vara kul, annars kan det kvitta.
Det är inte min sak att tycka något, men jag hoppas den som tar ansvaret har förmågan att tillse att det blir högklassiga tester, som gör att jag får veta något om testobjekten.
Vh, iö
Fd psykoakustikforskare & ordf LTS. Nu akustiker m specialiteten
studiokontrollrum, hemmabiosar & musiklyssnrum. Även Ch. R&D
åt Carlsson och Guru, konsult åt andra + hobbyhögtalartillv (Ino).