Lång intervju med Dr Floyd Toole

av **music4ever** » 2021-05-31 20:38

Maarten skrev:M4e: Håller i stort med om din poäng. I synnerhet om det är mycket pengar involverade.
Samtidigt tänker jag att mätningar har fått lite oförtjänt dåligt rykte pga hur de ibland har använts eller att de har gjorts fel, t ex i marknadsföring. Om man har bra mätningar, gjorda på samma sätt och att man själv har kalibrerat sitt omdöme mot dem, så kan de snabbt skapa en god bild för vederbörande.

Bra mätningar kräver extremt mycket av de som gör mätningarna för att inte fel ska slinka sig in. När man använder helt olika källor, och inte ens vet hur det har skett, så blir det problematiskt. Och vad mäter man påverkar också såklart.
Så jag är inte emot mätningar men försiktigt påpekar problemet med svåra mätningar som att mäta högtalare, korrekt.

av JM » 2021-05-31 21:41

Maarten skrev: Har läst den danska studien lite noggrannare och den är mycket intressant och relativt lättläst i relation till att det många faktorer att hålla reda på. Den visar ju hur svårt det är att först emulera perception och sen kvantifiera subjektiv upplevelse. Men från mitt amatörperspektiv ser det ut som ett gediget arbete som de har gjort och ljusår över den nivå jag tycker man brukar se på nätet inom HiFi. Det är dock många referenser till annan forskning som jag inte känner till.

Fastade också i danskstudien men i helt andra saker. Data i studien var ursprungligen ordinal data men för mig på oklart sätt blev kvotdata. Danskarna konverterade sina data till sone skalan och använde därefter medelvärden och parametriska test i Matlab.
Att köra ordinaldata i icke-parametriska test utifrån medianvärden typ M-W U-test vore för mig mer naturligt men med begränsningar.
Du verkar vara mer insatt i statistiken. Kan du förklara hur?

Efter lite sökande visade det sig att psykologen Stevens tog 1946 fram "the theory of scales of measurement" med bla ordinal o kvot datas begränsningar. https://en.wikipedia.org/wiki/Level_of_measurement
Samma Stevens skapades 1936 "sone scale". Vilket gjort mig mer misstänksam.
"Sone scale" har aldrig landat i min hjärna. Uppfattar den som en bluff att konvertera ordinaldata till kvotdata för att kunna köra er avancerade matematiska modeller. Men du kanske har en förklaring som kan förstås?

JM

av **Maarten** » 2021-06-01 09:06

JM, jag är ingen statistiker men har läst en del i olika omgångar och dök ner i frågan om ordinal kontra kvotdata för ett antal år sedan då jag upplevde att man slarvade med detta i studier. Hursomhelst, en del av det jag kom fram till då följer nedan:

1: Spearman (korrelation), Wilcoxon, Kendall’s tau, M-W-U eller K-S vore bättre i de fall det är ordinaldata som ska analyseras (nog konsensus om det utifrån vad jag läst).
2: Parametriska tester funkar i praktiken ändå bra i många sammanhang ävenför ordinaldata. Se t ex "Analyzing and Interpreting Data From Likert-Type Scales":

In the medical education literature, there has been a longstanding controversy regarding whether ordinal data, converted to numbers, can be treated as interval data.2 That is, can means, standard deviations, and parametric statistics, which depend upon data that are normally distributed (F I G U R E 2), be used to analyze ordinal data? When conducting research, we measure data from a sample of the total population of interest, not from all members of the population. Parametric tests make assumptions about the underlying population from which the research data have been obtained—usually that these population data are normally distributed. Nonparametric tests do not make this assumption about the ‘‘shape’’ of the population from which the study data have been drawn. Nonparametric tests are less powerful than parametric tests and usually require a larger sample size (n value) to have the same power as parametric tests to find a difference between groups when a difference actually exists. Descriptive statistics, such as means and standard deviations, have unclear meanings when applied to Likert scale responses. For example, what does the average of ‘‘never’’ and ‘‘rarely’’ really mean? Does ‘‘rarely and a half’’ have a useful meaning?3 Furthermore, if responses are clustered at the high and low extremes, the mean may appear to be the neutral or middle response, but this may not fairly characterize the data.

...Fortunately, Dr. Geoff Norman, one of world’s leaders in medical education research methodology, has comprehensively reviewed this controversy. He provides compelling evidence, with actual examples using real and simulated data, that parametric tests not only can be used with ordinal data, such as data from Likert scales, but also that parametric tests are generally more robust than nonparametric tests. That is, parametric tests tend to give ‘‘the right answer’’ even when statistical assumptions— such as a normal distribution of data—are violated, even to an extreme degree.4 Thus, parametric tests are sufficiently robust to yield largely unbiased answers that are acceptably close to ‘‘the truth’’ when analyzing Likert scale responses.4

Ref 4: Norman G. Likert scales, levels of measurement and the ‘‘laws’’ of statistics. Adv Health Sci Educ Theory Pract. 2010;15(5):625–632.

Från Parametric tests for Likert scale: For and against

Several experts also argue that PT can be employed for Likert scale and they have also demonstrated this with research evidence. PT not only can be used with ordinal data, but they are generally more robust than nonparametric tests (Sullivan and Artino, 2013).
1. Research affirms the robustness of parametric test for Likert scale when analyzed as a scale that is a summed composite score, not individual items. But, scale should fulfill standard psychometric assessment (Carifio and Perla, 2008).
2. Standard t-tests and ANOVA depend on assumption of normal distribution of means, not of the data and Central limit theorem demonstrates that, for sample sizes greater than 5 or 10 per group, the means are approximately normally distributed regardless of the original distribution (Norman, 2010).
3. Data simulation studies demonstrated robustness of Pearson correlation for sample size from 5 to 60, for normal and rectangular distribution of ordinal data (Murray, 2013).
4. Monte Carlo studies convincingly verified that F-test is extremely robust when analyzing Likert scale data and even analyzing such data selectively at the item level (Glass et al., 1972). Researchers on both sides argue with the logical reasoning however those who argue against the practice of parametric test for Likert scale responses base their argument on theoretical assumptions.

Thus compelling evidence objectively justifies the robustness of parametric statistics for the Likert data, even with small sample sizes and with non-normal distributions

Se även: Can Likert Scale Data ever be Continuous?

Vid egna tester på data fann jag att Pearson-korrelation och Spearman var förvånansvärt lika, trots att distributionen avvek en del från normalfördelning. I t ex SPSS finns ju lite extra tester att göra för att kolla normalitet, t ex Shapiro-Wilks och Kolmogorov-Smirnov.

Dessutom: Den danska studien har en 10-gradig skala, vilket jag tänker gör den mer "kvot- eller intervall-lik" än en traditionell ordinalskala såsom 5-gradig Likert-skala. Att korrelationerna är höga till extremt höga talar för att analysen av data är robust (såvida inte grova fel begåtts).

av JM » 2021-06-01 22:50

Maarten skrev:JM, jag är ingen statistiker men har läst en del i olika omgångar och dök ner i frågan om ordinal kontra kvotdata för ett antal år sedan då jag upplevde att man slarvade med detta i studier. Hursomhelst, en del av det jag kom fram till då följer nedan:

1: Spearman (korrelation), Wilcoxon, Kendall’s tau, M-W-U eller K-S vore bättre i de fall det är ordinaldata som ska analyseras (nog konsensus om det utifrån vad jag läst).
2: Parametriska tester funkar i praktiken ändå bra i många sammanhang ävenför ordinaldata. Se t ex "Analyzing and Interpreting Data From Likert-Type Scales":
In the medical education literature, there has been a longstanding controversy regarding whether ordinal data, converted to numbers, can be treated as interval data.2 That is, can means, standard deviations, and parametric statistics, which depend upon data that are normally distributed (F I G U R E 2), be used to analyze ordinal data? When conducting research, we measure data from a sample of the total population of interest, not from all members of the population. Parametric tests make assumptions about the underlying population from which the research data have been obtained—usually that these population data are normally distributed. Nonparametric tests do not make this assumption about the ‘‘shape’’ of the population from which the study data have been drawn. Nonparametric tests are less powerful than parametric tests and usually require a larger sample size (n value) to have the same power as parametric tests to find a difference between groups when a difference actually exists. Descriptive statistics, such as means and standard deviations, have unclear meanings when applied to Likert scale responses. For example, what does the average of ‘‘never’’ and ‘‘rarely’’ really mean? Does ‘‘rarely and a half’’ have a useful meaning?3 Furthermore, if responses are clustered at the high and low extremes, the mean may appear to be the neutral or middle response, but this may not fairly characterize the data.

...Fortunately, Dr. Geoff Norman, one of world’s leaders in medical education research methodology, has comprehensively reviewed this controversy. He provides compelling evidence, with actual examples using real and simulated data, that parametric tests not only can be used with ordinal data, such as data from Likert scales, but also that parametric tests are generally more robust than nonparametric tests. That is, parametric tests tend to give ‘‘the right answer’’ even when statistical assumptions— such as a normal distribution of data—are violated, even to an extreme degree.4 Thus, parametric tests are sufficiently robust to yield largely unbiased answers that are acceptably close to ‘‘the truth’’ when analyzing Likert scale responses.4

Ref 4: Norman G. Likert scales, levels of measurement and the ‘‘laws’’ of statistics. Adv Health Sci Educ Theory Pract. 2010;15(5):625–632.

Från Parametric tests for Likert scale: For and against
Several experts also argue that PT can be employed for Likert scale and they have also demonstrated this with research evidence. PT not only can be used with ordinal data, but they are generally more robust than nonparametric tests (Sullivan and Artino, 2013).
1. Research affirms the robustness of parametric test for Likert scale when analyzed as a scale that is a summed composite score, not individual items. But, scale should fulfill standard psychometric assessment (Carifio and Perla, 2008).
2. Standard t-tests and ANOVA depend on assumption of normal distribution of means, not of the data and Central limit theorem demonstrates that, for sample sizes greater than 5 or 10 per group, the means are approximately normally distributed regardless of the original distribution (Norman, 2010).
3. Data simulation studies demonstrated robustness of Pearson correlation for sample size from 5 to 60, for normal and rectangular distribution of ordinal data (Murray, 2013).
4. Monte Carlo studies convincingly verified that F-test is extremely robust when analyzing Likert scale data and even analyzing such data selectively at the item level (Glass et al., 1972). Researchers on both sides argue with the logical reasoning however those who argue against the practice of parametric test for Likert scale responses base their argument on theoretical assumptions.

Thus compelling evidence objectively justifies the robustness of parametric statistics for the Likert data, even with small sample sizes and with non-normal distributions

Se även: Can Likert Scale Data ever be Continuous?

Vid egna tester på data fann jag att Pearson-korrelation och Spearman var förvånansvärt lika, trots att distributionen avvek en del från normalfördelning. I t ex SPSS finns ju lite extra tester att göra för att kolla normalitet, t ex Shapiro-Wilks och Kolmogorov-Smirnov. t SPL

Dessutom: Den danska studien har en 10-gradig skala, vilket jag tänker gör den mer "kvot- eller intervall-lik" än en traditionell ordinalskala såsom 5-gradig Likert-skala. Att korrelationerna är höga till extremt höga talar för att analysen av data är robust (såvida inte grova fel begåtts).

Intressant att du menar att ordinaldata kan använda i parametriska test. Måste vara problem med små urval med få individer. Måste då finns en minimängd som krävs.
Med hörselskadade försökspersoner (lyssna på Floyd ovan) kan det inte hjälpa ens med 10 gradig skala.
I danskarnas fall skulle aldrig studien publicerats i ansedda psykologiska tidskrifter med deras fp urval. Studien gäller bara för de personer som var med i studien. Omöjligt att extrapolera resultaten med trovärdighet.

Vill jag se de försökspersoner som kan höra vid upprepade tillfällen att en visst ljud har exakt 1/4 så låg SPL relativt testtonen. Omöjligt som jag ser det.
Det är något lurt här.

Det är något här som inte stämmer! Det är här som Sone skalan falerar.
Misstänker starkt att ordinal data bara kan betraktas som kvotdata med extremt stora urval. I vissa större medicinstudier kan det möjligen fungera. Mängden försökspersoner som förekommer i vanliga lyssningstest räcker inte. Frestelsen att använda kvotdatans starkare statistik förför.

Använde faktiskt SPSS med ickeparametriska test redan i början av 1970-talet med åtskilliga konsumkassar fyllda med stansade Fortran kort.

JM

av **I-or** » 2021-06-02 10:58

Det vore märkligt om ett examensarbete publicerades i en vetenskaplig journal, oavsett område.

Sedan är det förstås precis så som Maarten beskriver ovan och som det är i de flesta statistiska sammanhang, att trots att man kan anföra diverse tveksamheter angående den matematiska styrkan i resonemangen, vilka här involverar en hög grad av subjektivitet, så fungerar det hela ganska väl i praktiken. Ett hyggligt träffsäkert svar är betydligt bättre än inget svar alls.

av JM » 2021-06-02 16:19

I-or skrev:Det vore märkligt om ett examensarbete publicerades i en vetenskaplig journal, oavsett område.

Sedan är det förstås precis så som Maarten beskriver ovan och som det är i de flesta statistiska sammanhang, att trots att man kan anföra diverse tveksamheter angående den matematiska styrkan i resonemangen, vilka här involverar en hög grad av subjektivitet, så fungerar det hela ganska väl i praktiken. Ett hyggligt träffsäkert svar är betydligt bättre än inget svar alls.

Systematiska fel kan smyga sig in och ge korrelationer utan relation till verkligheten.
Mätningar skall göras enligt datanivåns begränsningar. Fusk bara för att det är subjektiva mätningar är inte ok.
Stevens datanivåer är sannolikt inte bästa sättet att hantera subjektiva mätningar. Men ser inget bättre alternativ just nu. Här finns ett outforskat område.

JM

av **Maarten** » 2021-06-02 19:49

JM, ett sista försök, som jag skrev ovan,

Maarten skrev:...Fortunately, Dr. Geoff Norman, one of world’s leaders in medical education research methodology, has comprehensively reviewed this controversy. He provides compelling evidence, with actual examples using real and simulated data, that parametric tests not only can be used with ordinal data, such as data from Likert scales, but also that parametric tests are generally more robust than nonparametric tests. That is, parametric tests tend to give ‘‘the right answer’’ even when statistical assumptions— such as a normal distribution of data—are violated, even to an extreme degree. Thus, parametric tests are sufficiently robust to yield largely unbiased answers that are acceptably close to ‘‘the truth’’ when analyzing Likert scale responses.4

Thus compelling evidence objectively justifies the robustness of parametric statistics for the Likert data, even with small sample sizes and with non-normal distributions

Då kan du inte med seriositet skriva:

JM skrev:Intressant att du menar att ordinaldata kan använda i parametriska test. Måste vara problem med små urval med få individer. Måste då finns en minimängd som krävs.
…
Misstänker starkt att ordinal data bara kan betraktas som kvotdata med extremt stora urval. I vissa större medicinstudier kan det möjligen fungera. Mängden försökspersoner som förekommer i vanliga lyssningstest räcker inte. Frestelsen att använda kvotdatans starkare statistik förför.

Nu undrar jag varför du skriver två svepande inlägg som inte tar hänsyn till det du citerade? Kritik är ju såklart viktigt men den måste vara vederhäftig, saklig och välmenande.
Jag vet inte hur jag ska tolka dina svar och jag undrar varför du skriver som du gör? Jag funderar om det är följande som inverkar, vilket inte är ovanligt fenomen som kan hända många:

Maarten skrev:Jag funderar över om många sådana här diskussioner på faktiskt hamnar lite i djävulens advokat-spåret, "tänk om"-tankar, där allt eller inget har betydelse och nyanser såväl som proportioner förloras, vilket inte sällan lägger krokben för det man vill uppnå?

Bara för att andra läsare inte ska förledas av det du skrev i ovan citat, gjorde jag helt enkelt ett mycket enkelt test och det påvisar minimala skillnader ifall data i den danska studien hade hanterats som ordinaldata avseende korrelationer, i detta fall typ ca 3%.

: Pearson_vs_Spearman-THD-rating.png (89.44 KiB) Visad 1462 gånger

Not: Korrelationen r skiljer sig något mot bilden till höger då jag inte hade tillgång till orginaldata. Men emuleringen kommer klart nära och det har hursomhelst ingen betydelse för jämförelse mellan Pearson (kvotdata) och Spearman (ordinaldata) korrelationer.

Jag håller heller inte med om följande;

JM skrev:I danskarnas fall skulle aldrig studien publicerats i ansedda psykologiska tidskrifter med deras fp urval. Studien gäller bara för de personer som var med i studien. Omöjligt att extrapolera resultaten med trovärdighet.

Förmodligen skulle det finnas krav på mer deskriptiv data och större urval hade varit bra, liksom lite andra nivåer av distorsion, men min upplevelse är att mindre vederhäftiga saker har publicerats i ansedda psykologiska likväl som medicinska tidskrifter, om än kanske inte vanligt. Den danska studien är i mina ögon långtifrån dålig, trots att den är examensarbete.

Men framförallt, det är sällan man uppnår så stora korrelationer och såvida inte grova fel begåtts, vill jag mena att resultatet är robust.

Till sist för att knyta tillbaka till trådens ämne; THD har sin plats för att utvärdera prestanda (om än inte den mest exakta kvantifieringen).

Over & out.

av **Almen** » 2021-06-03 08:31

Tack för det, Maarten, mycket intressant inlägg.

av **goat76** » 2021-06-04 00:37

Såg färdigt intervjun igår, hade glömt bort att jag inte hade sett den färdigt.

Toole efterlyser lyssningstester och främst blindtester hos AudioScienceReview och hos intervjuarens egna sida Erin's Audio Corner, han menar att deras mätningar täcker upp det mesta men att lyssningstester ändå behövs för att verifiera mätningarna som gjorts.

Jag håller helt klart med, Amir gör extremt knapphändiga lyssningstester och ibland inte alls då han skyller på att sakerna måste lämnas tillbaka eller att de är för tunga att bära...

För övrigt brinner han inte längre lika mycket för mätningar, han tar till sig konsten istället och ljudet är egentligen av sekundär natur.
Klok herre, man kan inte sitta och pilla på allt och analysera ljudet hela tiden, musik är en konstform som när den är som bäst bryter igenom det mesta.

av **MacBruce** » 2021-06-04 01:06

goat76 skrev:Såg färdigt intervjun igår, hade glömt bort att jag inte hade sett den färdigt.

Toole efterlyser lyssningstester och främst blindtester hos AudioScienceReview och hos intervjuarens egna sida Erin's Audio Corner, han menar att deras mätningar täcker upp det mesta men att lyssningstester ändå behövs för att verifiera mätningarna som gjorts.

Jag håller helt klart med, Amir gör extremt knapphändiga lyssningstester och ibland inte alls då han skyller på att sakerna måste lämnas tillbaka eller att de är för tunga att bära...

För övrigt brinner han inte längre lika mycket för mätningar, han tar till sig konsten istället och ljudet är egentligen av sekundär natur.
Klok herre, man kan inte sitta och pilla på allt och analysera ljudet hela tiden, musik är en konstform som när den är som bäst bryter igenom det mesta.

Håller med "i huvudsak" men - när tekniken t.ex ruinerar betydelsebärande klanger, kan man inte bortse från det i första taget.

av **goat76** » 2021-06-04 01:31

MacBruce skrev:
goat76 skrev:Såg färdigt intervjun igår, hade glömt bort att jag inte hade sett den färdigt.

Toole efterlyser lyssningstester och främst blindtester hos AudioScienceReview och hos intervjuarens egna sida Erin's Audio Corner, han menar att deras mätningar täcker upp det mesta men att lyssningstester ändå behövs för att verifiera mätningarna som gjorts.

Jag håller helt klart med, Amir gör extremt knapphändiga lyssningstester och ibland inte alls då han skyller på att sakerna måste lämnas tillbaka eller att de är för tunga att bära...

För övrigt brinner han inte längre lika mycket för mätningar, han tar till sig konsten istället och ljudet är egentligen av sekundär natur.
Klok herre, man kan inte sitta och pilla på allt och analysera ljudet hela tiden, musik är en konstform som när den är som bäst bryter igenom det mesta.

Håller med "i huvudsak" men - när tekniken t.ex ruinerar betydelsebärande klanger, kan man inte bortse från det i första taget.

Är du missnöjd med de betydelsebärande klangerna i ditt eget ljudsystem?

av **MacBruce** » 2021-06-04 12:10

goat76 skrev:
MacBruce skrev:
goat76 skrev:Såg färdigt intervjun igår, hade glömt bort att jag inte hade sett den färdigt.

Toole efterlyser lyssningstester och främst blindtester hos AudioScienceReview och hos intervjuarens egna sida Erin's Audio Corner, han menar att deras mätningar täcker upp det mesta men att lyssningstester ändå behövs för att verifiera mätningarna som gjorts.

Jag håller helt klart med, Amir gör extremt knapphändiga lyssningstester och ibland inte alls då han skyller på att sakerna måste lämnas tillbaka eller att de är för tunga att bära...

För övrigt brinner han inte längre lika mycket för mätningar, han tar till sig konsten istället och ljudet är egentligen av sekundär natur.
Klok herre, man kan inte sitta och pilla på allt och analysera ljudet hela tiden, musik är en konstform som när den är som bäst bryter igenom det mesta.

Håller med "i huvudsak" men - när tekniken t.ex ruinerar betydelsebärande klanger, kan man inte bortse från det i första taget.

Är du missnöjd med de betydelsebärande klangerna i ditt eget ljudsystem?

Du vet ju inte vad för sorts "ljudsystem" jag har, så du kan inte veta hur "rolig" den frågan är. :-)

av **Maarten** » 2021-06-04 22:31

Almen skrev:Tack för det, Maarten, mycket intressant inlägg.

Tack Almen!

goat76 skrev:Toole efterlyser lyssningstester och främst blindtester hos AudioScienceReview

BT är basal hygien om man ska dra några omdömen om skillnaderna är små. Är de stora och uppenbara så är BT kanske inte lika viktigt. Dock är det här även viktigt med ankare i form av någon referens.

goat76 skrev:För övrigt brinner han (Floyd) inte längre lika mycket för mätningar, han tar till sig konsten istället och ljudet är egentligen av sekundär natur.
Klok herre, man kan inte sitta och pilla på allt och analysera ljudet hela tiden, musik är en konstform som när den är som bäst bryter igenom det mesta.

Jag skulle vilja lägga till att lyssnarens receptivitet är viktigt. Har själv erfarenhet av hur detta kan påverka upplevelsen.
Sen är denna fråga återigen inte svart eller vit. Mätningar har sin plats. Inte sällan är de överlägsna lyssningsintryck med en precision och upplösning som sinnena inte har.
Dvs, reliabiliteten är ofta avsevärt högre i mätningar. Validiteten kan diskuteras.

Och håller också med om detta:

MacBruce skrev:Håller med "i huvudsak" men - när tekniken t.ex ruinerar betydelsebärande klanger, kan man inte bortse från det i första taget.

Frånvaro av t ex distorsion ökar ju sannolikt möjligheten till god upplevelse (och minskar risk för störningar i upplevelse). Förmodligen dock olika känslighet mellan lyssnare i enlighet med andra inlägg och tester.

av **Maarten** » 2022-04-07 08:16

Tangband skrev:
music4ever skrev:Harman kör väl deras lyssningstest även i mono med en högtalare, vill jag minnas?

Ja, det kan vara en brist helt klart.

Även om de skulle köra blindtester med 2 stereohögtalare så skulle den bli kraftigt missvisande eftersom olika högtalare kräver olika placeringar med avseende på avstånd mellan dem. Om de ska optimeras.

Jag ser därför hela den testmetodiken där man jämför blint, som en ren salespoint för Harmans produkter.

Med det sagt, -det ligger mycket i detta som Toole säger om bra direktivitet och jämn frekvensgång . Det är något som gör skillnad till det bättre.

Råkade springa på detta inlägg av Toole, som besvarar frågor som varit uppe i en del trådar (bla denna tråd) och som har rätt stora implikationer för utvärdering av högtalare:

The short answer, summarized in Figure7.14 is that monophonic tests yielded the strongest opinions and the clearest differentiation among test loudspeakers. Ratings and rankings in stereo were so influenced by spatial cues in the recordings that listeners ended up having essentially no opinion, averaged across all types of recordings. However, when ratings were separated according to music type, each type yielded different results, but the statistical scatter was so great that they generated little confidence. Except for popular music. That result was almost identical to the monophonic results. Why? Because such recordings are substantially mono: mono left (hard panned), mono right (hard panned) and double-mono for all amplitude panned phantom images between the speakers, including the featured artist. Most pop music and jazz has much less uncorrelated information (between left and right channels) than the classical repertoire where hall sound is strong.

So, the decision to employ monophonic listening tests was not a goal, but a result of exploring the options. When blind listening in mono, it is often noted that the highest rated loudspeakers "disappear" behind the screen - they do not draw attention to themselves.

Over the years a number of mono vs. stereo tests have been done, mostly to satisfy skeptics that mono tests don't overlook important sound quality factors. All have yielded the same rankings, but the statistical confidence is much higher in mono. Looking back, it is clear that the best of today's loudspeakers are much better than those in the original test (e.g. Figure 12.1) so it is essential to maximize the ability of listeners to discern small differences; hence the basic reliance on mono tests.

av **Kraniet** » 2022-04-07 08:53

Erin la ut en video om det där "mäter lika men låter annorlunda"
Han menar att det aldrig är så att två högtalare "mäter lika".
Men skulle man ha två högtalare som faktiskt mäter lika så kommer de låta likadant.

https://youtu.be/sps8mc-snQU

av **goat76** » 2022-04-07 11:52

Japp, att testa en ensam högtalare i mono kan man ju göra ifall man helt vill utesluta en för vissa enormt viktig faktor i valet mellan olika stereohögtalare. För mig utgör den spatiala kvaliten säkert upp emot 25% varför jag föredrar ett högtalarpar före ett annat, för någon annan lyssnare kan den aspekten säkert utgöra en ännu större del i varför han förerar en viss högtalare före en annan.

Jag har lite frågor om de påståenden Toole kommer med.

The short answer, summarized in Figure7.14 is that monophonic tests yielded the strongest opinions and the clearest differentiation among test loudspeakers. Ratings and rankings in stereo were so influenced by spatial cues in the recordings that listeners ended up having essentially no opinion, averaged across all types of recordings.

Först vill jag ställa mig frågande till om högtalarna i de tester som gjorts i stereo verkligen hade placerats individuellt på bästa möjliga sätt, detta skiljer sig i väsentlig grad mellan olika modeller av högtalare och hur deras spridning är. Alla de högtalare jag haft i mitt nuvarande lyssningsrum har alla fått helt skilda positioneringar för bästa möjliga återgivning, exempelvis vad gäller att hitta tydlig balans för basåtergivningen (avstånd från vägg), avstånd mellan högtalarna för att de på bästa vis ska "sammarbeta" fram en distinkt och tydlig fantomcenter, och finjustering av invinkling för återgivningen av de högre frekvenserna för att hitta en önskvärd balans till övriga register. Det hela handlar om en räcka kompromisser för att hitta bästa möjliga "total" där lyssningsrummets atributer har en avgörande roll.
En viktig punkt av de ovanstående aspekterna gäller naturligtvis även för en ensam högtalare i mono, hur skulle exempelvis högtalare av märket Ino eller Carlsson bedömmas i dessa tester, högtalare som är tänkt att få ett visst basstöd genom nära placering till väggen bakom? Att döma av de bilder jag sett från diverse tester hos Harman så tar de absolut ingen hänsyn till ett tänkt lyssningsrum eller om högtalarna är designade för olika placeringar i ett rum.

Ratings and rankings in stereo were so influenced by spatial cues in the recordings that listeners ended up having essentially no opinion, averaged across all types of recordings.

However, when ratings were separated according to music type, each type yielded different results, but the statistical scatter was so great that they generated little confidence. Except for popular music. That result was almost identical to the monophonic results. Why? Because such recordings are substantially mono: mono left (hard panned), mono right (hard panned) and double-mono for all amplitude panned phantom images between the speakers, including the featured artist. Most pop music and jazz has much less uncorrelated information (between left and right channels) than the classical repertoire where hall sound is strong.

Det enkla svaret på det påståendet är att olika högtalare är olika bra på olika aspekter av ljudåtergivningen. En viss högtalare kan ha en bättre tonal balans än en annan men samtidigt uppvisa en högre distorsion och/eller ett helt annat spridningsmönster som kanske inte återger den spatiella informationen lika bra i en stereouppställning. Vilka av dessa aspekter som är de viktigaste för olika lyssnare kommer naturligtvis skilja sig åt individuellt och kommer därmed värderas olika beroende på vad som spelas. Om deltagarna sätts att rangordna högtalarna efter vilken av dessa som vid monolyssning låter bäst för exempelvis en "torr"/icke spatiell inspelning (där främst den tonala aspekten bedöms) så är det inte speciellt konstigt ifall lyssnaren kan föredra en viss högtalare före en annan för just den aspekten. Men om samma lyssnare istället får höra helheten av en inspelning gjord för stereoåtergivning, så kommer personen få ta del av en mer komplett bild av hur högtalarna presterar när det kommer till den spatiella återgivningen och därmed möjligtvis föredra en annan högtalare än den personen föredrog vis monolyssning. Vilken av högtalarna individen totalt föredrar kommer därmed bero mycket på vilka aspekter av ljudåtergivningen personen värderar högst.

So, the decision to employ monophonic listening tests was not a goal, but a result of exploring the options. When blind listening in mono, it is often noted that the highest rated loudspeakers "disappear" behind the screen - they do not draw attention to themselves.

Over the years a number of mono vs. stereo tests have been done, mostly to satisfy skeptics that mono tests don't overlook important sound quality factors. All have yielded the same rankings, but the statistical confidence is much higher in mono. Looking back, it is clear that the best of today's loudspeakers are much better than those in the original test (e.g. Figure 12.1) so it is essential to maximize the ability of listeners to discern small differences; hence the basic reliance on mono tests.

Vid lyssning i mono är det väl mycket möjligt att de flesta lyssnare föredrar en högtalare med mer diffus återgivning och ett visst spridningsmönster, men vad säger det om hur ett högtalarpar tillsammans presenterar den spatiella informationen, förutsatt en omsorgsfull och nogrann placerad stereouppställning. Finns det ens något som indikerar att Harman någonsin utfört lyssningstester i stereo där de olika högtalarmodellerna fått en individuell och omsorgsfull placering för att de två högtalarna "sammankopplat" ska kunnat presterat som allra bäst, vid uppspelning i stereo?

Jag är inte imponerad av deras automatiserade system där högtalare testas från samma punkt i rummet, utan vare sig individuell anpassning till en bakre vägg eller möjligheten till optimal individuell placering i stereoupsställning för olika högtalarkonstruktioner. Hur skulle exempelvis Peters ägghögtalarer stå sig i ett Harman-test?

För mig förefaller det så att Harman har ett testresultat man vill uppnå, och sedan har testerna utformats för att uppnå just de önskade resultaten. Jag tycker alldeles för många tar deras tester med hull och hår utan att kritiskt granska hur grunderna för deras tester faktiskt ser ut. Sen tycker jag Toole ofta ”bakar in” lite svepande slutsatser i sina texter som han inte alls redovisar för på ett ingående sätt, vi förväntas ofta bara ta hans ord för hur genomsnittet av hans tester sammanställts. Som sagt, fallerar grunderna i testerna med icke optimala individuella placeringar av högtalarna så fallerar hela testresultatet. Det man kan konstatera är iallafall att testutförandet passar Harmans egna konstruktioner alldeles ypperligt.

Lång intervju med Dr Floyd Toole

Re: Lång intervju med Dr Floyd Toole

Re: Lång intervju med Dr Floyd Toole

Re: Lång intervju med Dr Floyd Toole

Re: Lång intervju med Dr Floyd Toole

Re: Lång intervju med Dr Floyd Toole

Re: Lång intervju med Dr Floyd Toole

Re: Lång intervju med Dr Floyd Toole

Re: Lång intervju med Dr Floyd Toole

Re: Lång intervju med Dr Floyd Toole

Re: Lång intervju med Dr Floyd Toole

Re: Lång intervju med Dr Floyd Toole

Re: Lång intervju med Dr Floyd Toole

Re: Lång intervju med Dr Floyd Toole

Re: Lång intervju med Dr Floyd Toole

Re: Lång intervju med Dr Floyd Toole

Re: Lång intervju med Dr Floyd Toole