Det har för övrigt inte så mycket med hur kraften alstras att göra, som det har med vad som belastar och möjliggör för en ljudvåg att skapar och låta ljudeffekt lämna högtalaren.
En normal elektrostat arbetar, på grund av sitt i förhållande till våglängden stora membran, över större delen av sitt frekvensområdet med en nästan reell belastning. Därför är membranrörelsen, mätt i m/s, praktiskt taget frekvensoberoende, medan membranutslaget ökar med 6 dB per oktav nedåt i frekvens (i regel ännu mera i basområdet, eftersom man oftast har en kraftig resonans där för att kompensera utslääckningen från bakvågen). Det fenomen som i huvuddelen av frekvensområdet bestämmer membranrörelsen är den resistiva (akustiskt) belastningen på membranet som luften utgör.
[Att känsliheten trots detta är så dålig beror på den måttiga andelen verklig effekt som högtalarens med sin kraftigt reaktiva elektriska impedans förmår absorbera från förstärkaren.]
Denna resistiva akustiska last får till följd att när membranmassan börjar bli signifikant i förhållande till medsvängande luftens massa (=när våglängden blir kort) så når man systemets övre gränsfrekvens.

I en elektrostathögtalare strävar man därför alltid efter en membranmassa som är så låg som det bara är möjligt, och helst skall den vara så låg att den är försumbar. Det är alltså bara utanför arbetsområdet som man har en massastyrd känslighet i en välkonstruerad elektrostathögtalare.
En normal dynamisk högtalare (med flera element för olika register) är tvärtom väldig rektivt belastad (akustiskt), och membranrörelsen SKALL därför vara massastyrd för att erhålla rimligt rak tonkurva. Det beror på att membranen i huvudsak är små i förhållande till genererad våglängd. Massastyrd membranrörelse betyder att membranrörelsens hastighet får en proportionalitet som ser ut enligt: v = k/f
Vad får detta då för konsekvenser?
Jo, om man vibrerar ett elektrostatmembran med en sinuston, och har en rörelsedistorsion (hastighetens avvikelse från en perfekt sinuston) på 0,08%, så kommer högtalarens distorsion att bli just dessa 0,08%.
Gör man detsamma med en konhögtalare så kommer emellertid den harmoniska distorsionen (den akustiskt mätbara alltså) till följd av den deriverande lasten från luften, att bli väsentligt högre än så!
Hur mycket högre den blir avgörs av vilken distorsionsöverton som dominerar. Är det andratonen som dominerar blir den 6 dB starkare (0,16%), är det tredjetonen så blir det 9,54 dB mer, alltså 0,24%, och sen blir det mer för varje överton uppåt man går.
Nu kan man fråga sig vad allt detta har med det tidigare resonemanget att göra?
Jo, det som i praktiken (vid musiklyssning) bestämmer "hörbara orenheten" är en kombination av alla distorsionsfenomen, THD är bara en enda mätmetod, en otolkbar dessutom (ur en THD-mätning framgår ju inte ens vilken karaktär distorsionen har!) och det intressanta för hörbarheten är i regel snarare de intrinsiska olinjäriteternas storlek än en otolkbar THD-siffra.
Den allra västa distorsionsmekanismen, i synnerhet vid höga frekvenser är nedblandaning av skillnadskomponenter (den nedåtgående halvan av uppstådd intermodulationsdistorsion) - och nu kommer själva grejjen:
Dessa blir typiskt mycket värre i elektrostathögtalare än i dynamiska, av skäl som framgår (hoppas jag) ovan.
Man bör därför ställa avsevärt mycket högre krav på låg distorsion (THD) för elektrostathögtalare (och alla andra stormembrankonstruktioner) än på dynamiska högtalare. Om en stormembranhögtalare skall låta lika subjektivt rent som en dynamisk måste den typiskt ha 1/10 av distorsionen, det vill säga lika låg THD som en bättre förstärkare.
Som tur är, så är faktiskt elektrostathögtalare ofta mycket lågdistorderande

, så frågan är - har de tillräckligt mycket lägre THD för att låta lika rena som de bästa dynamiska högtalarna?