Waarom zit er verschil tussen de formules voor de standaarddeviatie bij een populatie en een bij steekproef: Hoe verklaar je die n-1?Bob
28-11-2002
In Moore & McCabe' boek 'Statistiek in de Praktijk' staat een mooi antwoord op deze vraag:'Als de variantie gelijk is aan het gemiddelde van de gekwadrateerde afwijkingen van de waarnemingen t.o.v. hun gemiddelde, waarom bepalen we dat gemiddelde door te delen door n-1 en niet door n?'Het antwoord luidt vervolgens:'Aangezien de som van de afwijkingen xi-m steeds 0 oplevert, kan de laatste afwijking gevonden worden uit de eerste n-1. We berekenen dus niet het gemiddelde van n getallen zonder verwantschap. Slecht n-1 van de gekwadrateerde afwijkingen kunnen vrij bewegen, daarom berekenen we het gemiddelde door het totaal te delen door n-1. Het getal n-1 noemt men het aantal vrijheidsgraden van de variantie of van de standaardafwijking.'In een ander statistiekboek spreekt men in dit verband ook wel van biased en unbiased. Als je door n zou delen zou je voor de standaarddeviatie van de steekproef als schatter voor de standaarddeviatie van de populatie systematisch een afwijking krijgen. Doordat je deelt door n-1 gebeurt dat niet...
WvR
1-12-2002
#1112 - Statistiek - Leerling bovenbouw havo-vwo