Waarom zit er verschil tussen de formules voor de standaarddeviatie bij een populatie en een bij steekproef: Hoe verklaar je die n-1?
Bob
Leerling bovenbouw havo-vwo - donderdag 28 november 2002
Antwoord
In Moore & McCabe' boek 'Statistiek in de Praktijk' staat een mooi antwoord op deze vraag:
'Als de variantie gelijk is aan het gemiddelde van de gekwadrateerde afwijkingen van de waarnemingen t.o.v. hun gemiddelde, waarom bepalen we dat gemiddelde door te delen door n-1 en niet door n?'
Het antwoord luidt vervolgens:
'Aangezien de som van de afwijkingen xi-m steeds 0 oplevert, kan de laatste afwijking gevonden worden uit de eerste n-1. We berekenen dus niet het gemiddelde van n getallen zonder verwantschap. Slecht n-1 van de gekwadrateerde afwijkingen kunnen vrij bewegen, daarom berekenen we het gemiddelde door het totaal te delen door n-1. Het getal n-1 noemt men het aantal vrijheidsgraden van de variantie of van de standaardafwijking.'
In een ander statistiekboek spreekt men in dit verband ook wel van biased en unbiased. Als je door n zou delen zou je voor de standaarddeviatie van de steekproef als schatter voor de standaarddeviatie van de populatie systematisch een afwijking krijgen. Doordat je deelt door n-1 gebeurt dat niet...