Hoort dit niet √SD(X)2-SD(Y)2 te zijn? Waarom is het plus?
Daisy
Leerling bovenbouw havo-vwo - donderdag 21 januari 2021
Antwoord
Hallo Daisy,
Het plus-teken in de formule SD(X-Y)=√(SD(X)2+(SD(X)2) is correct. Dit is te begrijpen aan de hand van het volgende voorbeeld:
Stel dat de lengte van Nederlanders (X) en Belgen (Y) normaal verdeeld is met hetzelfde gemiddelde en dezelfde standaarddeviatie. We kiezen steeds willekeurig een Nederlander en een Belg en we bepalen het lengteverschil X-Y van dit koppel. De gemiddelde waarde van X-Y is nul: we zullen net zo vaak een langere Nederlander met een kortere Belg als andersom, gemiddeld komt dit verschil uit op nul.
De formule SD(X-Y)=√(SD(X)2-(SD(X)2) zou ook nul opleveren (immers: SD(X)=SD(Y)). Dat kan alleen als alle gevonden verschillen X-Y gelijk zijn aan nul, ofwel: in elk koppel is de Nederlander even lang als de Belg. Bij willekeurig gekozen koppels kan dit niet het geval zijn, dus deze formule is zeker onjuist.
In werkelijkheid dragen SD(X) en SD(Y) beide bij aan SD(X-Y). Immers, we zullen wel eens een lange Nederlander vinden met een korte Belg. Dit levert een grote positieve waarde op voor (X-Y). Andersom geldt ook: een korte Nederlander met een lange Belg levert een sterk negatieve waarde op voor (X-Y). Als SD(X) zou toenemen, dus meer variatie in lengte van Nederlanders, dan neemt de variatie van (X-Y) ook toe. Aan eenzelfde Belg kunnen langere en kortere Nederlanders worden gekoppeld, dus SD(X-Y) neemt toe. Andersom ook: Als SD(Y) zou toenemen, dus meer variatie in lengte van Belgen, dan neemt de variatie van (X-Y) opnieuw toe. Aan eenzelfde Nederlander kunnen langere en kortere Belgen worden gekoppeld, dus SD(X-Y) neemt opnieuw toe.
Conclusie: zowel SD(X) ans SD(Y) hebben een positieve invloed op SD(X-Y), vandaar het plus-teken in de formule voor SD(X-Y).