Re: Hoe moet ik de verschiltoets voor gemiddelden toepassen?
Hoe komt u aan de formule voor de standaarddeviatie van de verschilvariabele? Oftewel: waarom geldt var(v)=var(gemiddelde 1-eiig) + var(gemiddelde 2-eiig). Waarom de variantie van de groepsgemiddelden optellen als schatting voor de verschilvariabele?
Jan
Leerling mbo - zondag 4 juni 2023
Antwoord
Hallo Jan,
Wellicht vraag je je af waarom je bij een verschilvariabele de varianties moet optellen en niet aftrekken. Om dat te begrijpen, bedenken we eerst waarom je bij een somvariabele S=X+Y varianties moet optellen. Beide variabelen X en Y kunnen variëren. Dan kan het voorkomen dat een waarde van X die toevallig wat groot is, gecombineerd wordt met een waarde van Y die toevallig ook wat groot is. Het resultaat S ligt dan verder van het gemiddelde dan bij X of Y afzonderlijk. Met twee kleine waarden van X en Y krijg je een som die aan de andere kant verder van het gemiddelde af ligt dan bij X of Y afzonderlijk. Ofwel: de spreiding (variantie) van de som S is groter dan de variantie van X of Y alleen.
Nu bij een verschilvariabele V=X-Y. Wellicht zou je denken dat je varianties zou moeten aftrekken, maar dat is toch niet logisch: stel dat de varianties van X en Y gelijk zijn. Dan zou de variantie van het verschil nul moeten zijn, ofwel: het verschil moet constant zijn. Dat kan alleen wanneer bij een grote waarde van X steeds een grote waarde van Y hoort, en bij een kleine waarde van X ook een kleine waarde van Y. Bij onafhankelijke variabelen X en Y kan dat nooit zo het geval zijn. Hoe zit het dan wel? Bij een verschilvariabele kan het zijn dat een grote waarde van X 'toevallig' wordt gecombineerd met een kleine waarde van Y. In dat geval krijg je een 'extra groot' verschil V, dit ligt ook weer verder van het gemiddelde dan bij X of Y afzonderlijk. Hetzelfde geldt bij de combinatie van een kleine waarde van X met een grote waarde van Y. Dan is het verschil V 'extra klein'. Dus ook bij het verschil V van twee stochastische variabelen X en Y wordt de variantie groter dan bij de variabelen X en Y afzonderlijk. Je telt varianties dan op.
Het kan ook zijn dat je je afvraagt waarom je varianties 'zomaar' mag optellen. Waarom tel je bijvoorbeeld net de standaarddeviaties op? Dat volgt uit de formulebrij wanneer je de definitie van de variantie bekijkt. Als je wilt weten hoe uit de definitie van de variantie volgt dat de variantie van een som- of verschilvariabele de som is van de afzonderlijke varianties, kijk dan maar eens op hhofstede.nl: Stochasten optellen, en dan op de button bewijs.