WisFaq!

\require{AMSmath} geprint op vrijdag 22 november 2024

Standaardfout

Beste,

We hebben een continue variabele getransformeerd in een categorische variabelen met 5 klassen. Nu staat er dat je moet opletten dat er genoeg waarnemingen in elke klasse zijn, omdat anders je standaardfout te groot kan uitvallen en dat heeft gevolgen voor de significantietoetsen. Hoe bereken je dan deze standaardfout op basis van categorische variabelen? En hoe bereken je de standaardfout van dummy-regressie met 3 onafhankelijke (zowel dummy als continue) variabelen?

Alvast bedankt!

Amy
29-5-2017

Antwoord

Hallo, Amy.
Een vraag tegelijk, graag.
Stel, bijvoorbeeld, dat de categorische variabele Y uit de continue variabele X wordt afgeleid als volgt:
voor zekere positieve getallen a,b,c,d,e is
Y = 1 als 0 $\le$ X $<$ a,
Y = 2 als a $\le$ X $<$ b,
Y = 3 als c $\le$ X $<$ d,
Y = 4 als d $\le$ X $<$ e,
Y = 5 als e $\le$ X.
Bij waarnemingen xi, 1 $\le$ i $\le$ n, horen dus evenveel waarnemingen yi, maar dit is afhankelijk van de keuze van a,b,c,d,e.
Een goede schatter van de standaarddeviatie van Y is de wortel uit ((de som van (yi-y¯)2) gedeeld door n-1), waarbij y¯ het gemiddelde der yi is.
Maar als je a,b,c,d,e zo kiest dat er te weinig waarnemingen yi in de buurt van y¯ liggen, zullen de standaarddeviatie en de standaardfout te groot uitvallen.
Voor de definities: zie wikipedia onder standard error.

hr
31-5-2017


© 2001-2024 WisFaq
WisFaq - de digitale vraagbaak voor het wiskunde onderwijs - http://www.wisfaq.nl

#84520 - Statistiek - Student universiteit België