Standaardfout
Beste,
We hebben een continue variabele getransformeerd in een categorische variabelen met 5 klassen. Nu staat er dat je moet opletten dat er genoeg waarnemingen in elke klasse zijn, omdat anders je standaardfout te groot kan uitvallen en dat heeft gevolgen voor de significantietoetsen. Hoe bereken je dan deze standaardfout op basis van categorische variabelen? En hoe bereken je de standaardfout van dummy-regressie met 3 onafhankelijke (zowel dummy als continue) variabelen?
Alvast bedankt!
Amy
Student universiteit België - maandag 29 mei 2017
Antwoord
Hallo, Amy. Een vraag tegelijk, graag. Stel, bijvoorbeeld, dat de categorische variabele Y uit de continue variabele X wordt afgeleid als volgt: voor zekere positieve getallen a,b,c,d,e is Y = 1 als 0 $\le$ X $<$ a, Y = 2 als a $\le$ X $<$ b, Y = 3 als c $\le$ X $<$ d, Y = 4 als d $\le$ X $<$ e, Y = 5 als e $\le$ X. Bij waarnemingen xi, 1 $\le$ i $\le$ n, horen dus evenveel waarnemingen yi, maar dit is afhankelijk van de keuze van a,b,c,d,e. Een goede schatter van de standaarddeviatie van Y is de wortel uit ((de som van (yi-y¯)2) gedeeld door n-1), waarbij y¯ het gemiddelde der yi is. Maar als je a,b,c,d,e zo kiest dat er te weinig waarnemingen yi in de buurt van y¯ liggen, zullen de standaarddeviatie en de standaardfout te groot uitvallen. Voor de definities: zie wikipedia onder standard error.
woensdag 31 mei 2017
©2001-2024 WisFaq
|