\require{AMSmath}
WisFaq - de digitale vraagbaak voor wiskunde en wiskunde onderwijs


Printen

Analyses en missing values

Hallo,

Ik ben heb een afstudeerscriptie geschreven en heb daarbij een enquete gedaan onder woningzoekenden in Veenendaal.

In totaal heb ik 745 respondenten van de 2600 woningzoekenden in Veenendaal. Ik gebruik SPSS 11.5.

Nu heb ik een probleem: Bij verschillende vragen heb ik ontbrekende antwoorden: missing values dus. Het zijn er nogal wat, want als ik listwise alles weglaat houd ik er zo'n 290 over die alles hebben ingevuld.

Nu heb ik al gelezen dat je eventueel schattingen in kan vullen maar ik heb veel antwoorden met als respons 1,2,3,4,5 en dan is 1 zeer goed enzovoorts. Kan je dus geen mooie Mean mee berekenen.

Verder heb ik ergens een opdracht gezien waarbij men gewoon wel gewoon alle respondenten mee neemt, ondanks eventuele missing values bij bepaalde variabelen.
Daarbij vermeldde men bij de tabel de totale steekproefgrootte n, en zette men onder de tabel de percentages missing values met als noot dat van zoveel procent de gegevens ontbreken.

Mijn vraag is: Is laatste oplossing verantwoord als je meerdere tabellen met frequentieverdelingen en kruistabellen maakt?? Als je dus gewoon vermeld: deze kruistabel gaat over 500 respondenten want van de rest waren gegevens niet bekend? Of is er een betere oplossing?

Hopelijk weet u een antwoord want mijn scriptie moet al bijna ingeleverd !

Alvast bedankt

Corinn
Student universiteit - maandag 9 augustus 2004

Antwoord

Beste Corinne,

Op zich kun je gewoon van die kruistabellen/frequentieverdelingen maken over de wel-bekende gegevens en daarbij dan vermelden hoeveel er ontbrekend waren. Je zou evt. ook nog bij de kruistabellen een extra categorie kunnen toevoegen in de tabel: "ontbrekend".
MAAR: belangrijker is je af te vragen of het toeval is dat mensen bepaalde vragen niet invullen of dat dat samenhangt met bepaalde kenmerken die je wel of niet ook in je vragenlijst hebt zitten. Stel bijv. een van de vragen was wat het besteedbaar inkomen is; Mensen zijn gauw geneigd om dat niet te willen beantwoorden, zeker naarmate het inkomen hoger is. Dan heb je te maken met selectieve uitval en dat kan de uitkomsten in je kruistabellen beinvloeden. Volkomen willekeurige uitval is niet erg en wat je dan ook voor oplossing verzint dat zal je resultaten niet echt veranderen (of je neemt alleen de beschikbare gegevens of je vult de ontbrekende waarden in, je krijgt dan alleen onderschattingen van standaard deviaties, wel correcte schattingen van gemiddelden). Maar bij selectieve uitval dan voldoen deze methoden niet meer. In dat geval moet je multipele imputatie toepassen (www.multiple-imputation.com). Helaas zit dat niet standaard in SPSS en is het niet eenvoudig om dat zomaar te doen.

Succes met de afronding van je scriptie,

Martijn

mg
dinsdag 10 augustus 2004

©2001-2024 WisFaq