\require{AMSmath}
WisFaq - de digitale vraagbaak voor wiskunde en wiskunde onderwijs


Printen

Steekproefgrootte

Voor mijn stage ga ik een enquête houden.

Deze wordt gehouden onder drie doelgroepen:

o Doelgroep 1: totaal 795 personen
o Doelgroep 2: totaal 89 personen
o Doelgroep 3: 32.508 personen, opgebouwd uit de subgroepen van 11.660; 13.080 en 7.768 personen.

Echter heb ik (gezien mijn geringe wiskundige kennis) geen idee hoe ik hier de steekproefgrootte moet gaan berekenen. Ik wil voor mijn onderzoek een betrouwbaarheid van 95 % en een onnauwkeurigheid van 2,5 % hanteren.

Maartj
Student hbo - maandag 2 februari 2004

Antwoord

Dat ligt eraan wat je wilt.
Je hebt drie doelgroepen met totaal verschillende grootten:
o Doelgroep 1: totaal 795 personen
o Doelgroep 2: totaal 89 personen
o Doelgroep 3: 32.508 personen, opgebouwd uit de subgroepen van 11.660; 13.080 en 7.768 personen.

Die doelgroep 3 is het probleem niet. Het probleen zit in het feit dat doelgroep 1 en 2 klein tot zeer klein zijn in vergelijking tot doelgroep 3. Nu moet je jezelf de vraag stellen wat eigenlijk de bedoeling van je onderzoek is.
Wil je voornamelijk iets over de hele populatie zeggen, waarbij alle doelgroepen voor jezelf even belangrijk zijn, dan kun je gewoon een aselecte steekproef trekken.
Is het de bedoeling om over elk van de doelgroepen apart uitspraken te doen en/of de doelgroepen met elkaar te vergelijken, dan moet je een disproportioneel gestratificeerde steekproef nemen. Concreet: in doelgroep 1 en 2 iedereen benaderen. En in doelgroep 3 een aselecte steekproef nemen die zorgt voor een respons van pakweg 250.

Lees even het volgende stuk over disproportioneel stratificeren afkomstig uit het door mij geschreven dictaat steekproefonderzoek.

Er zijn situaties waar je bewust een gestratificeerde steekproef trekt die niet representatief zal zijn. Zo’n steekproef is bijvoorbeeld een disproportioneel gestratificeerde steekproef. Het woord disproportioneel betekent letterlijk: niet in verhouding. Waarom je dit zou doen zullen we uitleggen aan de hand van een voorbeeld, dat overigens in de praktijk behoorlijk vaak voorkomt.
Voorbeeld
Een bedrijf wil een klanttevredenheidsonderzoek laten uitvoeren. De klanten van het bedrijf bestaan uit twee categorieën.
Categorie A: de belangrijke klanten met een hoge omzet per klant.
Categorie B: de minder belangrijke klanten met een lagere omzet per klant.
Nu bevinden er 1000 zich in categorie A, categorie B bevat 9000 klanten.
Het bedrijf wil met dit klanttevredenheidsonderzoek drie onderzoeksvragen beantwoord zien:
1) Hoe staat het met de tevredenheid van de klanten in beide categorieën afzonderlijk?
2) Verschilt de beoordeling van de service van het bedrijf bij klanten uit categorie A en klanten uit categorie B?
3) Wat is de mening van alle klanten over de telefonische bereikbaarheid van het bedrijf?
Dit zijn drie verschillende soorten onderzoeksvragen. Bij vraag 1) moet je conclusies trekken over elke categorie (stratum) apart. Vraag 2) betekent dat je de tevredenheid in twee categorieën met elkaar gaat vergelijken. Bij vraag 3) moet je een uitspraak doen over beide categorieën gezamenlijk.
Wanneer je nu een representatieve steekproef van 400 klanten zou trekken dan betekent dat dat je 40 klanten uit categorie A en 360 klanten uit categorie B trekt. Hiermee kan onderzoeksvraag 3) perfect beantwoord worden. Bij het beantwoorden van vraag 1) en 2) echter zal het zo zijn dat door de kleine steekproef van 40 in categorie A de uitspraken over categorie A niet erg nauwkeurig zullen zijn (zie ook hoofdstuk 2). Dat is des te vervelender als je bedenkt dat bij dit soort onderzoeken aan de mening van de grote klanten vaak de meeste waarde gehecht wordt.
Het alternatief is om de steekproef bewust niet in verhouding van de grootte van de strata te nemen. Je zou bijvoorbeeld kunnen besluiten om 200 klanten uit categorie A te ondervragen en 200 klanten uit categorie B. Het gevolg van deze keuze is:
- De steekproef is niet representatief naar het type klant (A of B).
- Uitspraken over klanten uit categorie A (onderzoeksvraag 1)) alsmede het vergelijken van de tevredenheid in de categorieën (onderzoeksvraag 2)) kun je veel nauwkeuriger doen. Uitspraken over categorie B alleen zullen nauwelijks aan nauwkeurigheid verliezen.
- Uitspraken over de hele groep klanten (A en B samen) zijn nu niet meer zonder meer te geven omdat de steekproef niet representatief is.
Het laatste probleem valt op te lossen door de uitspraken te herwegen. Met dit herwegen zorg je ervoor dat de herwogen antwoorden beschouwd kunnen worden als representatief voor de hele populatie.
Dat doe je als volgt. In de steekproef zijn de grote bedrijven oververtegen-woordigd: je hebt er 200 terwijl je voor representativiteit en maar 40 nodig had. Bij het herwegen voorzie je nu de betreffende antwoorden van een wegingsfactor 40/200. De kleine bedrijven zijn ondervertegenwoordigd: 200 in plaats van de voor representativiteit benodigde 360. Koppel daarom nu aan de betreffende antwoorden een wegingsfactor van 360/200.
Let op: het herwegen gebeurt alleen op het moment dat je uitspraken over de gehele populatie wil gaan doen. Op dit herwegen komen we in het hoofdstuk over chi-kwadraattoetsen nog terug. Ook met SPSS kan dit herwegen met niet al te veel moeite uitgevoerd worden.


Met vriendelijke groet

JaDeX


donderdag 5 februari 2004

©2001-2024 WisFaq