Ik doe voor mijn afstudeeronderzoek een klantentevredenheidsonderzoek. Punt is echter dat de populatie uit ruim 40000 klanten bestaat. Hoe krijg ik hier een betrouwbare en nauwkeurige steekproef uit?? Ik ben op zoek naar een steekproef met 95% betrouwbaarheid en 5% nauwkeurigheid.
Ik heb wel enkele formule's gevonden, o.a. uit Methoden en Toepassingen van de Pelsmacker maar daar wordt ik niet echt wijzer van.
Daarnaast heb ik nog een andere vraag: D.m.v. correlatie wil ik de factoren die van het grootste belang zijn voor de tevredenheid van de klant te weten komen. Ik ga er van uit dat ik een bivariate Pearson correlation moet gebruiken in SPSS, kan iemand mij vertellen of die juist is?? Bij voorbaat dank, Groeten
Arie
Student hbo - dinsdag 17 september 2002
Antwoord
Beste Arie,
De berekening van de steekproefomvang hangt ook af van het type vraag wat je wilt beantwoorden. Als je op zoek bent naar een percentage dan kun je als volgt te werk gaan:
noteer d=0.05 (de nauwkeurigheid); t=1.96 (de t-score van een t-verdeling die hoort bij 95 %) en N=40.000 de populatieomvang.
In dat geval moet je steekproefomvang n minstens gelijk zijn als: n = (t·t /(4·d·d)) / (1 + (1/N)·((t·t/(4·d·d))-1).
Een nauwkeurigere formule is ook mogelijk als je weet waar het percentage in de buurt ligt. Bij bovenstaande formule is uitgegaan van het slechtste geval: percentage in de buurt van de 50 %. Aan de formule kun je al zien dat de invloed van N, de populatieomvang, wegvalt als N heel erg groot is.
Als het goed is moet je uiteindelijk op een getal komen wat net iets minder is als 405. Dat laatste is namelijk de steekproefomvang die je nodig hebt bij een oneindige grote steekproef met 5 % nauwkeurigheid en 95 % betrouwbaarheid.
Antwoord op je tweede vraag: als je de tevredenheid van de klant gemeten hebt m.b.v. van een of andere score zodanig dat je dus kan spreken van een continue meting en het andere kenmerk is ook enigzins continu dan kun je inderdaad de Pearson correlatie gebruiken. En dan alle kenmerken aflopen. Als je meerdere kenmerken hebt is het beter om een regressiemodel te gebruiken met alle kenmerken in een keer erin (niet te veel natuurlijk). Dan zul je zien dat een aantal kenmerken die wel een hoge correlatie hebben met de klanttevredenheid uiteindelijk in het regressiemodel niet meer zo belangrijk zijn voor de klanttevredenheid doordat er op dat moment voor andere kenmerken gecorrigeerd is.