De steekproefomvang heb ik berekend voor mijn onderzoek. Deze dient voor mij n = 1,65^2 * 50^2 / 5^2 = 273 personen te zijn. Ik heb 282 vragenlijsten terug gekregen en om de representativiteit te controleren heb ik naar de variabelen bedrijfsgrootte en sector gekeken. Hierbij heeft een chi-kwadraat toetst uitgewezen dat op beide punten mijn onderzoek niet representatief is. Zie onderstaand stuk.
Ik mag de resultaten dus niet op de populatie projecteren. De lezer informeer ik hier vooraf duidelijk over. Is het echter mogelijk om toch uitspraken te doen voor het gehele ledenbestand maar dan met een correctie? Indien ik de chi-kwadraat niet mag toepassen is er dan een andere methode om de representativiteit te controleren. Ik hoop dat iemand me kan helpen want ik zit nu behoorlijk vast
Bedrijfsgrootte
Nulhypothese: De verdeling naar bedrijfsgrootte binnen het marktonderzoek is een afspiegeling van het ledenbestand. Alternatieve hypothese: De verdeling naar sector binnen het marktonderzoek is geen afspiegeling van het ledenbestand.
Bedrijfsgrootte
Oi
Ei
Oi - Ei
(Oi – Ei)2
(Oi – Ei)2 / Ei
50 werknemers
144
155
-11
121
0,78
50 – 200 werknemers
89
73
16
256
3,51
200 werknemers
39
44
-5
25
0,57
Totaal
4,86
Het vergelijken van de waargenomen (observed) en de theoretische (expected) frequenties geschiedt hier op 3 posities. De onderstaande formule wijst dan uit dat we werken met 2 vrijheidsgraden.
Vrijheidsgraden = n (aantal klassen) – 1
De berekening van de toetsingsgrootheid chi-kwadraat leverde de waarde van 4,86 op. Bij een betrouwbaarheid van 90% vertelt de statistiek ons dat het kritieke gebied ligt op 4,61 en hier voorbij. Onze berekende waarde valt hier binnen waardoor de nulhypothese verworpen mag worden.
Sector
Nulhypothese: De verdeling naar sector binnen het marktonderzoek is een afspiegeling van het ledenbestand. Alternatieve hypothese: De verdeling naar sector binnen het marktonderzoek is geen afspiegeling van het ledenbestand.
Sector
Oi
Ei
Oi - Ei
(Oi – Ei)2
(Oi – Ei)2 / Ei
Dienstverlening
129
92
37
1369
14,88
Zorg
7
11
-4
16
1,45
Bouw
20
28
-8
64
2,29
Groothandel
27
41
-14
196
4,78
Overig
16
14
2
4
0,29
Industrie
83
92
-9
81
0,88
Totaal
24,57
Het vergelijken van de waargenomen (observed) en de theoretische (expected) frequenties geschiedt hier op 6 posities (er zijn immers 6 sectoren aanwezig) De onderstaande formule wijst dan uit dat we werken met 5 vrijheidsgraden.
Vrijheidsgraden = n (aantal klassen) – 1
De berekening van de toetsingsgrootheid chi-kwadraat leverde de waarde van 24,57 op. Bij een betrouwbaarheid van 90% vertelt de statistiek ons dat het kritieke gebied ligt op 9,24 en hier voorbij. Onze berekende waarde valt hier buiten waardoor de nulhypothese verworpen mag worden.
Henk D
Student hbo - woensdag 10 november 2004
Antwoord
In het eerste geval is het nauwelijks significant. Zelf zou ik het wel noemen maar daar in dit geval niet voor corrigeren. Wanneer je met SPSS werkt kun je er voor kiezen om bij uitspraken over alle sectoren gezamelijk te werken met een correctie voor de niet-representativiteit. Met SPSS kan dat met het commando WEIGHT. Hiertoe maak je een gewichtsvariabele aan die afhankelijk van de sector een waarde meekrijgt. Bij sector zorg zou je 11 in plaats van 7 willen hebben. De bijbehorende gewichtswaarde is dan 11/7. Wanneer je aan een commando nu WEIGHT by Gewicht meegeeft wordt automatisch gecorrigeerd.