Het wordt me stilletjes aan duidelijk allemaal... Hopelijk vat ik het nu goed samen: Een steekproefverdeling is dus altijd binomiaal verdeeld als de steekproefgrootte niet meer dan 1/10 van de populatie is en dan is die dus eventueel te benaderen door een normale verdeling als np=10 en nq=10 (vuistregel). Als de steekproefgrootte te groot is in verhouding met de populatie, dan is de steekproefverdeling hypergeometrisch verdeeld. En als de normale benadering niet werkt, bestaat er ook nog zoiets als de Poissonverdeling heb ik gelezen (maar moet ik niet kennen). Bestaan er dan ook hypergeometrische hypothesetoetsen of wordt dat niet gedaan? Is een hypergeometrische verdeling onder bepaalde voorwaarden ook weer te benaderen door een normale verdeling? Héél erg bedankt!OPA
18-7-2018
Hallo Odile,
Laat ik proberen het een en ander in de juiste volgorde te plaatsen. Ik zal me beperken tot steekproeven waarbij het gaat om een proportie: en zeker deel van de populatie heeft een bepaald kenmerk (dit noemen we succes), het andere deel niet (=mislukt). Bijvoorbeeld:Je moet dan onderscheid maken tussen kansexperimenten 'met terugleggen' en 'zonder terugleggen'. Bij de eerste twee voorbeelden is sprake van 'zonder terugleggen': je gaat niet twee keer aan dezelfde leerling vragen of deze een voldoende heeft of niet. Wanneer je een leerling met een voldoende hebt aangetroffen, zoek je de volgende leerling in het overgebleven deel van de populatie. De eerste leerling 'leg je niet terug' in de populatie. Omdat in het overgebleven deel van de populatie één leerling ontbreekt, is de samenstelling niet meer hetzelfde. De kans op succes is niet constant. In zo'n situatie is het aantal successen hypergeometrisch verdeeld.
- Welk deel van de leerlingen heeft een voldoende voor een toets (voldoende = succes, onvoldoende = mislukt)?
- Welk deel van de verkochte auto's heeft binnen een jaar een reparatie nodig (reparatie nodig = succes, geen reparatie nodig = mislukt)?
- Welk deel van de worpen met een dobbelsteen levert 6 ogen op (6 ogen = succes, ander aantal ogen = mislukt)?
Bij de auto's geldt hetzelfde: elke auto kan maar één keer in je steekproef voorkomen. Een auto 'leg je niet terug', het aantal successen is hypergeometrisch verdeeld.
Bij de dobbelsteen is sprake van 'met terugleggen': wanneer je toevallig 6 ogen hebt gegooid, kan je de volgende keer net zo goed weer 6 ogen gooien. Het is alsof je de uitkomst '6 ogen' weer terug legt in de populatie. De kans op succes blijft constant. In situaties 'met terugleggen' is het aantal keer succes binomiaal verdeeld.
Wanneer je te maken hebt met een binomiale verdeling met grote aantallen en waarbij de kans op succes niet te dicht bij 0 of 1 ligt, dan kan je deze benaderen met een normale verdeling. Je hebt enkele vuistregels geleerd die je vertellen of je deze benadering mag toepassen of niet.
Wanneer je te maken hebt met een hypergeometrische verdeling, maar de populatie is zo groot dat bij elke waarneming de kans op succes nagenoeg constant blijft, dan kan je deze verdeling benaderen met een binomiale verdeling. Bijvoorbeeld: wanneer je weet dat 80% van de leerlingen uit jouw klas een voldoende heeft, en je vraagt aan 10 leerlingen of deze een voldoende hebben (=succes), dan is het aantal successen hypergeometrisch verdeeld. Wanneer je weet dat 80% van alle examenleerlingen in het land geslaagd is (=succes), en je vraagt aan 10 examenleerlingen of deze geslaagd zijn, dan is het aantal successen in theorie hypergeometrisch verdeeld. Maar 10 leerlingen is zo weinig ten opzichte van de gehele populatie, dat we de kans op succes wel als constant kunnen beschouwen. Dan mag je de uitkomst benaderen met een binomiale verdeling.
In het geval dat je een hypergeometrische verdeling mag benaderen met een binomiale verdeling, en je voldoet aan de vuistregels voor benadering met de normale verdeling, dan mag dat.
Tot slot statistische toetsen: ja, ik kan best een 'hypergeometrische hypothesetoets' verzinnen. Stel je een partij van 200 lampen voor. De leverancier beweert dat minimaal 95% (dus 190 lampen) goed functioneert. Ik besluit 15 lampen te testen.
Wanneer daadwerkelijk 190 lampen functioneren, dan is het aantal goede lampen in een steekproef van 15 hypergeometrisch verdeeld. De kans dat ik maximaal 12 goede lampen tref, is slechts 0,03:
Die kans is zo klein dat ik bij 12 of minder goede lampen aanneem dat in werkelijkheid minder dan 95% van de lampen goed is. Ik verwerp de hypothese van de leverancier.
De kans dat ik maximaal 13 goede lampen aantref, is 0,17 (vul maar in: k=13). Deze kans is nog steeds wel klein, maar groter dan de vaak gebruikte 0,05. De kans dat dit resultaat gevolg is van louter toeval is te groot om de hypothese van de leverancier te verwerpen.
GHvD
19-7-2018
#86578 - Statistiek - 3de graad ASO