Steekproefverdeling
Klopt de volgende redenering? Stel dat we een EAS nemen uit een populatie jongeren (waarvan we b.v. weten dat 30% rookt) en dat we de steekproefgrootheid X = “aantal jongeren die roken” bekijken, dan is X in theorie binomiaal verdeeld met n = de steekproefomvang en p=0,30? In ons handboek staat dat de populatie minstens 10 keer zo groot als de steekproef moet zijn, is dat om de afhankelijkheid te "benaderen", om van een binomiale verdeling te kunnen spreken? Ik zou zeggen hoe groter n, hoe meer binomiaal (wet van de grote aantallen), klopt dat ook? Als dan np≥10 en nq≥10 (vuistregel), dan kan X benaderd worden door de normale verdeling met parameters μ=np en σ=√npq?
Odile
3de graad ASO - zaterdag 14 juli 2018
Antwoord
Hallo Odille, X is alleen binomiaal verdeeld als de kans op succes (hier: iemand aantreffen die rookt) constant is. In dit geval betekent dit: wanneer je iemand hebt aangetroffen die rookt (p=0,3 dat dit gebeurt), dan moet voor elke volgende persoon de kans opnieuw 0,3 zijn dat deze rookt. Dit is alleen het geval wanneer de steekproef de samenstelling van de populatie niet beïnvloedt. Stel je eens voor dat jouw populatie bestaat uit slechts 10 personen, waarvan 3 roken. De kans dat je een roker treft, is 3/10 (=0,3). De kans dat de volgende persoon opnieuw een roker is, is dan 2/9. De kans op succes is niet constant. Wanneer je populatie groot is ten opzichte van de omvang van je steekproef, dan is deze beïnvloeding verwaarloosbaar. Wanneer je 10 personen uit een groep van 10000 haalt, dan is het percentage rokers niet noemenswaardig veranderd, zelfs als al die 10 personen zouden roken. Kennelijk hanteert jouw handboek als vuistregel dat de populatie minstens 10 keer zo groot is als de steekproefomvang. Je kunt ook zeggen: voor je steekproef mag je niet meer dan 1/10 deel 'uit de populatie halen' om de samenstelling van de populatie niet te veel te beïnvloeden. Jouw uitspraak 'hoe groter n, hoe meer binomiaal' is niet juist. Wanneer je drie keer gooit met een dobbelsteen, dan is het aantal keer 'zes ogen' netjes binomiaal verdeeld met n=3 en p=1/6. Wellicht verwar je dit met de betrouwbaarheid waarmee je de kans op succes kunt vaststellen. In dit voorbeeld zijn de mogelijke uitkomsten 0, 1, 2 of 3 keer 'zes ogen', dit zou een schatting opleveren van de kans op succes van 0, 1/3, 2/3 of 1. Niet zo'n beste schatting, we weten dat in dit geval p=1/6. Wanneer we vaker gooien (grotere n), dan zal het aantal getelde worpen van 6 ogen een betere schatting van de werkelijke kans op zes ogen opleveren. Tot slot: bij toenemende n kan een binomiale verdeling steeds beter worden benaderd met een normale verdeling. Wanneer de kans p op succes in de buurt van 0,5 ligt, dan lukt dit bij een kleinere waarde van n dan wanneer p dicht bij 0 ligt (en q dus dicht bij 1) of andersom (p dicht bij 1 en q dicht bij 0). Dit komt tot uitdrukking in de vuistregels np$\ge$10 en nq$\ge$10. Bij heel kleine waarde van p of q moet n groter zijn om het product boven de 10 te krijgen.
zaterdag 14 juli 2018
©2001-2024 WisFaq
|