Bij het studeren van een cursus gevorderde statistiek was iets me al niet helemaal duidelijk bij het eerste hoofdstuk. Ze hebben het hier over de verdeling van steekproefgrootheden en de centrale limietstelling.
De eigenschap wordt aangehaald dat de standaardafwijking van de kansverdeling van het steekproefgemiddelde gelijk is aan (de standaardafwijking van de populatie waaruit de steekproef wordt genomen / wortel uit de grootte van de steekproef). Indien n groot genoeg is, zal de kansverdeling van x bar bij benadering normaal zijn en zal bovengenoemde formule de standaardafwijking weergeven die de normale verdeling kenmerkt.
Nu vroeg ik me af: wanneer men 1000 steekproeven neemt van grootte 10, mag de CLS dan toegepast worden? De steekproefomvang is immers maar 10? En waarom vul je dan 10 in in de formule voor de standaardfout en niet 1000? Je gaat toch van elke steekproef het gemiddelde gaan berekenen en de standaardfout van de steekproefgrootheid lijkt me dan de afwijking te zijn van elk van deze waarnemingen ( de 1000 steekproefgemiddelden ) tot het populatiegemiddelde ( het gemiddelde dat je vindt over de 1000 steekproeven dan ook?).
Ik hoop dat jullie me kunnen vertellen of ik in de goede richting ben aan het denken.Statistiek
29-5-2019
In de boeken wordt vaak aangegeven dat wanneer een steekproefgrootte 'voldoende' groot is, dat dan de CLS toegepast mag worden als men het gemiddelde berekent. Vaak wordt hier aangegeven dat men n = 30 of meer moet hebben voor een 'mooie' normale distributie. In jouw geval met een steekproefgrootte van 10 zal dit bij benadering geen 'mooie' normale verdeling opleveren.
Dat je de steekproef 1000 keer uitvoert heeft niets te maken met de verwachtingswaarde en de standaardafwijking van één enkele steekproef. Die blijft hetzelfde en is inderdaad te berekenen zoals jij schrijft, delen door de wortel van de steekproefgrootte. Je berekent niet het gemiddelde van deze 1000 gemiddeldes, je voert een steekproef uit, berekent het gemiddelde, en deze uitkomst zet je apart. Dit doe je nog 999 keer en als je al die gemiddeldes bij elkaar zet in een histogram zal dit er uit gaan zien als een normale verdeling.
Hopelijk kun je hier iets mee, succes!
ks
3-6-2019
#88128 - Kansverdelingen - Student universiteit