Ik heb een dataset met 9500 incidenten. De data heeft een rechts-scheve verdeling. Per incident is aangegeven in hoeveel dagen het incident is afgehandeld.
De dataset beschouw ik als de populatie. Hieruit kan ik dus de standaardafwijking aflezen.
Ik wil toetsen of de incidenten gemiddeld wel binnen de afgesproken tijd worden afgehandeld. De hypothese is als volgt:
H0: u $\ge$ 20 H1: u $<$ 20
Stel dat ik een aselecte steekproef doe van 300 incidenten. Omdat mijn populatie een rechts-scheve verdeling heeft zal mijn steekproef waarschijnlijk ook rechts-scheef zijn.
Mag ik zoals de centrale limietstelling beschrijft aannemen dat de steekproef bij benadering normaal verdeeld is omdat mijn steekproef van voldoende grootte is en dat ik daardoor gebruik kan maken van de z-test om mijn hypothese te toetsen?
Benjam
Student hbo - woensdag 29 april 2020
Antwoord
Zeker. De verdeling van de oorspronkelijke waarnemingen kan dan wel scheef zijn. Het gaat bij het toetsen om de verdelinging die bij het gemiddelde past. En dat is volgens de CLS normaal verdeeld, zeker met die n=300
Maar wat nog beter is is van die 9500 gewoon het gemiddelde uitrekenen, als dat toch al in een dataset staat, dan moet dat niet zo moeilijk zijn.