Bedankt voor uw snelle reactie. Ik zal proberen wat specifieker te zijn: Wij hebben twee datasets en om te kijken of er een significant verschil tussen deze twee sets bestaat moeten wij de kans berekenen dat het gemiddelde van set 2 voorkomt in de normale verdeling van set 1. Ik heb van de gegevens al een normaalkromme gemaakt. Ik hoop dat u nu voldoende informatie heeft om mij te helpen. Groet, Koen
Koen K
Leerling bovenbouw havo-vwo - donderdag 27 oktober 2016
Antwoord
Hallo Koen,
Een normaal verdeelde variabele kan alle waarden aannemen tussen min-oneindig en plus-oneindig (geen enkele grootheid is dus exact normaal verdeeld, in opgaven lees je dan ook altijd 'bij benadering normaal verdeeld'). De kans dat het gemiddelde van set 2 ergens voorkomt in de normale verdeling van set 1 is dus 100%! Om het nog verwarrender te maken: de kans dat je een waarneming doet bij set 1 die precies gelijk is aan een bepaalde waarde (zoals het gemiddelde van set 2) is weer 0. Bijvoorbeeld: stel dat de lengte van Nederlanders bij benadering normaal verdeeld is. De kans dat je een man treft die precies 182 cm lang is, is nul. Immers, wanneer je maar nauwkeurig genoeg meet, is een man van 182 cm lang toch wel enkele micrometers langer of korter, of desnoods enkele nanometers. Een lengte van exact 182 cm bestaat gewoon niet. Pas wanneer je twee grenzen kiest, kan je een kans berekenen dat een waarneming tussen die grenzen ligt.
Nu terug naar jouw vraag. Het kan zijn dat deze vraag een didactische reden heeft: jou laten inzien dat je nooit met 100% betrouwbaarheid kunt vaststellen of er een verschil is of niet. Er is immers altijd een kans dat er in werkelijkheid een verschil is, maar dat een steekproef wat ongelukkig uitvalt waardoor je denkt dat er geen verschil is (of andersom). Dan geeft mijn tekst hierboven hierover wat uitleg.
Wanneer de gevraagde kansberekening werkelijk een stap is in de richting van de conclusie 'wel of geen significant verschil', dan denk ik dat je niet helemaal op de goede weg zit. In dat geval zou een betere vraag zijn hoe groot de kans is dat je in set 1 een waarneming zou vinden ter grootte van het gemiddelde van set 2 of nog verder weg.
Kortom, ik zou toch nog meer over jouw opdracht moeten weten om je verder te helpen.