Verschillende modellen voor een trekking 2 uit 100
Ik wil 100 maal een getal van 00 tot 99 aselect trekken met teruglegging. Een getal kan dus minimaal 0 en maximaal 100 keer getrokken worden. Ik heb drie methoden bedacht.
Methode 1: ik heb een bak met 10.000 ballen, 100 ballen van elk nummer 00 t/m 99. Ik trek 100 ballen uit de bak, zonder teruglegging.
Methode 2: ik heb een bak met 100 ballen genummerd 00 t/m 99. Ik trek 100 ballen met teruglegging.
Methode 3. Ik heb een bak met 10 ballen genummerd 00 t/m 10. Ik trek 10 ballen met teruglegging, deze 10 getallen vormen de 10-tallen voor de trekkingsgetallen, oftewel de x- coördinaten in een 10x10 matrix. Dan trek ik nogmaals 10 ballen met teruglegging, deze getallen vormen de 10 verschillende eenheden behorend bij elk 10-tal, oftewel de y-coórdinaten in een 10x10 matrix. De x-coördinaten vormen de 10-tallen, de y-coördinaten de eenheden.
De kans dat het eerste getal 52 is, is bij elke methode 1/100. De kans dat het tweede getal 52 is, is bij methode 1: 99/9.999 methode 2: 1/100 methode 3: 1/10 x 1/10= 1/100 De kans dat 52 meteen als eerste tweemaal achter elkaar wordt getrokken is: methode 1: 100/10.000 x 99/9.999 = 0,000099099 methode 2: 1/100 x 1/100 = 0,0001 methode 3: 1/10 x 1/10 x 1/10 = 0,001 (x1,y1) en (x2,y1). Kennelijk gaan methode 1 en 3 mank als het gaat om de PLAATS -kans t.o.v. elkaar. Zijn deze methodes echter wel gelijkwaardig als het gaat om de AANTAL-kans dat een getal een getrokken wordt? Is bijvoorbeeld de kans dat 52 4x getrokken wordt even groot bij elke methode? Ik kom er niet uit om hier een kansboom voor op te zetten.
Erwin
Iets anders - dinsdag 23 juli 2013
Antwoord
Dag Erwin,
Bij slechts 1 bal trekken, maakt het niks uit of het 'met of zonder terugleggen' is. Dat wordt pas belangrijk zodra je inderdaad meerdere trekkingen gaat doen.
Om die eerste bal te trekken (dus eigenlijk die ene bal) zijn de methodes gelijk. Dus die kans is inderdaad bij alle methoden gelijk aan 1/100 dat de eerste bal een specifiek nummer is. Daarna ga je kijken naar meerdere trekkingen en daar merk je verschillen op.
Ik wil eerst even een correctie op methode 3 toepassen, want die klopt niet zoals je beschrijft. Je hebt 10 ballen, 0 t/m 9 (niet t/m 10). Daaruit wil je twee keer een trekking doen met terugleggen, die samen het gewenste resultaat van een tiental en een eenheid vormen. Wil je nu de kans bepalen dat je meteen twee keer achter elkaar 52 hebt, dan zul je dus 4 trekkingen moeten doen en wel 5 - 2 - 5 - 2. Die kans daarop is dan (1/10)4 = 0,0001 en dat is dan wel gelijk aan methode 2.
Methode 2 en 3 zijn in ieder geval gelijk. Of je nu willekeurig een 10-tal en een eenheid kiest, dat is het zelfde als dat je willekeurig een 2-cijferig getal kiest. Methode 2 en 3 is de willekeurigheid (is dat een woord?) bij iedere trekking weer opnieuw even groot. Het is immers met teruglegging, dus je gaat altijd weer terug naar de beginsituatie. De inhoud van de bakken blijft steeds gelijk.
De afwijking zit bij methode 1. De situatie wordt daar na iedere trekking anders. Als er eenmaal een balletje 52 is uitgehaald, dan wordt de kans op nog een 52 eenvoudigweg kleiner, terwijl die kans bij methode 2 en 3 steeds gelijk blijft. Die afwijking is echter klein.
Ze zeggen ook wel eens dat je trekkingen zonder terugleggen uit een populatie vanaf een bepaalde grootte, kunt benaderen als trekkingen met teruglegging.
Stel je bijvoorbeeld 10.000 ballen van elk nummer 00 t/m 99 hebt (dus 1.000.000 ballen in totaal) en je trekt daar 100 ballen uit en je berekent de kansen vervolgens daadwerkelijk volgens een experiment zonder terugleggen, dan zul je zien dat die afwijkingen zo verwaarloosbaar klein worden. Had je hem net zo goed 'eenvoudig' als experiment met teruglegging kunnen benaderen.
Dus methode 2 en 3 zijn gelijk en methode 1 is afwijkend (als je niet gaat benaderen volgens met teruglegging)
Dus 100 getallen trekken en de kans dat daar 4 keer de 52 tussen zit: