De digitale vraagbaak voor het wiskundeonderwijs

home |  vandaag |  gisteren |  bijzonder |  prikbord |  gastenboek |  wie is wie? |  contact

HOME

samengevat
vragen bekijken
een vraag stellen
hulpjes
zoeken
FAQ's
links
twitter
boeken
help

inloggen

colofon

  \require{AMSmath}

Steekproeven

Een bewegend deeltje

Een deeltje beweegt zich willekeurig langs een lijn. Dat wil zeggen dat het deeltje begint in de oorsprong, positie 0, en beweegt met onafhankelijke stappen van lengte 1 naar links of rechts. De waarschijnlijkheid dat het deeltje naar rechts gaat is bij elke stap gelijk aan 0,75. Zij Xp de discrete stochastische variabele die aangeeft of het deeltje bij de i-de stap naar rechts (Xp= 1), dan wel naar links (Xp=-1) gaat.

Bekijk de sv Yk die de positie van het deeltje aangeeft na k stappen.
  • Hoe kan je Yk beschrijven in functie van de sv Xp?
  • Bereken vervolgens benaderend de kans dat het deeltje na 500 stappen op zijn minst 200 posities naar rechts is beland.
Hoe kan ik hieraan beginnen? Ik wou beginnen met het toepassen van de centrale limietstelling maar ik weet niet of dit kan.

elke
2-4-2021

Antwoord

Printen
Even voor de beeldvorming:

Totaal 500 stappen. Zij k het aantal stappen naar rechts dan is het aantal stappen naar links 500-k.
Nu moet gelden 1·k + -1·(500-k) $\ge$ 200.
Laat zelf zien dat dan k $\ge$ 350

Nu moet dus het aantal stappen naar rechts op 500 stappen minstens 350 zijn. Je hebt dan voor k een binomiale verdeling met p=0,75 en n=500. Hieruit moet je berekenen P(k$\ge$350).

Zo kan je daar het beste aan beginnen. Overigens geeft de centrale limietstelling geen oplossing van dit probleem. Die zegt namelijk wat anders.

Met vriendelijke groet
JaDeX

jadex
2-4-2021


Re: Een bewegend deeltje

Klopt het dat dit 0,001585 moet zijn? Of is het misschien 0,0064. Ik ben niet zeker want ik heb dit berekend met mijn GRM door de functie binompdf en binomcdf te gebruiken, maar ik weet het verschil niet echt...

In mijn oplossingen daarentegen staat er P(Y$\ge$ 200)= 0,9951. Ik heb dit dan geprobeerd door toch de CLS toe te passen maar dan is mijn uitkomst 1. Ik weet niet echt waar mijn fout ligt. Ik heb mijn berekening doorgestuurd via email...

elke
2-4-2021

Antwoord

Printen
Je moet binomcdf nemen, die c staat voor cumulatief en dat is precies wat je nodig hebt.

Maar wacht even binomcdf werkt met $\le$ kansen en jij zoekt P (K$\ge$350)

Dan reken je dus eerst uit P(K$\le$349) ofwel commando binomcdf(500, 0.75, 349) = 0.0049
Jouw kans wordt het complement = 1-0,0049 = 0,9951

Met vriendelijke groet
JaDeX

jadex
2-4-2021


Re: Re: Een bewegend deeltje

Oei, maar waarom pak je nu 349 en niet 350? Heeft dit te maken met de continuïteitscorrectie?

elke
2-4-2021

Antwoord

Printen
Nee dat heeft niets met continuïteitscorrectie te maken, maar wel met discrete variabelen. P(K$\ge$350) bestaat uit de kans op uitkomsten 350, 351, 352 ...... of 500. Het complement daarvan zijn de uitkomsten 0,1, ......... 347, 348, 349 dus complement is P(K$\le$349) en dat gaat bij discrete variabelen altijd op die manier.

Die continuïteitscorrectie komt pas later wanneer je de kans normaal zou willen benaderen. Dan wordt P(K$\le$349)= P(X$\le$349,5) =
P(Z$\le$((349,5-375)/√93,75) = 0,00422

Die continuiteitscorrctie zit dus bij het benaderen van een binomiale verdeling door een normale verdeling bij die 349,5

Dus dat gaat ook maar binomcdf(500, 0.75, 349) is beter en simpeler.

Met vriendelijke groet
JaDeX

jadex
2-4-2021


Enquete

In een enquête van een instituut werden 1006 aselect gekozen volwassenen de vraag gesteld wat volgens hen het ideale aantal kinderen in een gezin is. Bijna de helft van de respondenten, 49%, noemde 2 kinderen ideaal. Neem aan dat p = 0,49 voor deze populatie van volwassenen de exacte waarde is.

Het instituut gaf voor deze enquete een foutenmarge van +-3% aan. Hoe groot is de kans dat de steekproefproportie $\widehat p$ voor een EAS met n = 1006 ligt tussen 0,46 en 0,52 (Binnen het 3 procentpunt van de echte p?)

De uitkomst zou 94,26% zijn. ik heb gevonden (als het juist is) $\widehat p$-N(0,49 ; 0,0004969)

Alleen weet ik niet hoe ik dit moet uitrekenen door de 3% waarmee ik (mogelijks) rekening mee moet houden.

elke
3-4-2021

Antwoord

Printen
Hallo Elke,

Wanneer je uit een populatie met populatieproportie p steekproeven trekt met lengte n, dan zullen steekproefproporties $\widehat p$ normaal verdeeld zijn met als gemiddelde waarde $\mu$=p en standaardafwijking $\sigma$=√(p(1-p)/n) (zie ook gemiddelde en standaardafwijking van een proportie.

In dit geval dus:

$\widehat p$gemiddeld = 0,49
$\sigma$ = √(0,49(1-0,49)/1006) = 0,01576

De vraag is dus: hoe groot is de kans dat een waarneming van een normaal verdeelde variabele met $\mu$=0,49 en $\sigma$=0,01576 ligt tussen 0,46 en 0,52?

Je kunt dit berekenen met behulp van je grafische rekenmachine, een tabel of met dit hulpje:
Vul in de hokjes links onder de waarden 0.46 en 0.52 in, klik op de pijl naar rechts voor het resultaat.

Ik vind als kans 0,9430 ofwel 94,30%. Het verschil met het modelantwoord zal wel komen door eventuele afronding tussendoor.

Doorgaans wordt gerekend met een 95% betrouwbaarheidsinterval, dat wil zeggen: je wilt met 95% betrouwbaarheid kunnen zeggen dat je, uitgaande van het steekproefresutaat, kunt concluderen dat de populatieproportie binnen dit interval ligt. In dit geval wordt 95% net niet gehaald. Bij deze enquête is de foutenmarge dus iets groter dan 3 procentpunt.

Opmerking:
In de praktijk is de werkelijke populatieproportie p niet bekend, deze wil je juist te weten komen met de enquête. Doorgaans wordt dan de steekproefproportie $\widehat p$ genomen. Immers, bij een goede steekproef is dit een goede schatting van de werkelijke populatieproportie p. Een klein verschil tussen p en $\widehat p$ heeft weinig invloed op de uitkomst van de berekeningen.

Wanneer niets bekend is over p en men heeft toch een waarde nodig (bijvoorbeeld om vooraf een steekproefomvang n te bepalen die minimaal nodig is om een zekere betrouwbaarheid te kunnen behalen), dan schat men p=0,5. Dit is de meest ongunstige schatting, want deze levert de grootste waarde voor de standaardafwijking, en dus de grootste waarde voor n om de vereiste betrouwbaarheid te behalen. Het uiteindelijke resultaat kan dan alleen maar meevallen.

GHvD
3-4-2021


Fietsketting

Een fietsketting bestaat uit een aantal schakels. De lengte van zo'n schakel is een stochastische veranderlijke met verwachting $\mu$=0,5 cm en standaardafwijking $\sigma$=0,04 cm.

De lengtes van de verschillende schakels binnen een ketting zijn onafhankelijk en hebben alle dezelfde verdeling. Een fietsketting moet een lengte hebben tussen 49 cm en 50 cm.

Welke fractie van kettingen met 100 schakels voldoen aan deze voorwaarde?

Wat moet ik hier doen? Kan iemand me helpen?

elke
3-4-2021

Antwoord

Printen
Hallo Elke,

Maak gebruik van de eigenschap dat de som X van n normaal verdeelde variabelen (hier: de lengte van n=100 schakels met $\mu$=0,5 cm en $\sigma$=0,04 cm) een nieuwe normaal verdeelde variabele is met:

Xgemiddeld = n·$\mu$
Standaardafwijking = √n·$\sigma$

Bereken dus welke fractie van deze nieuwe variabele X een waarde heeft tussen 49 en 50 cm.

GHvD
3-4-2021


Re: Enquete

dankuwel!! ik heb een ander vraag als volgt: hoe groot moet de steekproefgrootte zijn om de standaardafwijking van P^terug te brengen tot 0,5%? wat betekent dit in het licht van de 68-95-99,7% vuistregel?

ik snap niet echt hoe ik n moet vinden en waar die regel ermee te maken heeft?

een ander vraag; Ik wijk bij het berekenen van mijn uitkomsten vaak af van de modeloplossing, is dit iets ergs of is het normaal? vaak verschilt dit met 0,001 of 0,002 en soms met 0,01 wel. ik weet niet of dit dan is door afrondingen of misschien dat er gebruik wordt gemaakt van een tabel maar ik wijk soms wel af.

elke
3-4-2021

Antwoord

Printen
Hallo Elke,

In het antwoord op jouw vorige vraag gaf ik al aan dat voor de standaarddeviatie geldt:

q91889img2.gif

Wanneer je bij $\widehat p$=0,49 eist dat $\sigma$=0,005, dan moet kennelijk gelden:

q91889img1.gif

De vereiste grootte van de steekproef (dus: n) vind je door deze vergelijking op te lossen. Gaat dat lukken?

Wat betreft de betekenis van de vuistregels:
Bij een normaalverdeling ligt 68% van de waarnemingen binnen één keer de standaardafwijking van het gemiddelde, 95% van de waarnemingen binnen twee keer de standaardafwijking en 99,7% binnen drie keer de standaardafwijking van het gemiddelde. Met $\sigma$=0,005 betekent dit:
Met 68% betrouwbaarheid is de foutenmarge 0,005 (dus: +/- 0,5%);
Met 95% betrouwbaarheid is de foutenmarge 0,01 (dus: +/- 1%);
Met 99,7% betrouwbaarheid is de foutenmarge 0,015 (dus: +/- 1,5%);

Wat betreft de verschillen tussen jouw antwoorden en modelantwoorden: in het algemeen kan ik natuurlijk niet aangeven waar dit aan ligt. Zeker als door jou of voor het modelantwoord tabellen worden gebruikt, kunnen afrondingsfouten een rol spelen. Immers, je kunt geen tabel maken met oneindig veel waarden. Vaak moet je aflezen bij een waarde die het dichts ligt bij de waarden uit de opgave. Hierbij wordt dan een afrondfout gemaakt.

GHvD
4-4-2021


Re: Fietsketting

veronderstel nu dat de fietskettingen 99 schakels hebben en dat je sigma kan aanpassen. welke waarde voor sigma zorgt ervoor dat minstens 90% van alle fietskettingen voldoen aan de voorwaarde?

hoe moet ik dit doen? sigma zou $\le$ 0,03055 cm moeten zijn. maar ik weet niet hoe je die vergelijking moet opstellen.

elke
3-4-2021

Antwoord

Printen
Hallo Elke,

De vraag komt er dus op neer:
  • De lengte van de fietsketting is normaal verdeeld,
  • De gemiddelde lengte is 99·0,5=49,5 cm
  • Hoe groot moet $\sigma$ zijn zodat 90% van de lengtes tussen 49 en 50 cm ligt?
Maak voor dit soort vragen een schets van de normaalverdeling, dat helpt om inzicht in het probleem te krijgen. In dit geval ziet de schets er zo uit:

q91890img1.gif

Het vervolg hangt af van de hulpmiddelen die je gebruikt. Je kunt deze normaalverdeling omrekenen naar een standaardnormale verdeling en vervolgens een tabel of op je grafische rekenmachine de functie InvNorm gebruiken om een z-waarde te bepalen. Deze z-waarde reken je weer om naar de standaardafwijking (zie het laatste voorbeeld op pagina 8 en opgave 3.2 van de lesbrief waarnaar eerder is verwezen.
Op je grafische rekenmachine kan je ook twee formules invoeren:

y1=normalcdf(ondergrens=49, bovengrens=50, $\mu$=49.5, $\sigma$=X)
y2=0,9

en vervolgens het snijpunt van de grafieken bepalen. Je rekenmachine zoekt dan de waarde van X (dus: van $\sigma$) waarvoor de oppervlakte tussen l=49 en l=50 gelijk is aan 0,9.

Let op: Wanneer je op deze wijze een standaardafwijking hebt berekend, dan is dit de standaardafwijking van de lengte van de ketting ($\sigma$ketting), dus van de som van 99 lengtes van afzonderlijke schakels. De vraag is om de standaardafwijking te berekenen van de lengte van afzonderlijke schakels ($\sigma$schakel). Het verband tussen deze standaardafwijkingen wordt gegeven door de wortel-n-wet:

$\sigma$ketting = (√n)·$\sigma$schakel

Je moet je gevonden waarde voor $\sigma$ketting dus nog wel delen door √99 0m de gevraagde $\sigma$schakel te vinden.

GHvD
4-4-2021


Boete krijgen

In een fabriek vult men botervlootjes. Het gewicht in gram van een willekeurig gekozen gevuld botervlootje is normaal verdeeld met verwachting $\mu$ en standaardafwijking van 3 gram. Een inspecteur neemt een enkelvoudig aselecte steekproef van 25 gevulde botervlootjes en weegt deze. Als de botervlootjes uit deze selectie gemiddeld minder wegen dan 250 gram, dan moet de fabriek een boete betalen.
  1. Wat is de kans op een boete als $\mu$ = 251 gram?
  2. Welke waarde moet de verwachting hebben om ervoor te zorgen dat de kans op een boete kleiner is dan 1%?
Ik heb dit geprobeerd maar ik snap het niet. ik had bij a. dat X~(6275,15) maar dan kan ik niet verder omdat het zegt wat de kans is, ik dacht om dit met GRM, normalcdf te berekenen maar ik heb niet genoeg gegevens of zo. Vraag b. weet ik niet hoe ik die vergelijking moet opstellen om de verwachting te berekenen.
  1. Hier moet ik een uitkomst van 4,75% hebben en...
  2. $\mu$ = 251,398 gram.
Hoe kan ik aan deze 2 getallen komen?

elke
3-4-2021

Antwoord

Printen
Ik denk dat je de wortel-n-wet nog niet helemaal verwerkt hebt in je systeem:

q91891img1.gif

Ik zou dan denken dat je bij a. X~Bin(251,$\frac{3}{5}$) krijgt. In dat geval moet die 4,75% wel te vinden zijn. De andere vraag moet je dan nog maar 's proberen.

Om het beter te begrijpen heb je misschien hier iets aan:

WvR
4-4-2021


Re: Boete krijgen

Ohh, uw bundel gaat me zeker verder helpen! Maar ik vind nog steeds mijn antwoorden niet. Ik weet niet wat ik tussen mijn haakjes moet schrijven en of dit groter of kleiner dan moet zijn.

Dus P(X $<$ ? ) = ? $\to$ dit weet ik dus niet.

En moet ik aangezien het binomiaal verdeeld is een continuiteitscorrectie toepassen?

Om vervolgens b te vinden, hoe moet ik dat doen?

elke
4-4-2021

Antwoord

Printen
In de vraag stond toch dat het normaal verdeeld was? De continuiteitscorrectie gebruik je als je een binomiale verdeling wilt benaderen door een normaal verdeling. Het gaat hier om het gemiddelde van 25 onafhankelijk stochasten die normaal verdeeld zijn.

In de lesbrief staan voorbeelden waarbij je een binomiaal verdeling benadert met een normaal verdeling. Je kunt daarbij denken aan munten of dobbelstenen.

De berekening bij b. lijkt sprekend op een van de voorbeelden uit de lesbrief. Je weet de $z$-score, de oppervlakte onder de grafiek en de staandaarddeviatie. Gevraagd wat is het gemiddelde?

q91895img1.gif

Maak een tekening! Je krijgt dan de volgende berekening:

$
\eqalign{
& P(X < 250) = 0,01 \cr
& \phi (z) = 0,01 \to z \approx - 2,326 \cr
& z = \frac{{250 - \mu }}
{{0,6}} = - 2,326 \cr}
$

...en dat kan je $\mu$ berekenen.

WvR
4-4-2021


Significantie waarden verschillende steekproeven met overlap

Ik heb voor mijn stage-onderzoek twee steekproeven: één waar ik alleen een vragenlijst over heb gedaan (n=12) en één waar ik diezelfde vragenlijst en interviews over heb gedaan (n=23). Die 12 participanten van de eerste groep zitten dus ook in de tweede groep, samen met de participanten die niet hebben deelgenomen aan de interviews.

Ik wil weten of de waarden (gemiddelden, percentage per gekozen antwoord, etc.) van de steekproef (n=12) significant verschillen van de steekproef (n=23). Hoe reken ik dat uit?

Kan dit met -Test Calculator for 2 Independent Means bijvoorbeeld?

Omdat de tweede steekproef dus deels overlapt met de eerste steekproef, is dat dan wel een onafhankelijke t-toets te noemen? Is het überhaupt een t-toets?

Ik hoor het heel graag!
Groet, Julia

Julia
12-7-2021

Antwoord

Printen
Begrijp ik het goed dat die 12 ook in die 23 zitten. Dan heb je dus 12 en 11 als verschillende steekproeven.

Jouw steekproeven zijn hoogstwaarschijnlijk veel te klein om statistisch significantie mee aan te tonen. Die t test met steekproeven van 12 en 23 mag nooit. Omdat die 12 ook in die 23 zitten is er geen sprake van onafhankelijkheid. Dit zo toepassen werkt significantie zelfs tegen. Aan de normaliteitseis zal vast niet voldaan zijn bovendien mag je die t test eigenlijk pas uitvoeren met liefst twee keer n$>$100 in ieder geval twee keer n$>$30. Verder gaat die t toets bij fracties natuurlijk ook niet op. Helaas lijkt mij dat er zo weinig van te maken valt.

Ik had eventueel wel verder willen meekijken maar helaas heb je op mijn mailtje van 12-7 niet geantwoord. Daarom sluiten we nu deze vraag.

Met vriendelijke groet
JaDeX

jadex
14-7-2021


klein |  normaal |  groot

home |  vandaag |  bijzonder |  twitter |  gastenboek |  wie is wie? |  colofon

©2001-2021 WisFaq - versie 3