WisFaq!

\require{AMSmath} geprint op maandag 25 november 2024

Toetsen van hypothesen

Ik zal maar beginnen met een voorbeeld:

De kans dat een bepaald geneesmiddel werkt is 80%(0.8)zegt de fabrikant. Nu wil ik deze hypothese toetsen met een significantieniveau van 5%(0.05)en een steekproef van 100 mensen.
Als dus een bepaald aantal mensen uit deze steekproef geen baat heeft bij dit middel kan ik zeggen dat de fabrikant ongelijk heeft. Het gaat er dus om bij welke waarde dat de fabrikant ongelijk heeft.
Schematisch:(X=aantal met baat, g=grenswaarde)
XIk wil dus weten:
P(Xg=72 zo blijkt uit de tabel
Dus de kans dat X<72 (terwijl dat de fabrikant toch gelijk heeft) is <0.05. Dit is dus de kans dat ik ten onrechte de hypothese verwerp.

Ik heb alleen een probleem:
P(X=75/p=0.8, n=100)=0.044 En dit is ook kleiner dan 0.05
Dit betekent, als 75 van de 100 mensen geen baat hebben bij dit middel, dat ik niet kan zeggen dat de fabrikant ongelijk heeft. De kans op deze situatie is immers 0.044(4.4%), terwijl ik een significantieniveau van 0.05 heb gesteld. Het verschil zit "natuurlijk" in X=75 en X<72
In het eerste geval is het een enkele kans(op 75) en in het tweede geval is het de som van alle kansen van X=0 tot X=72.

Dit begrijp ik niet goed. Waarom dan toch de som?( zo heb ik het tenminste geleerd) Want als ik 75 mensen zonder baat heb dan zou ik in het eerste geval de hypothese niet mogen verwerpen, terwijl als ik de kans op deze situatie uitreken dan zit deze nog wel onder het significantieniveau.

Kunt u mij helpen?
Ik hoop dat het een beetje duidelijk is zo; het is echt afgrijselijk moeilijk om je vraag op papier te zetten!

A.Manschot
14-5-2002

Antwoord

Beste A

Kort gezegd is deraag: waarom wordt er met overschrijdingskansen gewerkt bijv. P(X$\leq$75) en niet met 'gewonen kansen P(X=72)
Een bekende vraag.
Ik heb er twee antwoorden op. Kijk maar welke van de twee het meest aanspreekt.
1)Bij statistiek spelen naast wiskundige ook historische overwegingen - een beetje te vergijlen met economie. De aanpak met overschrijdingskansen is voor een deel historisch zo gegroeid. Er zijn alternatieve aanpakken (zoals van Bayes), maar die zijn minder populair
2) Een 'losse kans' zegt weinig. Wanneer je 83 of 84 van de 500 keer een 6 gooit met een dobbelsteen is er weinig reden om aan de eerlijheid daarvan te twijfelen. Deze getallen liggen vlak bij de verwachtingswaarde (500/6=83,33..)
Toch is de kans dat je 83 (of 84) gooit kleiner dan 5%
Waar het om gaat is dat er een grote kans is dat je met een zuivere dobbelsteen 'in de buurt' van de 83,33.. gooit, en een kleine kans dat het 'veel' afwijkt
Een ander voorbeeld: Wanneer je aslelect iemand uitkiest uit een grote groep is het zeer onwaarschijnlijk dat zijn/haar lengte op de milimeter nauwkeurig gelijk is aan het gemiddelde, maar wanneer de verdeling een beetje 'mooí'is, is de kans wel groot dat de lengte 'in de buurt' van het gemiddelde ligt

Je moet dus geen losse kansen bekijken, maar de kans dat iets in een bepaald gebied zit, dus bijv. kleiner of gelijk aan 72 is.
Het gaat er dus niet om dat de kans
P(X=72|n=100;p=0,8) klein is, het gaat er om dat de kans op een 'dergelijke' uitkomst (te) klein is (zo ver of verder onder de 80), m.a. w om P(X$\leq$72}n=100;p=0,8)

Nog even een (belangrijk) detail
Het gaat er NIET om bij welke waarde dat de fabrikant ongelijk HEEFT (dat weet je nooit,het gaat om de vraag bij welke uikomsten hij ongelijk KRIJGT.
In de berekingen ga je steeds uit van het gelijk van de fabrikant (p=0,8).

gk
14-5-2002


© 2001-2024 WisFaq
WisFaq - de digitale vraagbaak voor het wiskunde onderwijs - http://www.wisfaq.nl

#3159 - Statistiek - Iets anders