Ik zet momenteel met een klein inzichtsprobleempje denk ik rond de dichtheid van een continue verdeling (dit is inderdaad nog van het begin van m'n cursus statistiek, we zitten intussen al over hypothesetesten, regressie..., maar volgens mij is het tamelijk essentieel, dus...)
Ik dacht altijd dat P(X = y) met X toevalsvariabele en y willekeurig reëel getal gelijk was aan nul. Echter, in een oefening moesten we m.b.v. een statistisch programma allerlei kansen berekenen en één daarvan was P(X =/= 1). Mijn logica was: P(X =/= 1) = 1 - P(X = 1) = 100% omdat P(X=1) = 0. Dan kreeg ik echter te horen dat P(X = y) wel nul is in de verdelingsfunctie, maar omdat het niet van de vorm P(X y) is maar van de vorm P(X = y) moet je in de dichtheidsfunctie kijken. En daar zou de kans P(X = 1) wél verschillend zijn van nul. En dat versta ik nog altijd niet. Als je in het statistisch programma zo'n kans ingeeft, geeft hij inderdaad een waarde verschillend van nul. Zo is bv. volgens dat programma P(X = 0) bij standaardnormale verdeling iets van een 38%, wat ik dan alweer raar zou vinden omdat de kans P(X 0) al maar 50% is, en er dan maar 12% meer zou overschieten voor AL die andere waarden kleiner dan nul.
M.a.w. kort: Is de kans P(X = y) bij een continue verdeling ja dan nee?
Groeten
Brecht
Student universiteit - donderdag 15 april 2010
Antwoord
Je vraag maak niet duidelijk in welke context je die kansverdelingen gebruikt; je sprint heen en weer tussen theorie en knoppendrukken in een computerprogramma. Als de kansverdeling gegeven is door een dictheidsfunctie f dan geldt, per definitie dat P(X=a)=integraal(f(x),x=-oneindig..a) en in dat geval geldt inderdaad P(X=a)=0 voor elke a. Echter, de normale verdeling wordt vaak gebruikt als benadering van discrete verdelingen; zo'n discrete verdeling wordt door een staafdiagram voorgesteld met rond het gehele getal k een staaf die P(X=k) hoog is en als basis het interval [k-1/2,k+1/2] heeft. Dan kun die kans op X=k benaderen met P(Y=k+1/2)-P(Y=k-1/2) (hier is Y de normale verdeling). Het programma heeft warschijnlijk P(Y=1/2)-P(Y=-1/2) als benadering van de discrete kans P(X=0) genomen en daar komt inderdaad ongeveer 0.3829249225 uit.