Ik heb een vraag over het bewijs van Ewens sampling formule. Ik heb hiervoor Hoppe's urn model nodig:
Een vaas bevat een zwarte bal met massa m en verschillende andere kleuren met massa 1. Op elke tijdstip wordt er willekeurig een bal geselecteerd met kans proportioneel aan de massa. Als een gekleurde bal wordt getrokken, dan wordt deze bal teruggeplaatst en er gaat nog een bal met dezelfde kleur in de vaas. Als een zwarte bal wordt getrokken dan gaat deze terug in de vaas en er wordt een bal met een nieuwe kleur in de vaas gezet (met massa 1).
Bewijs ESW Laat a_i het aantal balletjes zijn dat i maal in een steekproef zit. Dan is Ewens sampling formule (EWS)
P(a_1,a_2,...,a_n)=[n!/t_(n)]PRODUCT[(t/j)^(a_j)/(a_j!)], het product loopt van j=1 t/m n en t_(n)=t(t+1)...(t+n-1).
Het bewijs gaat met inductie. Het geval n=1 is duidelijk. Stel dat de toestand op tijd n gelijk is aan (a_1,a_2,...,a_n) en laat a' de toestand zijn op het vorige tijdstip. Dan hebben we twee gevallen
geval 1: a'_1=(a_1)-1, m.a.w. een nieuwe kleur is toegevoegd. Dan is de overgangskans voor het Hoppe urn model
p(a',a)=t/(t+n-1)
en de ratio van de kansen in de EWS gelijk aan
P(a)/P(a')=[n/t+n-1]/[t/a_1]
VRAAG: Ik begrijp niet hoe je deze ratio moet afleiden. Er staat eigenlijk P(a)/P(a')=p(a',a)*(n/a1). Hoe zijn P en p(a',a) aan elkaar geralateerd?
geval2: voor zekere 1=jn hebben we a'_j=(a_j)+1, (a'_(j+1))-1, m.a.w. een bestaande kleur dat j keer aanwezig was in de vaas was gekozen, en een nieuwe bal met dezelfde kleur is in de vaas gedaan, dus de kleur is nu j+1 maal aanwezig.
p(a',a)=[j*a'_j]/[t+n-1]
nu is de ratio
P(a)/P(a')=[n/t+n-1]*[(j*a'_j)/(j+1)*a_(j+1)]
VRAAG: Ik begrijp ook niet hoe deze ratio is afgeleid.
Groeten,
Viky
Viky
Student universiteit - vrijdag 4 juni 2010
Antwoord
Viky, Laten we het bewijs geven van n naar (n+1).De situatie (a(1)=0,..,a(n)=0,a(n+1)=1) is alleen mogelijk als na n trekkingen alle n ballen dezelfde kleur hebben.Nu is P(a(1)=0,...,a(n)=1)=1*1/(t+1)*2/(t+2)*...*(n-1)/(t+n-1)= =n!/t(n)(t/n).EnP(a(1)=0,...,a(n)=0,a(n+1)=1)=n!/t(n)(t/n)(n/(t+n))= =(n+1)!/t(n+1)(t/(n+1)).Dus dit klopt.We nemen in wat volgt a(n+1)=0.
Geval 1. Na n trekkingen wordt de zwarte bal getrokken en een nieuwe kleur toegevoegd.Noem deze gebeurtenis X.Nu is P(X)=t/(t+n).Welke toestand na n trekkingen geeft na de (n+1)ste trekking (a(1),...,a(n),a(n+1)). Dat is (a(1)-1,a(2),...,a(n)).Dus in dit geval is P(a(1),...,a(n),a(n+1))=P(X,a(1)-1,a(2),...,a(n)) enz.
Geval 2.Zij X(j) de gebeurtenis dat bij de (n+1)ste trekking een kleur wordt getrokken die op tijdstip n j maal voorkomt.De kans hierop is j(a(j)+1)/(t+n).Om na de (n+1)ste trekking de toestand (a(1),..,a(n+1)) te krijgen heb je na de nde trekking de toestand (a(1),..,a(j-1),a(j)+1,a(j+1)-1,...,a(n)), zodat P(a(1),..,a(n),a(n+1))= P(X(j),a(1),...,a(j-1),a(j)+1,a(j+1)-1,...,a(n)).