Ik zou graag willen weten of uw antwoord hetzelfde blijft, als ik de volgende informatie erbij vermeld.
1. De bedrijven in periode 1 zijn dezelfde bedrijven als in periode 2
2. De nauwkeurigheidspercentages worden als volgt berekend:
aantal correcte voorspellingen t.o.v. totale voorspellingen
0= niet failliet 1= failliet met ( ) = werkelijkheid zonder ( ) = voorspelling
voorbeeld:
Periode 1 (steekproef 1) Model 1: 0(0), 0(0), 0(0), 0(0), 1(0)..... = in dit vb 80% nauwkeurigheid Model 2: 1(0), 1(0), 1(0), 0(0), 0(0)..... = in dit vb 40% nauwkeurigheid Model 3: 0(0), 0(0), 0(0), 0(0), 0(0)..... = in dit vb 100% nauwkeurigheid
Periode 2 (steekproef 2) Model 1: 0(0), 0(0), 0(0), 0(0), 0(0)..... = in dit vb 100% nauwkeurigheid Model 2: 1(0), 0(0), 0(0), 0(0), 0(0)..... = in dit vb 80% nauwkeurigheid Model 3: 0(0), 0(0), 1(0), 1(0), 1(0)..... = in dit vb 40% nauwkeurigheid
Alvast bedankt voor uw tijd!
P.S. Ik heb nog niet vastgesteld of het een normale verdeling is. Is dit relevant voor het toepassen van deze methode?
Tang
Student hbo - dinsdag 8 juli 2014
Antwoord
Als ik het goed begrepen heb, voorspelt elk model of een bedrijf failliet gaat of niet. Er zijn dus steeds twee mogelijke uitkomsten: de voorspelling is juist, of de voorspelling is onjuist. Er worden 21 voorspellingen gedaan.
Je neemt aan dat de kans op een juiste voorspelling constant is. In dat geval is het aantal juiste voorspellingen binomiaal verdeeld. Met behulp van de methode zoals beschreven bij jouw bron kan je met een zekere betrouwbaarheid bepalen binnen welke grenzen de kans op een juiste voorspelling ligt.
Wanneer je nu het experiment herhaalt (dus: periode 2), dan is het normaal dat je een iets ander percentage juiste voorspellingen vindt. Immers, door toevallige omstandigheden zal dit percentage variëren. Als de werkelijke kans op een juiste voorspelling constant is, dan kan het verschil tussen beide voorspellingen niet al te groot zijn. Kortom:
bij een klein verschil tussen de voorspellingen is er geen 'bewijs' dat er werkelijk een verschil is;
een groot verschil tussen de voorspellingen zien we als 'bewijs' dat de kans op een juiste voorpelling daadwerkelijk is veranderd.
Absolute zekerheid heb je nooit, want er is altijd een mogelijkheid dat de steekproef zodanig ongelukkig is dat je tot een onjuiste uitspraak komt.
Met behulp van de rekenmethode in de genoemde bron bereken je wat het minimale verschil moet zijn om met voldoende zekerheid (95%) te concluderen dat er daadwerkelijk een verschil is in kans op een juiste voorspelling. In het door jou gegeven voorbeeld is het gevonden verschil niet groot genoeg, je kunt dus niet concluderen dat in periode 2 daadwerkelijk een andere kans is op een correcte voorspelling door het model.
Hopelijk helpt dit om deze statistische aan pak beter te begrijpen.