\require{AMSmath}
WisFaq - de digitale vraagbaak voor wiskunde en wiskunde onderwijs


Printen

Re: Re: Re: Voorspellingsinterval en betrouwbaarheidsinterval

 Dit is een reactie op vraag 49991 
Hoi Oscar,
Dank je voor je informatie. Ik zal alleeen mijn probleem beter uitleggen. Ik heb een proces waarbij elke dag klanten aankomen. Ik wil kunnen voorspellen hoeveel klanten er over een maand binnengekomen zijn. Ik ga dit proces van het aantal klanten die binnenkomen per dag als een Poisson proces modelleren. Op basis van de aantallen klanten per dag, kan ik een schatting maken van de paramter $\lambda$. Deze parameter kan ik schatten door : N(t)/t met N(t) het aantal klanten binnengekomen t/m dag t. DUs stel dat op dag 1, 2 klanten binnenkomen dan is mijn schatting voor $\lambda$=N(1)/1=1. Stel dat op dag 2 , 3 klanten binnen komen. Op basis van de aantal binnengekomen klanten op de eerste 2 dagen is mijn schatting van $\lambda$=N(2)/2=(2+3)/2=2.5.
Voor elke geschatte $\lambda$ na elke nieuwe dag kan ik een BI opstellen door:
schatting $\lambda$ ± 1.96(schatting $\lambda$)/√(n)]

Om dus te bepalen hoeveel klanten er over een maand zijn vermenigvuldig ik het BI verkregen voor elke $\lambda$ door 25 (alleen werkdagen meetellen). Op deze manier krijg ik een BI rond 25·$\lambda$.

Ik kan ook gaan voorspellen. mijn voorspelling van het totaal aantal klanten na 25 dagen is dan 25$\lambda$( ik krijg dan voor elk geschatte lambda en andere voorspelling natuurlijk). Ik heb ookde formule voor eht VI maar die is aardig complex dus laat het even achterwegen.

De clue is dat ik weet al voor hele proces hoeveel klanten er per dag binnengekomen zijn en dus hoeveel klanten er over een maand zijn maar ik wil weten vanaf welke dag je dat het beste kan schatten/voorspellen. Dus welke dag ( eerste dag, 2de dag, derde dag etc)het beste de waarde van het totaal aantal klanten over een maand voorspeld.

In deze situatie wat zegt het BI mij over het totaal aantal klanten over een maand?

dankje!
groet caro

caro
Student hbo - woensdag 4 april 2007

Antwoord

Oke. We beginnen elkaar te begrijpen...

Als je N(n) klanten telt in n dagen dan vind je voor het gemiddeld aantal klanten per dag inderdaad een (95%) BI van $\lambda$±1,96$\sigma$ met $\lambda$ = N(n)/n met en $\sigma$= (√N(n))/n
(overigens benader je dan de poissonverdeling met een normale verdeling. Dat is handig, maar je moet wel opletten dat dat alleen mag als N(n) groot genoeg is.)
Voor het gemiddeld aantal klanten per 25 dagen vindt je BI = 25·$\lambda$±1,96·25·$\sigma$.
Dus als je 5 klanten in 2 dagen telt vind je inderdaad $\lambda$=5/2=2,5 en $\sigma$=(√5)/2=1,1 en dus
voor het gemiddeld aantal klanten per dag BI = 2,5±2,1
en voor het gemiddeld aantal klanten per 25 dagen BI = 63±55
(nog niet zo heel nauwkeurig dus)

Volgens mij het VI niet zo heel moeilijk. Alweer als $\lambda$ voldoende groot is kun je de normale benadering gebruiken en vindt je een 95% VI van $\lambda$±√$\lambda$. Dus b.v. voor $\lambda$=60 (klanten per 25 dagen) vind je een VI van 60±7,7

Maar nu wil je inderdaad je meting N(n) gebruiken om het aantal klanten in een periode van 25 dagen te voorspellen. In z'n algemeenheid weet ik daar geen oplossing voor. Maar als BI of VI een kleine spreiding heeft kan het wel.

Stel bij voorbeeld dat je in 800 dagen 1000 klanten hebt getelt. Dan vind je voor het aantal klanten per dag BI 2,5±0,08 en voor het gemiddeld aantal per 25 dagen: BI 63±1. Dat is niet al te breed. Dus kun je met redelijke zekerheid uitgaan van $\lambda$=63 (klanten/25 dagen). Daarmee vind je dan een VI = 63±16. Omdat de BI veel smaller is dan de VI zal dat een redelijke voorspelling zijn.

De andere kant krijg je bijvoorbeeld als je 100 klanten telt in 1 dag. Dan vind je voor het gemiddeld aantal klanten per dag BI 100±19 en voor het gemiddeld aantal klanten per 25 dagen BI 2500±490. Dat is niet zo'n smalle spreiding. Maar, ga je uit van $\lambda$=2500 (klanten per 25 dagen) dan vind je voor een periode van 25 dagen VI = 2500±98. VI is dus wel een redelijk smal interval. Dus in dit geval geeft de BI het beste aan hoeveel klanten je zult verwachten.

Als n veel kleiner is dan 25 is de spreiding in je BI groter dan in je VI en dus bepaalt die vooral de onzekerheid van je voorspelling. Als n veel groter is dan 25 dagen is de spreiding van VI groter en bepaald die de onzekerheid.

Maar in het algemeen dragen zowel BI en VI bij aan de onzekerheid van je voorspelling. Als je brutaal bent doe je alsof je twee normale verdelingen samenstelt. Dan kun je de kwadraten van de spreiding optellen. Dus als je dan voor het gemiddelde per dag $\lambda$ vindt met een spreiding van $\sigma$=√($\lambda$/n) en dus per 25 dagen een gemiddelde van 25$\lambda$ met een spreiding van 25$\sigma$ en daarbij een VI met een spreiding van √(25$\lambda$) dan kun je de totale spreiding benaderen met $\sigma$tot=√(25$\lambda$+(25$\sigma$)2)=(√25+25/√n)√$\lambda$. Ik denk dat je hiermee wel goede restultaten krijgt. Maar het is een versimpelde aanpak waarvoor geen goede onderbouwing is.

Nou. Een hoop tekst. Maar ik hoop dat je hier vindt wat je zoekt.

Groet. Oscar

os
donderdag 5 april 2007

©2001-2024 WisFaq