Met meervoudige regressie-analyse heb ik met een groot aantal waarden een model achterhaalt:
Y=Bo+B1*x1+B2*x2+e
B0 = 10
B1 = 35
B2 = 45
B zijn de beta-predictoren, x- zijn de onhankelijke variabelen. Y= is de afhankelijke variabelen.
Naast de formule geeft het programma voor de beta's B0, B1 en B2 een 95% betrouwbaarheidsgrens b1 95% zekerheid:
waarde ondergrens bovengrens
bo 10 8 12
b1 35 25 45
b2 45 43 47
is nu het betrouwbaarheidsinterval (95%) voor de totale formule Y te bepalen door:
Y(ondergr.)= B0(ondergr.)+ B1(ondergr.)*x1 + B2(ondergr.)*x2
Y(bovengr.)=B0(bovengr.) + B1(bovengr.)*x1 + B2(bovengr.)*x2
De residuen zijn normale verdeeld, de formule voordoet aan de voorwaarden.Gertjan Buisman
20-10-2004
Nee dat is zeker niet zo!
Dat kun je misschien wel inzien.
Stel het 95% betrouwbaarheidsinterval voor m1 is 5-8
En het 95% betrouwbaarheidsinterval voor m2 is 9-13
Is dan het 95% betrouwbaarheidsinterval voor m1+m2 dan 14-21 ?? Nee, want het is helemaal niet zeker dat dat interval nu nog een betrouwbaarheid van 95% heeft.
Jij gaat iets veel gevaarlijkers doen. Namelijk uit x1 en x2 het 95% betrouwbaarheidsinterval voor de voorspelling Y bepalen. Tussendoor wordt daarbij ook nog eens met variabele scores x1 en x2 vermenigvuldigd. Dat maakt het geheel nog onbetrouwbaarder. Wat nu als x1=0 en x2=0 ? Heb je dan de kleinste onbetrouwbaarheid? Volgens jouw verhaal wel maar in de regressietechniek is dat zeker niet het geval! De beste voorspelling geeft de regressielijn in de buurt van de gemiddelden van x1 en x2 en doorgaans niet bij 0.
Dat betekent dat je hiermee een verkeerde weg inslaat.
Met vriendelijke groet
JaDeX
jadex
23-10-2004
#28771 - Statistiek - Student hbo