Multi-collineariteit en regressie
Ik heb een regressiemodel,waarin ik met zes onafhankelijke variabelen één afhankelijke variabele wil verklaren. Hierbij heb ik de enter methode gebruikt. Mijn begeleider wil echter dat ik de multi-collineariteit meet, de onderlinge correlatie meet tussen de onafhankelijke variabelen. Wat zou de invloed van de multi-collineariteit kunnen zijn op mijn regressie model? Wanneer twee onafhankelijke variabelen samen sterk correleren, wat zou er dan aan mijn regressie model moeten veranderen? Moet ik misschien een andere methode gebruiken (backward, forward etc.)? Ik ben benieuwd naar het antwoord.
Joris
Student universiteit - maandag 6 december 2004
Antwoord
Kijk eerst eens of er waarschijnlijk multicollineariteit is. Dat kan door een correlatiematrix op te stellen en daar de hoge correlaties in op te zoeken. Dat zegt echter niet alles. Ook bij een variabele die redelijke correlatie vertoont met twee of meer andere variabelen kun je op een behoorlijke multicollineariteit uitkomen. Multicollineariteit heeft altijd gevolg op het de variabelen in het model. Deze variabelen krijgen door de multicollineariteit een vaak een andere coefficient dan je uit de correlatie met de afhankelijke variabele zou mogen verwachten. Forward gebruiken kan altijd. Dat zou ik je ook zeker aanraden. Onafhankelijke variabelen die niet nodig zijn voor de voorspelling van de afhankelijke variabele worden er zo uitgefilterd. Je kunt zelfs nog een stap verder gaan: wanneer de laast toegevoegde variabele bij forward hoog correleert met een van de eerder toegevoegde variabelen dan kun je eens proberen om deze laatste variabele uit het model weg te laten. Wanneer hierdoor de verklaarde variantie R2 niet al te zeer vermindert is dat weglaten vaak een goede keus. Met vriendelijke groet JaDeX
vrijdag 10 december 2004
©2001-2024 WisFaq
|