Wederom heel erg bedankt voor het antwoord op mijn vorige vraag. Ik zou mijn analyse binnen ongeveer een week moeten rond hebben... Het zou dan ook geweldig zijn als je even mee zou willen kijken naar mijn resultaten i.v.m. de interpretatie ervan. De informatie die ik vind (in SPSS-handboek, statistiekleerboeken,internet etc... is nogal tegenstrijdig en mijn scriptiebegeleider is met vakantie: ik zit m.a.w. met de handen in het haar !)
Als je me een seintje geeft zal ik je mijn onderzoeksopzet toesturen en verder mijn data-set (bedoel je mijn SPSS-bestand met gehercodeerde en nieuw aangemaakte data die ik gebruik om de analyses toe te passen of enkel de resultaten van de analyses?)
Ik kan je alvast in grote lijnen zeggen welke zaken ik moet nagaan voor mijn onderzoek:
1) correlaties nagaan tussen onafhankelijke variabelen onderling en tussen de onafh. en afhankelijke variabele 2) nagaan wat het relatieve belang van de onafhankelijke variabelen afzonderlijk is ter verklaring van de afhankelijke variabele (regressie-analyse) 3) het vaststellen van verschillen tussen groepen (enerzijds tussen mensen met een hoge en mensen met een lage score op de afhankelijke variabele en anderzijds tussen jongens en meisjes) (Deze analyses moet ik eigenlijk 3 keer toepassen omdat er sprake is van drie verschillende vormen van gedrag die ik met mijn theoretisch model moet verklaren)
De problemen die ik tot nu toe al tegengekomen ben met regressie-analyse zijn: een constante in de regressievergelijking die niet significant bijdroeg aan de regressievergelijking (?), een coëfficiënt in de regressievergelijking met een teken tegengesteld aan de correlatiecoëfficiënt (veroorzaakt door multicollineariteit?) en zoals eerder gezegd een onafhankelijke variabele die niet significant correleerde met de afhankelijke variabele, maar plots wel opdook in de regressievergelijking en significant bijdroeg aan de verklaring van de afh.variabele (terwijl andere variabelen die hoger en significant correleerden met de afh. variabele niet opgenomen werden in de regressievergelijking).
Een hele waslijst met problemen dus. Het spijt me dat ik je hier zo mee overrompel, maar ik zie door het bos de bomen niet meer. Geef je me een seintje en laat je me weten wat ik mag opsturen? Alvast enorm bedankt! Vriendelijke groet,
koen
Student universiteit - woensdag 6 augustus 2003
Antwoord
Even een reactie op de gesignaleerde problemen.
De correlaties tussen drie van je onafhankelijke variabelen zijn hoog, dat betekent dat hier inderdaad sprake is van multicollineariteit. Gevolgen hiervan zijn: 1) Een verklarende variabele wordt niet of pas laat in het model opgenomen terwijl hij toch hoog correleert met de afhankelijke (te verklaren) variabele. Dat komt omdat deze verklarende variabele al grotendeels overeenkomt met andere verklarende variabelen die al in het model zijn opgenomen. 2) Het relatieve belang van de varklarende variabelen in de onafhankelijke variabele kan moeilijker geinterpreteerd worden.
Een nauwelijks correlerende variabele die toch wordt opgenomen in het model komt vaak voor. Bij elke extra variabele wordt namelijk de verklaarde variantie beter. En zo'n laatste extra variabele hoeft dan maar iets te correleren met de afhankelijke variabele om die verbetering significant te laten zijn. Er is wel een andere techniek om te kijken of zo'n variabele het modele echt beter maakt (vaak niet dus). Een soort F toets. Maar om dat goed te kunnen doen heb je liefst een grote steekproef nodig. Bovendien lijkt met dit wat te ver gaan zeker als je nog in het beginstadium van de analyse bent.
Wanneer een constante niet significant bijdraagt aan de regressievergelijking betekent dat hoegenaamd niets. Het enige is dat die constante dan 0 zou kunnen zijn. Niet iets om je over druk te maken. Gewoon negeren dus.
Wanneer een coefficient echter niet significant bijdraagt aan de regressievergelijking is dat andere koek. Dat betekenent dat de bijbehorende variabele uiteindelijk geen invloed in de regressievergelijking brengt.