Re: Afh var is niet normaal verdeeld, t-test/ regressie uitvoeren?
de afhankelijke is performance (hiervoor gebruik ik turnover of Net Profit of Net Profit Margin, afhankelijk welke de beste relatie weergeeft)en is dus metrisch/ ratio. Deze zijn niet normaal verdeeld
de onafhankelijke variabelen zijn dummies (export: ja, nee) en metrisch/ ratio (grootte: aantal werknemers)
het aantal respondenten is 1884
groet, Barbara
Barbar
Student universiteit - dinsdag 3 januari 2006
Antwoord
Die t-test wil je vast uitvoeren met de groepen export (ja/nee). De waarnemingen bij turnover en profit laten vast een rechts scheve verdeling zien. Maar de vraag is of dat een probleem is voor de t-test. Welnu die t-test vereist een normale verdeling van het steekproefgemiddelde. En omdat je aantal resondenten 1884 bedraagt is dat m.i. door middel van de Centrale Limietstelling afgedekt. Dus zou ik geen probleem hebben met toepassing van de t-test in jouw geval. Om te verifieren zou je ook de t-test nog uit kunnen voeren op de zg. trimmed (5% grootste en kleinste waarden weggelaten). Maar dit heeft alleen maar zin bij hele hoge uitschieters die individueel de groepsgemiddelden te zeer beinvloeden. Dat zou je dan even moeten bekijken in de data. Voor de t-test zie ik eigenlijk geen probleem. Die (lineaire) regressie heeft geen normaliteit nodig.
Jouw probleem zit hem volgens mij overigens niet in de afhankelijke variabele maar in de onafhankelijke variabelen. Wanneer je apart met 1 onafhankelijke en 1 afhankelijke variabele technieken gaat uitvoeren worden eventuele interactie effecten bij de onafhankelijke variabelen onder tafel geschoven. Ik weet niet hoeveel onafhankelijke variabelen je hebt. Als dit de enige twee zijn vermoed ik dat je de turnover of profit niet of nauwelijks zal kunnen verklaren met de onafhankelijke variabelen. Met meer variabelen zou dat ook wel eens een probleem kunnen blijken. Dat kan komen omdat zo'n verband er nauwelijks is en/of omdat je belangrijke onafhankelijke variabelen in je model vergeten bent. Even afgezien of het mag..... probeer maar eens een multiple regressie uit te voeren en kijk wat je R2 waarde dan maximaal wordt. Zou toch eigenlijk boven 0,6 of liefst boven de 0,7 moeten uitkomen en ik vrees dat je dat niet gaat redden. Daarnaast maakt een combinatie van totaal verschillende soorten variabelen (export: dichotoom en werknemers: ratio) het uitermate lastig om alles in één goede techniek te stoppen. Ik denk dat daar je probleem gaat liggen: bij de onafhankelijke variabelen. En het is, zo op afstand, vrijwel onmogelijk om je daarin verder te adviseren.
Met vriendelijke groet JaDeX
donderdag 5 januari 2006
©2001-2024 WisFaq
|