|
|
\require{AMSmath}
Testen uitvoeren mbv een dataset
Beste,
IK heb de opdracht gekregen een taak te maken voor statistiek. De taak bestaat uit een dataset met volgende vragen:- Bestudeer de variabele gewicht. Bespreek gepaste numerieke en grafische voorstellingen. Ga na of de gegevens normaal verdeeld zijn. Indien dit niet zo is, hoe wijken ze af van de normale verdeling? Kan je eventueel de variabele transformeren tot normaliteit?
- Is de slaapduur van dieren die aan weinig gevaar blootgesteld zijn langer dan die van dieren die veel gevaar lopen?
- Is er een verband tussen de veiligheid van de slaapplaats van een dier en de mate waarin er op dat dier gejaagd wordt?
- Kan log(hersengewicht) voorspeld worden op basis van de slaapduur? Bespreek zo volledig mogelijk.
Bij de eerste vraag weet ik dat ik een histogram, boxplot, QQ-plot moet maken en de Shapiro-wilk test moet uitvoeren. Ook de transformatie kan ik uitvoeren. Maar bij de andere drie vragen weet ik niet of kan ik moeilijk afleiden welke soort test je voor deze vragen moet gebruiken om een antwoord te vinden. Ik weet wel hoe een betrouwbaarheidsintervel en een hypothesetest en dergelijke meer in zijn werk gaat, maar ik kan de links tussen al deze mogelijke testen niet leggen met de vragen. Is er iemand die mij kan helpen? Welke test moet ik uitvoeren bij welke vraag? Ik zie de verbanden niet echt...
Alvast bedankt!
Met vriendelijke groeten,
Valérie
Broeck
Student universiteit België - dinsdag 2 december 2008
Antwoord
Ik neem aan dat je ook een dataset hebt. Van belang is hoe de data gemeten is. Is slaapduur in klassen ingedeeld of niet ? ik neem aan van niet. Voor veiligheid en mate van bejaging neem ik aan dat daar wel een klasseindeling is gebruikt. Wanneer je dat soort zaken niet vertelt kunnen we ook geen duidelijk antwoord geven.
2. Twee groepen onafhankelijk. Een t-test voor onafhankelijke waarnemingen toepassen wanneer normaliteit mag worden aangenomen. Anders Mann-Whitney-Wilcoxon (U-test) gebruiken. 3. Van belang is het dat beide variabelen in klassen ingedeeld zijn. Ik gok van wel en dan zou ik kijken naar een kruistabel met een chi-kwadraattoets (eventueel cramers V nog meenemen). 4. Dit is een regressieprobleem log(hersengewicht) als de ene variabele en slaapduur als de andere. Correlatiecoefficient even uitrekenen (om te kijken of het lineair model wel past) en daarna de regressie toepassen.
Dit is wat ik zonder inzicht in jouw dataset zou gokken.
Met vriendelijke groet JaDeX
|
Vragen naar aanleiding van dit antwoord? Klik rechts..!
zondag 7 december 2008
|
|
home |
vandaag |
bijzonder |
gastenboek |
statistieken |
wie is wie? |
verhalen |
colofon
©2001-2024 WisFaq - versie 3
|