WisFaq - printen

WisFaq!

\require{AMSmath} geprint op zondag 24 november 2024

Toetsen van verschillende variabelen tegen een populatiegemiddelde

Hallo, ik doe een onderzoekje naar zwangerschapskansen bij een bepaalde medische behandeling, kamp met een nogal beperkte wiskunde kennis en hoop op hulp van u.

Ik wil met SPSS graag leeftijd (continue variabele), aantal eicellen (discrete waarde, interval), classificatie tussen primaire en secundaire infertiliteit (wel/niet ooit eerder zwanger geweest - nominaal) en zwangerschap na behandeling
(ja/nee - nominaal) tussen een geselecteerde groep en de (grote) gehele behandelde groep vergelijken.

welke toets kan ik voor wat gebruiken?

1) Ik denk dat een one sample T-test voor leeftijd moet gebruiken. Kan ik deze test ook gebruiken voor aantal verkregen eicellen bij behandeling, gezien dit altijd gehele getallen zijn?

2) Hoe kan ik de proporties van het soort infertiliteit en zwangerschapsuitkomst vergelijken met de proporties uit de gehele populatie?

Bij voorbaat alvast dank voor de moeite
marcel
22-3-2005

Antwoord

Marcel,

Ik zie twee grote bezwaren:
Een bezwaar is jouw punt 2) Hoe krijg je inderdaad grip op die zwangerschapsKANS ??
Een ander bewaar is jouw keuze van de t-toets. Hier zijn meerdere argumenten tegen in te brengen.
- Je wil de t-toets gebruiken op de variabele leeftijd. Echter de t-toets mag alleen gebruikt worden in de situatie van een onafhankelijke (dichotome = 2 groepen) groepsvariabele en een daarvan afhankelijke interval ratio variabele. Maar leeftijd is op zichzelf altijd de onafhankelijke variabele. Dat loopt dus helemaal fout.
- De t-test is een techniek die op twee variabelen werkt. Het is niet echt verstandig om telkens twee variabele te toetsen omdat er vast interactie effecten zijn die ook een rol spelen. (leeftijd met classificatie infertiliteit bijvoorbeeld).
- In feite heb je weinig te toetsen. Zoals ik het interpreteer wil je een voorspeltechniek opzetten en daarbij is het gebruik van statistische toetsen zeker niet het meest belangrijk.

Wat dan wel. Dat is lastig te zeggen omdat ik geen concreet inzicht in de data heb. In eerste instantie zou ik wellicht zelf kijken naar een discriminantanalyse maar in jouw geval ben ik bang dat dat ook weinig brengt. Misschien dat een chaid-achtige techniek (SPSS answertree) leidt tot enigzins bruikbare resultaten, maar in iedere geval zal je dan de leeftijd in klassen moeten indelen op een verstandige manier. Een ook dat laatste vereist gepuzzel. Datamining (Clementine) zou misschien ook nog bruikbaar kunnen zijn maar daar heb ik helaas weinig zicht op.

Of er uberhaupt een techniek te vinden is die precies doet wat je wil is overigens nog maar de vraag. Dat hangt ook nog af van de data en de grootte en samenstelling van je onderzoeksgroep.....

PS. Krijgen jullie nog iets van les in deze statistische materie??

Met vriendelijke groet
JaDeX

jadex
25-3-2005

WisFaq - de digitale vraagbaak voor het wiskunde onderwijs - http://www.wisfaq.nl

#35747 - Statistiek - Student universiteit