Beste,
Ik zie uw mail niet in mijn mailbox staan. Dit zijn de verdelingen van beide groepen:
Groep A (n = 500):
- 0,5% BuSO
- 0,5% BSO
- 1,5% KSO
- 7% TSO
- 90,5% ASO
Groep B (n = 5000):
- 2% BuSO
- 2,5% BSO
- 2,5% KSO
- 28% TSO
- 65% ASO
Met vriendelijke groeten
Kimberly
24-5-2023
Kijk, hier komen we wel een stuk verder mee. Je kunt de groep A uit groep B halen en dan een vergelijking maken tussen alles wat in A zit en alles wat niet in A zit (totaal 4500). Dan zijn beide groepen onafhankelijk.
Maar er is nu een betere mogelijkheid aangezien jouw groep B zo groot is en groep A een relatief klein onderdeel hiervan is. Dat komt neer op het volgende. Ik beschouw groep B als een populatie en groep A als een steekproef uit deze populatie. Nu ga ik alle opleidingen vergelijken met één toets. De nulhypothese hierbij is: de verhoudingen van opleidingen in groep A komt overeen met die verhouding in de populatie B.
Dit toets je met een chi kwadraat goodness of fit toets. Deze werkt met aantallen en is op zich niet heel lastig. De groep A van totaal 500 ga ik omrekenen naar aantallen.
Dan gebruik ik de verhoudingen van groep B om de ideale verwachte waarden bij groep A te berekenen. Dus verwacht aantal TSO in groep A zou zijn 28% van 500 = 140
Dat kan je allemaal online uitvoeren b.v. via de genoemde site.
Dit is hoe ik de aantallen invul op deze site. Dat levert:
Dat dashboard is wel illustratief. Die P waarde dicht bij 0 in het rood betekent significant verschil tussen de verhoudingen in de steekproef en populatie.
Die power van 1 is het onderscheidend vermogen van de toets. In dit geval bijna perfect. Tot slot nog een toelichting richting conclusies.
Tja, er is dus een duidelijk verschil in de verhoudingen. Als je het eerste plaatje bekijkt dan zie dat dit met name ligt aan TSO en ASO. De site laat ook nog zoiets zien.
Je zou voor TSO apart en ASO apart nog een verschiltoets voor fracties kunnen uitvoeren maar dat is in deze situatie verder overbodig: het beeld is volkomen duidelijk.
Met vriendelijke groet
JaDeX
jadex
24-5-2023
#97747 - Statistiek - Student Hoger Onderwijs België