\require{AMSmath}
WisFaq - de digitale vraagbaak voor wiskunde en wiskunde onderwijs


Printen

Normaalverdeling, steekproef en t-test

Ik heb een kleine vraag ter controle van het één en ander.
Het onderzoek betreft een analyse van een Franstalig en Nederlandstalig magazine met advertenties uit 2003 om te zien of en in welke mate er Engels in voorkomt, en of er een significant verschil is tussen beide. Ik heb uit Elsevier (32 advertenties, 64 Engelse woorden) en Le Point (12 advertenties, 13 E. woorden) van 18 oktober 2003 alle grotere advertenties geselecteerd/geanalyseerd. Gemiddeld bleek in de Franse 1 Engels woord te zitten, in de Nederlandse rond de 2. Geen significant verschil volgens de T-test bij veronderstelde normaalverdeling (.367).
De vraag daarover luidt:
1. Volgens mijn docent is het wellicht mogelijk hier, ondanks dat de omvang van beide corpora duidelijk verschillen (al is haar kennis niet al te uitgebreid hiervan), hier een normaalverdeling te veronderstellen en mij op de gemiddelden te baseren voor de statistische berekening via t-test (equal variances assumed). De mediaan zal niet veel variëren ten opzichte van de gemiddelden, omdat in veel advertenties hetzelfde beeld naar voren komt. Uitschieters zijn er niet echt bij de Franse advertenties en weinig bij de Nederlandse. Is dit inderdaad een redelijk uitgangspunt?

2. Typering.
Het gaat ook om de bepaling van het referentiekader: wat neem je als uitgangspunt als populatie? Zij zegt: je wilt een inzicht krijgen in de recente stand van zaken (2003) van leenwoorden in het Franse en Nederlandse reclamelandschap (uiteraard). Dat is de aanvankelijke populatie. De steekproef is dan dat ik 1 toevallig, beschikbare publicatie van beide magazines neem en daarvan vervolgens alle advertenties analyseer. Is het in feite mogelijk om de verhouding (theoretische) populatie-steekproef hier zo te omschrijven?


Hartelijk dank voor het antwoord!




robin
Student universiteit - dinsdag 15 maart 2005

Antwoord

1) Het aantal engelse woorden in een artikel is een discrete variabele met slechts enkele voorkomende waarden 0,1,2 en zelden daarboven. Met je geringe onderzochte aantallen (32 en 12) een zeer slechte basis voor een t-test.
2) Medianen gebruiken lijkt mij helemaal verstandig.
3) Je steekproeven zijn veel te gering om welke toetsende techniek dan ook met succes uit te kunnen voeren!!!!

De oplossing: eerst maar eens moeite doen om minstens 100 vergelijkbare Nederlandse en minstens 100 Franse advertenties te bekijken. Wanneer je ons daarvan de exacte resultaten kunt vertellen willen nog wel eens kijken of we daar een goede techniek bij kunnen vinden.

Met vriendelijke groet
JaDeX


vrijdag 25 maart 2005

©2001-2024 WisFaq