Kruistabellen gebruik je om een overzicht te krijgen van het verband tussen twee of meer variabelen. Het meetniveau is nominaal of ordinaal. Soms worden interval en ratio niveau als klassen weergegeven.
Voorbeeld
Bij een bankkantoor onderzoekt men de gang van zaken bij de afbetaling van persoonlijke leningen. Voor 100 verstrekte leningen werd bekeken of deze volledig volgens de voorwaarden afgelost zijn. Bij 30 leningen bleken er problemen te zijn geweest. We noemen dit wanbetalers, bij 70 leningen is de afbetaling correct verlopen. De bank wil onderzoeken of het betaalgedrag afhangt van de leeftijd van de leners. Daarom is tevens vastgesteld wat de leeftijd van iedere lener was.
Leeftijd van de lener
|
betaalgedrag
|
totaal
|
|
wan-betalers
|
correct
|
|
Jonger dan 40
|
24
|
36
|
60
|
40 of ouder
|
6
|
34
|
40
|
Totaal
|
30
|
70
|
100
|
Op grond van de randtotalen zou je, als betaalgedrag en leeftijd onafhankelijk zouden zijn iets anders verwachten:
Leeftijd van de lener
|
betaalgedrag
|
totaal
|
|
wan-betalers
|
correct
|
|
Jonger dan 40
|
18
|
42
|
60
|
40 of ouder
|
12
|
28
|
40
|
Totaal
|
30
|
70
|
100
|
Het vergelijken van theoretische en de waargenomen frequenties doen we volgens een methode die men de $\chi^2$-toets noemt. Bij deze methode wordt een toetsingsgrootheid $\chi^2$ berekend volgens de volgende formule:
$
\chi ^2 = \sum {\large \frac{{\left( {O_i - E_i } \right)^2 }}{{E_i }}}
$
Oi = de waargenomen frequentie (observed)
Ei = de theoretische frequentie (expected)
$
\chi ^2 = \large \frac{{\left( {24 - 18} \right)^2 }}{{18}} + \frac{{\left( {36 - 42} \right)^2 }}{{42}} + \frac{{\left( {6 - 12} \right)^2 }}{{12}} + \frac{{\left( {34 - 28} \right)^2 }}{{28}}
$
$
\chi ^2 = 2 + 0,86 + 3 + 1,29 = 7,14
$
Vrijheidsgraden
De vraag is nu voor welke waarde van $\chi^2$ je besluit dat 'leeftijd' en 'betaalgedrag' niet onafhankelijk zijn. Dat hang af van de grootte van de tabel. Je spreekt in dat geval over vrijheidsgraden.
Het aantal vrijheidsgraden v = (m-1)(n-1) waarbij m het aantal keuzemogelijkheden voor de eerste variabele en n het aantal keuzemogelijkheden voor de tweede variabele.
In bovenstaand voorbeeld is het vrijheidsgraden gelijk aan (2-1)(2-1)=1.
In de tabel is de grenswaarde gelijk aan 3,84. Wij hadden 7,14 berekend. Dat is groter dan 3,84, dus kan je concluderen dat 'leeftijd' en 'betaalgedrag' afhankelijk zijn.