Stel dat je het gemiddelde gewicht en de standaardafwijking wilt weten van 250 personen. Streef je naar perfectie, dan zul je met 250 waarnemingsgetallen aan de slag moeten. Veel werk dus. Op dat moment komt de klassenverdeling in zicht. In plaats van met ieder apart geregistreerd gewicht te werken, maak je een klassenindeling van bijvoorbeeld 5 kilo breed. Als de lichtste persoon 47 kg weegt en de zwaarste 102, dan zou je bijvoorbeeld de volgende klassenindeling kunnen kiezen:
45-<50 en 50-<55 en 55-<60 ......t/m 100-<105.
Als ik goed geteld heb, dan krijg je op deze manier 12 klassen. Vervolgens plaats je alle 250 meetresultaten in de juiste klasse. Iemand van bijv. 82 kilo komt dan in klasse 80-<85, maar iemand van 84 kilo komt in die zelfde klasse. Als alle gewichten in de goede klasse zijn gezet, dan heb je een klassenindeling gemaakt.
Stel dat er in de al genoemde klasse 80-<85 in totaal 41 personen zitten. Van al deze 41 personen vervang je nu hun echte gewicht door het zogenaamde klassemidden, in dit geval 82,5 kilo.
Het nadeel is dus dat de individuele meting verloren gaat, het voordeel is dat je met veel minder verschillende gewichten te maken hebt. Natuurlijk zal door deze aanpak het gemiddelde dat je met de klassenindeling berekent niet precies samenvallen met het échte gemiddelde. Idem voor de standaardafwijking. Maar, als het er niet zo heel erg op aan komt, dan weegt de bereikte tijdsbesparing op tegen deze kleine verschillen.
In de praktijk maakt men het aantal klassen niet al te groot, maximaal een stuk of 20. Als je namelijk heel veel klassen aanlegt, dan heb je bijna net zoveel werk aan het maken van de indeling dan wanneer je alle getallen apart zou meenemen. Ook te weinig klassen is niet goed: dan wordt het dermate grofmazig dat de resultaten onbetrouwbaar worden.
MBL
vrijdag 25 oktober 2002