Hallo, Graag zou ik willen weten of iemand me kan helpen met het volgende probleem:
Er wordt over een aantal dagen per week gemeten hoe vaak een foutsituatie voor komt ten opzichte van het totaal. Dit met de bedoeling om te kunnen achterhalen op welke tijdstippen op een dag de fout vaker voor komt dan anders. Er wordt per uur gemeten. Een dag-overzicht van aantallen per uur kan het volgende zijn:
Wanneer ik van de dagen alle totalen en alle fouten optel en die ten opzichte van elkaar laat verhouden, zie ik een duidelijke trend ontstaan. Ik zet daarin echter een goede situatie op dag x, af tegen dag y. Wanneer ik alle dagen afzonderlijk meet (percentages per uur), zie ik in een grafiek een "wolk" van resultaten, met zeer diverse trendlijnen per dag.
Bij de interpretatie van de resultaten per dag zit ik dus met het probleem dat een percentage bij kleine getallen, feitelijk iets anders uitdrukt dan bij grote getallen. De nauwkeurigheid is immers een stuk kleiner en toeval speelt een veel grotere rol (1 uit 4 zegt iets anders dan 25 uit 100).
Is er een betere methode om de tijdstippen met meer fouten te achterhalen dan werken met percentages? Wat kan mij per dag een betere trendlijn doen opleveren? Hoe kan ik het cijfer van een uur met weinig meetresultaten toch even zwaar laten wegen als een uur met veel ervan?
Groetjes,
Hans H
Iets anders - vrijdag 10 oktober 2003
Antwoord
Je analyse is zo gek nog niet, het probleem zit hem in die metingen waar slechts enkele keren per uur gemeten wordt. Dat maakt een goede vergelijking dan ook eigenlijk bijna onmogelijk. Overigens heb ik sterk de indruk dat de cijfers die je als voorbeeld geeft niet de realiteit weerspiegelen. Wanneer ons wat meer exacte gegevens zou kunnen verstrekken dan kan ik kijken wat daarmee te doen valt. Daarnaast ook een beschrijving van de situatie (welke grootheid wil je exact en hoe ?) Verder is het van belang of het hier een continu of een ad hoc (eenmalig) onderzoek betreft.