Voor mijn bacheloropdracht heb een model opgesteld waarmee het aantal benodigde arbeidsuren op een afdeling in een bepaalde week, gegeven een aantal factoren zoals het aantal geplande opdrachten en mogelijke spoedopdrachten, berekend/voorspeld kan worden.
Nu wil ik toetsen in hoeverre dit model betrouwbaar is. Ik heb daarom uit een jaar (52 weken) een steekproef genomen van 45 weken en uitgezocht wat de omstandigheden van die week waren en hoeveel arbeidsuren er ingezet zijn.
Daarmee wil ik gaan bepalen of de waarde die mijn model voorspelt voor een bepaalde week significant afwijkt van de in de praktijk gemeten waarde.
De gegevens zijn van deze vorm:
week praktijk modelvoorspelling
1 10 11
2 17 13
3 40 32
4 21 18
.. .. ..
45 18 15
In eerste instantie dacht ik een tweezijdige t-toets te moeten toepassen. Maar die toets gebruik gemiddelden over beide variabelen. Dat lijkt me hier niet juist, aangezien het getal van de ene week van een totaal andere orde van grootte kan zijn dan in de andere week en een gemiddelde over alle weken dus eigenlijk niets zegt. Het gaat dus echt om de vergelijk tussen de paren: per week. Welke toets is daarvoor geschikt?Gerben
6-5-2010
lastige vraag, dat ligt eraan. Van belang is ook of de totalen bij het model en bij de voorspelling gelijk zijn. In ieder geval moet je m.i. op zoek naar een verdelingsvrije toets.
Dan is het zo dat de meeste toetsen slechts toetsen op een gemiddelde of mediaan dus niet op dse afzonderlijke afwijkingen. Dan weet je overigens wel iets van je model, dat is namelijk dat je model een zuivere schatter geeft. M.a.w. niet systematisch te hoog of te laag schat. En dat is ook wel wat waard. Daarvoor zou ik een rangtekentoets voor gepaarde (=gekoppelde) waarnemingen gebruiken. Wanneer je een normale verdeling aanneemt kun je daar ook nog een t-test voor gepaarde waarnemingen tegenaan zetten om te kijken wat die doet.
Met vriendelijke groet
JaDeX
jadex
7-5-2010
#62363 - Steekproeven - Student universiteit