Als afstudeerproject wil ik het gasverbruik kunnen voorspellen. Het gasverbruik is afhankelijk van 2 factoren: de buitentemperatuur en het tijdstip van de dag. Hier ligt volgens mij een niet-lineair verband, want de correlatiecoefficient is bijna 0. De correlatiecoefficient is op maandbasis 0,71 omdat hier het dag-nacht-patroon niet aanwezig is. Mijn vraag: Hoe kan ik nu het beste een voorspelling opstellen van het gasverbruik op uurbasis? Ik heb een historische data (uurbasis) van minimaal 1 jaar. Op deze data heb ik een effeningsmethode (voortschrijdende gemiddelden) toegepast, om de seizoensbijdrage te bepalen (ieder uur heeft dan zijn eigen gemiddelde bijdrage). Vervolgens heb ik de seizoensbijdrage uit de data gehaald, door de uurwaarde te delen door zijn eigen seizoensbijdrage. Er onstaat dan een nieuwe trendlijn over het jaar gezien, die 's zomers laag is en 's winters hoog. Moet ik nu nog de kleinste-kwadraten-methode toepassen om een trendlijn te verkrijgen? En vervolgens de trendwaarde voor iedere periode bepalen (periode=uur)? Wie kan mij helpen met bovenstaand probleem. B.v.d.
Doo
Student hbo - zaterdag 23 oktober 2004
Antwoord
Je hebt te maken met twee seizoensinvloeden. Deze seizoensinvloeden zijn niet onafhankelijk van elkaar in die zin dat de buitentemperatuur ook afhangt van het tijstip van de dag. Daarnaast is het ook nog zo dat er een derde seizoensinvloed een rol speelt namelijk de dag van het jaar. In de zomermaanden, wanneer veel mensen op vakantie zijn, zal het gasverbruik ook lager liggen door die oorzaak. Daarnaast zijn er twee vragen die een rol spelen bij de aanpak van dit probleem: 1) Gaat het om het huishoudelijk gasverbruik of telt het verbruik van de industrie ook mee? Dat laatste maakt het probleem (vrijwel) zeker veel gecompliceerder. 2) Wat is het doel van deze analyse? M.a.w. wanneer het model klaar is, wat moet er dan precies mee kunnen? en op welke termijn? Of dit lukt is maar de vraag.... dit soort vragen is vaak een kwestie van puzzelen met een niet zekere uitkomst.
Er ontstaat dan een nieuwe trendlijn over het jaar gezien, die 's zomers laag is en 's winters hoog. Moet ik nu nog de kleinste-kwadraten-methode toepassen om een trendlijn te verkrijgen? En vervolgens de trendwaarde voor iedere periode bepalen (periode=uur)?
Deze vraag is zeer terecht, ik zou zeggen nee. Want dan zouden de voorspellingen alleen maar slechter kunnen worden. Probleem is dat je een dubbele seizoensinvloed hebt. Namelijk de kwartalen (liever maanden) en het tijdstip van de dag.
Wellicht is het handig om een statistiekdocent van jouw hogeschool in te schakelen (welke HBO school is dit overigens?).