Via Excel wil ik van twee rijen getallen (rendementen) nagaan of hier een correlatie tussen bestaat.
Ik kom dan tot de volgende conclusie (deze wijsheid heb ik uit een wiskunde dictaat gehaald):
X-as: a
Y-as: b
Xcoeff (lijnsch() ): 0.8383
Constante (snijpunt() ): 8.3283
R2 (Rkwadraad): 0.8808
n (aantal): 68
Y = aX + b
a = 0,838
b = 8,33
CORRELATIE COEFF (R)
R2 = 0,8808
R 0,9385
NAUWKEURIGHEID VAN R: (S)
S = (1-R2)/Vn
S = 0,014449559
NAUWKEURIGHEID v.d.. CORR. COEFF.
R +/- S
Rmin 0,9241
Rmax 0,9530
AANWIJSBARE CORRELATIE
0,75 < R < 1
Rmin > 0,75? ja
Vervolgens maak ik voor de duidelijkheid een grafiek met regressielijn
Echter, hoe moet ik nu verwoorden wat er nu bedoeld wordt met een “nauwkeurigheid van de correlatiecoëfficiënt” tussen de 0.93 en 0.95 ? En welke conclusie mag ik hieruit trekken?
Mvg Gijs
gijs
29-10-2002
Hoi,
De nauwkeurigheid van de correlatiecoëfficiënt geeft aan hoe nauwkeurig je R berekend heb. R is berekend op basis van je data en heeft dus ook een schatting voor de correlatie. De S is wellicht de standaarddeviatie op deze correlatie. R heeft een normale verdeling zit met een kans van 67% binnen het interval [R-S,R+S].
De echte maat voor lineaire regressie is echter R2. Deze geeft aan welk deel van de variantie op je waarden door een lineair verband verklaard worden. In dit geval is dat dus 88%. Er is dus een sterk lineair verband.
Misschien moet je een aantal extremen uitsluiten, of een aantal waarden die de benadering sterk vertekenen.
Groetjes,
Johan
andros
30-10-2002
#5048 - Statistiek - Iets anders