Definicin
Diagrama de dispersin
80
100
70
90
60
80
50
70 40
60 30
50 20
10 r=-0,95
40 r=0,9
0
30
140 150 160 170 180 190 200
140 150 160 170 180 190 200
330
recta o parbola?
280
230
180
130
80 r=0,1
30
140 150 160 170 180 190 200 140 150 160 170 180 190 200
r=
n xy - x y
n x 2
- ( x) n y - ( y)
2 2 2
Karl Pearson
(1857 1936)
PROPIEDADES DE R
Relacin Relacin
No existe asociacin directa
inversa lineal
perfecta perfecta
-1 0 +1
INTERPRETACION DEL COEFICIENTE DE CORRELACION
Ventas en Millones
1998 3 20 0.8
1999 5 40 0.6
2000 5 80
0.4
2001 6 120
2002 6 90 0.2
2003 7 125 0
2004 4 35 0 0.2 0.4 0.6 0.8 1 1.2
Gastos en Publicidad (Millones)
2005 8 135
n 8, x 5.5, y 80.625
r=
n xy - x y
8(4015) - 44(645)
0.932
n x 2
- ( x) n y - ( y )
2 2 2
8(260) - 44 8(65975) - 645
2 2
Definicin
Y 0 1 X e
Francis Galton donde
Primo de Darwin
Estadstico y aventurero o y 1 : Parmetros o coeficientes del modelo
Fundador (con otros) de Y : Variable dependiente
la estadstica moderna
para explicar las teoras X : Variable Independiente
de Darwin.
e : Error aleatorio
REGRESIN LINEAL ESTIMADA
Como los parmetros o y 1 son desconocidos, es necesario estimar los valores de esos
parmetros a travs de datos muestrales.
Y b0 b1 X
donde
e (y
2
i y i ) 2 min
y = b n+b x
0 1
xy = b x + b x
0 1
2
De donde obtenemos
b 0 = y - b1x b1 =
n xy- x y
n x - ( x)
2 2
1 13 26
2 16 33
3 30 36
4 2 16
5 8 26
6 6 19
7 31 38
DIAGRAMA DE DISPERSIN
1.2
0.6
0.4
0.2
0
0 0.2 0.4 0.6 0.8 1 1.2
Experiencia
N
Experiencia Ventas(miles)
(X) (Y) XY X2 Y2
1 13 26 338 169 676
2 16 33 528 256 1089
3 30 36 1080 900 1296
4 2 16 32 4 256
5 8 26 208 64 676
6 6 19 114 36 361
7 31 38 1178 961 1444
X= 106 Y=194 XY=3478 X2=2390 Y2=5798
n 7 ; x
x 106 15.14 ; y
194
27.71
n 7 7
x 2
i
nx 2
i 1
b0 y - b x 27.71- 0.688 (15.14) 17.29
b0 y b1 x 27.71 ( 0.688 )15.14 17.29
ECUACIN DE REGRESIN
Y 17.29 0.688 X
n 2
yi y
R 1-
2 i=1
r2
n 2
yi y
i=1
Caractersticas:
Ejemplo: Del ejemplo sobre la regresin entre los aos de experiencia y las ventas
tenemos:
Interpretacin: El 88.3% de las variaciones de las ventas (Y) son explicados por los
aos de experiencia. Existe adems un (100-88.3)% = 11.7% que no es explicado por
los aos de experiencia.
Verificando mis Logros
X Y
35 60
45 75
55 95
50 80
60 90