JUNIO 2012
11.
y a bx
R2
Ho : 0
SITUACION BASICA
DOS VARIABLES NUMERICAS :
DEPENDIENTE
INDEPENDIENTE
y (peso)
Pesa 50 kg.
Mide 161 cm.
Pesa 76 kg.
Variable independiente
x (altura)
Finalidad
Modelo
y (peso)
Y x u
Y 0 1 x u
y
y
b
x
y
a
Ordenada en el
origen
(intercepto)
x (altura)
6
Modelo en la Poblacin
Y x u
Modelo en la Muestra
y a bx
y (peso)
y y
Error de estimacin
Variable independiente
x (altura)
III
I
II
tener un criterio de
aproximacin que diga
no solo la altura de la
linea sino tambin la
pendiente
8
Min
( yi yi )
2
i 1
i 1
Supuestos
1.- E() = 0
E(y|x= 170)
E(y|x= 150)
10
11
12
E b
ECUACIONES NORMALES
2
0
b
y na b x
2.
2
xy
a
x
b
x
13
La ecuacin 1.
implica que:.
ECUACIONES NORMALES
y na b x , si se divide todo por n
y a bx
a y bx
Sustituyendo a por
se obtiene:
y bx
y y b( x x )
en la ecuacin
xy y bx x b x
xy y x bx x b x
xy x y / n
b
2
2
x x /n
a x b
x y
b
xy
n
2
x
2
2
x ( x)
n
Cov ( x, y )
( x x )( y y ) SXY
b
b
Var ( x )
2
SCX
(x x)
14
y y ( y y ) ( y y )
y y ( y y ) b( x x )
2
2
2
2
y y ( y y) b ( x x )
SCtotal
SCresidual
los dobles
productos
se anulan
SC Regresin
2
2
(
y
y
)
s 2y.x
n2
n2
Varianza residual (insesgada)
Grados de
libertad
15
ESTADISTICOS USUALES
2
2
(
y
y
)
s 2y.x
n2
n2
s y.x s 2y.x
sb s y.x
Coeficiente
de Determinacin R
2
S
2
R 1 e2
SY
SCRegresi n
SCtotal
SCX
2
(0 R 1)
Varianza residual
Varianza de las y originales
16
17
Interpretacin de la variabilidad en Y
2
Y
18
y )
2
e
19
Bondad de un ajuste
Resumiendo:
S
R 1
S
2
2
e
2
Y
S 20 S
2
e
2
Y
b tsb
b b tsb
faja de
confianza
para
y x
y
faja de
confianza
para y
x
y)
21
No hay relacion
230
180
130
80
30
140
150
160
170
180
190
200
CORRELACION
CAUSACION
23
COVARIANZA
Es una medida de la variacin lineal conjunta de dos variables
y
centroide
yy
xy
x x
( y y )( x x )
N
Estimacin de xy
( y y )( x x )
cov
n
Es un estimador sesgado
xy <
xy =
xy
24
El
Valor en la muestra
(Rho ) en la poblacin
25
CORRELACION LINEAL
Finalidad
Medir la intensidad de la asociacin lineal entre dos variables
aleatorias
coeficiente de correlacin
xy / x y
covarianza poblacional
r s xy / s x s y
coeficiente de
determinacin
r2
26
Propiedades de r
Es adimensional
Slo toma valores entre -1y +1
Las variables NO estn correlacionadas r=0
Relacin lineal perfecta entre dos variables r = +1 o r=-1
Excluimos los casos de puntos alineados horiz. o
verticalmente.
Cuanto ms cerca est r de +1 o -1 mejor ser el grado de relacin
lineal.
Siempre que no existan observaciones anmalas.
Relacin
inversa
perfecta
-1
Variables
NO correlacionadas
Relacin
directa
casi
perfecta
+1
27
Correlacin negativa
-1 r 0
r=-1
Correlacin positiva
0 r +1
r=+1
28
r=0
Ausencia de correlacin
29
30
ESTIMACION DE
PRUEBA DE
(rho) r Cov s .s
x y
Ho : 0 t calc
r n2
1 r 2
32
34
35
Precauciones en la interpretacin de r
x
r = 0.98 (p=0.001)
y
El coeficiente de correlacin entre dos variables SE VE AFECTADO
por la existencia de otras variables
Un tercer factor no considerado an (llamado "factor de confusin
o "variable escondida").
36
r = 0.92
un coeficiente de correlacin alto no
siempre se corresponde con una
relacin lineal entre las variables
37
CORRELACION
x variable
independiente fija
y variable
x e y son variables
dependiente aleatoria
aleatorias
38
39
Hallar
Entrar y Hallar
Entrar x
denominador
Entrar los productos (x y) Hallar
Calcular:
Cov x y x. y
r Cov
rs y
sx
s x .s y
a y bx
xy
Testar:
Ho : 0
y a bx
40