simple
(variables):
(dependiente)
Buscamos encontrar una funcin de X muy simple (lineal) que nos permita
aproximar Y mediante la ecuacin de la recta de regresin Y = B0 +
BX
Constantes regresin B (pendiente/ incremento de la VD (Y) cuando
la VI (X) aumenta en una unidad) y B0 (ordenada en el origen / valor
estimado de Y cuando X = 0)
Error residual o Error de estimacin = (Y Y)
_
_
Siendo la media de los valores pronosticados (Y) = la media de los valores observados (Y)
AD II Y
6
4
6
7
7
= 30
AD I X
4
3
7
6
9
= 29
XY
24
12
42
42
63
= 183
Media X = 29 / 5 = 5,8
Y
5,29
4,895
6,475
6,08
7,265
=
30,005
(Y Y)2
0,5041
0,8010
0,2256
0,8464
0,0702
= 2,45
y2
0
4
0
1
1
=6
Media Y = 30 / 5 = 6
S n
4,56 5
SX X
SX
5,7 S X 5,7 2,39
n 1
4
2
Y 2
186
Y S Y2
(6) 2 1,2 S Y 1,2 1,095
n
5
2
2
2
S n
1,2 5
SY Y
SY
1,5 S X 1,5 1,22
n 1
4
S Y2
S XY
X Y S XY
(5,8 6) 1,8 rXY XY rXY
0,769
n
5
S X SY
2,135 1,095
rXY
n XY X Y
[n X ( X ) ][ n Y ( Y ) ]
2
rXY
0,769
S
n XY X Y
(5 183) (29 30)
1,095
B
0,395 B rXY Y 0,769
0,395
2
2
2
SX
2,135
[ n X ( X ) ]
(5 191) 29
RECTAS DE REGRESIN
Diferenciales
y Bx B( X X )
y= 0,395
Media X)
(X
Tpicas
X X
z rXY Z X rXY
SX
XX
z= 0,769
S Y2
(Y Y ) 2 6
(Y Y ) 2 3,55
(Y Y ) 2 2,45
1,2 S Y2
0,71 S e2
0,49
n
5
n
5
n
5
Proporcin de varianza de la
3
R2XY
R2XY (Coeficiente de
Determinacin)
Proporcin de varianza de la
VD no explicada por la varianza
de la VI
Ejemplo para
representar la
proporcin de
varianza
compartida por X e
Y
Para r = 0,892
2
S e S Y 1 rXY
1,095 0,639 0,7 S e
(Y Y ) 2
2,45
0,904
n2
3
(15,1)
2
2
0,456
1 r XY
1 (0,89)
Estadsticos de contraste
Decisin
La T terica = 0005 t 60gl = (- 15,1) < (- 266); por tanto rechazamos H0 (la
correlacin es significativa)
Interpretacin Para un nivel de confianza del 99% y un contraste bilateral, la
correlacin es significativamente distinta de cero (H1: NC 0) por lo que debe
pensarse que existe relacin lineal significativa entre el consumo medio de
cigarrillos y la ingesta media de chicles de nicotina.
C. HIPTESIS PARA LA PENDIENTE DE LA REGRESIN Se pueden utilizar
dos mtodos (mediante ANOVA y mediante un contraste T) para comprobar si la
pendiente es significativa (igual o distinta de cero):
MTODO ANOVA (Probamos Hiptesis
0)
SUMAS
CUADRTICA
S
GRADOS
DE
LIBERTAD
MEDIAS
CUADRTICAS
ESTADSTICO DE
CONTRASTE
DEBIDA A LA
REGRESIN
RESIDUAL
O ERROR
SC
TOTAL
MC REGRESIN
3,55 / 1 = 3,55
MC RESIDUAL = 2e
2,45 / 3 = 0,82
REGRESIN
3,55
SC RESIDUAL
2,45
SC
1
(5-2) = 3
F = (3,55 / 0,82)
= 4,3
TOTAL
(5-1) = 4
rXY n 2
2
1 r XY
0,769 (5 2)
1 0,769
1,33
R 2 /1
0,59
2,08 F
4,3
2
0,64
(1 R ) /( N 2) 0,137
Distribucin T
B0
SY
SX
/ 2 = 0,025; n-2
0,395
H1: 0
0,395
2,1
0,188
2
1 rXY
1,09 1 0,769 2
2,13
52
n2
y T 1 - / 2 = 0,975; n-2 3,18 > 2,1 (Mantenemos H0)
B0 0
Se
3,71
2
2
H1: 0 0
0,904
1
5,8
5 (5 1) 5,7
3,71
3,37
1,1
(n 1) S X
Distribucin T / 2 = 0,025; n-2 y T 1 - / 2 = 0,975; n-2 3,18 < 337 (Rechazamos H0)
Intervalo de confianza IC (B0)= B0 T n-2; 1- /2 B0 3,71 (3,18 1,1) =
(7208 y 0212)
El intercepto no es nulo (0 0) 0 no est en el
intervalo de confianza.
En la mayora de los estudios el contraste para el intercepto (0) suele ignorarse.
PROBLEMA EJEMPLO
Sumatorio ()
Media
Desviacin
tpica
varianza
942933
434
Y
2354
9416
105423
11114
B2 = 2 (SY / S2)
RY .12
0,759
0,946
1 r122
RY. 12 = 0759 Coeficiente de correlacin
mltiple
R2Y. 12
= 0,576
Coeficiente de
determinacin mltiple
rY 1 (rY 2 r12 )
0,436 [0,504 (0,231)]
1
0,583
2
0,9466
1 r12
r ( rY 1 r12 )
0,504 [0,436 ( 0,231)]
2 Y 2
2
0,639
2
0,9466
1 r12
R Y .12 1 (1 R
2
Y 12
2
n 1
24
)
R Y .12 1 [(0,4239)
0,538
n p 1
25 2 1
margen del influjo de las otras variables del modelo). Las correlaciones entre
dos variables de orden cero son correlaciones calculadas sin tener en cuenta
la presencia de terceras variables.
Aclaracin
Al considerar una variable dependiente (Y) y dos independientes (X 1 y X2), para
calcular la correlacin parcial entre Y y X1, eliminamos en ambas variables
el influjo de X2. Para calcular el coeficiente de correlacin semiparcial
eliminamos solamente en X1 el influjo de X2.
11
a = sr21 = (0,64-0,36) =
0,28
b = sr22 = (0,64-0,49) =
0,15
CONTRIBUCIN EXCLUSIVA
c = proporcin de
varianza de la VD
estimada conjuntamente
( de forma redundante)
por las dos variables (X1
y X2) = 0,21
CONTRIBUCIN EXCLUSIVA
R2Y. 12 = a + b + c
0,64 = 0,28 + 0,15 +
0,21
CORRELACIONES PARCIALES
r2Y1 = a + c 0,28+0,21 =
0,49
r2Y2 = b + c 0,15+0,21 =
0,36
PROBLEMAS EJEMPLO
1.- Consideremos, a modo de ejemplo, las variables X1, X2 e Y, cuyas
correlaciones son las siguientes: ry1 = 0,7; ry2 = 0,6 y RY. 12 = 0,8. Una primera
ojeada puede hacernos pensar que la variable X 1 contribuye a la variabilidad de
Y en una proporcin de 0,72 = 0,49 y que la variable X2 contribuye en una
proporcin de 0,62 = 0,36. No obstante, se sabe por la correlacin mltiple que
la proporcin de variacin explicada es de 0,8 2 = 0,64. El total de ambas
contribuciones no es igual a la suma, luego est claro que ambas variables
12
13