de Probabilidades
1
Relaciones entre variables y regresión
El término regresión fue introducido por Galton en su libro
“Natural inheritance” (1889) refiriéndose a la “ley de la
regresión universal”:
100
90
80
70
10 kg.
60
50
10 cm.
40
30
140 150 160 170 180 190 200
3
Regresión
El análisis de regresión sirve para predecir una medida en
función de otra medida (o varias).
XY
(X1, X2, … , Xn) Y
Y = Variable dependiente
respuesta
predicha
explicada
X = Variable independiente
regresora
predictora
explicativa
4
Regresión
¿Es posible descubrir una relación?
RELACIÓN FUNCIONAL
Y=f (X1, X2, … , Xn)
Ejemplo: La relación que existe entre el tiempo (Y) que tarda un
móvil en recorrer una distancia (X) a velocidad constante (v)
Y=X/v
NO EXISTE NINGUNA RELACIÓN
Ejemplo: La relación que existe entre el dinero (Y) que gana una
persona adulta mensualmente y su altura (X)
RELACIÓN ESTOCÁSTICA
Y = f(X) + error
5
Regresión
180
150 b1=0,5
120
90
60
b0=85 cm
30
0
0
10
20
30
40
50
60
70
80
90
100
110
120
130
140
150
160
170
180
190
200
210
220
8
La relación entre las variables no es exacta. Es natural
preguntarse entonces:
¿Cuál es la mejor recta que sirve para predecir los valores de
Y en función de los de X?
¿Qué error cometemos con dicha aproximación (residual)?.
180
150 b1=0,5
120
90
60
b0=85 cm
30
0
0
10
20
30
40
50
60
70
80
90
100
110
120
130
140
150
160
170
180
190
200
210
220
9
El modelo lineal de regresión se construye utilizando la técnica de
estimación mínimo cuadrática:
Buscar b0, b1 de tal manera que se minimice la cantidad
Σi ei2
SY
b1 r b0 y b1 x
SX
Se obtiene además unas ventajas “de regalo”
El error residual medio es nulo
La varianza del error residual es mínima para dicha estimación.
10
Que el error medio de las Cometió un error
predicciones sea nulo no quiere de -30 en su
última predicción
decir que las predicciones sean
buenas.
11
¿Cómo medir la bondad de una regresión?
12
Bondad de un ajuste
Resumiendo: Y
2
S
R 1
2 e
2
S Y
S 2
e S 2
Y
13
Otros modelos de regresión
Se pueden considerar otros ¿recta o parábola?
tipos de modelos, en función del
aspecto que presente el
diagrama de dispersión
(regresión no lineal)
14