Anda di halaman 1dari 20

Tema 6: Regresión simple

Introducción a la Estadística Económica


© ª
Covadonga Caso, Esteban Fernández, Ana Salomé García, Matías Mayor, M
Jesús Río y M Rosalía Vicente
ª

©
Introducción a la Estadística Económica ( Tema 6: Regresión
Covadonga Caso, simple 1 / 20
Esteban Fernández, Ana Salomé García,
Índice

1 Correlación y regresión

2 Rectas de regresión minímo cuadráticas

3 Análisis de bondad de modelos

4 Predicción con modelos causales

©
Introducción a la Estadística Económica ( Tema 6: Regresión
Covadonga Caso, simple 2 / 20
Esteban Fernández, Ana Salomé García,
Correlación y regresión

Correlación y regresión

Correlación: Estudio del tipo e intensidad de las relaciones entre


variables estadísticas

Regresión: Construir modelos Y=f(X) para representar la relación


causal entre dos variables

©
Introducción a la Estadística Económica ( Tema 6: Regresión
Covadonga Caso, simple 3 / 20
Esteban Fernández, Ana Salomé García,
Correlación y regresión

Regresión
La nube de puntos sirve de orientación sobre la forma de la función que
mejor aproxima las observaciones (función de ajuste Y=f(X))

=⇒Sugiere un ajuste lineal

La función de ajuste dependerá de una serie de parámetros desconocidos


que se deben estimar
En este tema estudiaremos
Regresión lineal simple
La regresión lineal simple no agota las posibilidades:
Regresión no lineal
Regresión lineal múltiple
©
Introducción a la Estadística Económica ( Tema 6: Regresión
Covadonga Caso, simple 4 / 20
Esteban Fernández, Ana Salomé García,
Rectas de regresión minímo cuadráticas

Ajuste por mínimos cuadrados I

Sea (X,Y) una variable bidimensional con distribución de frecuencias


(xi , yj , nij )(i = 1, ..., k; j = 1, ..., m)

Objetivo
Determinar los parámetros que especican la función de ajuste Y= f(X)

Para cada valor observado de la variable independiente X (xi ) se pueden


considerar dos valores de la variable dependiente Y :
Valor observado (yj )
Valor teóricoobtenido mediante la función de ajuste yti = f (xi )
La diferencia entre el valor observado y el valor teórico recibe el nombre de
error o residuo (eij = yj − yti )

©
Introducción a la Estadística Económica ( Tema 6: Regresión
Covadonga Caso, simple 5 / 20
Esteban Fernández, Ana Salomé García,
Rectas de regresión minímo cuadráticas

Ajuste lineal por mínimos cuadrados II


Objetivo
Determinar los parámetros de la función de ajuste Yt = f (X ) que minimice
la suma de cuadrados de los errores:
k m k m
∑ ∑ eij2 nij = ∑ ∑ (yj − yti )2 nij
i=1j=1 i=1j=1

©
Introducción a la Estadística Económica ( Tema 6: Regresión
Covadonga Caso, simple 6 / 20
Esteban Fernández, Ana Salomé García,
Rectas de regresión minímo cuadráticas

Regresión lineal por mínimos cuadrados I


Objetivo
Determinar los parámetros b0 y b1 de la recta de ajuste Yt = b0 + b1 X
tales que:

k m k m
min E (b0 , b1 ) =
b0 ,b1
∑ ∑ eij2 nij = ∑ ∑ (yj − b0 − b1 xi )2 nij
i=1j=1 i=1j=1

Condición necesaria de extremo:

Ecuaciones Normales
k m
∂ E (b0 , b1 )
= −2 ∑ ∑ (yj − b0 − b1 xi ) nij = 0 (1)
∂ b0 i=1 j=1

k m
∂ E (b0 , b1 )
= −2 ∑ ∑ (yj − b0 − b1 xi ) xi nij = 0 (2)
∂ b1 i=1 j=1

Introducción a la Estadística Económica ( © Tema 6: Regresión


Covadonga Caso, simple 7 / 20
Esteban Fernández, Ana Salomé García,
Rectas de regresión minímo cuadráticas

Regresión lineal por mínimos cuadrados II

Solución
SXY
b1 = ; b0 = ȳ − b1 x
SX2

Propiedad
La recta de regresión de Y sobre X se puede expresar como:
SXY
(y − ȳ ) = (x − x)
SX2

©
Introducción a la Estadística Económica ( Tema 6: Regresión
Covadonga Caso, simple 8 / 20
Esteban Fernández, Ana Salomé García,
Rectas de regresión minímo cuadráticas

Interpretación de parámetros

b0 : Ordenada en el origen
b1 : Pendiente de la recta b1 = dY
. Variación de Y ante un

dX
incremento unitario de X

Denición
La pendiente de la recta de regresión mínimo cuadrática de Y sobre X se
denomina coeciente de regresión de Y sobre X (rY /X )

Propiedad
El coeciente de regresión de Y sobre X puede ser expresado como:
SY
rY /X = rXY
SX

©
Introducción a la Estadística Económica ( Tema 6: Regresión
Covadonga Caso, simple 9 / 20
Esteban Fernández, Ana Salomé García,
Rectas de regresión minímo cuadráticas

Ilustración recta de regresión

X: Renta (miles de euros)


Y: Gasto en viajes (miles de euros)

x = 35, 5; ȳ = 5, 5; SXY = 30, 15; SX2 = 118, 75

Y=-3,5+0,25X

Ante un aumento de la
renta de 1.000 euros se
espera un aumento del
gasto en viajes de 250
euros

©
Introducción a la Estadística Económica ( Tema 6: Regresión
Covadonga Caso, simple 10 / 20
Esteban Fernández, Ana Salomé García,
Rectas de regresión minímo cuadráticas

Propiedades de la recta de regresión

k m
La suma de errores mínimo cuadráticos es nula ∑ ∑ eij nij = 0
i=1j=1
La recta de ajuste mínimo cuadrática pasa por el centro de gravedad
de la distribución (x̄, ȳ )
Si dos variables X e Y son incorreladas, la recta de regresión es
paralela al eje de abcisas y = ȳ

©
Introducción a la Estadística Económica ( Tema 6: Regresión
Covadonga Caso, simple 11 / 20
Esteban Fernández, Ana Salomé García,
Análisis de bondad de modelos

Descomposición de la varianza de Y (I)

Si no se dispone de información Si se dispone de información


sobre una variable explicativa, relevante sobre una variable
la mejor explicación de la explicativa, la mejor
variable Y es ȳ explicación de Y es yti = f (xi )

La desviación respecto a la media para cada observación puede

descomponerse como:

yj − ȳ = (yj − yti ) + (yti − ȳ ) = eij + (yti − ȳ )

- Error que queda tras efectuar la regresión eij = (yj − yti )


- Desviación que es explicada por la regresión (yti − ȳ )

©
Introducción a la Estadística Económica ( Tema 6: Regresión
Covadonga Caso, simple 12 / 20
Esteban Fernández, Ana Salomé García,
Análisis de bondad de modelos

Descomposición de la varianza de Y (II)

Deniciones
Se denomina varianza explicada o debida a la regresión y se denota por
SY2 t , al valor de la expresión:
k
SY2 t = ∑ (yti − ȳ )2 fi.
i=1

Se denomina varianza residual y se denota por Se2 , al valor de la


expresión:
k m
Se2 = ∑ ∑ eij2 fij
i=1j=1

©
Introducción a la Estadística Económica ( Tema 6: Regresión
Covadonga Caso, simple 13 / 20
Esteban Fernández, Ana Salomé García,
Análisis de bondad de modelos

Descomposición de la varianza de Y (III)

Propiedad
En un ajuste lineal, la varianza de la variable dependiente Y puede ser
expresada como suma de la varianza explicada y la varianza residual:

SY2 = SY2 t + Se2

©
Introducción a la Estadística Económica ( Tema 6: Regresión
Covadonga Caso, simple 14 / 20
Esteban Fernández, Ana Salomé García,
Análisis de bondad de modelos

Coeciente de determinación

A partir de la descomposición de la varianza de Y (caso lineal):


SY2t 2
SY2 = SY2 t + Se2 =⇒ 1 = SY2
+ SSe2
Y

Denición
El coeciente de determinacion R 2 se dene como la proporción de


variación de Y explicada por el modelo teórico:

2
SY2 t Se2
R = = 1−
SY2 SY2

©
Introducción a la Estadística Económica ( Tema 6: Regresión
Covadonga Caso, simple 15 / 20
Esteban Fernández, Ana Salomé García,
Análisis de bondad de modelos

Propiedades del coeciente de determinación

0 ≤ R2 ≤ 1
El coeciente de determinación es nulo cuando el modelo no aporta
ninguna explicación sobre el comportamiento de Y
Cuando el ajuste es perfecto R 2 = 1
En el caso de regresión lineal simple el coeciente de determinación
coincide con el cuadrado del coeciente de correlación lineal, es decir,
R 2 = rXY
2

©
Introducción a la Estadística Económica ( Tema 6: Regresión
Covadonga Caso, simple 16 / 20
Esteban Fernández, Ana Salomé García,
Análisis de bondad de modelos

Ilustración coeciente de determinación

X: Renta (miles de euros)


Y: Gasto en viajes (miles de euros)

Y=-3,5+0,25X

SY2 = 11, 55 SY2 t = 7, 65 Se2 = 3, 9

3, 9 7, 65
R2 = 1 − = = 0, 66
11, 55 11, 55

El 66% de las variaciones del gasto en viajes se explican mediante la recta


mínimo cuadrática a partir de la renta

©
Introducción a la Estadística Económica ( Tema 6: Regresión
Covadonga Caso, simple 17 / 20
Esteban Fernández, Ana Salomé García,
Predicción con modelos causales

Predicción con modelos causales

Predicción
Si la variable X toma el valor x0 , la predicción de Y se obtiene como el valor
teórico de la variable Y condicionado a dicho valor de la variable explicativa:

yt 0 = b0 + b1 x0

Fiabilidad de la predicción

Capacidad explicativa del modelo R 2




Posición del valor para el que se predice en relación con los valores de
X para los que se estima el modelo (interpolación-extrapolación)

©
Introducción a la Estadística Económica ( Tema 6: Regresión
Covadonga Caso, simple 18 / 20
Esteban Fernández, Ana Salomé García,
Predicción con modelos causales

Ilustración predicción

Predicción para x0 = 40

¾Fiabilidad de la predicción?

Modelo con alta capacidad explicativa


El valor 40 se sitúa lejos del recorrido para el que se estimó la recta,
por lo que no puede asegurarse que se mantenga el mismo patrón de
comportamiento =⇒ La predicción no tiene garantías
©
Introducción a la Estadística Económica ( Tema 6: Regresión
Covadonga Caso, simple 19 / 20
Esteban Fernández, Ana Salomé García,
Predicción con modelos causales

Objetivos de aprendizaje

Al nalizar el tema 6 el estudiante debe ser capaz de:

Distinguir los conceptos de correlación y regresión y analizar la


conexión entre ambos
Calcular rectas de regresión por ajuste mínimo-cuadrático
Interpretar los coecientes de la recta de regresión
Analizar la bondad de un modelo mediante el coeciente de
determinación
Calcular predicciones a partir de modelos causales y analizar su
abilidad

©
Introducción a la Estadística Económica ( Tema 6: Regresión
Covadonga Caso, simple 20 / 20
Esteban Fernández, Ana Salomé García,