Anda di halaman 1dari 383

,

ECONOMETRIA ·
, I

ECONOMETRIA

Primera Parte

~/ EDITORIAL
V FÉUX VARELA
La Habana. 2005

Libros de Estadística en PDF | Statistics Books in PDF


PROLOGO

El objetivo fundamental de la segunda edición del texto Econometrfa básica


sigue siendo el mismo. Se busca proporcionar una introducción elemental y
comprensible de la econometría, sin tener que recurrir al álgebra matricial,
al cálculo ni a la estadfstica, más allá de un nivel elemental.
Desde la publicación de la primera edición de este libro en 1978, he re-
cibido innumerables sugerencias de parte de alumnos, profesores e investi-
gadores tanto de los Estados Unidos como del exterior sobre cómo se puede
mejorar el libro y hacerlo accesible el una m,ayor audiencia. En respuesta a
estas sugerencias y también buscando reflejar los nuevos acontecimientos en
materia económica desde 1978, he revisado y actualizado significativamente
este libro: Algunos de los cambios más importantes en la segunda edición son
los siguientes:
l. La notación de subíndice Yule se ha eliminado y se ha remplazado por
una notación mucho más simple.
2. La expo'sición de algunos temas incluidos en la primera edición se ha sim-
plificado y algunoslde los conceptos más abstractos se han clarificado
con mayor profundidad. Las pruebas matemáticas, donde son necesarias,
se relegan a los apéndices.
3. Temas tales como las pruebas de Goldfeld-Quandt y Breusch-Pagan de
heterocedasticidad, la prueba del índice de condición de la multicolinea-
lidad, la prueba Xl de autocorrelación, la prueba RESET de Ramsey para
la especificación de errores, la prueba de Chowpara la comparación de
dos o más regresiones, los efectos de interacción de las variables dicotó-
micas y otros temas similares se presentan ahora en diferentes capítulos.
Todos estos temas se ilustran con ejemplos numéricos.
4. Se han incorporado tres nuevos capítulos que reunen material que se en-
contraba disperso en la primera edición. En el Capítulo 6 (Extensiones
al modelo de regresión lineal con dos variables) se cubren los siguientes
temas: Regresión a través del origen, escalamiento de las unidades de
medida yl formas funcionales para los modelos de regresión, tales como
los modelos log-lineal, semilogarítmico y recíprocos. En el Capítulo 11
(Especificación de modelos) se analizan los atributos de-un buen modelo

Libros de Estadística en PDF | Statistics Books in PDF


y se consideran las consecuencias de un modelo inc~rrectamente especi-
ficado. También se trata en este c~p1tulo el tema de la medición de erro-
res. En el Capítulo 13 (Regresión sobre una variable dep~ndiente dico-
tómica: Los modelos MPL, Logit y Probit), se da un tratamiento más
profundo al caso en donde la variable dependiente es dicotómica (sí /
no, presente I ausente). Algunos ejemplos numéricos, como también
ejemplos de la vida diaria, ilustran las diferentes técnicas.
5. Los problemas y preguntas al final de cada capítulo se han ampliado
considerablemente, incorporando gran parte del material de interés teó-
rico y práctico. Se han incluido ejemplos concretos de las diferentes
ramas de los negocios, la economía y las finanzas, para demostrar clara-
mente la versatilidad de los modelos de regresión.
6. Desde la publicáción de la primera edición se han lanzado al mercado
excelentes paquetes de software de econometría disponibles tanto para
grandes computadores (mainframe) como para los computadores perso-
nales. El Apéndice A presenta un breve análisis de estos paquetes. La
mayor parte de los problemas numéricos considerados en este texto se
solucionan utílízando el paquete SAS.
El cubrimiento más extenso de los antiguos temas, jUJ;lto con la adición
de nuevos temas y ejercicios, han hecho que el libro sea un poco más largo.
Esperamos que esto proporcione al profesor una mayor flexibilidad para es-
coger los temas que considere adecuados para la audiencia específica. A con-
tinuación se presentan algunas sugerencias sobre la manera como puede utili-
zarse este libro.

Cursos sobre econometría


Un curso de un semestre para un no especiali::ta. CApítulos 1 a 6 y revisión
de los Capítulos 7 y 8 (omitiendo todas las pruebas) y el Capítulo 10. Se
pueden omitir los ejercicios teóricos.
Un curso de un semestre para estudiantes de economía. Capítulos 1 a 6,
Capítulos 7 a 10. Se pueden omitir algunos ejercicios teóricos.
Un curso de dos semestres para estudiantes de economía. Capítulos 1 a 15.
Las pruebas matemáticas dadas en los diferentes apéndices se pueden cubrir
en forma selectiva.

Cursos sobre análisis de regresión


Un curso corto de un trimestre (aproximadamente 7 a 8 semanas). Capítu-
los 1 a 6, omitiendo todas las pruebas matemáticas.
Un curso de un semestre. Capítulos 1 a 10. Se pueden omitir algunos desa-
rrollos teóricos.
Esta revisión no habría sido posible sin los comentarios constructivos,
las sugerencias y el estímulo que he recibido de diferentes personas que han

Libros de Estadística en PDF | Statistics Books in PDF


revisado el libro. En particular, deseo agradecer a los siguientes profesores,
sin hacerlos, por supuesto, responsables de cualquier deficiencia que subsis-
ta en la versión final de este libro:
Ann R. Horowitz (University of Florida en Gainesville)
James McDonald (Brigham Young University)
James Moncur (University of Hawaii)
Mark J. Roberts (Pennsylvania State University)
Joseph J. Seneca (Rutgers University)
John J. Spitzer (State University ofNew York,en Brockport)
H. D. Vinod (Fordham University)
Ronald Warren (University of Virginia)
También estoy endeuda con mis colegas John Martin, por su valiosa
ayuda, con Ashok Vora por las estimulantes conversaciones que sostuvi-
mos, y con mi asistente de investigación, Zhenmin Fang, por su colabora-
ción en repetidas ocasiones.
. Finalmente, pero no menos importante, estoy profundamente agrade-
cido con mi esposa Pushpa, mis hijas J oan y Diane, y con dos amigos especiales,
Sushila Gildwani-Buschi y Joseph Buschi, por proporcionarme la paz mental
necesaria para completar la revisión.

Libros de Estadística en PDF | Statistics Books in PDF


CONTENIDO

In troducción 1

Parta I Modelos uniecuacionales de regresión 11

1 La naturaleza del análisis de regresión 13 .


1.1 Origen histórico del ténnino "regresión" 13
1.2' Interpretación moderna de la regresión 14
1.3 Relaciones estadísticas vs. relaciones detenninísticas 18
1.4 Regresión vs. causación 19
1.5 Regresión vs. correlación 19
1.5 Tenninología y notación 21
1.7 Naturaleza y fuentes de infonnación para el análisis econométrico 22
Tipos de datos
Fuentes de datos
Exactitud de los datos
1.8 Resumen y conclusiones 2S
Ejercicios 26

2 Modelos de regresión con dos variables:


algunas ideas básicas 28
2.1 Ejemplo hipotético 28
2.2 Concepto de la función de regresión poblacional (FRP) 31
23 Significado ~l ténnino "lineal" 33
Linealidad en las variables
Linealidad en los parámetros
2.4 Especiftcación estocástica de la FRP 34
2.S La signifJCanCÍa del ténnino de -"perturbación estocástica" 3S
2.6 Función de regresión muestral {FRM} 37
2.7 Resumen y conclusiones 41
Ejercicios 42

Libros de Estadística en PDF | Statistics Books in PDF


3 El modelo de regresión con dos variables:
El problema de la estimación 47
3.1 El método de mínimos cuadrados ordinarios 47
Principio de los mínimos cuadrados
3.2 El modelo de regresión lineal clásico: Supuestos fundamentales del
método de mínimos cuadrados ordinarios 54
3.3 Errores de precisión o errores estándar de los estimadores de mínimos
cuadrados ordinarios 63
3.4 Propiedades de los estimadores de mínimos cuadrados: El teorema
de Gauss-Markov 65
3.5 Coeficiente de detenninación ". : Medida de la "bondad del ajuste" 67
3.6 Un ejemplo numérico 73
3.7 Un ejemplo ilustrativo: La demanda de café en los Estados Unidos 7S
3.8 Listado de computador para la función de demanda de café 77
3.9 Resumen y conclusiones 77
Ejercicios 79
Apéndice 3A 84.
3A.l Derivación de los estimadores de mínimos cuadrados 84
3A.2· Las propiedades de linealidad e insesgamiento de los
estimadores de mínimos cuadrados ordinarios 84
·3A.3 Varianzas y errores estándar de los estimadores mínimos
cuadrados ordinarios 85
3A.4 El estimador de mínimos cuadrados para 0 2 86
3A.5 La propiedad de la varianza mínima de los estimadores con
mínimos cuadrados 87
3A.6 Listado SAS para la función de demanda de café (3.7.1) 89

4 El supuesto de nonnalidad: El modelo clásico


de regresión lineal nonnal 91
4.1 La distribución probabilística de las perturbaciones Ilt 91
4.2 El supuesto de normalidad 92
4.3 Propiedades de los estimadores de MCO bajo el supuesto de
normalidad 94
4.4 El método de máxima ver:osimilitud (MV) 97
4.5 Resumen y conclusiones 97
Apéndice 4A 98
Estimacion utilizando el método de máxima verosimilitud para un
modelo de regresión con dos va,riables 98
Ejercicios· del Apéndice 4A· 101

5 Regresión con dos variables: Estimación por intervalos


y prueba de hipótesis 102
5.1 Estimación por intervalos: Algunos conceptos básicos 102
5.2 Distribuciones normal t, )(l YF: Breve exposición 104
5.3 Intervalos de COnI18nZa para IQs coeficientes de regresión PI y P2 106
Intervalo de confianza para {J2
Intervalo de confianza para {Jt
Intervalo de confumza para {Jt y {J2 simultáneamente
5.4 Intervalo de confumza para 0 2 109
5.5 Prueba de hipótesis: Gomentarios generales 110
5.6 Prueba de hipótesis: El enfoque del intervalo de confianza 111

Libros de Estadística en PDF | Statistics Books in PDF


Prueba con dos colas o büateral
Prueba con una cola o unilateral
5.7 Prueba de hipótesis: El enfoque de la prueba de significancia 113
Prueba de significancia para los coeficismtes de regresión:
La prueba t. .
Prueba designificancia para a2: La prueba i"
5.8 Prueba de hipótesis: Algunos aspectos prácticos 117
El significado de "aceptar" o "rechazar" una hipótesis
La hipótesis nula o "O" y el "2t"
La regla empírica
Planteamiento de las hipótesis nula y alterna
Escogencia del nivel de significancia ex
Significancia estadística vs. significancia práctica
5.9 Análisis de regresión y análisis de varianza 121
5.10 Aplicación del análisis de regresión: El problema de la
predicción 124
Predicción media
Predicción individual
5.11 Informes de los resultados del análisis de regresión 127
5.12. Evaluación de los resultados del análisis de regresión 128
5.13 Ejempl<1ilustrativo: La relación entre salarios y productividad
en los Estados Unidos entre 1960-1983 129
5.14 Resumen y conclusiones 131
Ejercicjos 132
ApéndiCe 5A 138
5A.l· Derivación de la ecuación (5.3.2) 138
5A.2 Derivación de la ecuación (5.9.1) 138
SA.3 Listado SAS para la regresión salarios-productividad para
los Estados Unidos (5.13.2) 139

6 Extensiones del modelo de regresi6n lineal


con dos variables 140
6.1 Regresión a través del origen 141
Ejemplo ilustrativo: La línea característica de la teoría del
portafolio
6.2 Escalas y unidades de medición 146
Ejemplo nUmérico: La relación entre ellPDB y elPNB en los
Estados Unidos, 1974-1983
Algunas palabras sobre la interpretación
6.3 Formas funcionales de los modelos de regresión 150
Modelos Log-Log, Doble Log, Log-Lineal o de elasticidad constante
Ejemplo ilustrativo: La función reconsiderada de demanda de café
Modelos semilogarítmicos: Modelos Log-Lin y Ling-Log
Ejemplo ilustrativo: Tasa de crecimiento del PNB real,
Estados Unidos, 1969-1983
Transformaciones recíprocas
Ejemplo ilustrativo: La curva de Phillips para el Reino Unido,
1950-1966
6.4 Resumen y conclusiones 161
Ejercicios 162
Apéndice 6A 168
Libros de Estadística en PDF | Statistics Books in PDF

6A.l Derivación de los estimadores con el 'método mínimos
cuadrad~s para la regresión a trávés del origen 168
6A.2 '. liStado SAS para la línea' característica (6.1.11) 170
6A.3 Listado' SAS para la regresión de. la curVa de Phillips, para
el Reino Unido (6.3.13) 171

7 Enfoque matricial para el modelo


de regresi6n lineal 172
7.1 El modelo de regresión lineal con kvariobles 173
7.2 Supuestos del modelo clásico de regresión utilizan:do notac~ón
matricial 175
7.3 Estimaciones utilizando MCO 177
Ilustración
Matriz de varianza-covarianzapata ,
Propiedades del vector' de MeO .
'7.4 El coeficiente de detenninaciónR 2 y el coeficiente de determinación
ajustado R 2 es la notación matricial 182
7.5 La matriz de correlación 184
7.6 Pruebas de hiPótesis con respecto a los coeficientes individuales
de regresión en notación matricial .,' • 18S
7.7 Pruebas de siSnificancia global de 18 regresióÍl: Análisis de,varianza
en notación matricial . 186
7.8 Prueba de restricciones lineales: Pruebas generales F utilizando
notación matricial ' 187
7.9 Predicción utilizando regresi6nmúltiple: Formulació~ matricial 187
Predicción media . .
Predicción individual.. .
Varianza y predicci6n media
Varianza de la predicción media
Varianza de la predicci6n individual ,
7.10 Resumen del enfoque matricial: Ejemplo ilustrátivo 192
7.11 Resumen y conclusiones 197
~~b 1~
Apéndice 7A 204
7A.l Derivación de las K ecuaciones normales o simultáneas 204
7A.2 Derivación matricial de las eci.iaciones riormales 20S
7A.3 Mátriz de variaI!za-cÓvarianza de , 205
7A.4 Propiedad MELI de los ~stimadores de MCO 206

Parte 11 Violaci6n.delos supuestos del modelo clásico ' 209


8 Multicolinealidad 213
8.1 Naturaleza de la multicolinealidad 213
8.2 Esfimación en el caso de multicolinealidad perfecta 216
8.3 Estirnaci6nen el caso de "alta" multicolinealidad pero
"imperfecta" 218

Libros de Estadística en PDF | Statistics Books in PDF


8.4 Multicolinealidad: Consecuencias teóricas de la multico1inealidad 219
8.5 Consecuencias prácticas de la multicolinealidad 221
Varianzas y covarianzas amplias de los estimadores de MeO
Intervalos de confianza más amplios
Raz~es t "no significativas"
Un alto R' pero pocas razones t significativas ,
Sensibilidad de los estimadores de MeO y sus errores estándar
ante pequefl.os cambios en los datos
8.6 Ejemplo ilustrativo: gastos de consumo en ~lación éon ingreso y
la riqueza 226
8.7 Cómo detectar la multicolinealidad 229
t 8.8 Medidas remediales 233
8.9 ¿Es la mu!ticolinealidad necesariamente mala? tal vez no, si el
objetivo es únicamente la predicción 239
8.10 Resumen y conclusiones 240
Ejercicios 241

9 Heterocedasticidad 247
9.1 Naturaleza de la heterocedasticidad 241
9.2 La estimación con MCO en presencia de heterocedasticidacl 252
9.3 El método de los mínimos cuadrados generalizados (MCG) 253
Diferencia entre MCO y MCG
9.4 Consecuencias de utilizar MCO ante presencia de heterocedasticidad 256
Estimac.ón con MCO permitiendo heteroscedasticidacl
Estimación con MCO sin tener en cuenta la presencia de
heterocedasticidad 257
9.5 Cómo detectar la heterocedasticidad 258
Ejemplo ilustrativo
I 9.6 Medidas remediales 269
Cuando se conoce oi': el método de los mínimos cuadrados
ponderados
Cuando no se conoce Of
9.7 Resumen y conclusiones 214
Ejercicios 216
Apéndice 9A
9A.1 Prueba de la ecuación (9.2.2) 285
9A.2 Método de mínimos cuadl.ldos ponderados 285

10 Autocorrelación 287
10.1 Naturaleza del problema 287
10.2 Estimación de MCO en presencia de autoco~Jación 294
10.3 El MELI en presencia de autocorreJación 291
10.4 Consecuencias de utilizar MCO en presencia de autocorrelaoiÓD 298
Estimación de MCO permitiendo la autocorrelación
Estimación de MCO sin tener en cuenta la autocorrelaciÓD
10.5 Cómo detectar la autocorrelación 304
10.6 Medidas remediales . 316
Cuando se conoce la estructura de la autocorrelación.
Cuando p no se conoce

Libros de Estadística en PDF | Statistics Books in PDF


10.7 Ejemplo ilustrativo: La relación entre el índice de vacantes de empleos
y la tasa de desempleo en los Estados Unidos comparación de los
métodos 323
10.8 Resumen y conclusiones 326
Ejercicios 327

11 Especificación del modelo 336


11.1 Atributos de un buen modelo 337
11.2 Tipos de errores de especificación 339
11.3 Consecuencias de los errores de especificación 341
Omisión de una variable relevante
Inclusión de una variable irrelevante
11.4 Pruebas de errores de especificación 343
Cómo detectar la presencia de variables innecesarias
Prueba~ de variables omitidas y de la forma funcional incorrecta
Otras pruebas de error de especificación
11.5 Pruebas para detectar errores de especificación de un modelo 350
Ejemplo ilustrativo: el modelo de San Luis
11.6 Errores de medición 352
Errores de medición en la variable dependiente Y
Errores de medición en la variable explicativa X
Un ejemplo
11.7 Resumen y conclusiones 358
Ejercicios 359
Apéndice IIA 363
llA.l Consecuencias de incluir una variable irrelevante:
la propiedad de insesgamiento 363
l1A.2 Prueba de la ecuación (11.6.10) 363

Parte 111 Temas en econometría 365

12 Regresión con una variable dicotómica 367


12.1 Naturaleza de las variables dicotómicas 367
Ejemplo 12.1: Los salarios de los profesores según el sexo 369
12.2 Regresión con una variable independiente cuantitativa y una
cualitativa con dos clases o categorías 370
Ejemplo 12.2: ¿Son los inventarios sensibles a las tasas de interés?
12.3 Regresión en una variable independiente cuantitativa y una variable
cualitativa con más de dos clases 374
12.4 Regresión en una variable independiente cuantitativa y dos
cualitativas 376
Generalización
12.5 Ejemplo 12.3: La economía del "doble empleo" 377
12.6 Comparación de dos regresiones: Ideas básicas 379
Ejemplo 12.4: Athorro~ e ingresos, Reino Unido, 1946-1963 379
12.7 Comparación de dos regresiones: Prueba de Chow 381
12.8 Comparación de dos regresiones: Enfoque de la variable dicotómica 384

Libros de Estadística en PDF | Statistics Books in PDF


12.9 Comapración de dos regresiones: Ilustración adicional 386
Ejemplo 12.5: El comportamiento del desempleo y de las
vacantes sin llenar: Gran Bretaña, 1958-1971
12.10 Efectos de interacción 388
12.11 El uso de las variables dicotómicas en el análisis estacional 389
Ejemplo 12.6: Comportamiento de las ganancias-ventas en la
industria manufacturera en los Estados Unidos
12.12 Regresión discotinua o lineal por etapas o tramos 392
12.13 Resumen y conclusiones 394
Ejercicios 395
Apéndice 12A 403
12A.1 Matriz de datos para la regresión (12.9.2) 403
12A.2 Matriz de datos para la regresión (12.11.2) 404

13 Regresión en una variable dependiente dicotómica:


Los modelos MPL. Logit y Pro bit 405
13.1 Variable dependiente dicotómica 405
13.2 El modelo de probabilidad lineal (MPL) 406
13.3 Estimación de los MPL 407
13.4 MPL: Ejemplo numérico 411
13.5 Aplicaciones del MPL lO 413
13.6 Alternativas al MPL 418
13.7 El modelo Logit 420
13.8 Estimación del modelo Logit 422
13.9 El modelo Logit: Un ejemplo numérico 425
13 ..10 El modelo Logit: Ejemplos ilustrativos 428
13.11 El modelo Probit 430
13.12 El modelo Probit: Ejemplo numérico 434
Logit vs. Probit
13.13 El modelo Probit: Ejemplo ilustrativo 436
13.14 Resumen y conclusiones 439
Ejercicios 440

14· Modelos autorregresivos y rezagos distribuidos 445


14.1 El papel del "tiempo" o "rezagos" en la economía 446
14.2 Razones que explican los rezagos 450
14.3 Estimación de los modelos de rezagos distribuidos 452
Estimación Ad hoc de los modelos de rezagos distribuidos
14.4 El enfoque de Koyck para los modelos de rezagos distribuidos 453
Media y mediana de los rezagos
14.5 Racionalización del modelo de Koyck: El modelo de expectativas
adaptables 457
14.6 Otra racionalización del modelo Koyck: El modelo de ajuste de
exis.tencias o ajuste parcial 460
14.7 Combinación de los modelos de esperanzas adaptables y de ajuste
parcial 463
14.8 Estimación de los modelos autorregresivos 464
14.9 Método de variables instrumentales (VI) 466
14.10 Cómo detectar autocorrelación en los modelos autonegresivos:
Prueba h de Durbin 467
14.11 Ejemplo numérico: La demanda de dinero en la India 470

Libros de Estadística en PDF | Statistics Books in PDF


·14.12 Ejemplos ilustrativos 472
14.13 El enfoque de Almon a los modelos de rezagos distribuidos:
El modelo de rezagos polimoniales de Almon 477
Ejemplo numérico
14.14 Causalidad en economía: La prueba de Granger 484
La prueba de Granger
Resultados empíricos
14.15 Reswnen y conclusiones 486
Ejercicios 489

Parte IV Modelos de ecuaciones simultáneas 497

15 Modelos de ecuaciones simultáneas 499


15.1 Naturaleza de los modelos de ecuaciones simultáneas 499
15.2 Ejemplos de modelos de ecuaciones simultáneas 500
15.3 El sesgo en las ecuaciones simultáneas: Inconsistencia de los
estimadores de MCO 507
15.4 El sesgo en los 11\0delos de ecuaciones simultáneas: Ejemplo
numérico 510
15.5 Resumen y conclusiones 512
Ejercicios 512

16 El problema de la identificación 517


16.1 Notación y definiciones 517
16.2 El problema de la identificación 521
Sub identificación
Identificación justa o exacta
Sobreidentificación
163 Reglas para la identificación de un modelo 530
La condición de orden de identificabilidad
La condición de rango de identificabilidad
16.4 Resumen y conclusiones 535
Ejercicios 536

17 Métodos de ecuaciones simultáneas 539


17.1 Enfoque para la estimación de un modelo 539
17.2 Modelos recursivos y el método de,mínimos cuadrados ordinarios 541
17.3 Estimación de una ecuación exactamente identificada: El método
de mínimos cuadrados indirectos 544
Propiedades de los estimadores con el método de MCI
17.4 Estimación de una ecuación sobreidentificada: El método de
mínimos cuadrados en dos etapas. (MC2E) 548
Características sobresalientes de los estimadores con el método
de MC2E
17.5 MC2E: ejemplo numérico 553
17.6 Ejemplos ilustrativos 555
17.7' Resumen y conclusiones 561
Ejercicios 562

Libros de Estadística en PDF | Statistics Books in PDF


Apéndice 17 565
. 17A.l . El sesgo de los estimadores de mínimos cuadrados indirectos 565
17A.2 Estimación de los errores estándar de los estimadores
de MC2E 566
Apéndices.
A Lista de algunos paquetes estadísticos de computador 568
B Tablas estadísticas 571
Tabla B.l Areas bajo la distribución normal estandarizada
Tabla B.2 Puntos porcentuales de la distribución t
Tabla B.3 PUÍltos porcentuales superiores de la distribución F
Tabla B.4 Puntos porcentuales superiores de la distribucion X"
Tabla B.5 Estadística d de Durbin·Watson: Puntos de significancia
dL yd v a niveles de signiflcancia de 0.05 y 0.01
Tabla B.6 Valores críticos para diferentes rachas en la prueba de
rachas

Bibliografl3 588
Indice 591
INTRODUCCION

1. ¿QUE ES ECONOMETRIA?
Literalmente, econometría significa "medición económica". Sin embargo, si
bien es cierto que el fenómeno de la medición es una parte importante de la
econometría, el campo de acción de esta disciplina es mucho más amplio,
como puede apreciarse en las siguientes citas textuales: .

La econometría, que es el resultado de la adopción de una posición sobre el papel


que juega la economía, consiste en la aplicación de la estadística matemática a los
datos económicos con el objeto de proporcionar no sólo un apoyo empírico a los
modelos construidos por la economía matemática, sino una forma de obtener resul.
tados numéricos. 1
Se puede definir la econometría como el a'nálisis cuantitativo de fenómenos econó·
micos reales basados en el desarrollo simultáneo de la observación y la teoría, rela·
cionados a través de apropiados métodos de inferencia. 2
La econometría puede definirse como la ciencia social en la cual se aplican las he~
rramientas de la teoría económica, las matemáticas y la inferencia estadística, al
análisis de los fenómenos económicos. 3
La econometría tiene que ver con la determinación empírica de las leyes econó-
micas. 4
El arte del econometrista consiste en encontrar el conjunto de supuestos que sean
suficientemente específicos y realistas, de tal manera que le permitan aprovechar
de la mejor manera posible los datos que tiene a su disposición. .

1 Gerhard Tintner, Methodology 01 Mathem,atical Economics and Econometrics, The University of


Chicago Press, Chicago, 1968, p. 74.
2 P. A. Samuelson, T. C. Koopmans, and J. R. N. Stone, "Report of the Evaluative Committee ror
Econometrica", Econometrica, Vol. 22, No. 2, abril 1954, pp. 141-146.
3 Arthur S. Goldberger, Econometric Theory, John Wiley & Sons, Inc., New York, 1964, p. 1.
4 H. Theil, Principies of Econometrics, John Wiley & Sons, Inc., New York, 1971, p. 1
5 E. Malinvaud, Statistical Methods of Econometrics, Rand McNally & Co., Chicago, 1966, p. 514.

1
2 INTRODUCCION

2. ¿POR QUE UNA DISCIPLINA APARTE?


Corno sugieren las definiciones anteriores, la econometría es una amalgama
de teoría económica, economía matemática, estadística económica y estadís~
tica matemática. Sin embargo, es una disciplina que merece ser estu~iada
separadamente por las razones que se esbozan a continuación.
La t.eoría económica hace afirmaciones o formula hipótesis de naturale-
za principalmente cualitativa. Por ejemplo, la teoría microeconómica sostiene
que, al permanecer constantes otros factores, una reducción en el precio de
un bien debe traducirse en un aumento de la demanda de dicho bien.
De este modo, la teoría económica postula la existencia de una relación
negativa o inversa entre el precio y la cantidad demandada de un bien, sin
que proporcione, sin embargo, una medida numérica de la relación entre las
dos variables. en otras palabras, no nos dice en cuánto aumentará o disminuirá
la cantidad demandada cuando se presente un cambio en el precio de un bien.
En este sentido, es trabajo del econometrista proporcionar estimaciones
numéricas dirigidas a cuantificar dicha relación, es decir, la econometría
proporciona el contenido empírico a la mayoría de las teorías económicas.
La preocupación principal de la economía matemática consiste en ex-
presar la teoría económica en forma matemática (ecuaciones), sin prestar
atención a la medición ni a la verificación empírica de la teoría. La econome-
tría, corno bien se ha dicho hasta el momento, se interesa primordialmente
por la verificación empírica de la teoría económica. Corno veremos, a menudo
el econometrista hace uso de las e.cuaciones propuestas por el economista
matemático, pero de tal forma que éstas puedan estar sujetas a pruebas o
comprobaciones de tipo empírico. Esta conversión de ecuaciones matemáti~
cas a ecuaciones econométricas requiere, sin lugar a dudas, ingenio y destreza.
La estadística económica centra su atención en la recolección, procesa~
miento y presentación de cifras económicas en forma de gráficos y tablas.
Este es, en efecto, el trabajo del estadístico económieo, cuya actividad prin-
cipal consiste en recoger cifras de las cuentas nacionales, PIB, empleo, desem-
pleo, precios, etc. La información así recogida se constituye en la materia
prima de trabajo para el econometrista. Sin embargo, el estadístico econó-
mico no va más allá de la recolección de información, ya que no está interesado
en la utilización de la misma para validar ni refutar teorías; es, desde luego, el
econometrista quien se ocupa de realizar este trabajo.
Aunque la estadística matemática proporciona una buena parte de las
herramientas utilizadas en esta ciencia, a menudo el econometrista requiere
métodos especiales en virtud del carácter sui géneris de la mayor parte de las
cifras económicas, debido a que éstas no son el resultado de un experimento
controlado. El econometrista, como el meteorólogo, generalmente depende
información que no se puede controlar directamente; por tanto, las cifras
, de consumo, ingreso, inversión, ahorro, precios, etc., recogidas por agencias
públicas y privadas, son de características no experimentales. El econometrista
torna estos datos corno dados, hecho que gener~ problemas que se presentan
normalmente en el campo de la matemática estadística. Además, la informa-
ción puede contener errores de medición, situacióa que el econometrist~
nllprlp. ~vudar a remediar desarrollando métodos especiales de análisis.
INTROOUCCION 3

3. METODOLOGIA DE LA ECONOMETRIA
En términos generales, el análisis econométrico sigue las siguientes líneas
generales,de acción:
1. Enunciado de la teoría o hipótesis.
2. Especificación del modelo econométrico dirigido a probar la teoría.
3. Estimación de los parámetros del modelo escogido.
4. Verificación o inferencia estadística.
S. Predicciones o pronóstico.
6. Utilización del modelo para fmes de controlo formulación de políticas.
Para ilustrar la metodología de la econometría, consideremos a continua-
ción la teoría keynesiana de la función consumo, ampliamente conocida.

Enunciado de la teoría o hipótesis


Keynes plantea:

La ley sicológica fundamental consiste en que los hombres (y mujeres) están dis·
puestos, por regla general y en promedio, a aumentar su consumo a medida que
aumenta su ingreso, aunque no en la misma proporción al incremento en dicho
ingreSO.6

En poca~ palabras, Keynes afirma que la propensión marginal a consumir


{PMC), la tasa de cambio del consumo ante un cambio de una unidad (por
ejemplo, un dólar) en el ingreso, es mayor que O pero menor que l.

Especificación del modelo econométrico


Aunque Keynes postula una relación positiva entre el consumo y el ingreso,
no especifica la .forma precisa de la relación funcional entre las dos variables.
Para simplificar, un economista matemático pued-e sugerir la siguiente forma
para la función consumo de Keynes:"

(1)
en donde,
1':" gastos de consumo
X,. ingreso
fll - intersección con el eje Y
fl2 ,. pendiente

, John Maynard Keynea, '171, c;",,,,,, '17Ieory 01 EmpIoyment, 1"""" lI1Id Monq, Barcourt Brace
JaYlDmm, Ine., New York, 1936, p. 96.
4 INTRODUCCION

o
El
~
t:
otJ
..
"O

FIGURA 1.1
Ingresos Función de consumo keynesiana.

El coeficiente de la pendiente ~2 representa la propensión marginal a consumir


(PMC). Geométricamente, la ecuación (l) se puede representar gráficamente
mediante la Figura 1.1.
,La ecuación (1), que afirmá que el consumo está relacionado linealmen-
te con el ingreso, es un ejemplo de uro modelo matemático. Un modelo es
simplemente un conjunto de ecuaciones matemáticas. Si el modelo, como el
del ejemplo anterior, consta de una sola ecuación, recibe el nombre de modelo
uniecuacional; si tiene más de una ecuación, se denomina modelo multiecua-
cionalo modelo de ecuaciones simultáneas.
No,obstante lo anterior, el modelo puramente matemático de la función
consumo que se presenta en (l) es de limitado interés para el econometrista,
por cuanto supone una relación exacta o determinística entre el consumo y
el ingreso. Sin embargo, las relaciones existentes entre las variables económi·
cas son generalm'ente inexactas. De este modo, si fuéramos a obtener infor-
mación de gastos de consumo y de ingreso disponible (después de impuestos)
de una muestra de 5000 familias norteamericanas, por ejemplo, graficando a
continuación dicha información, colocando los gastos de consumo en el eje
vertical y el ingreso disponible en el eje horiz'ontal, seguramente no esperaría-
mos encontrar que las 5000 observaciones estuvieran exactamente sobre la
línea de la ecuación (1), debido a que además del ingreso, existen otras
variables que afectan los gastos de consumo, tales como el tamaño 'de la fa-
milia, la edad de sus miembros, la religión y otros factores que suelen ejercer
cierta influencia en los patrones de consumo.
Para tener en cuenta la existencia de una relación inexacta entre las va-
riables económicas, el econometrista debe modificar la función de consumo
determinística de (1), de la siguiente manera:

(2)
INTRODUCCION 5

P1GURALl
Modelo econom'trico de la func:i6h
~---------------------------x
Inp'eaol de consumo keyneslana.

en la que u representa el término de perturbación o de error, que es una


variable aleatona (estocástica) con propiedades probabilísticas bien def1nidas.
El término perturbacióJ}., u, suele representar todas aquellas fuerzas que
afectan el consumo pero que no se tienen en cuenta de manera explícita en
la ecuación. .
La ecuación (2) es un buen ejemplo de un modelo econométrico. Téc-
nicamente, dicha ecuación es un ejemplo de un modelo de regresión lineal,
modelo que constituirá uno de los más importantes objetivos de este libro.
La función econométrica de consumo (2), plantea la hipótesis de que la va-
riable dependiente Y (consumo) está relacionada linealmente con la variable
explicativa X (ingreso), aunque no de manera exacta puestQ que está sujeta a
variaciones individuales.
El modeloeconométrico en la e~ación (2) puede representarse gráf1ca-
mente tal como aparece en la Figura 1.2 .

. Estimación
Habiendo especificado el modelo econométrico, la tarea siguiente del econo-
metrista consiste en obtener estimaciones (valores numéricos) de los parámetros
del modelo, a partir de la información disponible, generalmente proporciona-
da por el estadístico económico. Estas estimaciones le confieren un contenido
empírico a la te orla económica. Así, por ejemplo, si en el. estudio de la
función consumo keynesiana anteriormente expuesta, se encuentra que
fJ" = 0$, este valor no sólo proporciona una estimación numerica de· la
PMC sino que corrobora la hipótesis keynesiana según la cual la PMe es me-
norque 1.
¿Cómo se estiman los parámetros 111 y fJ,,? La respuesta se hallará en
los capítulos siguientes. Por el momento, basta afirmar que la herramienta
6 INTRODUCCION

estadística del análsisi de regresión es la técnica utilizada en este libro para


I obtener dichas estimaciones.

Verificación (inferencia estadística)


Habiendo obtenido ya estimaciones de los parámetros, la tarea siguiente del
econometrista consiste en desarrollar criterios apropiados dirigidos a estable-
cer si las estimaciones obtenidas están de acuerdo con lo que se espera de la
teoría que se está verificando. Como se mencionó anteriormente, Keynes
pretendía que la PMC fuese positiva y menor que l. Supongamos de otro
lado, que en un estudio de la función consumo se encuentra que la PMC = 0.9;
si bien es cierto que este resultado es menor que 1, podemos preguntarnos
si es 10 suficientemente inferior a 1 como para que logremos convencernos
de que no es el resultado accidental del proceso de muestreo. En otras pala-
bras, ¿es esta estimación estadísticamente menor que 1? Si es así, se verifica
la afirmación keynesiana; de lo contrario, ésta quedaría refutada.
La refutación o confirmación de las teorías económicas, basándose en
·la evidencia empírica, se fundamenta en una rama de la teoría estadística
conocida como inferencia estadfstica (prueba de hipótesis). A lo largo del
libro veremos la manera como se lleva a cabo el proceso de inferencia esta-
dística.

Predicciones o pronósticos
Si el modelo escogido confirma la hipótesis o teoría que se está investigando,
se puede entonces proceder a predecir el (los) valorees) futuro(s) de la varia-
ble dependiente Y con base en valores futuros, conocidos o esperados, para
la (s) variable(s) explicativa(s) X. Supongamos, por ejemplo, que el gobierno
contempla la posibilidad de decretar una reducción en los impuestos persona-
les con el fin de est~ular una economía en recesión. ¿Cuál será el efecto de
esta política sobre el ingreso y, por consiguiente, sobre el em'pleo y los gastos
de consumo?
Como la teoría macroeconómica bien plantea, el cambio en los niveles
de ingreso,originado como resultado de un incremento de un dólar en los
gastos de inversión está determinado por el multiplicador de ingreso M, el
cual se define como: M = [1/0 - PMC)1. Si la PMC = 0.8, M será 5, lo cual
implica que si el. nivel de inversión aumenta en un dólar, se producirá final-
mente un aumento en el ingreso de 5 veces el incremento en la inversión. El
valor crítico a observar en estos cómputos es el del multiplicador del ingreso,
que depende del valor de la PMC. Por tanto, una estimación cuantitativa de
la PMC proporciona. información invaluable para fines de política económi-
ca; conociendo la PMC, se puede predecir el curso futuro del consumo como
consecuencia de los cambios en la política fis<;al del gobierno.
Utilización de los modelos para fines de controlo formulación de políticas
Supóngase que un economista dél gobierno estima la función de consumo
keynesiana, obteniendo los siguientes resultados:
INTRODUCCION 7

y = 5.0+0.7 X (3)
donde el gasto de consumo Y y el ingreso X se miden en miles de millones de
-dólares. Adicionalmente se ,Supone que el gobierno cree que un nivel de gastos
de 1060 (miles de millones de dólares) mantendrá la tasa de desempleo aun
nivel relativamente bajo, del orden del 5%. ¿Qué nivel de ingresos (X) garan-
tizará que se obtenga la cantidad presupuestada inicialmente de gastos de
consumo? Suponiendt> que el modelo (3) es aceptable, mediante cálculos
aritméticos sencillos se puede mostrar que:

1060 = 5;0 + 0.7 X o X = 1055/0.7 = 1507 (aproximadamente)

Lo anterior implica que un nivel de ingresos de 1507 ~miles de millones de


dólares), dada una PMC = 0.7, generará un gasto de 1060 (miles de millones
de dólares). .
Corno sugiere el cálculo anterior, se puede utilizar un modelo que haya
sido estimado para fines de control o para la formulación de una política
económica. Utilizando las herramientas fiscales~ monetarias apropiadas, el
gobierno puede controlar o manipular la variable de control X, dirigida a
producir el nivel deseado para la variable objetivo Y.

4. TIPOS DE ECONOMETRIA
Econometría
!

I
Teóri(:a Aplicada
I

Clásica Bayeaiana clásiu Bayesiana

De acuerdo con este esquema de clasificación, la econometría puede dividirse


en dos categorías generales: econometría teórica y econometda aplicada. En
cada categoría se puede enfocar el terna siguiendo la escuela clásica o la baye-
siana. En este libro se hará énfasis en el enfoque clásico. El enfoque bayesiano
puede encontrarse en el ibro de Zellner,7 pero infortunadamente este libro
no está al alcance de un principiante en econometría. Hasta donde conozco,
no existe un libro elemental sobre econometría bayesiana al mismo nivel de
Econometría básica.
La econometría teórica tiene que ver con el desarrollo de métodos apro-
piados para medir relaciones económicas especificadas a través de modelos
econométricos. En este aspecto, la f econometría se apoya fuertemente
'
en la

7 Arnold Zellner, An lntroduction 10 Bayesian lnference in Econometricl. 10hn Wiley el Sons, Inc.,
New York, 1971.
8 INTROUUCCION

estadística matemática. Por ejemplo, una de las herramientas más utilizadas


en este libro es el método de los mínimos cuadrados. Es una de las preocupa-
ciones principales de la econometría teórica plantear y aclarar los supuestos
de este método, sus propiedades y la manera como se ven afectadas dichas
propiedades cuando uno o varios de los supuestos no se cumplen.
En. la econometría aplicada se utilizan las herramientas de la econome-
tría teórica para estudiar algunos campos especiales de la economía tales
como la función de producción, la función de consumo, la función de inver-
sión, las funciones de oferta y demanda, entre otras.
Este libro se concentra fundamentalmente en el desarrollo de métodos
econométricos, sus supuestos, usos y limitaciones. Dichos métodos se ilustran
con ejemplos adecuados tomados de diversas áreas de la economía y de la
administración de empresas. Sin embargo, no es este un libro de econometría
aplicada, ya que no profundiza en ningún tema de aplicación económica en
particular. Se ha considerado conveniente dejar esta tarea a los libros explíci-
tamente destinados a ese fin. s

S'. REQUISITOS PREVIOS DE MATEMATICAS y ESTADISTICA


Este . libro, a pesar de estar escrito a nivel elemental, presupone cierta familia-
ridad del lector con la estadística elemental, especialmente con los conceptos
básicos de estimación estadística y pruebas de hipótesis. En lo tocante a las
matemáticas, es recomendable algún conocimiento, al menos elemental, de
cálculo diferencial. De otro lado se utiliza álgebra matricial en el Capítulo
7. Sin embargo, con los conocimientos de álgebra matricial que se proporcio-
nan en un curso de álgebra lineal, se superan las dificultades que pueda pre-
sentar dicho capítulo. Nótese, no obstante, que el álgebra matricial no es ':in
'requisito previo de este libro y no se pierde la esencia del mismo al omitir
ese apartado.

6. PAPEL QUE JUEGA EL COMPUTADOR


El análisis de regresión, el pan de cada día de la econometría, no sería posi-
ble en la actualidad sin contar con el computador y el acceso al software
estadístico. Por fortuna hay disponible en el mercado una variada muestra
de paquetes de regresión tanto para mainframe como para microcomputado-
res; con el paso del tiempo, la lista es cada vez mayor. En el Apéndice A
analizaremos brevemente las principales características de algunos de los
paquetes más populares, tales como SAS, SPSS, TSP, BMD y SHAZAM.
Estos paquetes, desarrollados originalmente para computadores de unidad

. s Algunas referencias son J. S. Cramer, Empirical Econometrics. North-Holland PubJishing Company,


Amsterdam. 1969; J. L. Bridge, Applied Econometrics, North-Holland Publishing Company. Amster-
dam, 1971 y M. Desai,Applied Econometrics. McGraw-Hlll Book Company, New York. 1976.
INTRODUCCION 9

central o mainframe, se encuentran disponibles en la actualidad' para micro-


computadores personales. En los ejemplos ilustrativos que se encuentran en
. este libro, utilizamos principalmente SAS y SHAZAM. Se aconseja a los
estudiantes familiarizarse con alguno(s) de estos paquetes de manera que
puedan solucionar los problemas numéricos que se originan al fmal de los
capítulos, así como adelantar proyectos específicos.

'l. PLAN DEL LIBRO


El libro se divide en cuatro partes. Las tres primeras estudian los modelos
de regresión uniecuacionales, vr. gr., aquellos en que el comportamiento
de la variable Y (la variable dependiente) se explica por una o más variables
X (las variables explicatorias). En la Parte I se presenta el modelo de regre-
sión lineal clásico, se desarrolla el método de los mínimos cuadrados y se
exponen sus supuestos. En la Parte 11 se analizan las consecuencias sobre las
propiedades del método de mínimos cuadrados cuando no se cumplen uno o
varios de sus supuestos, así como los métodos alternativos de estimación
disponibles. En la Parte lB se presentan algunos temas econométricos que
por sus características pueden considerarse como objeto único de la economía.
En la Parte IV se presentan algunas características especiales de los modelos
de ecuaciones simultáneas y se discuten los métodos espeCíficamente diseña-
dos para estimar los parámetros de este tipo de modelos.
Cada una de las partes incluye capítulos que desarrollan diversas técnicas
econométricas, cada una de las cuales se ilustra con ejemplos adecllados
tomados de la economía y la administración de empresas.
Los ejercicios que aparecen al final de cada capítulo constituyen una
parte integral del libro. Algunos de ellos exigen cálculos de rutina, mientras
que otros, de naturaleza más teórica, aclaran en mayor profundidad el material
tratado en el capítulo. Se espera, por tanto, que el estudiante intente desa-
rrollar la mayoría de estos ejercicios ya que ellos le permitirán conocer su
grado de comprensión acerca del material estudiado.
Con respecto a la notación utilizada en el libro, es preciso recalcar que
cada capítulo se ha dividido en secciones numeradas secuencialmente dentro
del mismo. Así, la sección 5.3 corresponde a la tercera sección del Capítulo 5.
Las ecuaciones se identifican en cada capítulo mediante el número de éste
seguido por la sección y por el número de la ecuación, todo entre parénte-
sis. Por ejemplo, (3.5.8) corresponde a la optava ecuación de la quinta sec-
ción del Capítulo 3. Cuando aparece un asterisco, debe entenderse que el
material es opcional. El libro está redactado de tal manera que puede omitirse
el material opcional sin que esto ocasione pérdida de continuidad.
PARTE

1

MODELOS
UN lE CUAC IONALE S
DE REGRESION

psta primera parte del libro introduce el concepto de modelos uniecuaciona-


les. En estos modelos una variable, llamada variable dependiente, se expresa
como una función lineal de una o más variables denominadas variables expli-
cativas. En tales modelos se supone implícitamente que las relaciones de
causalidad, si existe alguna, entre la variable independiente y las explicativas,
se. presentan en una sola dirección: de las variables explicativas hacia la varia-
ble dependiente.
En el Capítulo 1 se hace una exposición relacionada con la interpreta-
ción tanto histórica como moderna del término regresión, ilustrándose las
diferencias entre las dos interpretaciones mediante ejemplos provenientes de.
la economía y de otros campos.
En el Capítulo 2 se presentan algunos conceptos fundamentales del aná-
lisis de regresión, utilizando como ayuda el modelo de regresión lineal en dos
variables, en el ~ual la variable dependiente se expresa como una función
lineal de una sola variable explicativa.
En el Capítulo 3 continuamos con el modelo de dos variables e introdu-
cimos lo. que se conóce como el modelo de regresión lineal clásico, modelo
que tiene variós supuestos simplificadores. Con estos supuestos se examina
11
12 MODELOS UNIECUACIONALES DE REGRESION

el método de mínimos cuadrados ordinarios (MeO) para la estimación de los


, parámetros del modelo de regresión en dos variables. El método de MeO es de
aplicación sencilla, y tiene algunas propiedades estadísticas muy valiosas.
En el Capítulo 4 se estudia el modelo de regresión lineal normal clásico
(en dos variables) el cual supone que la variable dependiente aleatoria se ajus-
ta a una distribución normal de probabilidad. Con este supuesto, los estima-
dores de MCO obtenidos en el Capítulo 3 poseen propiedades estadísticas
más fuertes.que las de los modelos de regresión lineal clásicos no normales.
Dichas propie'dades nos permiten recurrir a la inferencia estadística y, en par-
ticular, a las pruebas de hipótesis.
El Capítulo 5 se dedica a tratar el tema de pruebas de hipótesis. En
este capítulo tratamOs de averiguar si los, coeficientes de regresión estimados
son compatibles con los valores hipotéticos iniciales que se asignaron a tales
coeficientes, los cuales fueron sugeridos por la teoría y I o por un trabajo
empírico previo.
En el Capítulo 6 consideramos algunas extensiones del modelo de re-
gresión en dos variables. En particular, se analizan temas tales como: (l)
la regresión a través del origen, (2) escalas y unidades de medida y (3) for-
mas funcioriales de los modelos de regresión, tales como los modelos doble
logarítmico, el semilogarítmico y el recíproco.
En el Capítulo 7 se desarrolla el modelo de regresión para K variables
explic&tivas utilizando álgebra matricial. Aunque la notación matricial no
introduce ningún concepto nuevo, proporciona un método muy compacto
de presentar la teoría de la regresión involucrando cualquier número de va-
riables explicativas.
CAPITULO 1
LA NATURALEZA
DEL ANALISIS
DE REGRESION

Como se mencionó en la Introducción, la I;egresión es una herramienta fun-


damental de la econometría; en este capítulo consideramos muy rápida-
mente la naturaleza de este importante instrumento.

1.1 ORIGENHISTORICO DEL TERMINO "REGRESION"


El término regresión fue introducido por Francis GaIton. En un famoso ar-
tículo, Galton halló que aunque existía una tendencia a que los padres de
alta estatura tuvieran asimismo hijos altos, y de igual forma que los padres a
de baja estatura tuvieran hijos de baja estatura; la estatura promedio de los
nifios que nacían de padres con una determinada estatura tendía a moverse
o "regresar" hacia la altura promedio de la población total. 1 En otras pala-
bras, la estatura de los hijos de padres inusualmente altos o inusualmente ba-
jos, tendía a estar más cerca de la estatura promedio de la población. La
ley de regresión universal d~ Galton fue confirmada por su amigo Karl Pear-
son, quien coleccionó más de mil registros de estaturas de los miembros de
diferentes grupos familiares. 2 Pearson encortró que la estatura promedio de
los hijos de un grupo de padres altos era inferior a la estatura de sus padres,
mientras que la estatura promedio de los hijos de un grupo de padres de baja

1 Francis Galton, "Family Likeness in Stature", Proceedings 01 Royal Society, Londres, vol. 40, 1886,
pp. 42-72.
2 K. Pearson y A. Lee, Biometrika, vol. 2, 1903, p. 357.
14 MODELOS UNIECUACIONAlES DE REGRESION

estatura era mayor que la estatura de sus respectivos padres, generándose un


fenómeno mediante el cual los hijos altos y bajos de estatura "regresaban"
hacia la estatura promedio de todos los hombres. Para utilizar las palabras
de Galton, ésta era una "regresión a la mediocridad".

1.2. INTERPRETACION MODERNA DE LA REGRESION


Sin embargo, la interpretación moderna de la regresión es diferente. En tér-
minos generales,
El análisis de regresión está relacionado con el estudio de !a dependencia de una
variable, la variable dependiente, de una o más variables adicionales, las variables
explicativas con la perspectiva de estimar y/o predecir el valor (poblacional) medio
o promedio .de la primera en términos de valores conocidos o fijos (en muestreos
repetidos) de las segundas.

La trascendental importancia de este punto de vista del análisis de regresión


se hará más clara a medida que avancemos en el tema, pero algunos ejemplos
facilitarán la aclaración de este concepto básico.

Ejemplos:
. 1. Consideremos nuevamente la ley de regresión universal de Galton. Galton
estaba interesado en averiguar las razones por las cuales existía estabili-
dad en la distribución de las estaturas dentro de una población. Pero desde
el punto de vista moderno, nuestra preocupación no está dirigida a esta
explicación sino, en cambio, a averiguar la manera como cambia la esta-

75
....
.
-g
"3Q.
.=
~
70
o
:=-
..
.<::

...,
.Q

:!
:s
<;¡
ti
¡¡¡

60

FIGURA 1.1
Distribución hipotética de las es-
65 70 75 taturas de los hijos correspondien-
Estatura de los padres. en pulgadas tes a estaturas dadas de los padres..
LA NATURALEZA DEL ANALlSIS DE REGRESION 15

70

40

12 13 .;
"·14
~ '('

'Edad, en años
FIGURA 1.2
DistTibución hipotética de estaturas correspondientes a edades seleccionadas.

tura promedio de los hijos, dada la estatura de los padres. En otras pala-
bras, estamos interesados en predecir la estatura promedio de los hijos a
partir de la estatura de sus padres. Para apreciar cómo puede llevarse esto
a cabo consideremos la Fig~ra 1.1 qúe corresponde a un diagrama de
dispersión.
La figura muestra la distribución de las estaturas de los hijos en una
población hipotética, correspondiente al conjunto de valores fijos o da-
dos de las estaturas de los padres. Nótese que existe un rango (distribu-
ción) de estaturas de los hijos, correspondiente a cualquier estatura dada
de un padre. Sin embargo, apréciese bien que la estatura promedio de los
hijos aumenta a medida que aumenta la estatura de los padres. Para ob-
servar esto claramente hemos trazado una línea a través de los puntos dis-
persos, la cual muestra cómo la estatura promedio de los hijos aumenta
con la estatura de los padres. Como veremos posteriormente, esta línea
se conoce como la línea, de regresión. 3 Obsérvese cómo esta línea tiene
una pendiente positiva pero menor que uno, lo cual está de acuerdo con
la tegresión' de Galton hacia la mediocridad. (¿Por qué?)
2. Considérese ahora el diagrama de dispersión que se presenta en la Figura

3 En esta etapa del desarrollo del tema denominaremos.a este línea de regresión,/inea de la relación
promedio entre la variable dejJendiente (la estatura de un hijo) y la variable explicativa (la e$tatura del
padre).
16 MODELOS UNIECUACIONALES DE REGRESION

1.2 Y que muestra la distribución de las est1lturas de ciertos nUlos, medida


a determinadas edades, en una población hipotética. Nótese que existe
un rango de estaturas correspondiente a una edad determinada. Como es
obvio, no todos los niftos a una determinada edad tienden a tener esta-
turas idéntiéas. Pero la estatura, en promedio, aumenta cpn la edad
(ciertamente hasta una determinada edad). En consecuencia, al conocer
la edad también estamos en posibilidad de predecir la estatura promedio
que corresponde a esa edad. ' -
3. Para utilizar ejemplos de la economía, un economista puede estar intere-
sado en estudiar la dependencia que existe entre ,los gastos personales
de consumo y el ingreso personal real o disponible después de impuestos.
Este tipo de análisis puede ser de gran ayuda para est~mar la propensión
marginal a consumir, es decir, el cambio promedio en los gastos de con-
sumo ante una v~ación de, por ejemplo, una unidad ~n el ingreso real.
4. Un monopolista que puede fijar el precio o la cantidad (pero no ambos
factores), puede estar interesado en averiguar la respuesta de la demanda
de un producto ante los cambios en el precio. Este experimento permite
la estimación de la elasticidad precio (es decir, la respuesta a variaciones
en el precio) de la demanda de un producto y puede ayudar a determinar
el precio que maximiza las ganancias de una empresa.
S. Un profesional en economía laboral puede estar interesad0 en éstudiar la
relación existente entre el porcentaje de cambio en los salarios monetarios
o nominales y la tasa de desempleo. En el diagrama de dispersión que apare-
ce en la Figura 1.3 se presenta información histórica al respecto. La curva

i
~
e
o

1
~
·8
t
" Ol-----~~.__----- Tasa de desempleo. %
'ti
c::
·3
.~
:
.g
!
FIGURA!.3
Curva hipotética d~!»hillips.
LA NATURALEZA DEL ANALlSIS DE REGRESION 17

k=~
Ingresos

FIGURA 1.4
Cantidad de dinero en poder del público con
o
, Tasa de inflación respecto a la tasa de inflación (n).

que aparece en la Figura 1.3 es un ejemplo de la famosa curva de Phillips,


donde se relacionan los cambios en los salarios nominales con la tasa
de desempleo. Este tipo de diagrama de dispersión permitirá al economis-
ta laboral predecir el cambio promedio en los salarios nominales, dada
cierta tasá de desempleo. Dicho conocimiento puede ser de gran ayuda
para realizar conjeturas sobre el proceso inflacionario por el cual puede
atravesar una determinada economía, puesto que los aumentos en sala-
rios probablemente se reflejarán en aumentos en los precios.
6. La economía monetaria plantea que, al permanecer constantes otros fac-
tores, cuanto mayor sea la tasa de inflación ( 1r ), menor será la proporción
(k) del ingreso que la gente querrá mantener en forma de dinero, como se
ilustra en.la Figura 1.4. Un análisis cuantitativo de esta relación permitirá
al economista monetario predecir la cantidad de dinero, como proporción
de su ingreso, que la gente querrá mantener, a diferentes tasas de inflación.
7. El director de mercadeo de una empresa puede estar interesado en cono·
cer la manera como se relacionan la demanda de su producto con los
gastos de publicidad en que incurre dicha empresa. Este tipo de estudio
sería de gran utilidad para averiguar la elasticidad de la demanda del pro-
ducto en los gastos de publicidad de la empresa, es decir, la respuesta
promedio de la demanda ante un aumento de una unidad, por ejemplo,
un dólar, en el presupuesto de gastos de publicidad. Este conocimiento
a su vez puede ser de mucha utilidad para determinar el presupuesto
"óptimo" de publicidad.
8. Finalmente, un agrónomo puede estar interesado en estudiar la depen-
dencia existente entre los niveles de producción de un cultivo de, por
. ejemplo, trigo, y la temperatura, la lluvia, la cantidad de luz solar y el
nivel de fertilidad de la tierra. Este análisis de dependencia puede permi.:.
tirle predecir o pronosticar la producción promedio de ese cultivo, dada
la información existente sobre las variables explicativas.
18 MODELOS UNIECUACIONALES DE REGRESION

El lector está en capacidad de proporcionar una amplia gama de ejem-


plos adicionales relacionados con la dependencia de. una variable ante una o
más variables adicionales. Además, las técnicas del análisis de regresión co-
mentadas en este texto están diseñadas especialmente para el estudio de este
tipo de dependencia entre variables.

1.3 RELACIONES ESTADISTICAS VS.


RELACIONES DETERMINISTICAS
De los ejemplos que se enunciaron en la Sección 1.2, el lector podrá obser-
var que dentro del análisis de regresión nos interesa lo que se conoce como la
dependencia estadistica y no la dependencia funcional odeterministica, entre
las variables, como aquellas que se presentan en la física clásica. En las rela-
ciones estadísticas entre variables tratamos esencialmente con variables
aleatorias o estocásticas,4 es decir, variables que tienen distribuciones proba-
bilísticas. Por otra parte, en la dependencia funcional o determinística tam-
bién tratamos con variables, pero éstas no son aleatorias ni estocásticas.
La dependencia de los niveles de producción de un cultivo con respecto
a la temperatura, la lluvia, el sol y la fertilidad, tiene, por ejemplo, una na-
turaleza estadística en el sentido de que las variables explicativas, aunque
ciertamente importantes, no permitirán al agrónomo predecir la producción
de ese cultivo en forma exacta, debido a los errores involucrados en la me-
dición de estas variables, como también debido a otra serie de factores (va-
riables), que en forma colectiva afectan la producción pero que pueden ser
difíciles de identificar en forma individual. Por tanto, se va a presentar cierta
variabilidad "intrínseca" o aleatoria en la variable dependiente rendimiento
del cultivo, que no puede explicarse por completo, independientemente del
número de variables explicativas que utilicemos.
Por otra parte', en los fenómenos determinísticos tratamos con Cierto
tipo de relaciones que surgen, por ejemplo, de la ley de la gravedad de
Newton, que plantea: toda partícula en el universo atrae a otra partícula
con una fuerza directamente proporcional al producto de sus masas e inversa-
mente proporcional al cuadrado de la distancia entre ellas. En símbolos,
F = k (m 1 m2 /r 2 ), donde F = fuerza, m 1 y m2 son las masas de las dos par-
tículas, r = distancia y k = constante de proporcionalidad. Otro ejemplo lo
constituye la ley de Ohm, que dice: para los conductores metálicos que están
en un rango limitado de temperatura, la corriente e es proporcional al vol-
taje V; es decir, v/e = k, donde k es la constante de proporcionalidad.
Otros ejemplos de este tipo de relaciones determinísticas son la ley de los
gases de Boyle; la ley de la electricidad de Kirchhoff y la ley del movimiento
de Newton.

4 La palabra "estocástico" proviene del griego Stokhos que significa "centro del blanco" o "tiTo acer-
tado que da en el centro del blanco". El resultado que se obtiene al lanzar dardos sobre un tablero es
un proceso estocástico, es dech, un proceso acompañado con errores.
LA NATURALEZA DEL ANAlISIS DE REGRESION 19

En este texto no estamos interesados en este tipo de relaciones determi-


nísticas. Sin embargo, ~s preciso aclarar que si existen errores de medición,
digamos en el valor de k en la ley de la gravedad de Newton, las relaciones que
de otra manera serían determinísticas se convertirían en rela:ciones estadís-
ticas. La razón radica en que en esta situación la fuerza puede predecirse
únicamente en forma aproximada, a partir de un valor dado de k (y ml' m2
y r) que contiene errores.· La variable F, en este caso, se convierte en una
variable aleatoria.

1.4 REGRESION VS. CAUSACION


Aunque el análisis de regresión tiene que ver con la. dependencia de una va-
riable con relación a otras variables, esto no implica necesariamente que
exista una relación de causalidad. Utilizando las palabras de Kendall y Stuart:
"Una relación estadística, independientemente de qué tan fuerte y aparente
sea, nunca puede establecer una conexión causal: nuestras ideas de causación
deben provenir de las estadísticas externas, y, en últimas, de algún tipo de
teoría"5 que las soporte.
En el ejemplo de la produ~ción del cultivo de trigo que antes menciona-·
mas, no existe una razón estadz'stica para suponer que la lluvia no depende
de ,la producción del cultivo. El hecho de que tratemos la producción del
cultivo como variable dependiente de los niveles de lluvias {entre otras cosas),
se debe a consideraciones de tipo no estadístico: el sentido común sugiere
que la relación no se puede invertir, puesto que no podemos controlar la lluvia
variando la producción del cultivo.
En todos los ejemplos mencionados en la Seccióp 1.2, el punto que de-
bemos 'mantener en mente es que una relación estadística no puede por sí
misma implicar en forma lógica una causación. Para atribuir causalidad se
debe hacer uso de consideraciones teóricas o a priori. Por tanto, en el tercer
ejemplo antes mencionado se puede invocar la teoría económica al plantear
que los gastos de consumo dependen del ingreso real. 6

1.5 REGRESION VS. CORRELACION


Aunque el análisis de correlación está estrechamente· relacionado con el
análisis de regresión, conceptualmente los dos son muy diferentes. En el
análisis de correlación, el objetivo fundamental es la medición de la fuerza

s M. G. K~ndal1.y A. Stuart, The advanced Theory 01 Statistics, Charles Griffin Publishers, New York,
1961, vol. 2, cap. 26, p. 279.
6 Pero, como veremos en el Capítulo 3, el análisis de regresión clásico está basado en el supuesto de
que el modelo utilizado en el análisis es el modelo correcto. Por tanto, la dirección de la causalidad'
puede est~r implícita en el modelo postulado.
20 MODELOS UN1ECUACI0NALES DE REGRESION

o grado de asociación lineal entre dos variables. El coeficiente de correlación,


que estudiaremos en detalle en el Capítulo 3, mide esta fuerza de asociación
(lineal). Por ejemplo, podríamos estar interesados en averiguar la correlación
(el coeficiente de correlación) entre el hábito de fumar y el cáncer del pul-
món, entre las calificaciones de exámenes de estadística y matemátic¡rs,
entre las calificaciones obtenidas en la escuela secundaria y en la universidad.
Como ya se comentó, e-n el análisis de regresión no estamos fundamental-
mente interesados en este tipo de medición. En lugar de ello, se intenta estimar
o predecir el valor promedio de una variable con base en los valores fijos de
otras variables. En este orden de ideas, podría ser importante saber si se puede
predecir la calificación promedio obtenida en un examen de estadística, co-
nociendo previamente la calificación obtenida en uno de matemáticas.
Las dos técnicas de regresión y correlación tienen ciertas diferencias
fundamentales que vale la pena mencionar. En el análisis de regresión existe
una asimetría en la manera como se manejan las variables dependientes y
explicativas. Se supone que la variable dependiente es estadística, aleatoria
o estocástica, 10 cual implica que tiene asociada a ella una distribución pro-
babilística. Se supone, de otro lado, que las variables explicativas tienen
valores fijos (en muestreos repetidos),' 10 cual se hizo explícito en la defi-
nición de regresión que se formuló en la Sección 1.2. De esta manera, en la
Figura 1.2 suponemos que la variable edad era fija a ciertos niveles dados,
obteniendo a partir de ella las mediciones de estatura para, cada uno de esos
niveles. Por otra parte, en el análisis de correlación se manejan las (dos)
variables simétricamente; no existe distinción alguna entre las variables
dependientes y las explicativas. Después de todo, la correlación existente
entre las calificaciones en matemáticas y los exámenes de estadística es la
misma que la correlación existente entre las calificaciones de estadística y
los exámenes de matemáticas. Adicionalmente, se supone que ambas variables
son aleatorias. Como veremos posteriormente, la mayor parte de la teoría de
la correlación está basada en el supuesto de aleatoriedad de las variables,
mientras que la mayor parte de la teoría de la regresión que expondremos en
este texto está condicionada al supuesto de que la variable dependiente es
estocástica y que las variables explicativas son fijas o no estocásticas. 8

7 Es decisivo hacer la observaci6n de que las variables explicativas pueden ser intrínsecamente estocás-
ticas, pero para los propósitos del análisis de regresión suponemos que sus valores se mantienen fijos
en muestreos repetidos (es decir, X tiene los mismos valores en diferentes muestras), hecho que les
imprime car~cterísticas no al~torias o no estocásticas. Hay informaci6n adicional sobre este tema en
el CapítulO 3, Sección 3.2
8 En el tratamiento avanzado de la econometría se puede liberar el supuesto de que las variables expli-
cativas no son estocásticas (véase Introducci6n a la Parte 11).
LA NATURALEZA DEL ANALlSIS DE REGRESION 21

1.6 TERMINOLOGIA y NOTACION


Antes de proceder a un análisd más formal de la teoría de la regresión, exa-
minemos brevemente la terminología y la notación a utilizar. En nuestra no-
menclatura, los términos variable dependiente y variable explicativa se defi-
nen o describen de varias maneras. A continuación se presenta una lista
representativa de ellas:

Variable dependiente Variable explicativa


li li
Variable explicada Variable independiente
li li
Predicha Predictor
li li
Regresada Regresor
ti ti
Respuesta Variable de controlo estímulo
li li
Endógena Ex6gena

Aunque es un problema de gusto personal y de tradición, en el presente libro


se utiliza la terminología variable dependiente - variable explicativa.
Si estamos estudiando la dependencia de una variable en una sola varia-
ble explicativa, tal como la dependencia existente entre el consumo y el
ingreso real, dicho estudio se conoce como análisis de regresión simple o en
dos variables. Sin embargo, si estamos estudiando la dependencia de una va-
riable en más de una variable explicativa, como en el ejemplo del cultivo y
su relación con la temperatura, las lluvias y los fertilizantes, nos estamos refi-
riendo al análisis de regresión múltiple. En otras palabras, en el análisis de re-
gresión en dos variables existe sólo una variable explicativa,. mientras que en
el análisis de regresión múltiple se trabaja con más de una de dichas variables.
El término aleatorio es sinónimo de estocástico, que a su vez es un sinó-
nimo de probabilidad. Como se anotó anteriormente, una variable aleatoria o
estocástica es aquella que puede tomar cualquier conjunto de valores positivos
o negativos, con una probabilidad dada. 9
A menos que se afirme lo contrario, la letra Y representará la variable
dependiente y las X (Xl' X 2 , ••• , X k ) representarán las variables explica-
tivas, siendo X k la i-ésima variable explicativa. Los subíndices i o t deno-
tarán la observación o valor i-ésimo o t-ésimo Xu (o X kt ) denotarán la
i-ésima (o t-ésima) observación de la variable X k • N (o T) representarán el
número total de observaciones o valores en la poblacion o en una muestra,
según el caso. En general, usaremos el subíndice i para las series de corte
transversal (vr. gr., información tomada en un punto en el tiempo). El sub-
índice t se usará para información de series de tiempo (vr. gr., datos recogí-

9 Véase Apéndice A, para efectos de una def'mición formal y detalles adicionales.


22 MODELOS UNIECUACIONALES DE REGRESION

dos a lo largo de un cierto período). La naturaleza de la información de las


series de corte transversal y de las series de tiempo, así como el importante
tema de la naturaleza y las fuentes de información para análisis empírico, se
estudiarán en la siguiente sección.

1.7 NATURALEZA Y FUENTES DE INFORMACION


PARA EL ANALlSIS ECONOMETRIC0 1o
El éxito de cualquier análisis econométrico depende en última instancia, de
la disponibilidad de información adecuada. Es, por tanto, esencial que se
dedique algún tiempo para comentar la naturaleza, fuentes y limitaciones de
la información con que se puede contar cuando se realiza análisis empírico.

Tipos de infonnación
Existen tres tipos de datos que generalmente se encuentran disponible~ para
realizar análisis empírico:
1. Series de tiempo.
2. Series de corte transversal.
3. Combinación de series de tiempo y series de corte transversal.
Los datos de series de tiempo son aquellos que se almacenan durante
un determinado período, tales como la información sobre PNB, empleo,
desempleo, oferta monetaria, etc. Estos datos se pueden recolectar en inter-
valos regulares, ya sea diariamente (por ejemplo, los precios de las acciones),
semanalmente (vr. gr., oferta monetaria), mensualmente (vr. gr., la tasa de
desempleo), trimestralmente (vr. gr., el PNB) o anualmente (vr. gr., el presu-
puesto nacional). Dicha información puede ser cuantitativa (por ejemplo,
precios, ingresos, oferta monetaria), o cualitativa (vr. gr., hombre o mujer,
empleado o desocupado, casado o soltero, blanco o negro). Como veremos
posteriormente, las variables cualitativas, también denominadas variables
dicotómicas o categóricas, pueden ser tan importantes como las variables
cuantitativas (véase Capítulo 12).
Las series de corte transversal se recolectan con base en una o más varia-
bles en un momento en el tiempo, tales como el censo de población que
lleva a cabo la oficina de censos cada 10 años, las encuestas de gastos del
consumidor llevadas a cabo por la Universidad de Michigan, las encuestas
de opinión que adelantan diferentes empresas especializadas, etc.
En los datos combinados ("pooled data" y de corte transversal) se
tienen elementos de información proveniente tanto de series de tiempo como
de corte transversal. Por ejemplo, los datos que se presentan en el Ejercicio

10 Para una explicación informativa, véase Michael D. Intriligator, Econometric Mode/s, Techniques,
and Applications, Ptentice-Hall, Inc., Englewood Cliffs, N. J., 1978, Cap. 3.
LA NATURALEZA DEL ANALlSIS DE REGRESION 23

1.1 son combinados debido a que la tasa de inflación de cada país durante
. un período' de 21 afios, 1960-1980, está en la fonna de una serie de tiem-
po, mientras que los datos sobre la tasa dé inflación durante un solo afio
para cada uno de los cinco países allí considerados es de corte transversal.
En los datos combinados se cuenta con un total de 105 observaciones. 21
observaciones anuales para cada uno de los cinco países.
Los datos longitudinales o de panel constituyen un tipo especial de da-
tos combinados a ros cuales también se les denomina datos de micropanel;
en éstos la misma unidad de corte transversal (por ejemplo, una familia o
una empresa) se encuesta a través del tiempo. Por ejemplo, el Departamento
de comercio de los Estados Unidos lleva a cabo un censo de vivienda a inter-
valos periódicos. En cada encuesta periódica se entrevista a la misma familia
(o a las personas que habitan la misma vivienda) buscando averiguar si se ha
presentado algún cambio en las condiciones tanto finanCieras como de la
vivienda misma de dicha familia desde la últiina encuesta. Al entrevistar
repetidamente a la misma familia a intervalos periódicOS, la infonnación
de panel proporciona infonnación muy útil sobre la dinámica del comporta-
miento familiar.

Las fuentes de infonnación l l


La infonnación que se utiliza en análisis empíricos puede recolectarse por
parte de una agencia gubernamental (vr. gr., el Departamento de' comercio de
los Estados Unidos), una agencia internacional (vr. gr., el FMI o el Banco
Mundial), una organización privada (la empresa Standar & Poor's) o por
parte de un individuo. Existen literalmente miles de estas agencias dedicadas
a recolectar infonnación para diversos propósitos.
Los datos recolectados por estas empresas pueden tener una naturaleza
experimental o no experimental. En los datos de tipo experimental, con
frecuencia recopilados por las ciencias naturales, el investigador puede estar
interesado en recolectar infonnación en que se mantengan ciertos factores
constantes, de tal manera que pueda evaluar el impacto de otros factores
adicionales sobre un fenómeno detenninado. Por ejemplo, para evaluar el
impacto de la obesidad sobre la presión sanguínea, el investigador desearía
recolectar infonnación manteniendo factores tales como los hábitos alimen-
ticios, las actividades de fumar o beber en fonna constante, de tal manera
que se pueda minimizar la influencia de, estas variables sobre la presión
sanguínea. '
En las ciencias so~iales generalmente los d'atos que se obtienen son de
naturaleza no experimental, lo cual implica que no están sujetos al control
del irivestigaaor. Así, por ejemplo, la infonnación referente al PNB, al de-

11 Para una explicación muy clara, véase Albert T. Sorners, The U.S. Economy Demystified: What
the Major Economic Statistics Mean and Their Significallce for BusinelS, D. C. Heath and Cornpany,
Lexington, Mass., 1985.
24 MODELOS UNIECUACIONALES DE REGRESION

sempleo, al precio de las acciones, etc., no está directamente bajo el control


del investigador. Como veremos posteriormente con frecuencia este hecho
crea problemas especiales al investigador que 'intenta encontrar la causa o las
causas que afectan una determinadasítuación. Por ejemplo, ¿es la cantidad
de dinero circulante la variable que deterlilina en PNB (nominal) o, por el
contrario, ocurre la relación de causalidad en la otra direccion?

La exactirup de la infonnacióri l 1.
Aunque existe mucha información disponitile para llevar a cabo investigación
económica, la calidad de ésta no es necesariamente tan buena. Existen dife-
rentes razon~ para ello. En primer lugar, como se señaló anteriorm~nte, la
mayor parte <\te la información de que disponen las ciencias sociales no es
de naturaleza experimental. Por tanto, existe la posibilidad de incurrir en
errores de observación, ya sea por omisión o por comisión. En segundo lugar,
aun para información recolectada experimentalmente se presentan errores
de medición que surgen debido a aproximaciones o redondeo de las cifras.
En tercer lugar, en las encuestas donde se entregan cuestionarios el problema
de que no haya respuesta puede tomarse serio; el investigador cuenta con
suerte cuando obtiene el 40 % de las respuestas a sus preguntas. El análisis
que ~e efectúe con base en estas respuestas parciales puede no reflejar el
comportamiento real del 60% que no respondió, conduciendo, por tanto, a
lo que se conoce como el sesgo selectivo (de la muestra). Se presenta tam-
bién otro problema, ya que existe la posibilidad de que quienes responden el
cuestionario tal vez no contesten todas las preguntas, especialmente aquellas
que toquen aspectos financieros, 10 cual ocasiona un sesgo selectivo adicional.
En cuarto lugar, los métodos de muestreo que se utilizan para obtener la
información pueden variar tan ampliamente que con frecuencia es difícil
comparar los resultados obtenidos de las diferentes muestras. En quinto lu-
gar, los datos económicos generalmente están disponibles con un nivel de
agregación muy alto. Por ejemplo, la mayor parte de los macrodatós (como el
PNB, el desempleo, la inflación, el empleo) están disponibles para la econo-
mía como un todo o, en el mejor de los casos, para algunas regiones geográfi-
cas muy amplias. Dicho tipo de agregación puede no decimos mucho sobre
las unidades individuales o microunidades que podrían construirse en el ob-
jetivo fundamental del estudio. En sexto lugar, debido a restricciones de
c0nfidencialidad, cierta información puede publicarse sólo en forma muy
agregada. En el caso de los Estados Unidos, por ejemplo, a la agencia de im-
puestos no se le permite por ley hacer pública la información sobre las decla-
raciones individuales de ingreso; solamente se le permite liberar información
agregada y ré'sumida. Por tanto, si se quiere conocer la 'magnitud de los gas-
tos en salud correspondiente a individuos de cierto nivel de ingresos, el

12 Para un punto de vista crítico, véase Morgenstern, O., The Accuracy 01 Economic Observations.
2a. ed., Princeton University Press, Princeton, N. J., 1963.
LA NATURALEZA DEL ANALlSIS DE REGRESION 25

análisis puede hacerse únicamente a ~n nivel muy agregado. Este. tipo de


macroanálisis no refleja, sin embargo, la dinámica del comportamiento de
las microunidades. De igual fonna, el Departamento de comercio de los
Estados Unidos, agencia que lleva a cabo un censo emprésarial cada cinco
afios en ese país, no puede hacer pública la informacion sobre produccióp,
empleo, consumo de energía, gastos en investigación y desarrollo, etc.,· a
nivel de cada empresa. Erl 'Consecuencia, es difícil estudiar las diferencias
existentes entre una empresa y otra en relación cón cada uno de estos as-
pectos.
Debido a estos y muchos otros problemas, el investigador siempre debe
tener presente que lés resultados de la investigacion son tan buenos como sea
la calidad de la infurmación con que trabaje. Por tanto, si en ciertas situaci~
nes se encuentra que los resultados de la investigación "no son satisfactorios",
no se debe necesariamente a que se haya utilizado el modelo equivocado,
sino a la mala calidad de los datos. Desafortunadamente, en razon de la na-
turaleza no experimental de .los datos que se utilizan en la mayoría de los
estudios en las ciencias sociales, con frecuencia los investigadores no tienen
otra opción aparte de depender de la información disponible. Sin embargo,
se debe recordar siempre que la información utilizada puede no ser la mejor,
no debiendo, por lo tanto, ser demasiado dogmáticos acerca de los resultados
que se obtienen de un determinado estudio, especialmente cuando se sospe-
cha de la calidad de la información con que se trabaja.

1.8 RESUMEN Y CONCLUSIONES


Este capítulo estuvo dirigido a suministrar información relacionada con la
naturaleza básica del análisis de regresión, de la manera más informal e intui-
tiva posible. La idea fundamental del análisis de regresión consiste en la de-
pendencia estadística. de una variable, la variable dependiente, con. respecto a
una o más variables, las variables explicativas. El objeto de este análisis es
estimar y/o predecir la medida o el valor promedio de la variable dependien-
te, con base en los valores fijos o conocidos de las variables explicativas.
Aunque la teoría y Jos mecanismos del análisis de regresión se analizarán
ampliamente en los próximos capítulos, debe tenerse siempre en mente que
el éxito del análisis de regresión depende de la disponibilidad de información
adecuada. En este capítulo analizamos la naturaleza, fuentes y limitaciones
de la información generalmente disponible para la investigaGión, especialmente
en las ciencias sociales. Debemos solicitar muy especialmente al lector que se
mantenga muy alerta sobre los datos que se utilizan en el análisis empírico.
En cualquier investigación, los investigadores deben enunciar claramente las
fuentes de los datos utilizaqos en el análisis, sus definiciones, su(s) método(s)
de recolección y cualquier omisión en los datos, así como cualquier revisión
de los mismos. Recuerde siempre que el consultante quizá no cuente con el
tiempo, energía ni recursos p"ara llegar a las fuentes originales de los datos o
para verificar los resultados; tiene el derecho de suponer que se obtuvieron
los mejores datos posibles y que los cálculos y análisis son correctos.
26 MODELOS UNIECUACIONALES DE REGRESION

EJERCICIOS
1.1 En la siguiente tabla se presentan las tasas de inflación correspondientes a cinco países
industrializados para el período 1960-1980.

Tasas de inflación en cinco países industria-


lizados 1960-1980 (% anual)
Año Estados Gran Japón Alemania Francia
Unidos Bretaña

1960 1.5 1.0 3.6 1.5 3.6


1961 1.1 3.4 5.4 2.3 3.4
1962 1.1 4.5 6.7 4.5 4.7
1963 1.2 2.5 7.7 3.0 4.8
1964 1.4 3.9 3.9 2.3' 3.4
1965 1.6 4.6 6.5 3.4 2.6
1966 2.8 3.7 6.0 3.5 2.7
1967 2.8 2.4 4.0 1.5 2.7
1968 4.2 4.8 5.5 1.8 4.5
1969 5.0 5.2 5.1 2.6 6.4
1970 5.9 6.5 7.6 3.7 5.5
1971 4.3 9.5 6.3 5.3 5.5
1972 3.6 6.8 4.9 5.4 5.9
1973 6.2 8.4 12.0 7.0 7.5
1974 10.9 16.0 24.6 7.0 14.0
1975 9.2 24.2 11.7 5.9 11.7
1976 5.8 16.5 9.3 4.5 9.6
1977 6.4 15.9 8.1 3.7 9.4
1978 7.6 8.3 3.8 2.7 9.1
1979 11.4 13.4 3.6 4.1 10.7
1980 13.6 18.0 8.0 5.5 13.3

Fuente: Richard Jackman, Charles Mulvey, and James


Trevithick, The Economics oi Inflation, 2d. ed., Martin
RobeTtson, 1981, tabla 1.1. p.5.

(a) Grafique la tasa de inflación para cada país frente al tiempo. (Utilice el eje hori-
zontal para el tiempo y el vertical para la tasa de inflación).
(b) ¿Qué conclusiones generales se pueden inferir acerca de la experiencia con la
inflación en los cinco países?
(e) ¿Qué país parece tener la tasa de inflación más variable? ¿Puede usted dar alguna
explicación?
1.2 Utilice los datos del Ejercicio 1.1.
(a) Grafique la tasa de inflación para Gran Bretaña, Japón, Alemania y Francia fren-
te a la tasa de inflación en los Estados Unidos. (Utilice el eje horizontal para la
tasa de inflación en los Estados Unidos y el vertical para la tasa de inflación de
los demás países. Si lo prefiere, puede hacer cuatro diagramas separados).
(b) Haga comentarios generales sobre el comportamiento en la tasa de inflación en
los cuatro países, en comparación con su comportamiento en los Estados Unidos.
LA NATURALEZA DEL ANALlSIS DE REGRESION 27
.J

(e) ¿Observa usted algún cambio significativo en el comportamiento inflacionario•


de cada país a través del tiempo, y de los cuatro países en relación con los Esta-
dos Unidos?
(d) ¿Cree usted que los embargoS petroleros de 1974 y 1979 hayan tenido un efecto
significativo en la tasa de inflación de los diferentes países? Si es así, ¿por qué
razón?
(e) <Jbtenga información sobre la tasa de inflación en los cinco países desde 1980
y haga un.comentario sobre el comportamiento de la inflación desde entonces en
el). estos países. ¿Cree usted que la situación petrolera mundial que prevalece des-
de 1980 haya tenido desde entonces algún efecto sobre la tasa de inflación?
CAPITULO 2
MODELOS DE REGRESION
CON DOS VARIABLES:
ALGUNAS IDEAS
BASICAS

En el·Capítulo 1 nos ocupamos del concepto de regresión en términos más


o menos amplios. En este capítulo tratamos el tema de manera un poco más
formal; específicamente, éste y los tres capítulos siguientes inician el estudio
de la teoría que sirve de fundamento al análisis de regresión más sencillo
para el caso de dos variables, el cual se .considera en primer lugar, no necesa-
riamente por su importancia práctica sino porque sirve para presentar en
forma simple las ideas básicas del análisis de regresión y porque con él se
pueden ilustrar algunas ideas usando diagramas en dos dimensiones. Además,
se verá más adelante, el caso general del 'análisis de regresión múltiple es en
muchos aspectos una extensión lógica del caso de dos variables.

2.1 EJEMPLO HIPOTETICO


Como se señaló en la Sección 1.2, el análisis de regresión está dirigido a esti-
mar o predecir el valor medio o promedio (poblacional) de la variable depen-
diente con base en los valores fijos o conocidos de la (s) variable (s) explicativa(s).
Para cómprender la manera como se lleva a cabo este análisis, examinemos el
si~l1ieT\te ejemplo:

28
MODELOS DE REGRESION CON DOS VARIABLES: ALGUNAS IDEAS BASICAS 29

.110
TABLA 2.1
familiar por semana X, $

~ 80 100 120 140 160 180 100 210 240 160


Gastos de COIlSUmO 55 65 79 80 102 110 120 135 137 150
familiar por 60 70 84 93 107 115 136 137 145 152
semana y, $ 65 74- 90 95 110 120 140 140 155 1.75
70 80 94 103 116 130 144 152 165 178
75 85 98 108 118 135 145 157 175 180
... !l8 ... 113 125 140 ... 160 189 185
... ... ... 115 ... .., . .. 162 ... 191
Total 325 462 445 707 678 750 685 1043 966 1211

Imaginemos un país con una población total 1 de 60 familias. Supóngase


que estarnos interesados en estudiar la relación existente entre los gastós de
consumo familiar semanal Y y el ingreso disponible familiar semanal después
de impuestos X. Más específicamente, asúmase que se desea predecir el nivel
(poblacional) promedio de los gastos de consumo semanales, conociendo el
ingreso de la familia en este lapso. Con este [m, supongamos que se dividen
las 60 familias en 10 grupos con el mismo ingreso aproximadamente, para
examin~ a continuación los gastos de consumo,de las familias en cada uno
de los grupos de ingreso. En la Tabla 2.1 se presenta información hipotética.
(Por razones expositivas, se supone que solamente se observaron en ~a1idad
los niveles de ingreso d.ados en dicha Tabla).
La Tabla 2.1 debe interpretarse de la siguiente manera: para un ingreso'
semanal de S80, existen 5 familias cuyos gastos' de consumo semanales osci-
lan entre S55 'y S75. Análogamente, para X = $240, existen 6 familias cuyos
gastos de consumo semanal están entre S137 y $189. En otras palabras, cada
columna de la Tabla 2.1 muestra la distribución de los gastos de consumo Y
correspondientes a un nivel fijo de ingreso X; esto es, muestra la distribución
condicional de Y condicionada en los valores dados de X.
Dados que los datos de la Tabla 2.1 representan la población, podernos
calcular fácilmente las probabilidades condicionales de Y p(Y I X). o la proba-
bilidad de Y dado X, de la siguiente manera. 2 Para X = S80, por ejemplo,

1 Informalmente, una población es el conjunto de todos los resultados posibles de un experimento o


medición, por ejemplo, cuando se lanza al aire una moneda varias veces o cuando se registran los pre-
cios de todos los títulos valores' transados en la Bólsa de valores de Nueva York al fmal del día.
2 Unas palabras sobre lB notación utilizada. La expresión p( y IX) o p( Y IXI) es una forma abreviada
de p( r = 1) IX = X¡}, la probabilidad de que la variable aleatoria (discreta) Y tome el valor numérico Y¡
dado que 'la variable aleatoria (discreta) X tome el valor numérico X" Sin embargo, pira no congestio-
nar la. notaci6n utilizaremos el subíndice i (el número de la observación) para las dos variables; Por
tanto,p(Y IX) o p(Y IX J significaráp(Y '" 1'; IX = XJes decir, la probabilidad de que Y tome el valor Y,
dado que X tome el valor XI, puesto que se desea aclarar el rango de los valores que 'toman X y Y. En
= =
la Tabla 2.1, cuando X $220, Y toma siete valores diferentes, pero cuando X $120, Y toma sólo
cinco valores diferentes.
30 MODELOS UNIECUACIONALES DE REGRESION

TABLA 2.2
Probabilidades condicionales p( Y I X ¡) para los datos de la Tabla 2.1

~Y;X~ 80 100 120 140 160 180 200 220 240 260

Probabilidades 1
5
1
¡;
1
5
1
7"
1
6
1
6
1
5
1
7
1
"
.
1

1 1 1 .), 1 1 1 17 1 1
condicionales j ;; 5 6 6 5 6 "7

p(Y I XI) 1
5
1
6
1
5
1
7
1
6
1
6
1
5
.J, 1
6
.J,
1 1 1 1
1
5 6 t 7
1
6
1
6
1
5
1
7 ti 7"

~ 1
6 ~ o\-
1
¡; 1
6
1
5
1
7
1
6 t
1
6
1
7
1
6
1
ti t i 1
7

o\- 1 1
7 7

Medias
condicionales de Y 65 77 89 101 113 125 137 149 161 173

existen 5 valores de Y: $55, $60, $65, $70 y $75. Por tanto, dado que X == $80,
la probabilidad de obtener uno de estos gastos de consumo es !. Simbólica-
mente, p(Y = 55\ X = 80) =!. De igual forma, p(Y = 150' X = 260) = t y así
sucesivamente. Las probabilidades condicionales para los datos de la Tabla 2.1
se presentan en la Tabla 2.2.
Ahora bien, para cada una de las distribuciones de probabilidad condi-
cionales de Y se puede calcular su valor medio o promedio, término conocido
también como la media condicional o esperanza condicional, que se denota
comoE(Y, X = Xi) Y que se lee "el valor esperado de Y dado que X toma el
valor específico X¡"y que, para efectos de simplificar la notación, se escribirá
como E(Y \ XJ (Nota: Un valor esperado es simplemente la media o valor
promedio de la población). Para nuestros datos hipotéticos, estas esperanzas
condicionales pueden ser calculadas fácilmente multiplicando los valores rele-
vantes de Y dados en la Tabla 2.1, por sus probabilidades condicionales dadas
en la Tabla 2.2 y sumando luego estos productos. Para ilustrar el concepto,
se tiene que la media condicional o esperanza de Y dado X == 80 será igual a:
5 5(!) + 60(!) + 65(}) + 70( *) + 7 5( ~) = 65. Las medidas condicionales cal-
culadas se encuentran al final de la Tabla 2.2. t
Antes de seguir es convenie'n te observar las cifras de la Tabla 2.1 a través
de un diagrama de dispersión, como se muestra en la Figura 2.1, en el cual se
muestra la distribución condicional de Y correspondiente a varios valores de X.
A pesar de que ocurren variaciones en los gastos de algunas familias conside-
radas individualmente, la gráfica de la Figura 2.1 muestra claramente que, e,.
promedio, los gastos de consumo aumentan al incrementarse el ingreso. Dicho
de otra manera, la figura sugiere que los valores (condicionales) promedios de
y aumentan cuando X se incrementa. La anterior afirmación puede apreciarse
mucho mejor si concentramos nuestra atención en los puntos más gruesos
que representan diferentes valores condicionales medios de Y. El diagrama
muestra la forma como estos puntos aparecen exactamente sobre una línea
MODELOS DE REGRESION CON DOS VARIABLES: ALGUNAS IDEAS BASICAS 31

200
M

7i
i
a
=
o
150
a
ao
...
u
'O
o 100
i
c.?

50~~~~--~--~--~--~--~--~---L---L--
80 100 120 140 160 180 200 220 240 260
Ingreso semanal, $

FIGVRA2.1
Distribución condicional del gasto para düeaentes niveles de Ingreso (datos de la Tabla 2.1).

,-

recta con pendiente positiva. 3 Esta línea se denomina línea de regresión po-
blacional o, más genéricamente, curva de regresión poblacional o, más espe-
cíficamente, curva de regresión poblacional de Yen X.
Desde el punto de vista geométrico, una curva de regresión poblacional
es simplemente el trazado o unión de las medÚlS condicionales o esperanzas
de la variable dependiente para losvaloresfijosde 10/s) variable(s) explicativolsJ.
En la Figura 2.2 .se puede observar la curva de regresión poblacional, que
mu~stra que para cada Xi existe una población de valores de Y (que se supo-
nen normalmente distribuidos, por razones que se explicarán más adelante) y
una media (condicional) correspondiente. La línea o curva de regresión atra-
viesa estas' medias condicionales. Con esta interpretación d~ la curva de
regresión es aconsejable releer la defmición de regresión dada en la sección 1.2.

2.2 CONCEPTO DE LA FUNCION


DE REGRESION POBLACIONAL (FRP)
De la ~terior exposición y especialmente de las Figuras 2.1 y 2.2, se deduce
claramente que cada medJa condicional E(Y I Xi) está en función de Xi' Sim-
bólicamente, se tiene que:

E(YIX¡) =f(X¡) (2.2.1)

3
.
El lector debe mantener presente la naturaleza hipotética de nuestra inforrnacion. No se está sugi-
riendo que las medias condicionales deban siempre estar sobre una línea recta; ellas pueden perfecta-
mente estar sobre un~ curva.
32 MODELOS UNIECUACIONALES DE REGRES!ON

y
@ Media condicional

....

;149~----~--~~~--~~~
e
~
o IOII------+~-::iIIIF--.\ Distribuci6n de Y dado X =$220
e
~ 6S I------~F_I
...
..,..
S
~
FIGURA 2.2
~~--J80-----1~40-------22~O--------X Lúteas de regresión poblacional
Ingreso seman.al. $ (datos de la Tabla 2.1).

en donde f(X i ) denota una función de la variable explicativa Xi' [En nuestro
ejemplo hipotético, E(YI Xi) es una función lineal de X¡]. La ecuación (2.2.1)
se conoce como la· función de regresión poblacional, FRP, (en dos variábles)
o simplemente regresión poblacional (RP). Dicha función denota únicamente
que la media (poblacional) de la distribución de Y dado Xi está funcional-
mente relacionada con XI. En otras palabras, nos muestra cómo el valor pro-
medio (poblacional) de Y varía con las X. Dicho de otra fonna, nos dice
cómo la respuesta media: o promedio de Y varía con X
¿Qué fonna toma la funciónf(X i )? Esta pregunta es importante, dado
que en una situaciÓn real no se dispone de la totalidad de la población para
efectuar el análisis. Por tanto, la fonna funcional de la FRP debe ser aproxi-
mada de una manera empírica, aunque para casos específicos es necesario
acudir a la teoría. Por ejemplo, un economista puede afinnar que los gastos
de consumo están linealmente relacionados con el ingreso. En consecuencia,
como una primera aproximación o como hipótesis de trabajo, podemos supo-
ner que la I;'RP E(Y I Xi) es una función lineal de Xi, por ejemplo, del siguiente
tipo:
(2.2.2)

en la cual PI y P2 son parámetros desconocidos pero fijos que se denominan


coeficientes de regresión, también llamados intersección y coeficiente de la
pendiente, respectivamente. La ecuación (2:2.2) se conoce como la función
de regresión lineal poblacional o, simplemente, como la regresión lineal poblo-
donal. Otras expresiones equivalentes utilizadas son: modelo de regresión li-
neal poblacional, o ecuación de regresión lineal poblacional. Obviamente, los
ténninos regresión ecuación de regresión y modelo de regresión son sinónimos.
En el análisis de regresión, nuestro interés consiste en estimar una FRP
como la de la ecuación (2.2.2), esto es, estimar los valores de las incógnitas y
MODELOS DE REGRESION CON DOS VARIABLES: ALGUNAS IDEAS BASICAS 33

TABLA 2.3
Modelo. de re¡resión lineal
¿Modelo Un. en 10& parimeuo.? ¿Modelo Uneal ea Ju Ylriablea?

Si No

sí MRI: MRL
No MRNL MRNL

NotG:MRL Modelo de rest_lón lineal


MRNL Modelo de rell'esión no lineal
I
I
PI y P2 con base en las observaciones de Y y X, 10 cual se estudiará en detalle
en el Capitulo 3. .

2.3 . SIGNIFICADO DEL TERMINO "LINEAL"


Dado que este texto está interesado principalmente en modelos lineales como
los de (2.2.2), es esencial entender en qué consiste el término lineal ya que'
éste puede ser interpretado de dos maneras diferentes.

Linealidad en las variables


~ .
El principal y quizá más "natural" significado de linealidad es que la expec-
tativa condicional de Y es una función lineal de X" por ejemplo en (2.2.2).04
Geométricamente, la CUNa de re~sión es en este caso una línea recta. En
esta interpretación, una función de regresión tal como E(Y I XJ=PI -+ P2 xf no
es una función lineal, debido a que la variable X aparece elevada al cuadrado.

Linealidad en los parámetros


El segundo sentido de linealidad es que la esperanza condicional de y, E(Y 1..1¡),
es una función lineal de los parámetros, de las p';puede ser o no lineal en la va-
riable X.s En esta interpretación, E(YIXI) = h + pzxf esunmodeloderegre-
sión lineal, pero el modelo E(Y I XI) = PI + -Jpz Xl no lo es. [La última ecuación
es un ejemplo de un modelo de regresión no lineal (en los parámetros), que
no se considera en este texto].
De las dos interpretaciones de linealidad, la linealidad en los parámetros
constitúye el concepto relevante en la teoría que se presenta en las páginas
siguientes. Por tanto, de ahora en adelante, la expresión "regresión lineal"

4 Una funci6n Y = f(x) se dice que es lineal en X si X aparece con una potencia de 1 (se excluyen tér-
minos tales como Xl, .,¡x.entre otros) y no está ni multiplicada ni dividida por otra variable (por
J'jemplo, X . Z o X/Z, donde Z es otra variable).
5 Se dice que una función es lineal en los parámetros, digamos en Pl'si PI aparece con una potencia de
1 y no está multiplicado ni dividido por ningÚn otro parámetro (por ejemplo, P1P1, fJz!fJl' etc.).
34 MODELOS UNIECUACIONALES DE REGRESION

significard siempre una regresión lineal en los parámetros; las p' (es decir, los
parámetros, se elevan únicamente a la primera potencia), pudiendo o no ser
lineales en las variables explicativas, las X Esquemáticamente, en la Tabla 2.3
tenemos que E(Y IXJ = Pl + Pl X¡, es lineal tanto en la variable como en los
parámetros, constituyendo, por ende, unMRL, aligualqueE(YIX¡)= Pl +PlX~,
el cual es lineal en los parámetros a pesar de no ser lineal en la variable X

2.4 ESPECIFICACION ESTOCASTICA DE LA FRP .


Como se. deduce claramente de la Figura 2.1, a medida que el ingreso familiar
aumenta, los gastos de consumo familiar en promt(dio también aumentan. Pero
¿qué ocurre con los gastos de consumo de una familia en particular, en rela-
ción con su nivel de ingreso (fijo)? Es obvio después de observar la Tabla 2.1
y la Figura 2.1, que los gastos de consumo de una familia ho necesariamente
aumentan con el nivel de ingreso. Por ejemplo, en la Tabla 2.1 observamos
que para el nivel de ingreso de $100 existe una familia cuyos gastos de consu-
mo de $65 son menores que el gasto de consumo de dos familias cuyo ingre-
so semanal es de sólo $80. Sin embargo, nótese que los gastos de consumo
promedio de las familias con ingresos semanales de $100 son superiores que
los de familias con ingresos semanales de $80 ($77 vs. $65).
¿Qué puede decirse entonces acerca de la relación ~xistente entre los
gastos de consumo de una familia y un nivel de ingreso dado? Observando la
Figura 2.1 se aprecia que para un nivel de ingreso dado Xi, los gastos de con-
sumo de una familia se concentran alrededor del consumo promedio de todas
las familias para ese mismo Xi, esto es, alrededor de su esperanza condicio-
nal. Por consiguiente, podemos expresar la desviación de un Yi individual
alrededor de su valor esperado, de la siguiente manera:
U¡ = Y; - E(YIX¡)
o Y; = E(YIX¡) + U¡ (2.4.1)

en donde la desviación u, es una variable aleatoria no observable que toma


valores positivos o negátivos. Técnicamente, se conoce a u, como la perturba-
ción estocástica o término del error estocástico.
La ecuación (2.4.1) postula que los gastos de una familia, dado su nivel
de ingreso, son iguales a los gastos promedio de consumo de todas las familias
con ese nivel de ingreso, más una cantidad positiva o negativa que es aleatoria.
Más adelante examinaremos la naturaleza del término de perturbación Ui,
pero por el momento supondremos que se trata de una variable sustitutiva
de todas las variables omitidas que pueden afectar a Y, pero que (por una o
varias razones) no pudieron incluirse en el modelo de regresión.
Si se supone que E(YI Xi) es lineal en X" como en (2.2.2), la ecuación
(2.4.1) puede escribirse como:
Y¡ - B(YI.X,)
;k'" ,c"i"" ;~
+.,
(2.4.2)
MODELOS DE REGRESION CON DOS VARIABLES;'ALGUNAS IDEAS BASICAS 35

Esta última ecuación plantea el hecho de que los gastos de consumo condicio-
nales de una familiá, están relacionados linealmente con su ingreso, más un
término de perturbación; así, los gastos de consumo dado X = $80 (véase
Tabla 2.1) pueden expresarse como:

Y1 = 55 = fJ1 + fJ2(80) + "1


Y2 = 60 = fJ1 + fJl(80) + "1
Y3 = 65 = fJ1 + fJl(SO) + "3 (2.4.3)
Y... = 70 = fJ1 + fJl(80) + "4
Ys = 75 = fJ1 + fJ2(80) + "5

Ahora bien, si se toma el valor esperado de (2.4.1) a ambos lados de la ecua-


ción, s&obtiene
E(líIXJ = E[E(Y IX¡)] + E(u¡/XJ
= E(YIXJ + E(u¡/X¡) . (2.4.4)
donde se hizo uso del hecho dé que el valor esperado de una constante es
igual a la constante misma. Nótese que en (2.4.4) hemos tomado la expecta-
tiva condicional, en X
Puesto qutE(líIX¡)es equivalente a E(Y IX¡),la ecuaclón (2.4.4) implica
que:
E(u¡IX¡) =O (2.4.5)

En otras palabras, el supuesto de que la línea de regresión pasa por las medias
condicionales de Y (véase Figura 2.2) implica que los valores medios condi-
cionales de Uf (condicionales a las X dadas) son iguales a cero.
De 10 anterior se deduce que (2.2.2) y (2.4.,2) son formas equivalentes si
E(u¡1 Xi) = 0. 6 Sin embargo, la especificación estocástica (2.4.2) ofrece la ven-
taja de mostrar claramente que, además del ingr~so, existen otras variables
que afectan los gastos de consumo, de una familia, los cuales no se pueden
explicar en su totalidad por la(s) variable(s)incluida(s) en el modelo de regre-
sión.

2.5 LA SIGNIFICANCIA DEL TERMINO


DE 'PERTURBACION ESTOCASTICA
Como pudo apreciarse en la Sección 2.4, el término perturbación ui sustituye
todas aquellas variables que han sido excluidas del modelo pero que afectan
conjuntamente a Y. La pregunta obvia es ¿por qué no se introducen explici-

6 En efecto, en el m~todo de mínimos cuadrados a desarrollarse en el Capítulo 3, se supone explíci-


tamente que E(YIXJ, Véue la sección
, 3.l.
36 MODELOS UNIECUACIONALES DE REGRESION

, .tamente en el modelo todas estas variables? 0, dicho de otro modo, ¿por


qué no desarrollar un modelo de regresión múltiple con tantas variables como
sea posible? Son varias las respuestas a este interrogante, a saber:
1. La teoría, si existe alguna, que determina el 'Comportamiento de Y, suele
ser incompleta. Se puede estar seguro de que el ingreso semanal X afecta
los gastos de consumo Y, pero puede ocurrir que estemos inseguros o que
desconozcamos otras variables que afectan a Y. Por tanto, u{ puede utili-
zarse como un sustituto de todas las variables excluidas u omitidas del
modelo.
2. Aun en caso de que se conocieran algunas de las variables excluidas y que
se procediera entonces a plantear un modelo de regresión múltiple, en
lugar de una regresión simple, es posible que no existan cifras sobre dichas
variables. Es muy común en los análisis empíricos, que la info{J11ación
que idealmente quisiéramos tener no se encuentre a nuestra disposición.
Por ejemplo, en principio podemos introducir la riqueza de la familia
como variable explicativa adicional al ingreso, para describir el consumo
familiar. Desafortunadamente, a menudo ocurre que no existe informa-
ción sobre esta variable, lo cual nos obliga a excluirla del modelo a pesar
de su relevancia teórica para explicar los gastos de consumo.
3. Supongamos que además del ingreso Xl, los gastos de cqnsumo también
se ven afectados por el número de hijos de cada familia X2 , el sexo X 3, la
religión X4, la educación X5 y la región geográfica X 6. Es muy posible
que la influencia conjunta de todas o algunas de estas variables sea insig-
nificante o a lo mejor aleatoria o no sistemática, y que desde el punto de
vista práctico y por razones de costo no se justifique su introducción
explícita en el modelo. Con optimismo, esperamos que el efecto combi-
nado de todas estas variables se pueda tratar como una variable aleatoria u¡. 7
4. Aunque tengamos éxito y podamos incluir todas las variables en el mo-
delo, no deja de existir cierta aleatoriedad "intrínseca" en Y, que, a pesar
de todos IQS esfuerzos que se hagan no puede ser explicada. Las u pueden
reflejar, en este sentido, la mencionada aleatoriedad intrínseca en Y.
S. Aunque el modelo clásico de regresión (que se desarrollará en el capítulo
siguiente supone que las variables Y y X se miden en forma exacta, en la
práctica los datos pueden estar plagados de errores de medición. Consi·
dérese como ejemplo la muy conocida teoría de Milton Friedman acerca
de la función de consumo. 8 Según esta teoría el consumo permanente
O,p) está en función del ingreso permanente (XI'). Sin embargo, dado

7 Una dificultad adicional consiste en que las variables sexo, educación, religión, etc., pueden ser de
difícil cuantificación.
8 Milton Friedman, A Theory 01 the Consumption Function. Princeton University Press, Princeton,
N.J., 1957.
MODELOS DE REGRESION CON DOS VARIABLES: ALGUNAS IDEAS BASleAS 37

que la infonnación para estas dos variables no se observa directamente,.


en la práctica nos vemos obligados a utilizar variables aproximadas (o
proxis) tales como el consumo actual (Y) y el ingreso actual (X), las
cuales si se pueden observar. Puesto que las Y y las X observadas pueden
no ser iguales a yP y )(P, existe el problema de que se presenten errores
de medición. El ténnino de perturbación u también puede representar en
este caso los errores de medición. Como veremos en un capítulo posterior,
si existen errores de medición éstos pueden ocasionar serios problemas en
la estimación de los coeficientes de regresión, las p.
6. Finalmente, siguiendo el principio de la hoja de afeitar, de Occam,9 es
importante mantener el modelo de regresión lo más simple posible. Si se
puede explicar "sustancialmente" el comportamiento de Y (vía el R 2 o
coeficiente de detenninaciónque se considerará en el Capítulo 3) utilir
zando dos o tres variables y si, además, nuestra teoría no es lo suficiente-
mente sólida como para sugerir la inclusión de otras variábles explicáti-
vas, ¿para qué introducir variables adicionales? Dejemos, en lugar de ello,
que Ui represente las restantes variables. Sobra decir que no se deben
excluir las variables importantes, buscando mantener simple el modelo de
regresión.
Por todas estas razones, las perturbacionés estocásticas Ui asumen un
papel d~cisivo en el análisis de regresión, como se podrá apreciar a medida
que avancemos en nuestro análisis.

2.6 FUNCION DE REGRESIONMUESTRAL (FRM)


Hasta el momeI1to hemos limitado nuestros planteamientos a los valores po-
blacionales de Y correspondientes a los valores fijos de X. Lo hemos hecho
de manera deliberada, pues no se deseaba hacer consideraciones de muestreo.
(Obsérvese que las cifras de la· Tabla 2.1 representan la población y no la
muestra). Sin embargo, es hora de referirnos a los problemas de muestreo
porque en la práctica lo que está a nuestro alcance es una muestra de valores
de Y correspondientes a valores fijos de X. Por consiguiente, nuestra tarea es
la estimación de la FRP con base en infonnación muestral.
A modo de ilustración, supongamos por un momento que no conocemos
la población de la Tabla 2.1 y que todo lo que tenemos es una muestra de Y
seleccionada aleatoriamente para valores fijos de X (véase Tabla 2.4). Ahora,
a diferencia de la Tabla 2.1, se cuenta con un solo valor de Y para cada X
dado; cada Y (dado Xi) de la Tabla 2.4 ha sido escogido aleatoriamente entre
la población de Y de la Tabla 2.1· dado un valor para Xi'

9 "Las descripciones deben ser tan simples como sea posible, a menos que resulten inadecuadas". 11Ie
World o[ Mathematics. vol. 2,J. R. Newman (ed.), Simon & Schuster, Inc., New York, 1956, p. 1247,
o "Las cantidades no se deben multiplicar más allá de lo necesario",Donald F. Morrison,~pplied Li
near Statistical Methods, Prentice-Hall, Inc., Englewood Cliffs, N.J., 1983, p. 58.
38 MODELOS UNIECUACIONALES DE REGRESION

TABLA 2.4
Muestra aleatoria tomada de la población
de la rabia 2.1
y X

70 80
65 100
90 120
95 140
110 160
115 180
120 200
140 220
155 240
150 260

De este modo, podemos formularnos la siguiente pregunta: de la muestra


de la Tabla 2.4, ¿es posible predecir el gasto promedio de consumo familiar
y para la población como un todo para los X que se hayan escogida? En
otras palabras, ¿es posible estimar la FRP con base en los datos muestrales?
Cpmo el lector seguramente sospecha, no es factible estimar "con precisión"
la FRP, debido a las fluctuaciones muestrales. Para examinar este punto,
supongamos que se toma otra muestra de la población de la Tabla 2.1, tal
como se presenta en la Tabla 2.5.
Al hacer un diagrama con los datos de las Tablas 2.4 y 2.5, se obtiene la
Figura 2.3, en la cual se grafican dos líneas de regresión muestra que tratan
de "ajustar" lo mejor posible los puntos dispersos. FRM 1 y FRM 2 son las
resultantes de la primera y la segunda muestra, respectivamente. Sin embargo,
la pregunta es: ¿cuál de las dos líneas es la "verdadera" línea de regresión
poblacional? Absteniéndonos de considerar la Figura 2.1 que, a propósito,
representa la RP, no existe modo alguno de afirmar con certeza cuál de las

TABLA 2.5
Otra muestra aleatoria tomada de la
población de la Tabla 2.1
y X

55 80
88 100
90 120
80 140
118 160
120 180
145 200
135 220
145 240
175 260
MODELOS DE REGRESION CON DOS VARIABLES: ALGUNAS IDEAS BASICAS 39

200
_ Primera muestra (Tabla 2.4)
e Segunda muestra (Tabla 2.5) "
Rellfeaion basada en la .,
FRM,
segunda muestra ... "FRM,
... ISO

1 . .........\ '" .,'"\-


~;
,
i Rellfeaión basada en
la primera muestra.
i 100
8 •

j 1. I I I I I I I
~~8~O~~IO~O--~12~O--I~~~-I~~~~I~W~~2~OO~~2~20~~24~O~~2~60~--
Ingreso semanal, $.
I I I

FIGURAl.3
Líneas de regresión basadas en dos muestras diferentes.

dos líneas que aparecen en la Figura 2.3 representa la verdadera línea (o cur-
va) de regresión poblacional. Las líneas de la Figura 2.3 se conocen como las
líneas de regresión muestra/o Supuestamente, ambas representan la línea de
regresión poblacional, pero en razón de fluctuaciones muestrales, en el mejor
de los casos son una aproximación de la verdadera RP. En general, se obten-
drán N FRMS diferentes para N muestras diferentes, y no es factible que
estas FRMS sean iguales.
Ahorá, de manera análoga a la FRP en que se fundamenta la regresión
lineal poblacional, es posible desarrollar el concepto de función de regresión
muestral (FRM) para representar la línea de regresión muestral. La contra-
parte muestral de (2.2.2) puede escribirse como:

1'; = PI + pzX¡ (2.6.1)


donde 1\ se lee como "sombrero" o "gorro"
~ = estimador de E(Y I Xi)
PI = estimador de P1
pz = estimador de P2
Nótese que un estimador o estadístico (muestral), como también se co-
noce, es simplemente una regla, fórmula o método que nos dice cómo esti-
mar el parámetro poblacional a partir de la información proporcionada por
la muestra que se tiene a mano. El valor particular que se obtiene para el esti-
40 MODELOS UNIECUACIONALES DE REGRESION

mador después de efectuada una aplicación se conoce con el nombre de esti-


mativo. lO
Ahora que se ha expresado la FRP en dos fonnas equivalentes, (2.2.2)
y (2.4.2), podemos también expresar la E'RM (2.6.1) en su fonna estocástica
de la siguiente manera:
(2.6.2)
en donde, además de los símbolos definidos anterionnente, e, denota el tér-
. mino residual (muestral). Conceptualmente e, es análogo a~" pudiendo con-
siderarse como una estimación de u,. Se introduce en la FRM por las mismas
razones por las cuales u¡ se introdujo en la FRP.
Resumiendo, el objetivo fundamental del análisis de regresión consiste
en estimarla FRP .

(2.4.2)
con base en la FRM
(2.6.2)
en razón. de. que en la mayoría de los casos el análisis se debe llevar a cabo
con base en una muestra tomada de una población. Sin embargo, debido a
fluctuaciones entre una muestra y otra, nuestra estimación de la FRP con
base en la FRM es, en el mejor de los casos, una aproximación. Esta aproxi-
mación se representa en fonna de diagrama en la Figura 2.4.
Para X = X, tenemos una observación (muestral) Y = Y,. En términos
de la FRM, el Y , observado puede expresarse como:
(2.6.3)
yen términos de la FRP, como:
1'; = E( Y I XI) + U¡ (2.6.4)

Ahora. es obvio que en la Figura 2.4, ~ sobreestima el verdadero E(Y I XI) para
el X, dado, mientras que para cualquier X, a la izquierda del punto A la FRM
subestima la verdadera FRP. El lector podrá concluir fácilmente que la sobre
o subestimación del modelo poblacional es inevitable, precisamente por las
fluctuaciones de tipo muestral.
. Surge ahora la siguiente pregunta esencial: puesto que sabemos que la
FRM es sólo una aproximación a la FRP, ¿es posible diseñar una regla o mé-
todo que haga que dicha aproximación sea lo más "ajustada" posible? En
otros ténninos, cómo se debe oonstruir la FRM de tal fonna que P1 y P2 estén

10 De aquí en adelante el símbolo A sobre una variable denotará un estimador del valor poblacional en
referencia.
MODEI.OS DE REGRESION CON DOS VARIABlES: ALGUNAS IDEAS BASICAS 41

..
ti
Ii
..
a
o
~

I..
o
E (Y)XI )

O>
'O
!
i
o

~--------------~~----------------X
XI
ln¡rao semanal, $
· FlGURA2.4
Líneas de regresión poblacional y rnuestral..

tan "cerca" de los verdaderos PI y P2 corno sea posible, aunque no se conozcan


PIyP2'
· La respuesta a esta pregunta ocupará nuestra atención en el Capítulo 3;
· por el momento, contentémonos con saber que es posible desarrollar proce-
dimientos que nos dicen cómo construir la FRM a "imagen y semejanza" de
la FRP y, lo que es más fascinante, que esto puede efectuarse sin que en rea-
lidad tengamos que determinar la FRP.

2.7 RESUMEN Y CONCLUSIONES


En este capítulo hemos considerado algurias ideas fundamentales del análisis
de regresión. Comenzando con el concepto clave de la función de regresión
poblacional (FRP) , hemos desarrollado el concepto de la FRP lineal. La
mayor parte de este libro está destinada a estudiar los FRP de tipo lineal,
esto es, re3fesiones que son lineales en los parámetros desconocidos, sin im-
portar qu,é sean lineales en las variables. Introdujimos a continuación la idea
de la FRP ~stocástica, analizando en detalle la naturaleza y el papel del tér-
mino de perturbación estocástica u,. La FRP es, desde luego, una construc-
ción idealizada o teórica, puesto que en la práctica todo lo que se tiene es
una(s) muestra(s) de la población. Para este efecto, se requería considerar la
función de regresión muestral (FRM). Es la FRM la que nos permite estimar
la FRP. La estimación de esta última será el objeto del Capítulo 3.
42 MODELOS UNIECUACIONALES DE REGRESION

EJERCICIOS
2.1 La tabla que presentamos a continuación muestra las tasas de retomo anuales anti-
cipadas de cierta inversión y sus probabilidades correspondientes.
Tasa de retomo Probabilidad
X(%) PI
-20 0.10
-10 0.15
10 0.45
25 0.25
30 0.05

Utilizando las defmiciones consideradas en cualquier texto de estadística,


(a) Calcule la tasa de retomo esperada,E(X).
(b) Calcule la varianza (02) y la desviación estándar (o) de las tasas de retomo.
(e) Calcule el coeficiente de variación, V, defIDido como V = a/E(X). Nota: Fre-
cuentemente V se multiplica por 100 para expresarlo en términos de porcentaje.
2.2 La siguiente tabla presenta la distribución de probabilidad conjunta p(x, y) de las
variables X y Y.

1 1 3

1 0.03 0.06 0.06


1 0.02 0.04 0.04
3 0.09 0.18 0.18
4 0.06 0.12 0.12

Utilizando las defmiciones consideradas en cualquier texto de estadística, determine:


(a) Las distribuciones de probabilidad marginal o no condicional de X y Y.
(b) Las distribuciones de probabilidad condicional p(X I Y¡) y p(Y IXi)'
(e) Las esperanzas condicionales E(X I Y¡) y E(Y IXi)'
2.3 En la tabla que se presenta a continuación se muestra la distribución probabilística
conjunta p(x, y) para las variables aleatorias X y Y, donde X = tasa de retomo espe-
rada para el primer año (%) del proyecto A y Y = tasa de retomo esperada para el
primer afto del proyecto B.

x
y -10 O 10 30

10 0.27 0.08 0.16 0.00


50 0.00 0.04 0.10 0.35

(a) Calcule la tasa de retomo esperada para el proyecto A, E(X).


(b) Calcule la tasa de retomo esperada para el proyecto B, E(Y).
(e) ¿Son independientes las tasas de retomo de los dos proyectos? (Sugerencia: ¿Es
4 2
E(XY) = E(X)E(Y)?) Nota: E(XY) = L L Xi 1)p(Xi 1).
;=\ j=\
MODELOS DE REGRESION CON DOS VARIABLES: ALGUNAS IDEAS BASICAS 43

2.4 Para 50 parejas, las edades de la esposa X y del marido Y se agrupan en la siguiente
tabla, con intervalos de cu de 10 aftos para cada pareja y con las respectivas fre-
cuencias en el interior de la tabla. Los valores de X y Y aquí presentados correspon-
den a: los valores promedio de cada intervalo de clase.

~ lO 30 40 50 60 70 Total

~ 1 1
30 2 11 1 14
40 4 10 1 15
50 3 6 1 10
60 2 3 2 7
70 1 2 3
Total 3 15 14 9 5 4 SO

De este modo, para la cuen la cual la edad del marido está entre 35 y 45 aftos y
la edad de la esposa entre 25 y 35 aftos,los valores de Y y X se toman centrados en
40 y 30, respectivamente, siendo la frecuencia de 4.
(ti) Determine la media de cada arreglo, es decir, de cada Illa y cada columna.
(b) Con X en la abscisa y Yen la ordenada, dibuje el arreglo de medias (condicio-
nales) obtenidas en (ti). Si 10 desea, u~ el sí~bolo + para la columna de las
medias yOpara la ma de las medias.
(e) ¿Qué se puede decir de la relación entre X y Y?
(d) ¿Cae aproximadamente la media condicional de las Illas y las columnas en una
línea recta? Dibuje las líneas de regresión.
2.5 En la siguiente tabla se presenta la cotización (X) y el rendimiento al vencimiento
Y.(%) de SO bonos, donde la cotización se mide a tres niveles: X = l(Bbb).X = 2(Bb) I

Y X = 3(B). De acuerdo con la cotización de bonos suministrados por la fonna


Standar & Poor, Bbb, Bb, Y B son bonos de calidad intermedia,dondeBb tiene una
cotización ligeramente mayor que B mientras que Bbb tiene una cotización ligera-
mente superior que Bb.

~
1 1 3
1M BII B Total

8.5 13 5 O 18
11.5 2 14 2 i8
17.5 O 1 13 14
Total 15 20 15 SO

(a) Convierta la tabla anterior en una tabla que presente la distnoución probabilís-
tica conjunta,p(x, y), es decir, p(X = 1, Y = 8.5) = 13/50 = .26.
(b) Calcule P(YIX = l),P(YIX ... 2), Y P(YIX = 3).
(e) Calcule E(Y I X = 1), E(Y I X - 2), Y E(Y I X = 3).
(d) ¿Están de acuerdo las tasas de retomo calculadas en (e) con las expectativas
a priori sobre la relación entre la cotización de los bonos y, su rendinUento al
vencimiento?
44 MODELOS UNIECUACIONALES DE REGRESION

2.6. Examine los siguientes datos:

Economistas con doctorado: mediana de los saJarios (en miles de dólares por
afio) en tipos de empleos según los afios de experiencia profesional, registros
nacionales, 1966 en los Estados Unidos.
Años de experiencia Institutos de educación Gobierno Federal Empresas o industrias

(}-2 lO
2--4 11 12
5-9 12 13 15.6
1(}-14 14 15.2 18.0
15-19 15 17.6 20.0
2(}-24 16.3 18.4 24.0
25-29 18.0 20.0 25.0
3(}-34 17.4 20.6 25.5
35-39 17.5
40-44* 18.0
• La categoría verdadera es de 40 o más
Fuente N. Amold Tolles y Emanuel Melichar. Studies of th,e Structure of Economlts'
Salaries and Income," American Economic Review. vol 57 no. 5 suplemento, diciembre
1968, Tablas 111 B-13 y 14 p.113.

(a) ¿A qué conclusión general llega usted?


(b) Con los afios de experiencia en el eje X y la mediana del salario en el eje Y, di-
buje curvas de regresión que relacionen la mediana del salario,con los afias de
experiencia para cada uno de los tres tipos de empleo que se presentan en la
tabla.
2.7. Considere la siguiente tabla:
Cantidad de economistas según afios de experiencia y edad (solamente eco-
nomistas de tiempo completo empleados profesionalmente).
Años de experiencia

Edades
(años) ~l 1-4 s-9 1~14 1~19 ~14* Total

2(}-24 24 13 1 38
25-29 121 405 184 710
3(}-34 77 497 825 197 3 1599
35-39 18 125 535 780 194 1 1653
40-44 6 36 161 652 761 235 1851
45-49 1 15 48 183 433 751 1431
5(}-54 1 5 19 52 119 784 980
55-59 1 2 10 18 27 612 670 -
60-64 l' 3 6 8 382 400
65-69 2 4 206 214
7(}-74t 1 27 28
T~tal 250 1099 1787, 1890 1550 2998 9574
• 'La categoría yerdadera es de 20 o más.
t 'La categoría verdadera es de 70 o más.
Fuente: Adaptado de "The Structure 01 Ec()nomista' Employment and
Salaries, 1964", American Economlc Revlew, vol. SS, no. 4, diciembre de
1965, Tabla VII, p. 40.
MODELOS DE REGRESION CON DOS VARIABLES: ALGUNAS IDEAS BASICAS 45

La tabla muestra las frecuencias absolutas de las variables edad y aftos de experien-
cia. Haciendo uso de frecuencias relativas (frecuencias absolutas- dividid:lS por el
número total) como una medida de las probabilidades:
(a) Obtenga la distribución probabilística conjunta de la edad y los aftos de expe-
riencia.
(b) Obtenga las distribuciones probabilísticas condicionales de la edad para diferen-
tes aftos de~experiencia.
(e) Obtenga lá. distribución probabilística condicional de los afios de experiencia
para varias edades. ,
(el) Haciendo uso de los puntos medios de los intervalos de la edad y de los aftos de
experiencia, obtenga las medias condicionales, de las distribuciones derivadas
en(b) y (e). .
(e) Dibuje los diagramas de dispersión apropiados que muestren las diferentes
medias condicionales.
(/) Si se conectan las medias condicionales que se muestran en (e) ¿Qué se obtiene?
(g) ¿Qué puede usted decir acerca de la relación existente entre los aftos de "xpe-
riencia y la edad?

2.8. Determine cuáles de los siguientes modelos son lineales en los parámetros, en las
variables o en ambos. ¿Cuáles de estos modelos son modelos de regresión lineal?

Modelo Descripción

(a) Y¡ = PI + P2(;) + ul Recíproco

(b) Y¡ = PI + P2 In X/ + u¡ Semilogarítmico

(e) In Y¡ = PI + P2XI + u¡ SemilogarítmiCO.inverso

(d) In Y¡ = In PI + P2 In XI + u¡ Logarítmico o doble logarítmico

(e) In Y¡ = PI - P2(;) + u 1 Semilogarítmico inverso en el recíproco

Nota: In = logaritmo natural (es decir, logaritmo en base e); Uf es el término de per-
turbación estocástica. Estudiaremos estos modelos en el Capítulo 6.

2.9. ¿Corresponden los siguientes a modelos de regresión lineal? ¿Por qué razón?

(e) Y¡ = PI + P~XI + U/.

(e) In Y¡ = PI + p~(;) + U1
46 MODELOS UNIECUACIONALES DE REGRESION

2.10. Si en (d) del ejercicio anterior, P2 = 0.8, ¿se convertida el modelo en un modelo de
regresión lineal? ¿Por qué?

2.11. Considere los siguientes modelos no estocásticos. ¿Son estos modelos lineales en los
parámetros? Si no, ¿es posible, utilizando operaciones algebraicas adecuadas, con-
vertirlos en modelos lineales?
1
(a) Y¡ = Pi + P2 X ¡
X.
(b) Y¡ = Pi + P2 X ¡
1
(e) y=--~~
I +
1 e-fJ¡-fJ,X,
CAPITULO 3
EL MODELO DE REGRESION
CON DOS VARIABLES:
EL PROBLEMA DE LA
ESTlMACION

Como se vio en el Capítulo 2, nuestra primera tarea consiste en estimar la


función de regresión poblacional (FRP) con base en la función de regresión
muestral (FRM}, de la manera más precisa posible. Existen en la actualidad
varios métodos para construir la FRM, pero en lo concerniente al análisis de
regresión el más usado es el. método de mínimos cuadrados ordinarios
(MCO).! En el presente capítulo se analiza este método en términos del mo-
'delo de regresión en dos variables.

3.1 EL METODO DE MINIMOS CUADRADOS ORDINARIOS


El método de mínimos cuadrados ordinarios se ha atribuido al matemático
alemán Carl Friedrich Gauss. Bajo ciertos supuestos (analizados en la seccion
3.2) el método de MCO ofrece algunas propiedades estadísticas muy atracti-
vas, por lo cual se ha constituido en uno de los más eficaces y populares
métodos de análisis de regresión. Para comprender este método procedere-
mos a explicar'primero el principio de los mínimos cuadrados.

1 Otro método, conocido como el método de m4xima lIerosimüitud, se explicará brevemente en el


Capítulo 4.

47
48 MODELOS UNIECUACIONALES DE REGRESION

L -____J -_ _- J _ _ _ _ _ _~--~--~~---------x

FIGURA 3.1
El criterio de mínimos cuadrados.

El prinCipio de los mínimos cuadrados


Recordando la FRP en dos variables,
1'; = /31 + /32 X ¡ + U¡ (2.4.2)
Sin embargo, como mencionamos· en el Capítulo 2, la FRP no se puede ob-
servar directameI).te, la estimamos a partir de la FRM:
1'; = P1 + P2 X¡ + e¡ (2.6.2)
= ~ +e¡ (2.6.3)
donde ~ es el valor estimado (media condicional) de 1';
Pero, ¿cómo se puede determinar la FRM misma? Para saberlo, proce-
damos de la siguiente forma. Primero expresemos (2.6.3) como:
e¡ = 1'; - ~
(3.1.1)
lo cual muestra que los e¡ (los residuos) son simplemente las diferencias entre
los valores reales y los estimados de Y.
Ahora bien, dados N pare') de observaciones de Y y X estamos interesa-
dos en determinar la FRM de tal forma que esté tan cerca como sea posible
del Y real. Con este fin podemos adoptar el siguiente criterio: elíjase la FRM,
de tal manera que la suma de los residuos ¿ e¡ = ¿ (1'; - ~) resulte ser tan pe-
queña como sea posible. Aunque intuitivamente este criterio parece atractivo,
no es un buen criterio de elección, como se desprende del diagrama hipotéti-
co que se muestra en la Figura 3.1.
Si adoptamos el criterio de minimizar ¿ e¡, observamos en la Figura 3.1
cómo los residuos ez y e3' así como los residuos el Y e4 reciben la .misma
/"
EL MODELO DEREGRESION CON DOS VARIABLES: EL PROBLEMA DE LA ESTIMACION 49

ponderación en la suma (el + e2 + ea + e4) a pesar de que los dos primeros


están mucho más cerca de la FRM que los dos últimos. En otras palabras, a
todos los residuos se les da la misma importancia o peso sin importar qué tan
cerca o qué tan dispersas estén las observaciones individuales de la FRM. Co-
mo consecuencia, es bastante factible que· la suma algebraica de los e, sea
muy pequeña (aun cero), a pesar de que los e, estén muy dispersos alrededor
de la FRM. Para verificar lo anterior, supongamos que el' e2' ea ye4 asumen
valores de 10, -2, +2, Y -10 respectivamente; la suma algebraica de estos resi-
duos es cero, a pesar de que e l y e4est~n más dispersos alrededor de la
FRM que e2 Y ea. Este problema puede evitarse adoptando el criterio de los
mínimos cuadrados según el cual la FRM puede plantearse en forma tal q~e

(3.1.2)

resulte ser tan pequeña como sea posible y en donde el representan los resi-
duos al cuadrado. Al elevar al cuadrado los residuos e" este método les asigna
un mayor peso a los residuos el ye4 en la Figura 3.1 que a los residuos e2 Y
ea. Como se anotó previamente, bajo el criterio de minimizar ¿ e¡, la suma
puede ser pequeña a pesar de que los e, estén bastante dispersos alrededor de
la FRM. La anterior situación no puede presentarse con el método de los mí-
nimos cuadrados debido a que cuanto más grandes sean los e, (en valores ab-
solutos), mayor será ¿ el. Una justificación adicional para el método de mí-
nunos cuadrados es el hecho de que los estimadores obtenidos mediante este
método tienen propiedades muy deseables desde el punto de vista estadístico,
como veremos más adelante.
Es obvio a partir de (3.1.2) que

(3.1.3)

TABLA3.l
Determinación experimental de la FRM
Y¡ XI fu eu r.1 f ZI eZI et
(1) (2) (3) (4) (S) (6) (7) .; (8)

4 1 2.929 1.071 1.147 4 O O


5 4 7.000 -2.000 4.000 7 -2 4
7 S 8.357 -1.357 1.841 8 -1 1
12 6 9.714 2.286 5.226 9 3 9

Suma: 28 16 0.0 12.214 O 14

Notas:fli = 1.572 + 1.357X,(V.gr., P. = 1.572 Y Jl = 1.357)


f l , = 3.0 + 1.0X,(V.gr., P. = 3 Y Pl = 1.0)
e ll = (1'; - fli)
el; - (1'; - flJ
50 MODELOS UNIECUACIONALES DE REGRESION

10 cual implica que la suma de los residuos al cuadrado es una función de los
estimadores PI y $2: para un conjunto dado de datos, con diferentes valores
para PI y P2. se obtendrán diferentes valores para e y por tanto, valores distin-
tos para ¿ ef. Para apreciar claramente lo anterior, considere los datos hipo-
téticos sobre Y y X dados en las primeras dos columnas de la Tabla 3.1. Ahora
llevamos a cabo dos experimentos. En el primero, sea PI = 1.572 Y P2 = 1.357
(por ahora no nos preocupemos sobre cómo obtuvimos estos valores; diga-
mós que se adivinaron). Utilizando estos valores de Py los valores de X dados
en la columna (2) de la Tabla 3.1, podemos calcular fácilmente el Y¡ estima-
do que está dado en la columna (3) de la tabla y denotado como Y1i (el sub-
índice·l se utiliza para indicar el primer experimento). Pasemos ahora al se-
gundo experimento, pero esta vez utilizando los valores de PI = 3· Y P2 = 1.
Los valores estimados de Y i para este experimento se presentan en la colum-
na (6) de la Tabla 3.1, mediante el ¡símbolo Y2i • Puesto que los valores de
P son diferentes en los dos experimentos, obtenemos valores asimismo dife-
rentes para los residuos estimados, como se ilustra en la tabla; los el ¡ corres-
ponden a los residuos del primer experimento, mientras que los e2 ¡ corres-
ponden a los del segundo. En las columnas (5) y (8) se presentan, de otro
lado, los cuadrados de estos residuos. Obviamente, como es de esperarse de
(3.1.3), estas sumas residuales de cuadrados son diferentes puesto que se de-
rivan de conjuntos de valores diferentes de p.
Entonces, ¡.qué conjuntos de valores de P debemos escoger? Debido a
que los valores P del primer experimento arrojan una ¿ er(= 12.214) infe-
rior a la que se obtiene para los valores P del segundo experimento (= 14),
podríamos concluir entonces que las ¡J del primer experimento son los "me-
jores" valores. ¿Pero cómo podemos saberlo? Si contásemos con una cantidad
infinita de tiempo y de paciencia, habríamos llevado a cabo muchos experi-
mentos similares adicionales escogiendo cada vez diferentes conjuntos de
er y
P, comparando. la ¿ resultante luego escogiendo el conjunto de valores
p que arrojara el mínimo valor posible para L er, suponiendo, como es lógi-
co, que hemos tenido en cuenta todos los valores posibles de PI y P2' Pero
como el tiempo y la paciencia siempre son escasos, necesitamos encontrar
una simplificación para este proceso de prueba y error. Afortunadamente, el
método de mínimos cuadrados nos ofrece tal simplificación. El principio
o método de mínimos cuadrados seleccion.a el ¡JI, y el P2 de tal forma que
para un conjunto muestral de información¿ efes la más pequefia posible. En
otras palabras, para una muestra dada, el método de mínimos cuadrados nos
arroja estimativos únicos de PI y P2 que producen el valor más pequefio posi-
ble de ¿ er . Lo anterior se obtiene mediante un ejercicio sencillo de cálculo
diferencial. El proceso de diferenciación produce las siguientes ecuaciones
para la estimación de Pi y {Jz., como se ilustra en el Apéndice 3A, Sección
3A.l;

(3.1.4)

(3.1.5)
EL MODELO DE REGRESION CON DÓS VARIABLES: EL PROBLEMA DE LA ESTIMACION 51

en donde N es el tamaño de la muestra. Estas ecuaciones simultáneas se co-


nocen como ecuacionej normales. Al resolverlas simultáneamente se obtiene

(3.1.6)

en donde X y Y son las medias muestrales de X y Y respectivamente, y en


donde definimos Xi = (Xi - X), y Yi = (Y¡ - Y¡) . De aquí en adelante adop-
tamos la convención de utilizar letras minúsculas para representar desviacio-
nes con respecto a los valores medios.
p = 1: Xl L Y¡ - L Xi LX, y,
1 NL Xl - (L X¡f
= r -P2Z (3.1.7)

El último paso en (3.1.7) puede obtenerse directamente a partir de (3.1.4)


por simple manipulación algebraica.
A esta altura del análisis puede decirse que al utilizar identidades alge-
braicas simples, la fónnula (3.1.6) para estimar P2 puede expresarse en fonna
alterna como:

(3.1.8)2

lo cual reduce el exceso de cálculos, en caso de que se utilizara utilice una


calculadora manual para resolver el problema de regresión con un conjunto
pequefio de datos.

lNota J: L xf = L (X, - X)l ~ L x: - x,


2 L X,X + 1:Xz = Lxf - 2X E + L Xl, puesto queX
es una constante. Además, apréciese que LX,. NX y 1: 1z - NXZ' puesto que X es una cons-
1: 1:
tante. Finalmente, obtenemos xf = Xf - N X Z . . •
Nota 2: 1: 1: 1:
X,Y, = L x,(Y, - 1) ... x, y, - f L x, "" x, y, - fr (X, - X) = L x, y" puesto
que y es una constante y la suma de las desviaciones de una variable con respecto a su valor promedio
(es decir, L (X, - X» 1: "
es siempre cero. De la mjsma manera, r
= (Y, - 1) .. o.
52 MODELOS UNIECUACIONALES DE REGRESION

FIGURA 3.2,
Diagrama que muestra cómo la
línea de regresión muestral pasa a
través de los valores de las medias
~------------~~---------------x
X mucstraJcs Y y X.

Los estimadores previamente obtenidos se conocen como estimadores


de mz'nimos cuadrados, por derivarse del principio de mínimos cuadrados.
Obsérvense a continuación las características de estos estimadores.
1. Están expresados únicamente en términos de cantidades observables
(v,gr., la muestra); es decir, Xi y Xi'
2. Son estimadores puntuales; es decir, dada la muestra, cada estimador
proporcionará un solo (punto) valor del parámetro poblacional relevante.
(En el Capítulo 5 consideraremos los llamados .estimadores de intervalos,
que porcionan un rango de valores posibles para el parámetro poblacio-
nal desconocido).
Una vez obtenidos los estimadores de mínimos cuadrados, a partir de
los datos que se tengan a mano es muy fácil ajustar la línea de regresión
muestral (Figura 3.1), la cual posee las siguientes propiedades:
1. Pasa a través de las medias muestrales de X y Y. Esto es obvio a partir de
la ecuación (3.1.7), puesto que ésta puede escribirse comoY = Pi + P2X,
como se observa en la Figura 3,2.
2. El valor medio del Y estimado (= f¡) es igual al valor medio del Y obser-
vado para
f; = Pi + P2 X ¡

= (Y - P2X) + P2X¡
= Y + P2(X¡ - X) (3.1.9)
Sumando a ambos lados de la última igualdad sobre los valores muestra- .
les y dividiendo por el tamÍlfto de la muestra N, se obtiene:
EL MODELO DE REGRESION CON DOS VARIABLES: EL PROBLEMA DE LA ESTIMACION 53

donde hemos hecho uso de L (XI - X) = O. (¿porqué?)


3. El valor medio de los residuos el es cero. A partir del Apéndice 3A,
Sección 3 A.l , la primera ecuación es

-2 L Pi - P1 - P2 XJ = O
Pero dado que el = lí - P1 - P2XI, la anterior ecuación
se reduce a
-2 L el = O teniéndose que e = 0.4
Como resultado de. la anterior propiedad, la regresión muestral
(2.6.2)
puede expresarse alternativamente en forma de desviación, donde tanto
X como Y se expresan en términos de desviaciones de sus valores medios.
Para apreciar lo anterior, tómese la sumatoria a ambos lados de (2.6.2)
para obtener
L lí = NP1 + P2 L X¡ + L e¡ (3.1.14)
=NP1+P2LX¡ puesto que Le¡=O' = (3.1.4)

Dividiendo la ecuación (3.1.11) por N, se obtiene


y = P1 + P2 X (3.1.12)
=(3.1.7)
restando (3.1.12) de (2.6.2), se obtiene

(3.1.13)

donde y, y Xi, representan, de acuerdo con nuestra convención, desvia-


ciones con relación a sus respectivos valores medios (muestrales).
La ecuación (3.1.13) se conoce como la forma de desviación para
uno de los estimadores de MCO. Nótese que el térm.ino de intersección
P1 ha desaparecido, aunque puede estimarse utilizando (3.1.7), debido a
que la línea de regresión muestral pasa siempre por las medidas muestra-
les de X y Y. Una de las ventajas de la desviación de las ecuaciones en

3 Se debe seÍialar que este resultado es correcto únicamente cuando el modelo de regresión incluye el
término de intersección PI Corito se demuestra en el Apéndice 6A, Sección 6A.l este resultado no se
da necesariamente cuando Pino forma parte del modelo.
4Este resultado también requiere que la intersección PI esté presente en el modelo. (VétUe Apéndice
6A, Sección 6A.l).
54 MODELOS UNIECUACIONALES DE REGRESION

fonna de desviaciones es la simplificación en los cálculos aritméticos.


cuando se trabaja con una calculadora de escritorio, ventaja que puede
ser insignificante en esta era de los computadores.
Observemos de paso que la FRP en fonna de desviaciones puede
expresarse de la siguiente manera:

(3.1.14)
mientras gue en las unidades originales 'de medida, dicha expresión era
}>¡ = Pl + P2 X i, como se muestra en (2.6.1).
4. Los residuos e, no están correlacionados con el valor estimado de Y" 10
cual se puede verificar de la siguiente manera, utilizando la fonna de
desviación:
L Yiei = P2 L Xiei
= P2 L Xl..Yi - P2 Xi)
= P2 L X¡ y¡ - P~ L xf
= P~ L xf - P~ r. xf
=0 (3.1~15)
donde nos hemos fundamentado en el hecho de que P2 = r. x¡y¡/r. xf.
S. Los residuos e, no están correlacionados con X" hecho que implica que
L e¡X¡ = O 10 cual se desprende de la ecuación (2) en el Apéndice 3A,
Sección 3 A.l. .

3.2 EL MODELO DE REGRESION LINEAL CLASICO:


SUPUESTOS FUNDAMENTALES DEL METOno
DE MINIMOS CUADRADOS ORDINARIOS
l
Si nuestro objetivo consiste en estimar Pl y P2 únicamente, el método de
MCO ya analizado, en la sección anterior sería sufi~iente. Pero recordemos
del Capítulo 2 que en el análisis de regresión nuestro objetivo no es solamen-
te obtener P1 y $2 sino también establecer inferencias acerca de los verdade-
ros valores de P1 y P2' Por ejemplo, sería interesante conocer qué tan cerca
están P1 y P2 de los parámetros poblacionales, así como qué tan ajustado
está Y¡ al verdadero E(Y IXi)' Con ese objetivo en mente, no sólo debemos
especificar la fonna funcional del modelo, como se hizo en (2.4.2), sino que
debemos también plantear ciertos supuestos sobre la manera como se generan
X, Y u,. Para entender las razones de 10 anterior, obsérvese la FRP: Y¡ = P1 + P2
X¡ + Uf. Esto muestra que Y , depende tanto de X, como de u.J.' Por tanto,
mientras no se especifique la forma como se generan X, y u" no se puede
hacer ninguna inferencia estadística sobre Y, ni sobre P1 y P2" como vere-
mos posterionnente. En consecuencia, los supuestos sobre la variable X, y
el término de perturbación son fundamentales para llevar a cabo una inter-
pretación válida de las estimaciones de la regresión.
EL MODELO DE REGRESION CON DOS VARIABLES: EL PROBLEMA DE LA ESTIMACION 55

El modelo de regresión, con9cido también como el modelo de Gauss,


o modelo clásico, estándar o lineal general, en el cual se basa la mayor parte
de la teoría econométrica, plantea los siguientes supuestos. 5
Supuesto 1. (El valor medio o promedio de Uf es igual a cero)

(3.2.1)

El supuesto plantea que el valor promedio de Uf, dado un valor de Xf,


es igual a cero. Geométricamente, este supuesto puede representarse a través
de la Figura 3.3, donde se muestran algunos pocos valores de la variable X y
las correspondientes poblaciones de Y asociadas con cada uno de ellos. Como
se presenta allí, cada población de Y correspondiente a un X dado, está dis-·
tribuida alrededor de su valor medio (que se representa mediante los puntos
rodeados por un círculo sobre la FRP), con algunos valores de Y por encima
y otros por debajo de la media. Las distancias de los puntos localizados' por
encima y por debajo de los valores medios no son otra cdsa que los Uf.
La ecuación (3.2.1) sólo requiere que el valor medio o promedio de esas des-
viaciones para un X cualquiera sea igual a cero. 6
Es fácil comprender este supuesto, teniendo presente el análisis hecho
en la Sección 2.4 (véase -la ecuación 2.4.5). Todo lo que se plantea es que
aquellos factores que no están incluidos explícitamente en el modelo, incor-
porados, por tanto, en Uf, no afectan sistemáticamente el valor promedio de
Y; dicho de otro modo, los valores positivos de Uf se cancelan con los valores
negativos de tal manera que su efecto promedio sobre Y es cero. 7
Nó·tese que el supuesto E(ud Xi) = O implica que E(Y¡ I Xi) = PI + P2 Xi'
(¿Por qué?) Por tanto, los dos supuestos son equivalentes.
Supuesto 2. (No eXiste autocorrelación entre las u)

COY (u¡, u) = E[u¡ - E(u¡)J[uJ - E(u)J


por el supuesto
i#j (3.2.2)

donde i Y j son dos observaciones diferentes y coy significa covarianza.


Dicho de otro modo, (3.2.2) postula que las perturbaciones Uf,y U, no
están correlacionadas. Técnicamente, este supuesto se conoce como el su-

-5Es clásico en el sentido de que fue desarrollado por primera vez por Gauss en 1821 y desde entónces
ha seivido como norma o patron contra el cual se pueden comparar los modelos de regresión que no
satisfacen los supuestos gausianos.
6 Para fmes ilustrativos, estamos suponiendo que las u están distribuidas simétricamente como se mues·
tra en la Figura 3.3;. sin-embargo, en el Capítulo 4 se supondrá además que las,u tienen una distribución
normal.
7 Para una explicaci6n más técnica de por qué el supuesto 1 es necesario, vétzse E. Malinvaud, Statistical
Methods of Econometrics, Rand McNally ti Co., Chicago, 1966, p. 75. Véase también el ejercicio 3.3.
56 MODELOS UNIECUACIONALES DE REGRESION

y
o Media

L-----~------~------~------~------------X
Xl
FIGURA 3.3
Distribución condicionada de las perturbaciones Ui.

puesto de co"elación no serial o de no autoco"elactón. Lo anterior significa


que, dado un valor de X" las desviaciones de dos valores cualesquiera de Y de
su media no presentan patrones como los que se muestran en la Figura 3.4a
y b. En la Figura 3.4a, vemos que los u están co"elacionados positivamente:
un u positivo .está seguido p~r un u positivo, o un u ~egativo está seguido
por un u negativo. En la Figura, 3.4b, los u están co"elacionados negativa-
mente, un u positivo está seguido por un u negativo y viceversa.
Si las perturbaciones (désviaciones) siguen patrones de tipo sistemático,
tales como los que se muestran en las Figuras 3.4a y b, existe autócorrelación
o correlación serial. La Figura 3.4c no muestra un patrón sistemático para los
u, 10 cual indica, por tanto, cero correlación.
A propósito, obsérvese que el supuesto (3.2.2) implica que la cov (Yj, lJ)
= 0, i =Fj. (¿Por qué?)
Las consecuencias de este supuesto se explicarán detalladamente en el
Capítulo 10; sin embargo, por el momento podemos explicar el supuesto de
la siguiente manera: Supongamos que en la FRP: 1'; = /31 + f32X, + U, U, U'-1
están positivamente correlacionadas. Por tanto, Y t depende no sólo de
X t sino también de U,-1 puesto que este valor, en cierto 'modo, determina
el de u t . Puf el momento, cuando invocamos el supuesto 2 decidimos estu-
diar el efecto sistemático, si éste existe, de X t sobre Y t sin tener en cuenta
otro tipo de influencias sobre Y que tengan lugar como resultado de las posi-
bles intercorrelaciones entre las u. Pero, como hemos dicho, en el Capítulo
lOse intentará ánallzar la manera como las intercorrelaciones entre las per-
turbaciones se pueden incluir en el análisis y cuáles son las consecuencias de
su inclusión en nuestros modelos.
EL MODELO DE REGRESION CON DOS VARIABLES: EL PROBLEMA DE LA ESTIMACION 57.

+U¡ +U¡

• •••
e.e:•• •••
•••••
•••• •
• ..:.
•• •
• •• •
.: .
-u¡-----.:-!e-!'-----.-:'+u¡
•••
- U ¡ - - - - - - - l ' n - . - - - - - +u¡
•• ••• •
••••
. -.
• •
••• ••
.•..••
• ••

:.
• :. e .• e••


-U¡

(a) (b)

+U¡

••••
.:.....- ...
:-.
••
-U¡ - - -___
.
.-.....
.~.r!"i.,;:J.0.:;."'.----+ U¡
.. .:.

-U¡

(e)

FIGURA 3.4
Patrones de correlación entre las perturbaciones (a) correlación serial positiva, (b) correlación serial
negativa, (e) cero correlación.

Supuesto 3. (Homocedasticidad o igual varianza para Ui)


var (ud X J = E[u¡ - E(UJ]2
= E(ur) por el supuesto
(3.2.3)
donde var significa varianza.
La ecuación (3.2.3) plantea que la varianza de Uf para cada Xi (es de-
cir, la varianza condicional de u¡) es un número positivo constante, igual a
(12. Técnicamente, (3.2.3) representa el supuesto de homocedasticidad o
igual (horno) dipersión (cedasticidad) o igual varianza. Dicho de otra manera,
(3.2.3) implica que las poblaciones de Y que corresponden a los diferentes
valores de X tienen la misma varianza. Esta situación se ilustra en la Figura
3.5.
58 MODELOS UNIECUACIONALES DE REGRESION

f(u)

FIGURA3.!
X Homocedasticidad.

En contraste con lo anterior, obsérvese la Figura 3.6 en donde la va-


rianza condicional de la población Y aumenta a medida que X aumenta. Esta
situación se conoce con el nombre de heterocedasticidad o dispersión o desi-
gual varianza. Simbólicamente, en esta situación (3.2.3) puede escribrrse
como
var (ud XJ = af (3.2.4)
Apréciese el subíndice i que acompaña a a2 el cual indica que la varianza de
la poclación Y ya no es constante.
Con el objeto de aclarar las dos situaciones, tomemos como ejemplo el
caso en que Y representa los gastos de consumo semanales y X el ingreso se-
manal. Las Figuras 3.5 y 3.6 muestran que a medida que el ingreso aumenta,
los gastos de consumo promedio también aumentan; sin embargo, mientras
que en la Figura 3.5 la varianza del consumo permanece igual para todos los
niveles de ingreso, en la Figura 3.6 dicha varianza aumenta con el ingreso.
Las llamadas familias ricas consumen, en promedio, más que las pobres; de la
misma manera, las primeras tienen mayor variabilidad en sus patrones de
consumo que las segundas. .
[(11)
::s-
"
."
01
.!:!
,~
::=
~ y
'2
'"
."
·01

1
FIGURA 3.6
Heterocedasticidad.
x
EL MODELO DE REGRESION CON DOS VARIABLES: El PROBLEMA DE LA ESTIMACION 59

Para comprender el razonamiento utilizado en este supuesto, analícese


la Figura 3.6 en la cual se muestra que var (u I XI) < var (u I X 2)' ... , < var
(u I XI)' Por tanto, existe una mayor probabilidad de que las observaciones de
y que provengan 'de una población donde X = XI estén más cerca de la FRP
que aquellas observaciones provenientes de las poblaciones donde X = X 2' X
= X 3' etc. Resumiendo, no todos los valores de Y para los diferentes X serán
igualmente confiables, donde la con fiabilidad se puede evaluar según qué
tan cerca o qué tan lejos estén distribuidos los valores de Y con respecto a
sus medias; es decir, los puntos sobre la FRP. Si en efecto éste es el caso, ¿no
sería preferible entonces obtener muestras de las poblaciones de Y que están
más cerca de sus medias que de aquellas que están muy dispersas de las mis-
mas? Al hacerlo, sin embargo, restringiríamos la variación que se obtiene en
los valores de las X.
Al invocar el supuesto 3 se está planteando que todos los valores de Y
que corresponden a las X son igualmente importantes. En el Capítulo 9 se
podrá observar qué ocurre si este no es el caso, momento en el cual se dice
que existe heterocedasticidad.
Obsérvese ahora que el supuesto 3 implica que var (lj IXi) = (12 de lo
cual a su vez se infiere que la varianza condiciona}'de Y también es homoce-
dástica. (¿Por qué?)
Supuesto 4. (Cero covarianz.a entre Ui YXi)
Formahhente.
COY (UI' X J = E[(u, - E(u¡)][(X, - E(XI )]
= E[u¡{X¡ - E(X J], puesto que E(uJ = O
= E(u,XJ -E(X,)E(u,), ya que E(X¡) es una constante
= E(u¡X,), puesto que E(u,) = O

= 0, de acuerdo con el supuesto (3.2.4)

El supuesto 4 afirma que la perturbación u y la variable explicativa X


no están correlacionadas. La justificación de este supuesto es la siguiente:
cuando expresamos la FRP como .en (2.4.2), supusimos que X y u (que re-
presenta la influencia de todas las variables omitidas) tienen innuencia sepa-
rada (y aditiva) sobre Y. Pero si X y u están correlacionadas, no es posible
establecer su efecto individual sobre Y. De este modo, si X y u están positi-
vamente correlacionadas, X aumenta cuando u aumenta y disminuye cuando
u disminuye. En forma similar, si X y u están negativamente correlacionadas,
X aumenta cuando u disminuye o X disminuye cuando u aumenta. En cual-
quiera de los dos casos es difícil aislar la influencia individual de X y de u
sobre Y.
El supuesto 4 se cumple automáticamente si la variable X no es aleato-
ria o estocástica y si el supuesto l se mantiene (en cuyo caso, cov
[XI - E(XJ]E[ul - E{uJ] = O.¿Por qué?) Ahora bien, dado que hemos supues;-
to que las variables X no solamente son no estocásticas, sino que se han asu-'
60 MODéLOS UNIECUACIONALES DE REGRESION

mido también valores fijos para ellas en muestras repetidas,8 el supuesto 4 no


es realmente tan crítico para nuestro análisis; se ha mencionado aquí con el
solo propósito de hacer énfasis en el hecho de que, aún siendo las X aleato-
rias o estocásticas, la teoría de regresión continúa siendo válida, dado que las
X son independientes o por 10 menos, no están correlacionadas con las per-
turbaciones U¡. 9 (En la Parte II, se examinan las consecuencias de liberar el
supuesto 4).
Debemos resaltar un supuesto auxiliar sobre Xi' Aunque las X perma-
necen fijas a 10 largo de muestreos repetidos, la totalidad de los valores de X
no deben permanecer iguales. Teniendo lo anterior en cuenta, para el ejem
plo consumo-ingresos los valores de X eran fijos, $80, $100, ... , $260 (véase
la Tabla 2.1) y, por tanto, no eran iguales. ¿Por qué se requiere ese supuesto
auxiliar? La respuesta es evidente partiendo de (3.1.6) puesto que si todos
los valores de X fuesen idénticos, Xi = X (¿por qué?) y el denominador de
la ecuación sería cero, haciendo imposible, por tanto, estimar /32 y /31' En
resumen, para que se puedan estimar los parámetros debe existir cierta varia-
ción en las X, hecho que implica que la expresión L (X - X)2 que aparece
en (3.1.6) no debe ser igual a cero. 10 En consecuencia, el lector debe tener
siempre presente que las variaciones tanto en X como en Y son claves en el
análisis de regresión.
Supuesto 5. El modelo de regresión está correctamente especificado. (No existen
sesgos ni errores de especificación)

De todos los supuestos, este es el más riguroso y quizás el menos atractivo.


En el Capítulo 11 se explicarán con más detalle las implicaciones del supues-
to; por ahora 10 explicaremos de la manera más informal posible .
. Como se señaló en la introducción, una investigación econométrica parte
de la especificación del modelo econométrico en el que se basa el fenómeno
que se está analizando. Algunas preguntas importantes que surgen al especifi-
car un modelo son: (1) ¿Cuáles variables se deben incluir en el modelo? (2)
¿Cuál es la forma funcional del mismo, lineal en las variables o en los pará-
metros, o en ambos? (3) ¿Cuáles son los supuestos probabilísticos que se ha-
cen sobre los Y¡, los X¡ y los Ui que se incluyen en el modelo?

8 Recuérdese que al obtener las muestras de las Tablas 2.4 y 2.5 mantuvimos los mismos valores de X.
9 Como se analizará en la Parte n, si las X son estocásticas y distribuidas independientemente de las
Uj, las propiedades de los estimadores mínimos analizadas a continuación siguen siendo válidas, pero si
las X son estocásticas y simplemente no están correlacionadas con las Uj, las propiedades de los esti-
madOres de MCO siguen siendo válidas solamente si el tamaño de la muestra es muy grande. Por ahora
no hay necesidad de preocupamos acerca de este punto teórico.
10 Más técnicamente hablando, para cualquier tamaño de muestra N.

var (X) =
L (XN- X)2
debe ser fmita
EL MODELO DE REGRESION CON DOS VARIABLES: EL PROBLEMA DE LA ESTlMACION 61

Estas son preguntas de fundamental trascendencia debido a que, como


veremos en el Capítulo 11 ,al omitir del modelo variables importantes, al
escoger la forma funcional incorrecta o al plantear supuestos estocásticos
equivocados sobre las variables del modelo, será muy cuestionable la validez
de la interpretación que se de a la regresión estimada. Para ilustrar 10 anterior,'
obsérvese la curva de Phillips que se plantea en la Figura 1.3. Suponiendo
que escogemos los siguientes dos modelos para ilustrar la relación fundamen-
tal existente entre la tasa de cambio de los salario's monetarios y la tasa de
desempleo: .
(3.2.5)

Ji = Pi + P2(~) + U¡ (3.2.6)

donde Ji = tasa de cambio de los salarios monetarios y X¡ = tasa de desempleo.


El modelo de regresión (3.2.5) es lineal tanto en los parámetros como
en las variables, mientras que (3.2.6) es lineal en los parámetros (y, por tan-
to, es un modelo de regresión lineal, de acuerdo con nuestra definición),
pero no lineal con respecto a la variable x. Consideremos ahora la siguiente
ilustración:
Si el modelo (3.2.6) es el modelo "correcto" o "verdadero", al ajustar
el modelo (3.2.5) a través de los puntos dispersos que se encuentran en la
Figura 3.7 se obtendrán predicciones erradas: entre los puntos A y B para
cualquier Xi dado, el modelo (3.2.5) va a sobrestimar el valor medio verda-
dero de Y, mientras que a la izquierda de A (o a la derecha de B) el modelo
va a subestimar (o sobrestimar, en términos absolutos) el verdadero valor
promedio de Y .
.,
o
~
~
o
e
.~
.,
01
§
.o
e

:E

.~"
'O

¡ Tasa de desempleo "10


¡...'--------...;.::~G_-~,_---------
O

FIGURA 3.7
Curvas de Phillips lineales y no lineales.
62 MODELOS UNIECUACIONALES DE REGRESION

El ejemplo anterior ilustra 10 que se conoce como el sesgo de especifi-


cación o error de especificación; en este caso el sesgo ocurre cuando se escoge
la forma funcional equivocada. Veremos otros tipos de errores de especifica-
ción en el Capítulo 11.
Desafortunadamente, sin embargo, en la práctica muy pocas veces cono-
cemos las variables correctas que deben incluirse en el modelo, la forma fun-
cional correcta del mismo o los supuestos probabilísticos correctos sobre las
variables utilizadas en el modelo, puesto que la teoría en la que se fundamen-
ta una investigación determinada (v. gr. la relación de tipo Phi11ips que mues-
tra la disyuntiva existente entre el cambio en los salarios monetarios y la tasa
de desempleo) puede no ser 10 suficientemente fuerte para responder a todas
estas preguntas. Por tanto, en la práctica el econometrista debe utilizar algo
de su juicio personal para escoger el número de variables que entran en el
modelo, la forma funcional del mismo, y tiene que hacer algunos supuestos
sobre la naturaleza estocástica de las variables que se incluyen en dicho mo-
delo. Hasta cierto punto, 'Se presenta algo del proceso de prueba y error al
tener que escogerse el modelo "correcto" para realizar análisis empírico. 11
Si es este el caso, ¿por qué razón se requiere el supuesto 51 Sin entrar
en detalles por ahora (véase Capítulo 11), basta con decir que este supuesto
está allí para recordarnos que nuestro análisis de regresión y, por tanto, los
resultados que se obterigan con base en ese análisis, están condicionados al
modelo que se haya escogido, y de otro lado, para advertirnos que debemos
pensar cuidadosamente sobre la fonna funcional de los modelos econornétri-
cos, especialmente cuando existan diferentes teorías que rivalizan entre sí
para explicar ciertos fenómenos económicos como, por ejemplo, la tasa de
inflación, la demanda de dinero o la determinación de un valor adec,uado o
de equilibrio para una acción o un bono. Por esta razón la construcción de
modelos econométricos, como descubriremos posteriormente, resulta ser más
un arte que una ciencia.
Con esto hemos completado nuestro análisis de los supuestos fundamen-
tales en que se basa el modelo clásico de regresión lineal. Es importante aclarar
que todos estos supuestos pertenecen únicamente a la FRP y no a la FRM. A
la vez, es interesante observar que el método de los mínimos cuadrados tiene
ciertas propiedades similares a los supuestos formulados sobre la FRP. Por
ejemplo, encontrar que L e¡ = O, Y que, por tanto, e = O, es semejante al su-
puesto de que E(ud Xi) = O. De la misma manera, que¿ e¡X¡ = Oes similar al
supuesto de que cov (u¡, Xi) = o. Es interesante entonces notar que el método
de los mínimos cuadrados trata de "duplicar" algunos de los supuestos que
hemos impuesto sopre la FRP.

11 No obstante, se debe evitar lo que se conoce como "excavación de información", es decir, tratar de
utilizar todos los modelos posibles con la esperanza de que al menos uno ajuste bien la información..
En consecuencia, es de fundamental importancia que haya cierto razonamiento económico como fun-
damento del modelo escogido y que cualquier modificación al mismo tenga alguna justificación econó-
mica. Un modelo puramente ad hoc puede ser difícil de justificar desde el punto de vista teórico o
a priori. En resumen, la estimación se debe basar en la teoría.
EL MODELO DE REGRESION CON DOS VARIABLES: EL PROBLEMA DE LA ESTIMACION 63

No obstante lo anterior, la justificación teórica del método de míni-


mos cuadrados se basa en el famoso teorema de 'Gauss-Markov. Dados los su-
. puestos que hemos hecho sobre la FRP" este teorema muestra que los estima-
tivos del método de mínimos cuadrados poseen ciertas propiedades estadís-
ticas deseables. Pero antes de continuar con el teorema de Gauss-Markov, es
preciso considerar los errores de precisión o errores estándar de los estimati-
vos de mínimos cuadrados.

3.3 ERRORES DE PRECISION O ERRORES ESTANDAR DE LOS


ESTIMADORES DE MINIMOS CUADRADOS
De las ecuaciones (3.1.6} y (3.1.7) se deduce que es evidente que los estima-
dores de mínimos cuadrados están en función de la' información muestral.
Sin embargo, como los datos pueden cambiar fácilmente de una muestra a
otra, de igual manera cambiarán ipso lacto los estimativos qúe se obtengan.
Por tanto, se hace necesario encontrar alguna medida de la "confiabilidad" o
precisión de los estimadores Pt Y P2' En estadística, la precisión de un esti-
mativo se mide a través de su error estdndar (se). 1 2 Dados los supuestos de
Gauss, se muestra en el Apéndice 3A Sección 3A.3, que los errores estándar
de los estimadores de MCO pueden obtenerse de la siguiente manera: -

(3.3.1)

(3.3.2)

-(3.3.3)

(3.3.4)

donde var = varianza; se = error estándar; (12 es la constante o varianza ho-


mocedástica de Uf en razón del supuesto 3.
Todas las cantidades que aparecen en las anteriores ecuaciones pueden
estimarse a partir de los datos, con excepción de (12 • Como se demuestra en
el Apéndice 3 A. Sección 3A.4, (12 se estima mediante la siguiente fórmula:

rr = L!L
N-2
\3.3.5)

12 El e"or estándar no es otra cosa que la desviación estándar de la distribución muestral del estimador,
siendo ésta última simplemente una distribución de frecuencias o de probabilidades de un estimador,
es decir, una distribución del conjunto de valores del estimador obtenidos de todas las muestras posi-
bles del mismo tamaño y de la mismá población. Las distribuciones muestrales se utilizan para realizar
inferencias acerca de los parámetros poblacionales con base en los valores de los estimadores calculados
a partir de una o más muestras.
64 MODELOS UNIECUACIONALES DE REGRESION

donde &2 es el estimador de MeO del verdadero pero desconocido (12 y don-
de la expresión N - 2 se conoce con el nombre de número de grados de liber-
tad (g de 1) y r. er
es la suma de los residuos al cuadrado o suma residual de
cuadrados (SRC) .13
Una vez se conoce I er
entonces f¡2 puede calcularse fácilmente. A
su vez, r. er
puede calcularse a partir de (3.1.2) o u titizando la siguiente
expresión (véase Sección 3.5 para la demostración):
"L. ei2-_~ 6~"
" Yi2 - Pl L. Xl1 (3.3.6)

Comparando esta ecuación con (3.1.2), observamos que (3.3.6) es más sim-
ple, por cuanto no requiere calcular e, para cada observación, sin que con
ello se pretenda demeritar el valor analítico propio de e en sí mismo (como
veremos en los Capítulos 9 y 10).
Puesto que
B _LXiYi
112 - " 2
L. Xi
una expresión alterna para calcular r. ef es:
"
L.
2 _
el -
"y2
"'" ¡ -
a: X¡yJ2
" 2
(3.3.7)
L.. XI

La raíz cuadrada positiva de f¡2

(1-
A - J.L!L
N-2
(3.3.8)

se conoce como el error estándar de la estimación. Básicamente, es la desvia-


ción estándar de los valores de, Y con respecto a la línea de regresión estima-
da y que se utiliza con frecuencia como una medida que resume la "bondad
del ajuste" de la línea de regresión estimada, tema que se analizará en la
Sección 3.5.
Obsérvense l¡ls siguientes características de las varianzas (y, por tanto,
de los errores estándar) de PI y P2'
1. La varianza dep2 es directamente proporcional a (12 pero inversamente
r.
proporcional a la x? lo cual implica que, dado (12, cuanto mayor sea la
variación en los valores de X, más pequefía será la varianza de $2 y mayor
la precisión en la estimación de 132' En resumen, dado (12, si existe una

13 El término números de grados de libertad muestra el número total de observaciones en la muestra


(= N) menos el número de restricciones (lineales) impuesto en ellas. Por ejemplo, antes de que la SRC
(3.1.2) pueda ser calculada, PI y P2 deben computarse. Estos dos estimativos ponen, por tanto, dos
restricciones sobre la SRC; así entonces, hay N - 2 y no N observaciones independientes para calcular
la SRC. Siguiendo ia misma lógica, en una regresión en tres variables la SRC tendrá N - 3 g de 1, en.
tanto que para el modelo con K variables se tenarán N - K g de 1. La regla general es: g de 1 =N -
número,Áe parametros estimados.
EL MODELO DE REGRESION CON DOS VARIABLES: EL PROBLEMA DE LA ESTIMACION 65

variación significativa en los valores de X, P2 se puede medir con mayor


exactitud que cuando los Xi no varían signific$ltivamente. Igualmente,
dado L xl, cuanto mayor sea la varianza de (12, mayor será también la
varianza de P2' •
2. La varianza de PI es directaqlente proporcional a (12 ya L xf pero in-
versamente proporcional a L xl y al tamaño de la muestra, N.
3. Puesto que PI y P2 son estimadores, no sólo varían de una muestra a
otra sino que dentro de una muestra dada tienden a depender entre sí.
Esta dependencia .entre los estimadores se miqe mediante la covarianza
existente entre .ellos. En el Apéndice 3 A, Sección 3 A.3 se demuestra que:

(3.3.9)

Puesto que var (P2) siempre es positiva, como es siempre el caso de la


varianza de cualquier variable, la naturaleza de la covarianza entre PI y
$2 depende del signo de X. Si X es positivo, entonces, como muestra la
fórmula, la covarianza será negativa. Después (especialmente en el Capí-
tulo 8 sobre multicolinealidad) veremos la utilidad de estudiar las cova-
rianzas entre los coeficientes estimados de regresión.
¿Cómo podem os juzgar la confiabilidad de los estimativos utilizando las
varianzas y los errores estándar de los coeficientes de regresión estimados?
Este es un problema sobre inferencia estadística que analizaremos en los
Capítulos 4 y 5.

3.4 PROPIEDADES DE LOS ESTIMADORES DE


MINIMOS CUADRADOS: EL TEOREMA DE GAUSS--MARKOVI4
Como se mencionó anteriormente, dados los supuestos del modelo de regre-
sión lineal clásica, los estimativos de mínimos cuadrados poseen propiedades
ideales u óptimas, las cuales se encuentran resumidos en el teorema de Gauss- '
Markov. Para comprender este teorema es necesario tener en cuenta la pro-
piedad por la cual un estimador se considera el mejor estimador lineal inses-
gado. 15 Un estimador, digamos el estimador P2' de MCO, es el mejor estima-
dor lineal insesgado (MELI) de P2 si:
1. Es lineal. es decir, una función lineal de una variable aleatoria tal corno la
variable dependiente Y en el modelo de regresión

14 Aunque conocido como teorema de Gauls-Markov, el enfoque de los mínimos cuadrados de Gauss
antecede (1821) al enfoque de Markov de varianza mínima (1900).
15 El lector debe remitirse a textos donde se explica la importancia de los estimadores.Hneales y se
presenta un análisis general sobre las propi$des deseables de los estimadore.s estadísticos.
66 MODELOS UNIECUACIONALES DE REGRESION

2. Es insesgado, es decir, su valor promedio o esperado E ($2)" es igual al


valor verdadero P2
3. Tiene varianza mínima entre la clase de todos los estimadores lineales
insesgados; a un estimador insesgado con varianza mínima se le conoce
como un estimador eficiente
En el contexto del análisis de regresión se puede demostrar que los esti-
madores de MCO son MELI. Esta es la clave del famoso teorema de Gauss-
Markov, el cual se puede enunciar de la siguiente forma:
Teorema de Gauss-Markov: Dados los supuestos del modelo clásico de regresión .
lineal, los estimadores de mínimos cuadrados, en la clase de estimadores lineales
insesgados, tienen varianza mínima; es decir, son MELI.

La demostración de este teorema se desarrolla en el Apéndice 3A,Sec-


ción 3A.5. La trascendental importancia del teorema de Gauss-Markov se hará
más clara a medida que avancemos en el texto. Por ahora, es suficie'nte resal-
tar que el teorema tiene una importancia teórica y práctica. 16
La significancia del teorema puede explicarse mejor con la ayuda de la
Figura 3.8. .
En la Figura 3.8 (a) se ilustra la distribución muestral del estimador
p2,de MeO, esto es, la distribución de los valores que toma P2 en experi-
mentos repetidos de muestreo (véase Tabla 3.1). Por conveniencia, hemos
supuesto que P2 está simétricamente distribuido (se hablará más al respecto
en el Capítulo 4). Como muestra la figura, la media de los valores de 112 E(¡!2),
es igual al valor verdadero de 112' En esta situación, se dice que P2 es un esti-
mador insesgado de {32' En la Figura 3.8 (b) se presenta la distribución mues-
tral de f3! , un estimador alterno de 112 que se obtiene utilizando otro método
diferente al de MCO. Por conveniencia, supongamos que (3!, al igual que P2'
. también es insesgado, hecho que implica que su valor promedio o esperado es
igual a 112' Supóngase además que P2 y P! son estimadores lineales, es' decir,
que son funciones lineales de Y. ¿Cuál de los dos estimadores escogería
usted?
Para responder a esta pregunta, procedamos a sobreponer las dos figuras
'como se muestra en la Figura 3.8 (e). Es obvio entonces que, aunque P2 y 11!
son insesgados, la distribución de 11! es más difusa y dispersa alrededor elel
valor de la media que la distribución de P2' En otras palabras, la varianza de
11! es superior a la varianza de P2' Ahora, dados dos estimadores lineales e
insesgados, se debe escoger el estimador con la menor varianza porque es más
probable que éste se encuentre más cerca de 132 que el estimador altérflo.En
resumen, se debe escoger el estimador MELI.

16 Por ejemplo, se puede demostrar que cualquier combinación lineal de los ¡rdigamos'(JJ1 - 2P1 ) se
puede estimar por medio de (JI - 2$2) siendo este estimador MELI. Para más detalles, véase Henri
Theil, Introduction to Econometrics, Prentice-Hall, Inc., Engléwood Clüfs, N.J., 1978, pp. 401-402.
EL MODELO DE REGRESION CON DOS VARIABLES: EL PROBLEMA DE LA ESTIMACION 67

----~------~------~-----P2
EcPJ=P2
(a) Distribución muestra! de P2

~-----------'.----------~P;
E<Pr>=P2
(b) Distribución muestra! deP;

.,\_P2·

P2
\'-...
-- .
- P,. P; FIGURA 3.8
Distribuciones muestrales del estimador de
(e) Distribuciones muestrales ue P2 y ~; MCO$2Y del estimador alterno p;.

('

3.5 COEFICIENTE DE DETERMINACION ,2 :


MEDIDA DE LA "BONDAD DEL AJUSTE"
Hasta el momento nos hemos concentrado en el problema de la estimación
de los coeficientes de regresión, sus errores estándar y en derivar algunas de
sus propiedades. Consideremos ahora la llamada bondad del ajuste de la línea
de regresión ajustada a un conjunto de datos, por lo cual se intentará encon-
trar en qué medida ajusta la línea de regresión muestral a los datos. De la
Figura 3.1 se desprende claramente que si todas las observaciones coincidie-
ran con la línea de regresión, obtendríamos un ajuste "perfecto", lo que
raras veces ocurre. Generalmente tienden a presentarse e¡ positivos y negati-
vos, con la esperanza de que los residuos localizados alrededor de la línea de
regresión sean lo más pequeños posible. En este sentido, el coeficiente de
determinación,2 (para el caso de dos variables) o R2 (para regresión múlti-
ple) es una medida resumen que nos dice qué tan bien la línea de regresión
muestral se ajusta a los datos.
68 MODELOS UNIECUACIONALES DE REGRESION

00 (a) (b) (e)

(ti) (e) (j)

FIGURA 3.9
El punto de vista de Ballentine para r l . (a) r l = 0, (f) r 1 = 1.

Antes de mostrar cómo se calcula el ,2, es conveniente proporcionar


una explicación heurística del r 2 utilizando una herramienta conocida como
el diagrama de Venn o Ballentine, como se ilustra en la Figura 3.9. 17
En esta figura, el círculo Y representa la variación en la variable depen-
diente Y, en tanto que el círculo X representa la variación en la variable
explicativa X.18 La intersección, de los dos círculos (elárea sombreada) indica
hasta qué punto la variación en Y se explica mediante la variación en X (di-
gamos que a través de la regresión de MCO). Cuanto mayor sea la rragnitud
del término de intersección, mayor será la variacion en Y que es explicada
por la variable X. El r 2 es simplemente una medida numérica de esta intersec-
ción. En la figura, a medida que nos movemos de izquierda a derecha el área
de la intersección aumenta, 10 cual implica que una proporCión cada vez
mayor de la variación en Y se explica por medio de X, hecho (}\le a su vez
implica ,que r 2 aumenta. Cuando no existe intersección alguna, es'obvio que
',2 es cero, pero cuando la intersección es total, r 2 es igual a uno puesto que
elIDO % de, la variación en Y se explica por medio de X. Como demostrare-
mos muy pronto, r 2 se encuentra entre O y 1.
Para calcular este r 2 procederemos de la siguiente forma:
Recuérdese que
Yj = f; + ei (2.6.3)

17 Véase Peter Kennedy, "Ballentine: A Graphical Aid for Econometrics", Australian Economics Pa·
pen, vol. 20, 1981, pp. 414-416. El nombre Ballentine se deriva del emblema de círculos de la conoci-
da cerveza Ballantine.
18 Los términos variación y varianza son diferentes. La variación es el cuadrado de la suma de las des-
viaciones de una variable con respecto a su media. La varianza es esta suma de cuadrados dividida por
los correspondientes grados de libert::d. En resumen, varianza =variación/g de 1.
EL MODELO DE REGRESION CON DOS VARIABLES: EL PRÓBLEMA DE LA ESTIMACION 69

o, en forma de desviación
Yi =;: Y¡
• A
+ ei (3.5.1)
en donde se han utilizado (3.1.13) y (3.1.14). Elevando al cuadrado ambos
lados de (3.5.1) y sumado sobre toda la muestra, obtenemos

(3.5.2)

debido 'a que L .vi ei = O (¿por qué?) y a que .vi = P2 Xi·


Las sumas de cuadrados que aparecen en la expresión (3.5.2) pueden
describirse de la siguiente manera: L yf = L (Y¡ - Y)2 = variación total de
los valores reales de Y con respecto a su medida muestraI. eJg)resión que se
conoce como suma total de cuadrados (STC). L.vf = L (~- r)l = L (f. - Y)2
= P~ L xt. = variación de-los valores estimados de Y con respecto a su media
(9' = Y), y que se conoce con el nombre de suma de cuadrados debida a la
regresión (v. gr., debida a las variables explicativas o explicada por la regre-
sión o, simplemente, suma explicada de cuadrados (SEC). ¿ ef = variac.ión
residual o no explicada de los valores.de Y con respecto a la línea de regre-
sión o, simplemente, suma residual de cuadrados (SRC). Por consiguiente,
(3.5.2) es igual a:

STC!= SEC+ SRC (3.5.3)

(~ - Y) = Debido, 1, re¡resión

~ ____________ ~ __ ~ ____________ X
O X,

i"IGURA3.10
Partición de los dos componentes de la.variaci6n de Y,.
70 MODELOS UNIECUACIONALES DE REGRESION

y nos muestra que la variación de los valores observados de Y alrededor de su


media pueden dividirse en dos componentes, el primero atribuible a la línea
de regresión y el segundo a fuerzas aleatorias, ya q1Je no todas las observacio-
nes reales de Y caen sobre la línea de regresión ajustada. Para una ilustración
geométrica, obsérvese la Figura 3.10.
Dividiendo ambos lados de (3.5.3) porla STC, obtenemos
SEC SRC
1 = STC+ STC

_ L (~ - y)2 L el (3.5.4)
- L Pi - y)2 + L Pi - y)2

Podemos ahora definir el r2 como

(3.5.5)

La cantidad r2 definida de esta manera, 'se conoce como coeficiente de deter-


minación (muestra!), y es la más ampliamente utilizada medida de la bondad
del ajuste de una línea de regresión. Claramente, r2 mide la proporción ó.
porcentaje de la variación total en Y explicada por el modelo de regresión.
Sus propiedades más importantes son:
1. Es una cantidad no negativa. (¿Por qué?)
2. Sus límites son O:::;; ,2:::;; 1. Un r 2 de 1 denota un ajuste perfecto, mien-
tras que un r2' de O nos dice que no existe relación alguna entre la variable
dependiente y la(s) variable(s) explicativa(s). '
Aunque r2 puede calcularse directamente a partir de su definición en
(3.5.5), puede derivarse más rápidamente haciendo uso de la siguiente fórmula:

,2 =SEC
-
STC
LJ;
=¿yl
= Pi L xl
Lyl
=piLE..). (3.5.6)
\1:11
si dividimos el numerador y el denominador de esta última expresión por el
tamatlo de la muestra N (o por N - 1, si el tamaño de la muestra es pequeño),
obtendremos

(3.5.7)
EL MODELO DEREGRESION CON DOS VARIABLES: EL PROBLEMA DE LA ESTIMACION 71

en donde S; y S; son las varianzas muestrales de Y y X, respectivamente.


Dado que $2 = L x¡yJL xl, la ecuación (3.5.6) también puede expresar-
se como:
(3.5.8)

ecuación que mediante computación es más fácil de calcular.


U na cantidad muy estrechamente relacionada a r 2 pero conceptualmen-
te diferente es el coeficiente de co"elación que, como se observó en el Capí-
tulo 1, es una medida del grado de asociación entre dos variables. Puede
calcularse bien como
r= ±# '(3.5.9)
o a partir de su definición

. ¿X¡YI
r = -¡::;:-~:;::::;;;:::::;::
,j<L xlXL Yl)
= N ¿ X¡ Yj - (¿ X ¡)(¿ Yj)
(3.5.10)
j[N ¿ xl - (¿ X¡)2][N ¿ Yl - (¿Yj)2]
medida que se conoce como coeficiente de co"elación muestral. 19
A continuación se presentan algunas propiedades de r: (Véase Figura
3.11 )"
1. Puede ser positivo o negativo; su signo dependerá del signo del numera-,
dar de (3.5.10), que mide la'covariación de las dos variables.
2., Tiene como límites -1' y + 1'; esto es, -1 ~ r ~ 1.
3. Es de naturaleza simétrica; lo anterior implica que el coeficiente de co-
rrelación entre X y Y (rXy') es igual al coeficiente de correlación entre
y y X (ryx ).
4. Es independiente del origen y de la escala; si definimos Xr = aX¡ + e y
yr = b Yj + d, donde ,a > 0, b > 0, y c y d son constantes, entonces r entre
X· y Y* es igual al r entre las vadables originales X y Y.
5. Si X y Y son estadísticamente independientes, el coeficiente de correla-
ción entre ellas es cero; pero si r = O,no se puede inferir que las dos
variables sean independientes. En otras palabras, una correlación igual a
cero no implica necesariamente independencia. (Véase Figura 3.11 h).
6. Es una medida de asociación lineal o dependencia lineal únicamente; por
consiguiente no tiene sentido, utilizarlo para describir relaciones no li-
neales. Por tanto, en la Figura 3.11h, Y = x 2 es una relación exacta pero
r es cero. (¿Por qué?).

19 El coeficiente de correlación poblacional, denotado por P. se define en textos de estadística.


72 MODELOS UNIECUACIONALES DE REGRESION

y y y
r cerca a +1
r= +1 r= -1

..

FIGURA 3.11 ,
Patrones de correlación (Adaptado de: Henri Theil: lntroduction to Econometrics, Prentice-Hall, Inc.,
Engl~wood Cliffs, N.J., 1978, p. 86.

7. Aunque mide la asociación lineal entre dos variables, no necesariamente


implica una relación de causa y efecto, como vimos en el Capítulo 1.
En el contexto del análisis de regresión,,2 es una medida más significa-
tiva que'" debido a que el primero muestra la proporción de la varianza en la
variable dependiente explicada por la(s) variable(s) explicativa(s) y, por tanto,
proporciona una medida global de la magnitud del efecto que ejerce la varia-
ción existente en una variable sobre la variabilidad de la otra. De otro lado,
no nos permite realizar inferencias de este género. 20 Además, como veremos

20 En los modelos de regresión, la teoría fundamental indicará la dirección de la causalidad entre Y y


X, la cual, en el contexto de los mOdelos de una sola ecuación, generalmente va de X a Y.
EL MODELO DE REGRESION CON DOS VARIABLES: EL PROBLEMA DE LA ESTIMACION 73

más adelante, la interpretación de r(=R)en un modelo de regresión múltiple


es de un valor dudoso .
r
.A propósito, obsérvese que ~l defmido previamente' también se puede
calcular como el cuadrado del coeficiente de la co"elación existente entre el
valor real de Y, y el valor estimado de f¡.
En otras palabras, utilizando (3.5.10) podemos escribir:

o,

(3.5.11)

donde Y; = y real, f¡ = y estimado y Y = f = la media de Y. En el Ejercicio


'3.19 se presenta la demostración de los anteriures conceptos. .

3.6 UN EJEMPW NUMERICO


Podemos ilustrar los conceptos básicos de teoría econométrica desarrollada hasta el
momento, considerando la función keynesiana de consumo analizada en la Intro-
ducción. Recuérdese que Keynes planteaba que "La ley sicológica fundamental ...
consiste en que los hombres (y mujeres) tienden, como regla general yen promedio,
a aumentar su consumo a medida que aumenta su ingreso, aunque no en la misma
cantidad que el aumento en su ingreso", afmnaciÓD que implica que la propensión
marginal al consumo (PMC) es mayor que cero pero menor que uno. AUnque Key-
nes no especificó la forma funcional exacta de la relación existente entre el consumo
yel ingreso, en aras de simplificar el análisis asúmase que dicha relación es lineal
como en (2.4.2). Para probar la función keynesiana de consumo, utilicemos la infor~
mación muestral de la Tabla 2.4 reproducida ahora en la Tabla 3.2. La información
básica primaria que se utiliza para obtener las estimaciones de los coeficientes de
regresión, sus errores estándar, etc., se presenta en la Tabla 3.3. Con base en esta
información se obtienen los siguientes cálculos, que se recomienda al lector verificar.

PI = 24.4545 var (PI) = 41.1370 Y se (PI) = 6.4138


P2 = 0.5091 var (P2) = 0.0013 y se (P2) = 0.0357 (3.6.1)
2
COY (PI' P2) = -0.2172 17 = 42.1591
r 2 = 0.9621 r =,0.9809 g de 1= 8
Por tanto, la línea de regrllsión estimada es
f; = 24.4545 + 0.5091X¡ (3.6.2)

que se muestra geométricamente en la Figura 3.12.


De acuerdo con el Capítulo 2, la FRM (ecuación (3.6.2» y la línea de regresión
asociada a ella se pueden interpretar de la siguiente manera: cada punto sobre la
línea de regresión proporciona una estimación del valor medio o esperado de f
correspondiente a un valor seleccionado de X; Yi es, por tanto, una estimación de
74 MODELOS UNIECUACIONALES DE REGRESION

TABLA 3.2
Cifras hipotéticas de gastos de consumo familiar
, semanal Y e ingreso familiar por semana X

Y (S) X (S)

70 80
65 100
90 120
95 140
110 160
115 180
120 200
140 220
155 240
150 260

E(YIX¡} El valor de P2=O.5091, que mide la pendiente de la línea, muestra que


dentro del rango de la muestra de X comprendido entre $80 y $260 semanales, a
medida que X aumenta, digamos en $1, el aumento estimado en el promedio de
gastos de consumo semanales es de aproximadamente 51 centavos. El valor dePl =
24.4545, el cu!11 corresponde a la intersección de la línea, indica el nivel promedio
de los gastos de consumo semanales cuand.o el ingreso semanal es cero. No obstante,
esta es una interpretación mecánica de la intersección. En el análisis de regresión
esta interpretación literal del intercepto no es siempre significativa, aunque en el
ejemplo que estamos considerando se puede· argumentar que una familia sin ingreso
alguno (ya sea por desempleo, despido, etc.) puede mantener algún nivel mínimo de

TABLA 3.3
Datos brutos basados en Ia,Tabla 3.2

JC,. Y,· ti·


Y, x, Y,X, Xf x,- J{ Y, - f JCl JC,Y, f, Y, :'" f , f,t ,

(1) (2) (3) (4) (5) (6) (7) (8) (9) (10) (11)

70 80 5600 6400 -90 - 41 8100 3690 65.1818 4.8181 314.0524


65 100 6500 10000 -70 -46 4900 3220 75.3636 -10.3636 -781.0382
90 120 10800 14400 -50 -21 2500 1050 85.5454 4.4545 381.0620
95 140 13300' 19600 -30 -16 900 480 95.7272 -0.7272 -69.6128
110 160 17600 25600 -10 -1 100 10 105.9090 4.0909 433.2631
115 180 20700 32400 10 4 100 40 116.0909 -1.0909 -126.6434
120 200 24000 40000 30 9 900 270 126.2727 -6.2727 -792.0708
140 220 30800 48400 50 29 2500 1450 136.4545 3.5454 483.7858
155 240 37200 57600 70 44 4900 3080 146.6363 8.3636 1226.4073
150 260 39000 67600 90 39 8100 3510 156.8181 -6;8181 -1069.2014
Sum 1110 1700 205500 322000 O O 33000 16800 1109.9995 O 0.0040
* 1110.0' *0.0
Media 111 170 ne ne O O ne ne 110 O O

Notas: '" significa "aproximadamente igual a". nc significa "no calculado",


EL MODELO DE REGRESION CON DOS VARIABLES: EL PROBLEMA DE LA ESTIMACION 75

Y¡ = 24.454\0.5091 Xi

lllr---------------------~~---------------
(y)

~--------------------~--------------------X
170
(X)

FIGURA 3.12
Línea de .regresión muestral basada en las cifras de lá Tabla 3.2.

gastos de consumo, ya sea tomand'odinero prestado o utilizando sus ahorros. Sin


embargo, en general, se debe apelar al sentido común para interpretar la inter-
sección puesto que es muy común que el rango que ha tomado la muestra de valores
de X no haya incluido el valor cero como uno de los valores observados.
Quizá sea mejor interpretar la intersección como el efecto medio o promedio
que tienen todas las variables omitidas del modelo de regresión sobre el valor de Y.
El valor de 0.9621 para r2 significa que cerca del 96 % de la variación en los gastos
de consumo semanales se explica por la variable ingreso; puesto que r 2 puede tener
un valor máximo de 1 solamente, el r2 observado sugiere que la línea de regresión
muestral se ajusta muy bien a la información. 21 El coeficiente de correlación de
0.9809 muestra que las dos variables, gastos de consumo e ingreso, están muy
positivamente correlacionadas. Los errores estándar ,estimados para los coeficientes
de regresión Se interpretarán en el Capítulo 5. .

3.7 UN EJEMPLO ILUSTRATIVO:


LADEMA.NDA DE CAFE EN LOS ESTADOS UNIDOS

EL CONSUMO DE CAFE EN LOS ESTADOS UNIDOS, 1970-1980


Considérense los datos presentados en la Tabla 3.4. 22

21 Agradezco a Scott E. Sandberg por su ayuda en la recolección de la información.


22 Por tanto, 0.01479 corresponde a la varianza deP,y 0.0130 es la varianza deP2; al sacar la raíz CUel-
drada de estos números obtenemos 0.1216 y 0.1140, que representan los errores estándar de los dos
coeficientes, respe!ctivamente, como se muestra en la Parte 111, excepto por errores de aproximación.
76 MODELOS UNIECUACIONALES DE REGRESION

TABLA 3.4
Consumo de café en los Estados
Unidos (Y) en relación con el precio
real al detal,(X)* 1970-1980
r
(tazas diarias
x
($ por libra)
Año P9r persona)

1970 2.57 0.77


1971 2.50 0.74
1972 2.35 0.72
1973 2.30 0.73
1974 2.25 0.76
1975 2.20 0.75
1976 2.11 1.08
1977 1.94 1.81
1978 1.97 1.39
1979 2.06 1.20
1980 2.02 1.17

"Nota: E\ precio nominal se dividió por


el índice de precios al consumidor (IPC)
para alimentos y bebidas, 1967 = 100.

Fuente: Los datos para .Y provienen del


Summary 01 National Collee Drlnking
Study, Data Group, Inc., Elkins Park,
Penn., 1981, y los datos sobre X nominal
(es decir, X a precios corrientes) provie-
nen de Nielsen Food Index, A.C Nielsen,
N_ York, 1981.

Según la microeconomía, la demanda de un producto de consumo depende


generalmente del precio de ese producto, de los precios de otros bienes que com-
piten con éste o que son complementarios a él, y del ingreso del consqmidor. Para
incorporar todas estas. variables en una función de demanda y suponiendo que
~xiste información disponible, se. precisaría utilizar un modelo de regresión múlti-
ple, para lo cual aún no nos encontramos preparados. Por tanto, lo que haremos es
suponer una función demanda parcial o ceteris paribus (todo lo demás, constante),
relacionando "!1nicamente la cantidad demandada con su precio. Por ahora supon-
dremos que las restantes variables ,que entran en la función deman.da permanecen
constantes. En consecuencia, si ajustamos el modelo lineal de dos variables (2.4.2) a
los datos de la Tabla 3.4, obtendremos los siguientes resultados (en el Apéndice3A,
Sección j A.6 se ilustra el resultado obtenido utilizando los listados tras una corrida
del paquete econométrico SAS);

f, = 2.6911- O.4795X, (3.7.1).


Var ($1)=0.0148; se <P1) ... 0.1216
Var <Pl)=0.0129; se <PJ=O.l140
r 1 ",,0.6628
, ,

EL MODELO DE REGRESION CON DOS VARIABLES: EL PROBLEMA DE LA ESTIMACION 77

Podemos interpretar la regresión estimada de la siguiente manera: si el precio de


venta real promedio del café por libra, a nivel de detallista, aumenta, digamos, en
un dólar, se espera que el consumo promedio diario de café disminuya en aproxi-
madamente media taza. Si el precio del café fuera igual a cero, se esperaría que el
consumo de café por persona sea de aproximadamente 2.69 tazas por día. Por su-
puesto, como se mencionó anteriormente, es muy frecuente que no se pueda asig-
nar ningún significado físico a la intersección. No obstante, debemos tener en cuen-
ta que aunque el precio del café fuera cero, la gente qo consumiría cantidades des-
proporcionadas de café debido al aparente efecto negativo de la cafeína sobre la
salud. El valor del r 2 implica que aproxima.damente el 66% de la variación en el
consumo de café diario percápita se explica a través de la variación del precio de
venta del mismo.

¿Qué tan real es el modelo que hemos ajustado a la información? Pues-


to que no incluye todas las variables relevantes, no podemos decir que es una
función de demanda completa de café. Este sencillo modelo se escogió para
fines didácticos en esta etapa de nuestro estudio.

3_8 LISTADO DE COMPUTADOR


PARA LA FUNCION DE DEMANDA DE CAFE
Como se mencionó en la Introducción, a lo largo de este texto estaremos uti- .
lizando el computador para obtener respuestas a los ejemplos ilustrativos,
con el fin de familiarizar al lector con algunos "paquetes" de programas de
regresión. En el Apéndice A analizamos en detalle algunos de estos progra-
mas, tales como SAS, SPSS, MINITAB, SHAZAM y TSP. Para la mayoría de
los ejemplos ilustrativos en este texto se ha utilizado el programa SAS (Sta-
tistical Analysis System, sistema de análisis estadístico). Para la función de-
manda de café de nuestro ejemplo, se presenta en el Apéndice 3A, Sección
3A.6, el listado de computador SAS con los resultados de la estimación
obtenida. Cuando sea posible, en los apéndices de los diferentes capítulos se
incluyen dichos listados de computador.

3.9 RESUMEN Y CONCLUSIONES '


En este capítulo se introdujo el enfoque de mínimos cuadrados al análisis de
regresión. Carl Friedrich Gauss, el creador de este enfoque, demostró que
bajo ciertos supuestos el método de mínimos cuadrados produce estimadores
lineales, insesgados y de la clase de estimadores lineales insesgados de varian-
za mínima. En una palabra, los estimadores de MCO son MELI. Este es el
contenido básico deI.famoso teorema de Gauss-Markov"teorema que propor-
ciona el fundamento teórico del método de mínimos cuadrados.
Después de haber analizado el problema de la estimación puntual de los
coeficientes de regresió.n, se consideré- el tema relacionado con la precisión
de los mismos. La precisión de un estimador se mide por su error estándar, el
cual nos permite hacer inferencias acerca de los parámetros (poblacionales),
tema Que trataremos en el Capítulo 4.
78 MODELOS UNIECUACIONALES DE REGRESION

Un problema estrechamente relacionado con la estimación de los coefi-


cientes de regresión es el de la bondad del ajuste (global) de la regresión
muestral. La bondad del ajuste se mide a través del coeficiente de determina-
ción r?' , el cual nos muestra la proporción de la variación en la variable de-
pendiente que se explica mediante la(s) variable(s) independiente(s). El r?'
puede estar entre O y 1; cuanto más cerca esté de 1, mejor será el ajuste. ,
Aunque conceptualmente diferente del análisis de regresión, se ha consi-
derado también el tema del coeficiente de correlación r, que mide el grado de
asociación entre, dos variables y que puede estar entre -1 y + 1. Al conside-
rar las propiedades de r se hizo énfasis sobre, algunas de sus limitaciones, es-
pecialmente el peligro de interpretar la correlación como causalidad.
Antes de concluir el presente capítulo es necesario comentar brevemente
acerca del modelo de regresión lineal clásico, que es el fundamento de casi la
totalidad del análisis de regresión. Debe tenerse en cuenta que el modelo clá-
sico es una abstracción o construcción teórica, ya que los supuestos que lo
fundamentan pueden llegar a ser considerados como rigurosos o poco realis-
tas. Sin embargo, dicha abstracción es a menudo necesaria durante las prime-
ras etapas de estudio de cualquier disciplina. A medida que nuestros conoci-
mientos progresen y que asimilemos los trucos de la ciencia, aprenderemos
también a convivir con supuestos irreales o a modificarlos sobre la marcha.
En esta forma, lo que es .importante en un comienzo es saber cuáles son las
cosas que suponemos, cuáles las que adivinamos y cuáles las que observamos.
Quizá la Tabla 3.5 permita al lector mantenerlos siempre presentes.
Una vez dominemos el modelo clásico, desarrollaremos, en las Partes 11
y 111 una investigación detallada sobre lo que ocurre cuando se liberan uno o
más de uno de los supuestos del modelo clásico.
TABLA3.S
Anatoínía del modelo de regresión clásico en dos variables
Esto se Esto se Esto no se Esto se Esto se
supone observa observa impone calcula

Los (JI y Pl {JI y (Jl Algún criterio PI y Pl


verdaderos existen verdaderos de estimación
v.gr. mínimos
Existe el u¡ cuadrados
verdadero con ' Uf verdadero Residuosef
las siguientes
propiedades:
(i) E(uJ=O E(uJ e= media de los
(ii) E(u~) = u l E(u~) residuos =0
(iii) E(u¡uJ)=O 8'1 = estimación
i ~j deu l
Población de
YpuaunX
4ado donde
"Y¡={JI+{JlX¡+U¡ y y X en Y fuerade
una mu~tra dada la muestra

Fuente: Adaptado de S. Valavanis, EconometrÚl, McGraw·Hül Book Company, Nueva York, 1959, p. 19
El MODELO DE REGRESION CON OOS VARIABLES: EL PROBLEMA DE LA ESTIMACION 79
EJERCICIOS
3.1 Dados los supuestos en la columna (1) de la siguiente tabla, demuestre que los su-
puestos en la columna (2) son equivalentes.
Supuesto del
, modelo clásico

(1) (2)

E(u¡/XJ==O E(YjIXJ=Pl +P 2 X
COy (14,,14)=0 i ~j cov(Yj,y)=O i~j
var (u¡/XJ=u 2 var (YjIXJ""u 2

3.2 Demuestre que las estimaciones PI = 1.572 Y P2 = 1.357 que se utilizaron en el pri-
mer experimento de la Tabla 3.1 de hecho son los estimadores de MCO.
3.3 Según Malinvaud, el supuesto de que E(u¡/ X J =0 es muy 'importante. Para compren-
derlo, consideremos la FRP: Y = PI + P2 X ¡ + U¡. Considérense ahora dos situaciones:
(i)PI = O, P2 = 1Y E(uJ=O y (ii) PI = 1, P2 =0 YE(uJ=(X¡-l). Tómese ahora la expec-
tativa de la FRP condicionada con respecto a X en los dos casos anteriores y veamos
si usted está de acuerdo con Malinvaud sobre la significancia del supuesto E;(u¡ I X J = O.
3.4 Considere la siguiente regresión muestral:
Y;=PI +P2 X ¡+e,
Imponiendolasrestriccionest(a) ¿ e¡=O y(b) ¿ e¡X¡=O obtengalosestimadores.d¡y
P y demuestre que son idénticos a Jos estimadores de mínimos cuadrados dados en
2
(3.1.6) Y (3.1.7). Este método de obtener estimadores se conoce como el principio
de analog(a. Dé una justificación intuitiva de la imposición de las restriccioQes (a) y
(b).
3.5 Muestre que el r'J. defmido en (3.5 .5) varía entre Oy l. Puede utilizar pilla tal efecto
la desigualdad de Cauchy-Schwarz que establece que para cualquier variable aleatoria
X y Y se cumple la siguiente relación:
[E(XY)]2 ~E(X2)E(y2)

3.6 Sean P,,, y p", las pendientes de una regresión de Y en X y de X en Y, respectiva-


mente. Muestre que

donde r es el coeficiente de, correlación entre X y Y.


3.7 La siguiente tabla proporciona cifras de las tasas de renuncias por cada 100 emplea-
dos y las tasas de desempleo en la industria manufacturera en los Estados Unido,s
para el período 1960-1972.
Nota: El 'término renuncia implica que el empleado salió voluntariamente de la
empresa.
(a) Represente gráficamente los datos.
(b) Suponga que la tasa de renuncias Y está linealmente relacionada con la tasa de
desempleo X, de la siguiente manera: Y;=PI +P2X¡+U¡.
Estime P¡, P2 , Ysus errores estándar.
(c) Calcule r2 y r
80 MODELOS UNIECUACIONALES DE REGRESION

Tasas de renuncias voluntarias y de desempleo en


la industria manufacturera en los Estados Unidos,
1960-1972

TUI. de renuncias Tasa de desempleo


Ailo por cada 100 empl~os, y (%), X

1960 1.3 6.2


1961 1.2 7.8
1962 1.4 5.8
1963 1.4 P
1964 1.5 5.Ó
1965 1.9 4.0
1966 2.6 3.2
1967 2.3 3.6
1968 2.5 3.3
1969 2.7 3.3
19JO 2.1 5.6
1971 1.8 6.8
1972 2.2 5.6
Fuente: Manpower Report of the President, 1973, tablas
ColO y A-lB.

(el) Interprete sus resultados


(e) Utilizando infonnación anual para el período 1966-1978 y el mismo modelo de
(b), se obtuvieron los siguientes resultados:
f.= 3.1237-0.l714X¡;

se <P2) = 0.0210 y r 2 =0.8575.


Si estos resultados son ,diferentes a los que usted obtuvo en (b), ¿cómo raciona-
lizaría esa diferencia?
3.8 Con base en una muestra de 10 observaciones se obtienen los siguientes resultadas:

¿ Y¡= 1110 ¿ X¡Y¡=205500


¿ y2= 132100

con un coeficiente de correlación' = 0.9758. Sin embargo, al revisar los resultados


nuevamente se encuentra que dos pares de observaciones se consideraron erróneamente,
así:

y X Y X

90 120 en lugar de 80 110


140 220 ISO 210

¿Cuál es el efecto dé esta equivocación en el cálculo de ,? Obtenga el, correcto.


3.9 La siguiente tabla proporciona la tasa de variación (porcentaje anual) de los índices
de precios de acciones y del índice de precios al consumidor en algunos países selec-
cionados para el período posterior a la segunda guerra mun~ial.
EL MODELO DE REGRESION CON DOS VARIABLES: EL PROBLEMA DE LA ESTIMACION 81

Valores de acciones y precios al consumidor, período


posterior a la segunda guerra mundial (1969)
Tasa de variación mual, %

PaÍl , Precio de las acciones, Y Precio. al consumidor, X

1. Australia S.O 4.3


2. Austria 11.1 4.6'
3. Bélgica 3.2 2.4
4. Canadá 7.9 2.4
S. Chile 2S.s 26.4
6. Dinamarca 3.8 4.2
7. Finlandia 11.1 S.S
8. Francia 9.9 4.7
9. Alemani~ 13.3 2.2
10; India I.S 4.0
11. Irlanda 6.4 4.0
12. Israel 8.9 8.4 .
13. Italia 8.1 3.3
14. Japón 13.5 4.7
lS. México 4.7 S.2
16. Holanda 7.S 3.6
17. Nueva Zelandia 4.7 3.6
18. Suecia 8.0 4.0
19. Reino Unido 7.5 3.9
20. Estados Unidos 9.0 2.1

Fuente: Phillip Cacen: Common Stock Value8 and Inflatlon:


1'IIe Hútorlcal Record 01 Many Countrle8, Natfonal Bureau of
Economic Relearch, Suppl., marzo, 1974, Tabla 1, p. 4.

(a) Represente gráficamente los datos.


(b) Estime los parámetros de una regresión lineal en que la tasa de variación en l~s .
precios de las acciones es :la variable dependiente y la tasa de variación en los
precios al consumidor es la variable explicativa. Calcule a continuación el r
(e) ¿Son las acciones una protección contra la inflación? ¿Son una protección
perfecta?
(á) Para un pºsible proyecto del curso actualice esta información y verifique si los
resultados de la regresión correspondiente al período 1970-1986 difieren de los
que se obtuvieron en (b).
3.10 La siguiente tabla suministra información relacionada con el producto nacional bru-
to de los Estados Unidos.
(a) A la información anterior, ajuste el siguiente modelo:

Y,=Pl +P2 X ,+U,

donde Yt = PNB en el período t.y X = tiempo, meWdo crono!ógicamente,


comenzando con 1 para 1969, 2 para 1970 y así sucesivamente.
(b) ¿Cómo interpretaría usted a P2?
• (e) ¿Existe alguna diferencia entre el P2 estimado utilizando el PNB en términos
82 MODELOS UNIECUACIONALES DE REGRESION

Producto Nacional Bruto en los


!stados Unidos, en dólares co-
trientes y constantes (1972),
1969 a 1983

PNB PNB
(JDÜes de (mies de millones de
Afto millones de dólares d6lares de 1972)

1969 944.0 1087.6


1970 9927 1085.6
1971 1077.6 11224
1972 1185.9 1185.9
1973 1326.4 1254.3
1974 1434.2 1246.3
·1975 1549.2 1231.6
1976 1718.0 1298.2
1977 1918.3 1369.6
1978 2163.9 1438.6
1979 2417.8 1479.4
1980 2631.7 1475.0
1981 2957.8 15122
1982 3069.3 1480.0
1983 3304.8 1534.7

Fuente: Economic Repon ofthe Pre,lident,


febrero de 1985, tablas 8-1 y 8-2, pp. 232-234.

corrientes y el estimado utilizando el PNB en términos constantes? ¿"Qué ex-


plica la diferencia?
(d) Con base en los resultados, ¿qué puede usted decir acerca de la naturaleza de la
inflación en los Estados Unidos durante el período 1969·1983?
3.11 Ajuste un modelo de regresión lineal apropiado a las siguientes cifras que relacionan
el índice de precios al consumidor y la oferta monetaria en el Japón para el período
comprendido entre 1977·3 y 1982·1 Y haga coment8rlos·al respecto.
EL MODELO DE REGRESION CON DOS VARIABLES: EL PROBLEMA DE LA ESTIMACION 83

Precios al consumidor y la oferta monetaria en el


Japón, 1977-3 a 1982-1
Indice de precios a! M_Oferta monetaria
Año y trimestrel, consumidor (1975-100) i(müei de millones de yenes)

1977-3 119.0 55,014


-4 119.9 56,310
1978--1 120.7 57,486
-2 122.0 59,093
-3 123.7 61,416
-4 124.0 63,343
1979-1 124.0 64,165
-2 125.8 66,873
-3 127.9 67,310
-4 130.1 66,909
198~1 133.4 67,976
-2 136.3 67,389
-3 138.6 66,345
-4 140.4 65,763
1981-1 . 142.3 66,183
-2 143.1 69,419
-3 144.3 69,993
-4' 146.1 71,849
1982-1 146.7 73,358

Fuente: Banco de la Reserva Federa! '<le St, Louis, International


Economlc Conditions, a,osto 31 de 1982, pp. 33-34.

3.12 Considere las siguientes fonnulaciones de la FRP en dos variables:


Modelo 1: l'¡""Pl +P2X¡+U¡
Modelo 11: l'¡=(Xl + (X2(X¡-X) + U¡
(a) Encuentre los estimadores de PI y (Xl ¿Son idénticos? ¿Son sus varianzas idén-
ticas?
(b) Encuentre los estúnadores de P2Y (X2 ¿Son idénticos? ¿Son sus varianzas idén-
ticas?
(c) ¿Cuál es la ventaja, si existe alguna, del modelo 11 sobre el modelo I?
3.13 Sea rl = coeficiente de correlaqi6n entre N pares de valores(l'¡, XJ y r2 =coeficien-
te de correlación entre N pares de valores (aX¡+b, cl'¡+d),- donde a, b, c y d son
constantes. Muestre que rl ·=r2 y, por consiguiente, establezCa el principio según el
cual el coeficiente de co"elación es invariable con respecto al cambio de escala y de
origen.
Sugerencia: Aplique la defmición de r dada en (3.5.10)
. Nota: Las operaciones aX¡, X¡+b, y aX¡+b se conocen como cambio de escala,
cambio de origen y. cf111lbio de escala y origen, respectivamente.
3.14 Si r,' el coeficiente de correlación entre N pares de valores (Xi' Y i ) es positivo, se
deduce que
(a) r entre ( -XI' -Jí) es también positivo.
(h) rentre(-X¡,Jí)yentre (XI' -YJ puede ser positivo o negativo.
I

84 MODELOS UNIECUACIONAlES DE REGRESION

(e) Los dos coeficientes de la pendienteP,x y Poi' son positivos, donde P'IC= coefi·
ciente' de la pendiente en la regresión de Yen X y ¡J",= pendiente de la regre·
sión de X en Y.
Detennine en cada caso si es cierta o falsa la afmnación
3.15 Si Xl. X 2 y X 3 son variables no correlacionadas, cada una con la misma desviación
estándar, muestre que el coeficiente de correlación entre Xl + X 2 Y X 2 + X 3 es
igual a l. ¿Por qué razón dicho coeficiente no es cero?
3.16 Demuestre que (3.5.11) de hecho mide el coeficiente de detenninación. Sugeren·
cia: Utilice ladefmici6n der dada en (3.5.10); recuerde que L Yi.Y¡= L (Y¡ +eJy¡ =Lyf
y tenga también en cuenta (3.5.6).

APENDICE3A

3A.1 DERIVAClON DE LOS ESTIMADORES


DE MINIMOS CUADRADOS
Derivando parcialmente (3.1.2) con respecto a PI y Pl se obtiene

~~ -2 L Oí-PI-P
ap;- 1 XJ=-2 ~:e, .(1)
a[ el)
aPl,
. 8 8
-2 ¿ (Y,-PI-P1XJX,= -2 ¿ e,X, (2)

Igualando estas dos ecuaciones a cero y después de algunas simplificaciones y


manipulaciones algebraicas, se obtienen los estimadores que se dan en las
ecuaciones (3.1.6) y (3.1.7).

3A.2 LAS PROPIEDADES DE LINEALIDAD E INSESGAMIENTO DE


LOS ESTIMADORES DE MINIMOS CUADRADOS ORDINARIOS
A partir de (3.1.8) tenemos

(3)

donde
X,
k,= <L xf)
10 cual muestra que Pl eS'un estimador lineal. puesto que .es una función lineal
de Y; en realidad, es un promedio ponderado de Y" donde k, representa las
diferentes ponderaciones. Se puede demostrar en forma similar, que 11 tam-
bién es un estimador lineal.
EL MODELO DE REGRESION CON DOS VARIABLES: EL PROBLEMA DE LA ESTIMACION 85

A propósito, obsérvense las siguientes propiedades de k i :


(i)puesto que se supone que las Xi no son estocásticas, las k¡ tampoco lo
son, consecuentemente.
(ii) L k¡=O;
000) '" k 2
(IJI t... ¡ =¿ 1xl; .
(iv) L k¡x¡= L k¡X¡= 1. Estas propiedades se pueden verificar directamente
partir de la definición de k¡.
Por ejemplo, ,
L k.= L (~)=_'1_ L x. puesto que para una muestra
• I L xl L xl determinada se conoce L xl
l'

=;0, dado que ¿ Xi' la suma de las desviaciones


de los valores promedio, siempre es igual a
cero.
Sustitúyase ahora la FRP Y¡=Pl +P2X¡+U¡ en (3) para obtener
P2=L k~Pl +P2 X ¡+U¡)
=Pl L k¡+P2 Lk¡X¡+ L k¡u¡
=P2+ L k¡u¡ (4)

donde se utilizan las propiedades de k¡ mencionadas anteriof111ente.


Ahora, tomando la expectativa de (4) a ambos lados de la ecuación y
considerando que las k¡ no son estocásticas y que, por consiguiente, pueden
considerarse como constantes, obtenemos
E(P2)=P2 + L k¡E(u¡)
=P2 (5)

puesto que se ha asumido que E(u¡) = O. Por tanto, P2es un estimador inses-
gado de P2' De la misma manera, se puede demostrar que PI también es un
estimador insesgado de PI'

3A.3 VARíANZAS y ERRORES ESTANDAR


DE LOS ESTIMADORES DE MINIMOS CUADRADOS
De la definición de varianza,
var (P2) = E[P2 -EW2W
=E(P2-~)2, puesto que E(P2)=P2
=E(L k¡UJ2, utilizando la eco (4) anterior.
=E(kiui +k~ u~ + ... +k~'U~+2klk2 U{U2 + ... +2kN-1kNuN-IUN) (6)
86 MOD~LOS UNIECUACIONAlES DE REGRESION

Como se ha supuesto que E (uf) == (J2 para cada i y E(u¡ uj) = 0, i 1: j, se deduce
que

=.;
Lo
2


2' (usando la definición de k1 )
= ecuación (3.3.1) (7)

La varianza de Pi se puede obtener utilizimdo el mismo tipo de racioci-


nio. Una vez obtenidas las varianzas de Pi y Pl se pueden obtener los errores
estándar correspondientes tomando las raíces cuadradas respectivas.

Covarianza entre P1Y P2


Por definición, .
cov (Pi' P2)=E[(Pl-EWlxPl-E(P2)]
= E<fll - fJl'lfll- fJl)( ¿Por qué?)
= - XEW2 - (Jl)l
= -X var Wl)
= ecuación (3.3.9) (8)
donde se utiliza el hecho de que Pi = y -Jl X y E(1) = y - (Jl X, que es igual
a Wl- E(1)= -XW1-{Jl).

3A.4 EL ESTIMADOR DE MINIMOS CUADRADOS PARA (J2


No olvide que
(9)
Por tanto,
(10)
Restando (10) de (9)
(11)
Recuérdese también que
e¡=Y¡-P1X¡ (12)
Por tanto, remplazando (11) en (12)
e¡={Jlx¡+(U¡-ü)-p1x¡ (13)
Agrupando términos, elevando al cuadrado y sumando a ambos lados, obten-
dremos
L el=Wl-{Jl)l L xl+ L (u¡-ü)l-2Wl-{Jl) L x~u¡-ü) l14)
EL MODELO DE REGRESION CON DOS VARIABLES: EL PROBLEMA DE LA ESTIMACION 87

Tomando el valor esperado a ambos lados,


E(¿ et)=¡: XtE(P2-P2)2+E[¿ (u¡-t)2]-2E[(P2-P2) ¿ xlu¡-·ü)]
= A + B + C (15)

Apelando a los supuestos del modelo de regresión lineal clásico, así


como' a algunos resultados obtenidos~nteriormente, es posible' verificar que
A=q2
B=(N _1)q2
C=-2 q 2
Por tanto, remplazando estos valores en (15) obtendremos
E(¿ et)=(N _2)q2 (16)
Consecuentemente, si 'definimos
~2
q=~
~ ef (17)
N-2
Su valor esperado es

(18)

lo cual demuestra que (¡2 es un estimador insesgado del verdadero q2,

3A.S LA PROPIEDAD DE LA VARIANZA MINIMA


DE LOS ESTIMADORES DE MINIMOS CUADRADOS
Se demostró en el Apéndice 3A, Sección 3A.2, que el estimador P2 de míni-
mos cuadrados era lineal e insesgado (esto es también válido para PI)' Para
mostrar que estos estimadores tienen varianza mínima dentro de la clase de
todos los estimadores lineales insesgados, consideremos por un. momento el
estimador $2: .

donde
Xi-X Xi
ki =¿ (X¡-X)2 ¿ xf (véase Apéndice 3A.2) (19)

lo cual muestra que $2' e's un promedio ponderado de las Y con las Ki sirvien- '
do como ponderaciones.
Definamos un estimador lineal alterno defJ2 en la siguiente forma:
(20}
, donde Wi son también ponderaciones, no necesariamente iguales a k i . Ahora
bien,
88 MODELOS UNIECUACIONALES DE REGRESION

E(fJ~) = L Wi E( lí)
= L W¡(fJl + {J2 XI)
=fJl L WI+{J2 L w¡X¡ (21)
Por tanto, para que {J~ sea insesgado se requiere que
LW¡=O (22)
y que
(23)
Ahora
var (fJ~) =var L W i lí
=L w~ var lí

=(12 r-(Wi-LX~f +i~fr(N6tese la manipulaci6n matemática)


2 ~( Xi )2 2 L xf 2 ~ ( X¡ )( X¡ )
=(1 '-' w¡-LX~ +(1 (LX~)2+2(1 '-' w¡-Ix; Ix;
2~ ( Wi -
Xx;
i )2 2(Ix;
1 ) (24)
=(1 '-'
I +(1

por .cuanto el último ténnino desaparece en el penúltimo paso (¿Por qué?)


Ya que e1.último ténnino en (24) es constante, la varianza de (fJ!) puede
minimizarse únicamente manipulando el primer ténnino. Si hacemos a

la ecuaci6n (24) se reduce a


(12
var (fJ!) =~ 2
'-' Xi
=var (P2) (25)

Puede decirse entonces que con ponderaciones WI = k" que son las pondera-
ciones de mínimos cuadrados, la varianza del estimador lineal {J! es igual a la
varianza del estimador de mínimos cuadrados P2; de otra manera, var ({J!»
var (P2)' Dicho de otra manera, si hay un estimador lineal insesgado de {J2 de
varianza mínima, éste debe ser el estimador de mínimos cuadrados. Igualmtm-
te, pu'ede demostrarse que PI' es un estimador lineal insesgado con varianza
mínima de {JI'
El MODELO DE REGRESION CON OOS VARIABLES: EL PROBLEMA DE LA ESTIMACION 89

3A.6 LISTADO SAS PARA LA FUNCION


DE ~EMANDA DE CAFE (3.7.1)
Puesto que esta es la primera vez que presentamos un listado producido por
. SAS, vale la pena comentar brevemente sobre el niismo. Los resultados se ob-
tienen del procedimiento REGRESSION de SAS. La variable dependiente es
y (tazas al día por persona) y el regresor es X 2 [Precio al detal real promedio,
$ por lb. Nótese que ésta es la variable X en (3.7.1)1. Con el fin de facilitar la
exposición, el listado se ha dividido en seis partes. Obsérvese que aparece un
buen número de cifras decimales en el listado, aunque en la práctica no se
requieren de más de cuatro o cinco.

Parte 1: Muestra la tabla del análisis-de varianza (ADV), la cual se analiza


en el Capítulo 5.
Parte 11: Root MSE significa la raíz cuadrada del error promedio al cua-
drado (= a2 ), es decir, el error estándar de la estimación a.
Dep Mean significa el valor medio o promedio de la variable
dependiente, y (= Y).
C. V. es el coeficiente de variación, definido como (a/Y) x 100, ex-
presa la variabilidad no explicada que permanece aún en la in-
formación (v.gr., en la variable Y) en relación con el valor
promedio f.
R 2 = Coeficiente de determinación
R2 = R 2 ajustado
Parte IlI: Muestra los valores estimados de los parámetros, sus errores
estándar, sus razones t y el nivel de,significancia de las mismas.
Estas últimas dos se analizarán extensamente en el Capítulo 5.
Parte IV: Nos proporciona lo que se conoce como la matriz de varianza
-ca varianza de los parámetros estimados. Los elementos sobre
la diagonal que van de la esquina superior izquierda a la es-
quina inferior derecha muestran las varianzas (v.gr. los cua-
drados de los errores estándar dados en la Parte III), 22 mien-
tras que los elementos que están fuera de la diagonal represen-
tan las covarianzas entre los para metros estimados; en este
caso, cov (¡JI' P2)' como se definió en (3.3.9).
Parte V: Muestra los valores reales pará Yi y Xi, los valores estimados de
y (= f¡) y los residuos e¡=Oí- ~).
Parte VI: Presenta el estadístico d de Durbin-Watson y el coeficiente de
autocorrelación de primer orden, temas que se analizarán en el
Capítulo 10.
90 MODELOS UNIECUACIONALES DE REGRESlON

SUMOF
SQUAAES.
1 '0.292975
, 0.149080
10 0.442055
0.128703
2.208364
5.833255

PARAMETER STANOARD' TFOR ttO:


UIVARIAB1..E DF ESTIMA TE ERROR PARAMETER-O
INTERCEP 2.691124 0.121622
X -0.479529 0.114022

IV
COVB INTERCEP X
INTERCEP 0.01479203 -0.0131428
X -0.0131428 0.0130Q097

OBS y X' YHAT ···'tAESID


\¡, . 1 2.57 0.77 2.32189 ~U
2 2:50 0.74' 2.33627 0:16313
3 2.35 0.72 2.34586 O.()f)414
4 2.30 0.73 2.34107 -0.04107
5 -2.25 0.76 2.32668 -0.07ees
S 2.20 0.75 2.33148 ,....n.13148
7 2.11 1.08 2.17323 -0.08323
8 1.94. 1.81 1.82318 0,11682
9 1.97 . 1.39 '
/Í'
"a024li8 :"'0.05458
10 2,06 1.20 ~~1_ -0.05569
11 2.02 1.17 , it.13007 ":':0.11007

'.:' .JJt.I.R8IN.WAlSON d 0.727


A~i,' ¡i:¡8'fORDERi AUTOCORAel.AllON 0.390
CAPITULO 4
EL SUPUESTO DE
NORMALIDAD:
EL MODELO CLASICO
DE REGRESION
LINEAL NORMAL

En este capítulo continuamos utilizando· el modelo clásico de regresión lineal


con dos variables, pero suponemos. que las perturbaéiones Uf de ]a población'
están· distribuidas normalmente. Este modelo' recibe el nombre de modelo
cldsico de regresión lineal nonnal con dos variables. En las secciones que se
presentan a continuación ofrecemos una justificación del supuesto de norma-
lidad para Ut, haciendo énfasis en las consecuencias del mismo.

4.1 LA DISTRIBUCION PROBABILISTKA DE LAS


PERTURBACIONES Uf
Recordemos que la aplicación del método de los mínimos cuadrados ordina-
rios (MCO) al modelo de regresión lineal clásica, no tuvimos que hacer su-
puestos con respecto a la distribución probabilística de las perturbaciones Ut.
Los únicos supuestos que se formularon con respecto a éstas eran las que
tenían un valor esperado igual a 0, no estaban correlacionadas y' tenían una
varianza constante. Con estos supueftos vimos (en el Capítulo 3) que los esti-
madores de MeO Pl' $2' y a2 satisfacían diferentes propiedades estadísticas
muy deseables, tales como. las de insesgamiento y varianza mínima. Si nues-
tro objetivo es únicamente la estimación puntual el método de MCO será
suficiente; sin embargo, la estimación puntual ·es sólo la formulación de un
91
92 MODELOS UNIECUACIONALES DE REGRESION

aspecto de la inferencia estadística; el otro tema tiene que ver con las llama-
das pruebas de hipótesis. 1
Por tanto, nuestro interés no consiste solamente en obtener, por ejem-
plo, P2' sino en utilizar dicha estimación para hacer enunciados o inferencias
sobre el valor verdadero de /32 . En términos más generales, nuestra meta con-
siste no sólo en obtener la función de regresión muestral (FRM), sino utili-
zarla para realizar inferencia sobre la función de regresión poblacional (FRP),
como se explicó claramente en el Capítulo 2.
Siendo entonces nuestro objetivo tanto la estimación como la inferencia
a través de pruebas de hipótesis, necesitamos especificar la distribución pro-
babilística de las perturbaciones Uf. ¿Por qué? La razón es sencilla. En el
Apéndice 3A, Sección 3A. 2, se demostró que los estimadores PI y P2 de
MeO son funciones lineales de las U¡, los cuales son a su vez aleatorios según
el supuesto que se planteó en su momento. 2 En consecuencia, las distribu-
ciones muestrales probabilísticas de los estimadores de MCO dependerán de
los supuestos que se formularon acerca de la distribución probabilística de
u/. y puesto que las distribuciones probabilísticas de estos estimadores son
necesarias para realizar inferencias sobre sus valores pOblacionales, la natura-
leza de la distribución probabilística de U¡ juega un papel muy importante
para la realización de pruebas de hipótesis. .
Dado que el método de MCO no formula ningún supuesto sobre la natu-
raleza probabilística de Uf, no es de mucha ayuda para obtener inferencias
sobre la FRP a partir de la FRM, a pasar del teorema de Gauss-Markov. Este
vacío puede llenarse si aceptamos que las u se basan en algún tipo de distri-
bución probabilística. Por razones que se explicarán muy pronto, en el con-
texto de análisis de regresión normalmente se supone que las u poseen una
distribución normal.

4.2 EL SUPUESTO DE NORMALIDAD


La regresión lineal normal clásica supone que cada u está distribuido normal-
mente con
Media o valor esperado: E(u¡) = O (4.2.1)
2
Varianza: E(uf) = u (4.2.2)

1 La que se ha venido a conocer corno teor{a clásica de la inferencia estadfstica consta de dos ramas:
la estimación (tanto puntual corno por intervalos) y las pruebas de hipótesis. La estimación puntual
. se mencionó en el Capítulo 3. Los ternas de estimación por intervalos y de pruebas de hipótesis, los
cuales están íntimamente ligados, se analizarán extensamente en el Capítulo S. Por ahora es suficiente
observar que en las pruebas de hipótesis generalmente estarnos interesados en la relación existente
entre las cantidades poblacionales (parámetros) y sus contrapartes muestrales (estimadores).
2 Nótese que estos estimadores en realidad son funciones lineales de la variable dependiente Y. Sin
embargo, Y es en sí misma una función lineal de u, corno se postuló en (2.4.2). Por tanto, los esti-
madores son, en última instancia, funciones lineales de u, la cual se ha asumido que es aleatoria. (Véase
ecuación 4 en el Apéndice 3A, Sección 3A.2)
EL SUPUESTO DE NORMALIDAD: EL MODELO CLASICO DE REGRESION L1NEAI.,NORMAL 93

i "" j (4.2.3)
Estos supuestos se pueden resumir y expresar de la siguiente forma:
U¡ -: N(O, 0"2) (4.2.4)
donde""" significa "distribuido" y N significa" distribución nonnal", en tanto
que los términos entre paréntesi~ representan los dos parámetros de la distri-
bución normal: la media y la varianza. .
A propósitQ, se puede observar que para dos variables con distribución
nonnal, una covarianza o co"elación de cero implica. independencia entre las
dos variables. En consecuencia, con el supuesto de normalidad (4.2.3) se
plantea que Ui Y u¡ no solamente no están correlacionadas sino que también
están distribuidas en forma independiente. (Véase Ejercicio 4.1 del Apéndice
4A).
¿Por qué razón plantear el supuesto de normalidad? Existen varias ra-
zones.
1. Como se sefialó en la Sección 2.5, Ui representa la influencia combinada
(sobre la variable dependiente) de un gran número de variables indepen-
dientes que no se introducen explícitamente en el modelo de regr.Qn.
Como se explicó, asimismo se esperaba que la influencia de estas variables
omitidas o no tenidas en cuenta fuera pequefia y, en el-mejor de los casos,
aleatoria. Ahora, gracias ai conocido teorema del límite central de la esta-
dística, se puede demostrar que si existe un número apreciable de variables
aleatorias independientes e idénticamente distribuidas, entonces, con
unas pocas excepciones, la distribución de su suma tenderá a 'seguir una
distribución normal a medida que el número de estas variables aumenta
indefinidamente. 3 Es precisamente este teorema del límite central el que
proporciona una justificación teórica para el supuesto de normalidad de
Ui'
2. Una variante del teorema del límite central afirma que aunque el número
de variables no sea muy grande o si estas variables no son estrictamente
independientes, su suma puede seguir teniendo una distribución norma1. 4
3. Con el supuesto de normalidad se pueden obtener fácilmente las distribu-
ciones probabilísticas de los estimadores de MCO, debido a que es una
propiedad de la distribución nonnal que cualquier función lineal de varia-
bles nonnalmente distribuidas también esté nonnalmente distribuida.
Posteriormente se demuestra que, bajo el supuesto de normalidad de Ui,
los estimadores PI y P2 de MCO también tienen una distribución normal.

3 Para una discusi6n relativamente sencilla del teorema, véase Harold Cramer, The Elementl of Proba-
bUity Theory and SomeofltlApplicationl, John Wiley & Sons, Inc., Nueva York, 1955, pp.114-U6.
Unaexcepci6n al teorema es 18 distribución de Cauchy; véale, M. G. Kendall yA. Stuart, The advan-
ced The¿ry 01 Statilticl, Charles Griffm & Company, Ltd., Londres 1960, vol. 1, pp. 248-249.
4 Para las distbttas formas de teorema del límite central, véale Harold Cramer, Mathematical Methodl
01 Statisticl, Princeton University Press, Princeton, N.J., 1946, Cap. 17.
94 MODELOS UNIECUACIONALES DE REGRESION

4. Finalmente, la distribución normal es una distribución comparativamente


sencilla que involucra sólo dos parámetros (media y varianza); es además
bien conocida y sus propiedades teóricas se han estudiado extensamente
en la estadística matemática.

4.3 PROPIEDADES DE LOS ESTIMADORES DE MeQ BAJO


EL SUPUESTO DE NORMALIDAD
Con el supuesto de normalidad, los estimadores PI' P2 Y(72 de MCO tienen las
siguientes propiedades estadísticas: s
1. Son insesgados.
2. Tienen varianza mínima. En combinación con 1, lo anterior implica que
son insesgados con varianza mínima, es decir, que son estimadores efi-
cientes.
3. Consistencia; a medida que el tamafto de la muestra aumenta indefinida-
mente, los estimadores convergen hacia sus valores poblacionales verda-
deros.
4. ~I está normalmente distribuida con
Media: E(PI) = PI (4.3.1)

var (p¡): (4.3.2)

o, en forma abreviada
PI '" N(Pl> al)
Entonces, de acuerdo con las propiedades de la distribución normal, se
define la variable Z como:

(4.3.3)

que tiene una distribución normal estandarizada, esto es, una distribu-
ción normal con una media de cero y una varianza unitaria (= 1):

Z '" N(O, 1)
En términos geométricos, la distribución probabilística de PI se pue-
de'ilustrar de la 'siguiente forma:

5 Las propiedat\es estadísticas de los estimadores se analizan en detalle en el Apéndice A.


EL SUPUESTO DE NORMALIDAD: EL MODELOCLASICO DE REGRESION LINEAL NORMAL 95

!(Z>

al-fJl
~----~--~~------------Z=--.-
tlp,

FIGURA 4.1
La distribución probabilística de , •.

~~--------~--------------~
!(Z>

FlGURA4,2 .
La distribuci6n probabibstica de $2.
96 MODELOS UNIECUACIONALES DE REGREStOti

S. P2 está normalmente distribuida con


Media: E<P2) = P2
(4.3.4)

o, más brevemente,

por tanto, como en (4.3.3),

(4.3.5)

también sigue una distribución normal estandarizada.


En términos geométricos, en la Figura 4.2 se ilustra la distribución
probabilística de P2 .
6. (N - 2)82/(]2 sigue una distribución X2 (Ji-cuadrado) con N - 2 g de l.
7. <PI' P2) están distribuidas independientemente de a2.
8. P1 Y P2 tienen varianza mínima entre toda clase de estimadores insesga-
dos, lineales o no lineales. Este resultado, desarrollado por Rao, es muy
poderoso porque, a diferencia del toerema de Gauss-Markov, no está res-
tringido a la clase de estimadores lineales únicamente. 6 Por tanto, pode- .
mos decir que los estimadores de mínimos cuadrados son los mejores
estimadores insesgados (MEl).
Las pr.opiedades de insesgamiento y de varianza mínima de los estima-
dores de MCO se demostraron en el Apéndice 3A, Sección 3A. 2. Es fácil
comprobar que PI y P2 tienen una distribución normal. Como se observó en
el Capífu10 3, PI y $2 son funciones lineales del 'término de perturbación
estocástica U¡ (véase Función 2). Puesto que los U¡ se suponen distribuidos
normalmente, entonces, de acuerdo con la regla de que cualquier función
lineal de variables normalmente distribuidas es asimismo normalmente dis-
tribuida, se concluye que PI y P2 son asimismo normalmente distribuidas con
las medias y varianzas antes mencionadas. La prueba de la aflrmación de que
(N - 2)c12/0 2 sigue una distribución t con N - 2 g de 1 es un poco mas ela-
borada y puede encontrarse en las referencias. 7
El punto que merece mayor atención consiste en que el supuesto de
normalidad pos permite obtener las distribuciones probabilísticas de PI (nor-

6C.R. Rao. Li~ear Statisticallnference and lts Applications, John Wiley & Sons, Ine., Nueva York,
1965, p. 258.
7 V~ase, por ejemplo, Robert V Hogg y Allen T. Craig, lntroduction to Mathematical Statistic" 2a.
ed., The Macmillan Company, Nueva York, 1965, p. 144. .
EL SUPUESTO DE NORMALIDAD: EL MODELO CLASICO DE REGRESION LINEAL NORMAL 97

mal), $2 (normal) y a2 (Ji-cuadrado). ,Esto simplifica la tarea de establecer


intervalos de conflallZa y llevar a cabo pruebas de hipótesis (estadísticas)
corno veremos en el Capítulo 5. .
A propósito, obsérvese que si suponemos que u, tiene una distribución
normal con una media de cero y una varianza de (12, entonces, Y, posee tam-
bién una distribución normal con una media y una varianza dadas por
Media: 'E(Yi) = Pi + P2 X ¡ (4.3.6)
var (Yi) = (12 (4.3.7)
Más brevemente, podernos escribir
tí - N(Pi + P2X¡, (12) (4.3,8)
La prueba de la ecuación (4.3.8) se deduce del hecho de que cualquierfun-
ción lineal de variables con una distribución normal posee también una dis-
tribución normal.

4.4 EL METOno DE MAXlMA VEROSIMILITUD (MV)


Un método de estimación puntual, con algunas propiedades teóricas más
fuertes que las del método de MCO, es el método de máxima verosimüitud
(MV). Puesto que el método es ligeramente complicado, se analiza en detalle
en el apéndice de este capítulo. Para el lector con sólo un interés~ general.
será suficiente con tener claro que si se formula el supuesto de que Uf tiene
una distribución normal, por razones ya analizadas, los estimadores de los
~oeficientes de regresión del modelo MV y de MCO. las P' serán idénticas,
:anto para el caso de regresión simple corno para el de regresión múltiple.
~l estimador de MV para (12 es L efjN.Este"estimador es sesgado~ mientras el
stimador de MeO para (12 = L er/(N - 2) es como hemos visto, insesgado.
in embargo, al comparar estos dos estimadores de (12, se puede apreciarque
medida que auItlenta el tamafio de la muestra, los dos estimadores de (12
mden a ser iguales. Por tanto, asintóticamente, (es decir, a medida que N
menta indefmidamente), el estimador MV de (12 también es insesgado. .
Dado que el método de mínimos cuadrados, sumado al supuesto adicio-
\ de la normalidad de Ut nos proporciona todas las ·herramientas necesarias
'a llevar a cabo la estimación y las pruebas de hipótesis necesarias de los
delos de regresión lilleal, no existe problema alguno para lectores que no
~en continuar usando el método de máxima verosimilitud debido a su
ra complejidad matemática.

RESUMEN Y CONCLUSIONES
ste capítulo consideramos nuevamente el modelo clásico de regresión
\ normal. Este modelo difiere del modelo considerado en el Capítulo 3
que se asume que las perturbaciones poblacionales tiene una distribu-
normal. Con este supuesto, vimos que los estimadores del modelo de
para Pto P~, y(lZ siguen distribuciones probabilísticas muy bien cono-
98 MODELOS UNIECuACIONALSS DE REGRESION

cidas. Esto simplifica de. manera conside~ble nuestra tarea aemferenCÍa esta-
dística, es decir, la estimación de parámetros, así como la posibilidad, de
llevar a cabo pruebas de hipótesis de dichos parámetros, como se demostrará
en el Capítulo S. .
Asimismo, se describió muy brevemente un método alterno para la esti-
mación puntual conocido como método de mtxima verosimilitud. Sin em-
bargo, con el supuesto de nohiuiUdad, los estimadores de MV generalmente
son iguales a los estimadores de MCO. Por tanto, en este texto no utilizare-
JIlOSJ~xplícitamente este método aunque será introducido en los apéndices a
ínedidaque SUIja la necesidad, para beneficio de los alumnos que tengan una
mayor hlclinación matemática.

APEMDI~4A~

ESTlMAClON UTILIZANDO ELMETODO DEMAXIMA VEROSIMILITUD


PARt\ UN MODELO DE REGRESION CON DOS VAmABLES
Supong¡anosque.en el modelo con dos variables: y, == P1 + P1X, + u, las
Y, tiener una· distribución normal e independiente,-con una media == P1 + Pl
Xt ,Y' una variánza == aa; [Véase ecuación (4.3.8)]. Como resultado de esto,
J8if\inción de densidád de probabilidad conjunta de y .. Y 2• •••• YN, con base
estJ.a' media y la varianza antes referidas, puede escribirse como
f(Yl' Y;¡, ••.• YNIPl + PaX,. a")
Pero en vista de la indepen4encia de las Y, esta función de densidad de pro-
babilidad conjunta se tonia en el producto de N funciones de densidad indio
viduales. así:
f(lí, 1'2, ... , YN·IJI,·+ P2 X"a")
=f(l'íIJlt + Pa X ,.112)f(Y1IP1 + plX" 0-2) •.• f(YNIPl + P2 X ,.I1") (
2
donde "(V\'
J'
1
A.u=--exp {1
- - (Y, - P1 - p" XJ }
. afo 2 a"
la cual es la función de densidad de una variable con distribución normal c
media y varian~ dadas.
(Nota: exp significa e elevado a la potencia de la e~presión enceltl
entre { }.)
SustituyendQ (21 para cada Y, en (1) obtenemos
EL SUPUESTO DE NORMALIDAD: EL MODELO CLASICO DE REGRESION LINEAL NORMAL 99

f (Yl, Y2 , ... , YNIPl + P2 X ¡, a 2) = 1


¡;;:
aN(y 21t)N
exp {l
- -2 ~ (Yi -
~
PI - P2 X¡)2}
,"
(1

(3)

Si Y 1• Y 2 , .• :, YN son valores conocidos o dados y PI' P2'Y a 2 son desco-


nocidos, la función en (3) se denomina función de verosimilitud, expresada
como L(Pl, P2, (12), Y escrita de la siguiente manera: 1

L(P P ( 2)= 1 exp {_,!r(Yi-PI-P2 X¡)2} (4)


1> 2' (lN(j2rc.)N 2 a2

El método de máxima verosimilitud, como su' nombre lo indica, con-


siste en la estimación de parámetros desconocidos de tal manera que la pro-
babilidad de observar un determinado valor de Y es la más elevada (o máxima)
posible. Es consecuencia, debemos hallar el máximo de la función (4). Este
es un sencillo ejercicio de cálculo diferencial. Para diferenciar dicha ecuación
es más fácil expresar (4) en términos logarítmicos, de la siguiente forma:"
(Nota: In = logaritmo natural).

In L = _ N In (1' _ N In (21t) _ ! ~ (Yi - PI - P2X¡)2


2 2 "'- (12

= _ N In a" _ N In (21t) _! ~ (Yi - P1.- P2 X ¡)2 (5)


2 2 2"" (1'2

Diferenciando (5) parcialmente con respecto a Plt P2 Y (1'2, obtenemos


oIn L 1
-apI- = - -(12 "'-
~ (Yi - PI - p"XiX-l) (6)
.
aIn L 1
ap2 = - (1'2 Lo (Yi - P1 - p" Xi)( - Xi) (7)

alnL N 1 2
aT = - 2(12 + 2(14 L (Yi - PI - P2 Xi) (8)

Igualando estas ecuaciones a cero (la condición de primer orden para


optimización) y permitiendo que /11t H2 y 0'2 denoten los estimadores de MV,
obtenemos:
(9)

1 Por supuesto, si PI' P2 Y al son conocidas pero no se conocen las Y,. (4) representa la función de den-
sidad conjunta, o sea, la probabilidad de observar conjuntamente las Y,
2Puesto que una función logarítmica es una función monotónica, In L logrará su máximo valor en el
mismo punto que L.
100 MODELOS UNIECUACIONAlES DE REGRESION

(10)

(11)

Después de simplificar, a partir de las ecuaciones (9) y (la) se encuentra que:


L Y¡ = NP1 + Pl L X, (12)
L Y¡X¡=P1 LX¡+P1L Xt (13)
las cuales son precisamente las ecuaciones normales de la teoría de mínimos
cuadrados que se obtuvieron en (3.1.4) y (3.1.5). Por tanto, los estimadores
de MV, las po, son las mismas que los estimadores de MeO, o sea, las fJ' dadas
en (3.1.6) y (3.1.7). Esta igualdad no es accidental. Al examinar la función
de verosimilitud (5) puede observarse que el último término entra con signo
negativo. En consecuencia, al maximizar (5) en realidad se está minimizando
este ténnino. Sin embargo, éste es precisamente el enfoque de mínimos cua-
drados, como se puede apreciar en (3.1.2).
Al sustituir los estimadores de MV (=MCO) en (11) y simplificar la ex-
presión resultante, obtenemos el estimador de MV para al, así:

a2 =!
N
L (l'; - P1 - P2XJ2
1
=-L(l';-P1-P2 X J2
N
1
= N Let (14)

Se deduce de (14) que el estimador a2 de MV"difiere del estimador a2 =


l: et/(N -2) de MeO,del cual se demostró en el Apéndice 3A, Sección 3A.4
que era un estimador insesgado de a2 • Esto significa que el estimador de MV
de a2 es sesgado. La magnitud de este sesgo se puede determinar fácilmente
de la siguiente manera:
Tomando la esperanza matemática de (14) en ambos lados de la ecua-
ción, obtenemos:
E(a 2 ) = !N E(l: en

= (N; 2) al, utilizando la ecuación (16) del Apéndice 3A,


Sección 3A.4
(15)

lo cual demuestra que a2 es sesgado hacia ab~o en muestras pequeflas. Pero


obsérvese que a medida que N, el tamafto de la muestra, aumenta indefmi-
EL SUPUESTO DE NORMALIDAD: EL MODELO CLASICO DE REGRESION LINEAL NORMAL 101

damente, el segundo término en (15), el factor de sesgamiento, tiende a cero.'


En consecuencia, asintóticamente (es decir, para una muestra muy grande),
u2 también es insesgado, es decir, lím E(¡¡2) = (12 a medida que 'N -+ oo. Se pue-
de demostrar además que u2 también es un estimador consistente,3 es decir,
a medida que N aumenta indefinidamente, u2 converge a su verdadero valor
de u 2 •

EJERCICIOS DEL APENDICE 4A *


4.1. "Si dos variables aleatorias son ,estadísticamente independientes, el, coeficiente de
correlación entre las dos es cero. Lo contrario, sin embargo, no es necesariamente
cierto; una correlación igual a cero no irilplica independencia estadística. No obs-
tante, si dos variables tienen una distribución normal, una correlación de cero nece-
sariamente irilplica independencia estadística". Verifique esta aIrrmación para la
siguiente función de densidad de probabilidad conjunta de dos variables normalmente
distribuidas r; y ~. (Esta función de densidad de. probabilidad conjunta se conoce
como lafuncion densidad de probabüidad nonnal bivariada):

f(Yl' Y2 ) =

1
21t(11(12Jl- p 2
,exp { _ 1 2
2(l-p)
[(lí u-
1
1'1)2 _ 2p (Y1 - J.ll)(l'í - 1'2) + (Y2 - J.l2)·2J}
(11(12 (12

donde 1'1 = media deY1, 1'2 =Y2 , (11 =desviación del estándar de Y1, (12 = desviación
estándar de ~ y p = coeficiente de correlación entre r; y ~.
4.2. Al aplicar las condiciones de segundo orden para la optirilización (es decir, la prueba
de la segunda derivada), demuestre que los estimadores de MV de PI' P2' Y(12 que se
obtienen resolviendo las ecuaciones (9), (10) Y (11), de hecho maxirilizan la función
(4) de verosirililitud.

3 Puede consultarse un tex,to de estadística para un análisis de las propi~dades de los estimadores de
máxima verosimilitud, así como también de la distinción entre insesgamiento asintótico y consistencia.
En términos generales, en el insesgamiento asint6tico tratamos de averiguar el Iím E(c7~) a medida que
N tiende a infinito, siendo N el tamaño de la muestra en la que se basa el estimador, mientras que en
la consistencia tratamos de averi¡uar cómo se comporta c7~ a medida que N aumenta indefinidamente.
Obsérvese que la propiedad de insesgamiento es una propiedad del muestreo repetid9 para un estima-
dor, basada en una muestra de un tamafio dado, mientras que la consistencia tiene que ver con el com-
portamiento de un estimador a medida que aumenta indefinidamente el tamaño de la muestra.
• Opcional.
CAPITULO 5
REGRESION CON
DOS VARIABLES:
ESTlMACION POR
INTERVALOS y
PRUEBA DE
HIPOTESIS

Como se señaló en el Capítulo 4, la estimación y la prueba de hipótesis cons-


tituyen las dos ramas principales de la estadística clásica. La teoría de la esti-
mación consta de dos partes: estimación puntual y estimación por intervalos.
La primera ya fue estudiada ampliamente en los dos capítulos anteriores,
donde introdujimos los métodos de MCO y de MV de estimación puntual. En
este capítulo consideramos primero la estimación por intervalos, retomando
a continuación el tema de pruebas de hipótesis, el cual está íntimamente rela-
cionado con la estimación por intervalos.

5.1 ESTIMACION POR INTERVALOS: ALGUNOS CONCEPTOS


BASICOS
Para poner las ideas en orden, consideremos el ejemplo hipotético consumo-
ingreso del Capítulo 3. La ecuación (3.6.1) muestra que la propensión mar-
ginal a consumir (PMC) estimada P2 es de 0.5091, correspondiente a una sola
. estimación (puntual) de la PMC fJ2 poblacional desconocida. ¿Qué tan con-

1 En el análisis siguiente se supone que el lector está familiarizado con los conocimientos básicos de la
inferencia estadística, tales como el intervalo de COnfl8llZ8, la prueba de hipótesis, el nivel de signifi-
cancia o la probabilidad de los errores de tipos 1 y n, entre otros.

102
REGRESION CON DOS VARIABLES: ESTIMACION POR INTERVALOS Y PRUEBA 103

ftab1e es esta estimación? Corno se mencionó en el Capítulo 3, debido a fluc-


tuaciones muestraIes, es posible que una sola estimación diftera del valor ver-
dadero, aunque en un muestreo repetido se espera que su valor medio sea
igual al valor verdadero. (Nota: E(#2) = P2 ). En estadística, la c<?nfiabilidad
de un estimador puntual se mide a través del error estándar o la varianza. Por
tanto, en lugar de basarse únicamente en ·la estimación puntual, podernos
proporcionar la probabilidad de que el verdadero parámetro se encuentre
dentro de cierto rango, alrededor del estimador de punto, digamos, por ejem-
plo, entre dos y tres errores estándar. Esta es, a grandes rasgos, la idea funda-
mental de la estimación por intervalos.
Para ser más específicos, supongamos que se desea averiguar qué tan
"cerca" está, por ejemplo, #2 de fJ2' Con esté fin, podernos tratar de encon-
trar dos números positivos ~ y IX, donde este último se encuentra entre O y
1, de tal manera que la probabilidad de que d intervalo aleatorio ($2 - ~, P2 +
~) contenga el valor verdadero de P2 sea 1 - IX. En símbolos,

Pr (P2 - ~ : :; P2 : :; P2 + ~) = 1 - IX (5.1.1)
Tal intervalo, si éste existe, se conoce corno intervalo de confianza; a 1 - IX
se le denomina coeficiente de confianza y a(O < IX < 1) se conoce corno nivel
de significancia. 2 Los dos extremos del intervalo de conftanza se conocen
corno lfmites ..de confianza (también denominados valores crfticos), en don-
de P2 - ~ corresponde al límite de· conFzanza inferior y P2 + ~. al limite
de confianza superior. A propósito, nótese que en la práctica I! y 1 - IX con
frecuencia se expresan a formas de porcentaje corno 1001X y 100 (1 - IX)
por ciento.
La ecuación (5.1.1) muestra que un estimador de intervalo, en contraste
con un estimador· puntual, es un· intervalo construido de tal manera que
tenga una probabilidad específica 1 - IX de incluir dentro de sus límites el
valor verdadero del parámetro. Por ejemplo, si IX = 0.05, o 5%, (5.1.1) sería:
la probabilidad de que el intervalo (aleatorio) que se muestra allí inCluya el
P2 verdadero es 0.95 ó 95 %. El estimador de intervalos proporciona enton-
ces un rango de valores dentro de los cuales se puede encontrar el valor ver-
dadero de P2 .
Es muy importante conocer los siguientes aspectos en la estimación por
intervalos:
1. La ecuación (5.1.1) no dice que la probabilidad de que P2 se encuentre en-
tre los'límites dados sea 1 -IX. Puesto que seha asumidoqueP2,'aunquees
un valor desconocido, es un número fijo, entonces se dice que está o no
está dentro del intervalo. Lo que dice (5.1.1) es que al utilizar el método
descrito en este capítulo, la probabilidad de construir un intervalo que
contenga P2 es 1 - IX.

2 También conocida como probabilidad de cometer el error de tipo L El error de tipo I consiste en
rechazar una hipótesis verdadera, mientras que el error de tipo Uconsiste en aceptar una hipótesis
falsa.
104 MODELOS UNIECUACIONALES DE REGRESION

2. El intervalo (5.1.1) es un intervalo aleatorio, 10 cual implica que éste va-


riará de una muestra a otra debido a .que está basado en $2' la cual es
aleatoria. (¿Por qué?).
3. Puesto que el intervalo de confianza es aleatorio, los enunciados proba-
bilísticos 'que le corresponden deben entenderse en un sentido de largo
plazo, es decir, para muestreos repetidos. Más específicamente, (5.1.1)
implica que siwconstruyen repetidamente intervalos de confianza como
el anterior con base en la probabilidad 1 - oc ,entonces, a largo plazo,
en promedio, tales intervalos contendrán en 1 - oc de los casos el verda-
dero valor del parámetro.
4. Como se mencion6 en 2, el intervalo (5.1.1) es aleatorio mientras P2 sea
desconocido. Pero una vez especificada la muestra y obtenido un valor
numérico específico para P2' el intervalo ~(5.1.1) deja de ser aleatorio
siendo entonces fijo. En este caso no podemos hacer la afmnaci6n proba-
bilística (5.1.1); ·no se puede decir que la probabilidad de que un determi-
nado intervalo fijo incluya el valor verdadero de P2 es de 1 - oc : en esta
situación, {J2 está dentro o fuera del intervalo fijo. Por tanto, la probabi-
lidad es 1 6 O. En consecuencia, en el caso hipotético de nuestro ejemplo·
consumo-ingreso, si el intervalo de confianza del 95% que se obtuviera
para (0.4268 ~ (J2 ~ 0.5914), como el que se obtendrá en (5.3.9), no po-
demos decir que existe un 95 % de probabilidad de que el verdadero valor
de P2 se encuentre en este intervalo. La probabilidad es de 1 6 O.
¿C6mo se construyen los intervalos de confianza? A partir del análisis
anterior es de esperarse que si se conocen el muestreo o las distribuciones
probabilísticas de los estimadores, se pueden hacer afirmaciones sobre el in-
tervalo de confianza similares a (5.1.1). En el Capítulo 4 vimos que bajo el
supuesto de normalidad de las perturbaciones U¡, los estimadores MCO P1 y
P2 poseen en sí mismos distribuciones normales y que el estimador de MCO
el 2 sigue una distribución X2 (ji-cuadrado). Parecería entonces que la tarea de
construir intervalos de confianza es sencilla. Aunque éste puede ser el caso,
es preciso realizar una breve exposici6n y considerar algunas de las distribu-
ciones probabilísticas relacionadas con la distribución normal que nos serán
de gran utilidad más adelante.

5.2 DISTRIBUCIONES NORMALES t, X2 , y F


BREVE EXPOSICION
En el Capítulo 4 se introdujo el concepto de la distribución normal; de otro
lado, algunas distribuciones relacionadas con la distribución normal se pre-
sentan a través de los siguientes teoremas, sin incluir las pruebas correspon-
dientes.!

! Pata una pn¡eba de los teoremas, vme Alexander M. Mood, Frank1in A. GtaybUl y Duane C Boes
ITltroductlon to me Theory of Sttztiltlc" 3a. ed., McGraw-HiU Book Company, Nueva York, 1974,
pp. 239-249.
REGRESIONCON DOS VARIABLES: ESTIMACION POR INTERVALOS Y PRUEBA 105

Teorema 5.1. SiZI' Z2 • .... ZN son variables aleatoriasconunadistribuciónnonnal


e independiente de la formaz¡- N(p¡, u¡)entonces la suma Z = L k¡Z¡, donde k,
son constantes sin ser todas cero, también está normalmente distribuida con una
media L k¡Jl¡ Y una varianza L kfuf; es decir, Z ~. N(L k¡Jl¡, L k¡u:).

En resumen, las combinaciones lineales de variables normales también


poseen una distribución normal. Por ejemplo, si Zl y Z2 poseen distribucio-
nes normales e independientes del tipo Zl '" N(l O, 2) y Z2 '" N (8, 1.5); en-
tónces la combinación lineal Z = 0.8Z 1 + 0.2Z2 también posee una distribu-
. ción normal con una media = 0.8(10) + 0.2(8) = 9.6 y una varianza = 0.64
(2) + .0.04(1.5) = 1.34, es decir, Z '" N (9.6,1.34).
Teorema 5.2. Si Z¡, Z2' ... , ZN son variables aleatorias con distribución normal e
independiente, de tal forma que cada Z¡ - N(O,l). es decir, que cada una de ellas
es un;! variable normal estandarizada, entoncesIz;= z¡ + zi + ... + Z~tiene una
distribución ji-cuadrado con Ng de 1. Simbólicamente L Z; - X~,donde N denota
los grados de libertad, g de l.
En resumen, "la suma de cuadrados de variables normales estándar inde-
pendientes posee una distribución ji-cuadrado, en donde los grados de liber-
tad son iguales al número de términos en la suma".4
Teorema 5.3. Si Z¡. Z2' ... , ZN son variables aleatorias distribuidas independiente-
mente, cada una con una distribución ji-cuadrado con k i g de 1, entonces la suma
I Z¡ = Z1 + Z2 + ... + ZN también posee unadistribuciónji-cuadrado con k =Lk¡ g,
del 1. .

Por tanto, si Z 1 y Z2 son variables l independientes con k y k g de 1,


respectivamente, entonces Z = ZI + Z2 también eS una variable X2 con(k 1 + k 2 )
grados de libertad. .
Teorema 5.4. Si Z 1 es una variable normal estandarizada [Z1 - N(O, 1)] Y si una se-
gunda variable Z2 posee una distribución ji-cuadrado con k g de 1 y es indepen-
diente de Z¡, entonces la variable que se defme como:

t=
ZI ZIJI<
=--
AlJI< A
variable normal estándar
(5.2.1)
J variable ji-cuadrado independiente/g de 1
sigue una distribución t de 8tudent con k g de l.
Al margen de lo anterior, obsérvese que como k, g de 1 en (5.2.1)
aumenta indefinidamente (es decir, a medida que k ~ (0), la distribución t de
Student se aproxima a la distribución normal estandariZada. s Por conven-

4 lbid., p. 243 .•
5 Para una prueba, véale Henri Theil. Introduction to Econometricl. Prentice-Hall. Inc.• Eriglewood
Clif'f's, N.J., 1978, pp. 237-245. .
106 MODELOS UNIECUACIONALES DE REGRESION

ción, la notación tk implica una distribución o variable t de Student con k g


de 1. .
Teorema S.S. Si Z, y Z, son variables ji-cuadrado distribuidas independientemente
con k, y k, g de 1, respectivamente, entonces la variable

(5.2.2)

tiene una distribución F con k, y k, grados de libertad, donde k, se conoce como


los grados de libertad del numerador y k, como los grados de libertad del denomi-
nador.
Nuevamente, por convención la notación F tI, I:z implica una variabl~ F
con k 1 y k" grados de libertad, donde los g de 1 del numerador aparecen' pri-
mero.
En otras palabras (5.2.2) afIrma que la variable Fes simplemente la razón
de dos variables ji-cuadrado distribuidas independientemente,' divididas por
sus respectivos grados de libertad.
Teorema 5.6. El cuadrado de la variable t (de Student) con k g de 1 tiene una dis-
tribución F con k, = 1 g de 1 en el numerador y k, = k g de 1 en el denominador. 6 ·
Es decir,
(5.2.3)

Se debe observar que, para que esta igualdad se mantenga, los g de 1 del
numerador de la variable F deben ser iguales a 1. En consecuencia F 1." ;:: ti o
F 1,23 = t~3 Y así sucesivamente.
En 10 que resta de este capítulo veremos cómo los anteriores teoremas
nos ayudan a establecer los intervalos de confIanza y a efectuar pruebas de
hipótesis.

5.3 INTERVALOS DE CONFIANZA PARA LOS COEFICIENTES


DE REGRESION Pl y P2

Intervalo de cOn118Dza para P2


En el Capítulo 4, Sección 4.3, se estableció que con el supuesto de normali-
dad para u" los estimadores de MCO Pl y $2 tienden en sí mismos a una dis-
tribución normal con medias y varianzas dadas. En consecuencia, por ejem-
plo, la variable

(5.3.1)

6 Para una prueba, v",e EjerciciO 5.18. Para una aplicaci6n, véoIe Sección 5.13.
REGRESION CON DOS VARIABLES: ESTIMACION POR INTERVALOS Y PRUEBA 107

como se mencionó en (4.3.5), es una variable nonnal estandarizada. Parece


entonces que podemos utilizar la distribución nonnal para hacer aflI1Ilacio-
nes probabilísticas sobre P2 dado que se conoce la verdadera varianza pobla-
cional (12. Si se conoce (12 una propiedad importante de una variable con
distribución nonnal, con una media de J.I. y una varianza de u2 es que el área
bajo la curva nonnal entre/l ±udicha área es de aproximadamente el 68%;
que entre los limites/l±2(1dicha área es de aproximadamente el 95%yque
entre p. ± 3(1 es de aproximadamente el 99.7%.
Noobstarite, muy pocas veces se conoce (12 y, en la práctica, ésta se de-
tennina utilizando el estimador insesgado (¡2. Al remplazar (1 por ft, se puede
reescribir la ecuación (5.3.1) como

t- P2 - P2 - estimador - parámetro
------':.....---..;..~-
- se cP2) - error estándar del estimador
(P2 - P2>!f:? -~~
(5.3.2)

donde el se ($2) se refiere ahora al error estándar estimado. Se puede demos-


trar (véase Apéndice 5A, Sección 5A.l) que la variable l' defmida previamente
tiene una distribución t con N - 2 g de l. (Obsérvese la diferencia entre
(5.3.1) y (5.3.2).) Por tanto, en lugar' de utilizar la distribución nonna!, po-
demos usar la distribución t para establecer intervalos de confianza paraP2
así: •
(5.3.3)

donde el valor t en medio de esta doble desigualdad es el valor t dado por


(5.3.2) y en donde t«/2 es el valor de la variable t obtenida de la distribución
t para UD nivel de significancia de 0l/2 y N - '2 g de l. Al sustituir (5.3.2) en
(5.3.3), obtenemos

Pr [- t«/2:::;;
P2se -(P2)P2 : :; t«/2 J'= 1 - IX (5.3.4)

Reordenado (5.3.4), obtenemos


Pr [P2 - tll/ 2se cP2) :s; P2 :s; P2 + tll/ 2se (.82)] - 1 - IX (5.3.5f

La ecuación (5.3.5) proporciona el intervalo de confianza del 100 (l - IX)


por ciento para P2 que se puede escribir más brevemente como: .
intervalo de confianza del 100 (1 - Ol) por ciento para: P2
P.lc± t-fl/2 se <ftJ (5.3.6)

7 Algunos autores prefieren ~scribir la ecuación (S.3.S) indicando explícitamente los g de 1: por tanto,.
la expresión se escribiría de la· siguiente forma:
Pr rfJ2 - t(N-21 ••/2 se (12) S PI S $2 + t(N-21,./2 se (12)] = 1- IX.
Pero para mayor simplicidad, continuaremos utilizand~ nuestra notación; el contexto clarifica los g de
1 apropiados.
108 MODELOS UNIECUACIONALES DE REGRESION

Utilizando un argumento análogo y las ecuaciones (4.3.1) y (4.3.2), se


concluye entonces que

Pr [J. - t IJr1 se <Pi) ~ /J. ~I);~ -ir,,-,IiiIIII.:J~ fJ. (5.3.7)


0, más brevemente:
Intervalo de confianza de 100 (1 - ex)
P1 ± t"'/l se <Pl~ ~ (5.3.8)

Al regresar a nuestro ejemplo ilustrativo de consumo-ingreso en el Capí-


tulo 3 (Sección 3.6) encontramos que¡J2 = 0.5091, se (P1) = 0.0357y g de 1
= 8. Si suponemos que IX = 5%, es decir, un coeficiente de confianza del 95%,
entOnces la Tabla t muestra que para 8 g de 1, el t,,/2 critico es = t O.025 = 2.306.
Al sustituir estos valores en (5.3.5), el lector debe verificar que el intervalo
de confianza de195% para P2 es el siguiente:
0.4268 ~ P2 ~ 0.5914 (5.3.9)
0, utilizando (5.3.6), es:
0.5091 ± 2.306(0.0357)
es decir,
0.5091 ± 0.0823 (5.3.10)

La interpretación de este intervalo de confianza es: dado un coeficiente
de confianza del 95 % en el largo plazo, en 95 de cada cien casos, intervalos
como (0.4268, 0.5914) contendrán el verdadero P2' Pero como se advirtió
anteriormente, obsérvese que no podemos decir que existe una propabilidad
del 95% de que el intervalo específico (0.4268, 0.5914) contenga el verda-
dero valor de P2 porque este intervalo es ahora fijo, dejando por tanto, de
ser aleatorio; en consecuencia, pz está o no está en el intervalo: la probabi-
lidad de que el intervalo fijo que se especifique contenga el verdadero valor
de P2 es, por tanto, 1 ó O.

Intervalo de confIanza para P1


Desarrollando (5.3.7), el lector debe poder verificar fácilmente que el inter-
valo de confianza del 95% para P1 en el caso de nuestro ejemplo consumo-
ingreso es:
9.6643 ~ P1 ~ 39.2545 (5.3.11)
0, utilizando t5.3.8)
24.4545 ± 2.306(6.4138)
es decir,
24.4545 ± 14.7902 (5.3.12)
Nuevamente, se debe ser precabido al interpretar este intervalo de con-
fianza. A largo plazo, 95 de cada cien casos de intervalos como (5.3.11) con-

REGRESION CON DOS VARIABLES: ESTIMACION POR INTERVALOS Y PRUEBA 109

tendrán el verdadero valor de PI; la probabilidad de que este detenninado


intervalo fijo incluya el verdadero valor. de Pies 1 ó O.

Intervalo de conrl8llza paraPl yP2 simultáneamente


Existen ocasiones en que sé necesita construir intervalos de confianza con-
juntos para PI y P2 de tal manera que con un nivel de confianza del O - a),
por ejemplo del 95 % tanto PI como P2 se encuentren simultáneamente en
este intervalo. Puesto que este tema es un poco más elaborado, el lector pue-
de consultar las referencias en caso de que requiera intervalos de confianza
conjuntos para apl~caciones espeCíficas.!

S.4 INTERVALO DE CONFIANZA PARA (12

Como se mencionó en el Capítulo 4, Sección 4.3, bajo el supuesto de nonna-


lidad la variable

(5.4.1)

posee una distribución X2 con N - 2 g de 1. 9 Por tanto, podemos utilizar la


distribución X2 para establecer intervalos de confianza para (12:
Pr (xi -,./2 ::s; X2 ::s; X;/2) = 1- a (5.4.2)
2
en donde el valor x en medio de esta doble desigualdad está dado por (5.4.1)
y en donde xi -11./2 y X; corresponden a dos valores de X2 obtenidos de la tabla
ji-cuadrado para N - 2 g de 1, de tal fonna que corten (o dejen por fuera)
lOO(a/2) por ciento del área de las colas de la distribución X2 tal como se
muestra en la Figura 5.1.
Remplazando X2 de (5.4.1) en (5.4.2) y ordenando ténninos, se obtiene

(5.4.3)

lo cual da el intervalo de confianza del 1000 - a) por ciento para (12.


Para ilustrarlo, consideremos este ejemplo. A partir del Capítulo 3, Sec-
ción 3.6, obtenemos que ¡,2 = 42.1591 Y, g de 1 = 8. Si a a se le asigna un valor
del 5%, la tabla ji-<:uadrado para 8 g de 1 arroja los siguientes valores críticos:
X~.025 = 17.5346, Y X~.975 = 2.1797. Estos valores muestran que la probabilidad
de que un valor ji cuadrado exceda 17.5346 es del 2.5%, y que, sea mayor de
2.1797 es del 97.5%. Portanto, el intervalo entre estos dos valores corres-

lIéase Jobn Neter, y Micbael H. Kutner, Applied Lineflr Regreai01l Models,


8 Para un análisis sencillo,
Richard D. Irwin Inc., Homewood, 111, 1983, Cap. 5.

9 Para una prueba, J1étzse Robert V. Hogg y Allen T. Craig, /ntroduction to Mllthe1Nlticlll Stlltistics, 2
ed., The Macmillan Company, New York, 1965, p. 144.
110 MODELOS UNIECUACIONALES DE REGRESION

2.1797 17.5346

\Ó.97S t XÓ .02S

FIGURAS.l
Intervalo de confianza de195%para X2 (8 g de 1).

ponde al intervalo de confianza del 95% parax 2 , como se muestra en el dia-


grama de la Figura 5.1. (Obsérvese la asimetría característica de la distribución
ji-cuadrado).
Al sustituir los datos de nuestro ejemplo en (5.4.3), el lector debe verifi-
car que el intervalo de confianza del 95 % para (12 es el siguiente:
19.2347 ~ (12 ~ 154.7336 (5.4.4)
La interpretación de este intervalo es: si establecemos límites de confianza
del 95 % sobre (12 y si mantenemos a priori que estos límites incluirán el ver-
dadero valor de (12, a largo plazo estaremos en lo correcto el95 % de las veces.

5.5 PRUEBA DE HIPOTESIS: COMENTARIOS GENERALES


Habiendo considerado el tema de la estimación puntual y por intervalos,
debemos pasar ahora a considerar las llamadas pruebas de hipótesis, tema que
trataremos a partir de esta sección y sobre el cual se puede consultar en otros
libros para considerar algunos detalles adicionales.
El problema que se intenta resolver con las pruebas de hipótesis estadís-
ticas puede enunciarse sencillamente de la siguiente manera: ¿Es cierta obser-
vaci6n o hallazgo compatible con una determinada hip6tesis? La palabra
"compatible" en este contexto significa "suficientemente" cerca del valor
hipotético, de sue{te que nos lleve a aceptar la hip~tesis enunciada inicial-
mente. Por tanto, si alguna teoría o experiencia previa nos lleva a creer que el
verdadero coeficiente P2 de la pendiente, para el ejemplo consumo-ingreso, es
de 1, ¿es el valor P2 = 0.5091 observado que se obtiene de la muestra en la
Tabla 3.2, consistenté con la hipótesis enunciada? Si lo es, podemos aceptar
la hipótesis; de lo contrario, debemos rechazarla.
En el lenguaje de la estadísti~, ra hipótesis enunciada se conoce como
hip6tesis nula y se denota mediante el símbolo Ro. La hipótesis nula gene-
REGRESION CON DOS VARIABLES: ESTIMACION POR INTERVALOS Y PRUEBA 111

ralmente se prueba contra una hip6tesis alterna, que se denota como H 1 , Y


que puede afmnar, por ejemplo, que el verdadero valor de P2 es diferente de
l. La hipótesis alterna puede ser simple o compuesta. 10 Por ejemplo, H 1: P2 =
1.5 es una hipótesis simple, pero H 1: fJ2 #= 1.5 es una hipótesis compuesta ...
La teoría de pruebas de hipótesis se preocupa por desarrollar regIas o
procedimientos para decidir si se acepta o se rechaza la hipótesis nula. Exis-
ten dos enfoques mutullmente complementarlos para desarrollar est.s reglas:
el del intervalo de confianza y el de la prueba de signiftcancia. Ambos enfoques
predican que la variable (estadístico o estimador) bajo consideración, tiene
cierta distribución probabilística y que las pruebas de hipótesis involu-
cran o encierran afmnaciones sobre los valores de los parámetros de dicha
distribución. Por ejemplo, sabemos que con el supuesto de nonnalidad, 12 tie-
ne una distribución nonnal donde la media es igual a P2 y la varianza está
dada por (4.3.4). Si fonnulamos la hipótesis de queP2 = 1 ,estamos haciendo
una afirmación sobre \lno de los parámetros de la distribución nonnal, es
decir, la media. La mayoría de las hipótesis estadísticas que se encuentran en
este texto serán de este tipo; mediante ellas se hacen afmnaciones'sobre uno
o más valores de los parámetros de cierta distribución probabilística supuesta,
ya sea normal, F, t o X2. Este constituirá·el tema de las siguientes dos secciones.

5.6 PRUEBA DE HIPOTESIS:


EL ENFOQUE DEL INTERVALO DE CONFIANZA
Prueba en dos colas o prueba bilateral
Para ilustrar el enfoque del intervalo de confianza, consideramos nuevamente'
el ejemplo consumo-ingreso. Como ya sabemos, la propensión marginal a
consumir (PMC) estimada, P2' es de 0.5091. Supongamos que postulamos
que:
Ho: P2 = 0.3
H 1 : P2 #= 0.3
lo cual implica que la PMC verdadera es 0.3 bajo la hipótesis nula pero infe-
rior o mayor que 0.3 bajo la hipótesis alterna. La hipótesis nula es una hipó-
tesis simple, mientras que la hipótesis alterna es compuesta. Esto es lo que en
realidad se conoce como la hipótesis de dos colas o bilateral. Es común que
una hipótesis alterna bilateral refleje el hecho de que no tenemos una fuerte .
expectativa teórica o apriori sobre la dirección en que se debe mover la hipó-
tesis alterna l1artiendo de la hipótesis nula.

10 Se dice que una hipótesis estadística es una hip6tem rimple si especifica el valor preciso de los pará-
metros de una función de densidad ~babilística; en caso contrario, se denomina hipótesis compuerta.
Por ejemplo, en la fdp normal(l/t1y'21t} exp { -i[(X -1l)/t1]2},si afirmamos que H 1: Il = 15 Y t1 = 2,
ésta es una hipótesis simple, pero siH 1: Il = 15 Y t1 > 15, es una hipótesis compuesta porque la desvia-
ción estándar no tiene un valor específico.
.
112 MODELOS UNIECUACIONALES DE REGRESION

¿Es.el valor observado de P2 compatible con Ro? Para responder a esta


pregunta,·considérese el intervalo de confianza (5.3.9). Sabemos que a largo
plazo, intervalos como (0.4268, 05914) c¿ntendrán el verdadero valor de
fJ2 con una probabilidad del 95 %. En consecuencia, a largo plazo (es decir, en
muestreos repetidos), tales intervalos proporcionan un rango a unos límites
dentro de los éuales puede encontrarse el verdadero valor de fJ2 con un coefi-
ciente df confian~a de, digamos, el 95%. Por tanto, el intervaló de confianza
proporcIona un conjunto de hipótesis nulas posibles. En consecuencia, si
fJ2 bajo Ho cae dentro del intervalo de confianza del 100(1-1X) por ciento,
podemos aceptar la hipótesis nula. Si se encuentra fuera del intervalo, pode-
mos rechazarla. 11 Esto se ilustra esquemáticamente en la Figura 5.2.
Regla de decisión. Construya un intervalo de conf"lanza del 100( 1-1) por ciento
para. Si el valor de" bajo Ho cae dentro de este intervalo de conftanza, acepte
Ho, pero si cae fuera del intervalo, rechace Ho .

De acuerdo con esta regla, para nuestro ejemplo hipotético Ho: fJ2 = 0.3
claramente se encuentra fuera del intervalo de confianza del 95% parafJ2
Entonces podemos rechazar la hipótesis' nula. En este caso decimos que nues-
tra estimación de 0.5091 es estadfsticamente significativa, es decir, significa-
tivamente diferente en términos estadísticos del valor hipotético de 0.3 para
este caso específico.

Prueba en una cola o prueba unilateral


En ocasiones existen altas expectativas teóricas o a priori (o expectativas
basadas en cierto trabajo empírico anterior) de Gue la hipótesis alterna es de
una cola (o unilateral) o unidireccional, en lugar de ser bilateral, como se

I
I
I
I
I Los valores de 132
1 dentro de este intervalo
I son posibles bajo Ha
I con 100 (l-a) por
1 ciento de confianza.
I
I Por tanto, acepte Ha
I si 132 se encuentra én
I esta región.
I FIGURA 5.2
_ _ _~...
I _ _ _ _ _ _ _ _ _+-_ _ _,_ ün intervalo de confianza del 100
6 - t «/2
1'2 se (6
1'21\ 6
1'2 + t «/2 se (61'2) (1 - IX) para fJ2'

11 Mantenga siempre en mente que existe una probabilidad del lOOlX por ciento de que el intervalo de
confianza no contenga el valor fJ2 que se encuentra bajo Ho aun cuando la hipótesis sea correcta. En resu
men, existe una probabilidad del 1001% por ciento de cometer el e"or tipo de l. Por tanto, si'lX = 0.05,
existe una probabilidad del5%,de que podamos rechazar la hipótesis nula cuando esta sea verdadf!1"a.
REGRESION CON DOS VARIABLES: ESTIMACION POR INTERVALOS Y PRUEBA 113

planteó anteriormem,~. Por tanto, en nuestro ejemplo de consumo-ingreso


podríamos postular que
H o: P2 :;;, 0.3 Y H 1: /12 > 0.3

Quizá la teoría económica o trabajo empírico anterior sugiera que la ptopen-


sión marginal a consumit es'mayor que 0.3. Aunque el procedimiento para
probar esta hipótesis puede derivarse fácilmente de la ecuación (5.3 .5), los
mecanismos reales pueden explicarse mejor en términos del enfoque de la
prueba de significancia que se explica a continuación. 12

5.7 PRUEBA DE HIPOTESIS:


EL ENFOQUE DE LA PRUEBA DE SIGNIFICANCIA
Prueba de significancia para los coeficientes de regresión: la prueba t
Un enfoque alterno pero complementario al método del intervalo de confian-
za para las pruebas de hipótesis estadísticas, es el enfoque de la prueba de sig-
nificancia desarrollado independientemente por F.A. Fisher, de un lado, y
Neyman y Pearson,13 del otro. En términos generales, una prueba de signifi-
cancia es un procedimiento mediante el cual se utilizan los resultados de la
muestra para verificar la veracidad o falsedad de una hipótesis. La idea funda-
mental detrás de las pruebas de significancia consiste en utilizar un estadísti-
co de prueba (estimador) y la distribución muestral de die.ho estadístico bajo
la hipótesis nula. La decisión de aceptar o rechazar Hose toma sobre la base
del valor del estadístico obtenido a partir de los datos que se tengan a mano.
A manera de ilustración, recordemos que bajo el supuesto de normalidad
la variable
t - P2 - P2
- se (P2)
(P2 - P2)/f.:Xt (5.3.2)

sigue la distribución t con N - 2 g de l. Si el valor verdadero de P2 se especi-


fica en la hipótesis nula, el valor t para (5.3.2) puede calcularse fácilmente a
partir de la muestra disponible, pudiendo servir por tanto como estadístico
de prueba. Y puesto que este estadístico de prueba posee la distribución t, es
posible hacer afmnaciohes sobre el intervalo de confianza, como la siguiente:

(5.7.1)

12 Si desea utilizar el enfoque del intervalo de confianza, construya un intervalo de confianza del
(100 - IX) por ciento de una cola o unilateral.paraP2· (¿Por qué?).
13 Para mayores detalles, véase E. L. Lehman. Testing Statistical Hypothesis, John Wiley &; Sons,lnc,
Nueva York, 1959.
114 MODElOS UNIECUACIONALES DE AEGAESION

donde /l~ es el valor de/l2 blÜO HoY - t./1 Y t./1 son los valores de t que se
obtienen de la tabla t para un nivel de significancia de (<</2) y N - 2 g de 1
(cf. (5.3.4»].
Reordenando (5.7.1), obtenemos

(5.7.2)
'~presiónque proporciona el intervalo en el que z se encontrará con una t1
probabilidad de (1 -IX )%, dado que f31 = f3r· En ellenguaje de lás pruebas de
hipótesis, el intervalo de confianza dell00 (1 - a) por ciento establecido en
(5.7.2) se conoce como reglón de aceptación (de la hipótesis nula), mientras
que la(s) región( es) fuera del intervalo de confianza se denomina(n) región(ea)
de rechazo (de Ho) o región(es) crítica(s). Como se mencionó previamente, los
límites de confianza, es decir, los extremos del intervalo de confianza, reciben
también el nombre de valores criticos.
La estrecha relación existente entre los enfoques del intervalo de con-
fUlIlza y la prueba de significancia en el análisis de pruebas de hipótesis puede
observarse ahora al comparar (5.3.5) con (5.7.2). En el procedimiento de
intervalos de confUlIlza tratamos de establecer los límites dentro de los cuales
se puede encontrar el f31 verdadero pero desconocido, mientras que utilizando
el enfoque de la prueba de significancia se plantea un valor hipotético para
f3z buscando comprobar si el pz calculado se encuentra dentro de ciertos lí-
mites razonables (de confianza) con respecto al valor en la hipótesis. .
Consideremos nuevamente nuestro ejemplo de consumo~ingreso. Sabe-
mos que pz = 0.5091, se <pz) = 0.0357. yg de 1 = 8. Si suponemos que a =5 %
t«jz =2.30(í.Si Ho: f3z = f3f = 0.3 Y H 1 : f3z:F O.3,la ecuación (5.7.2) se transforma

Pr (0.2177 S; Pl S; 0.3823) = 0.95 (5.7.3)

~z=0.5091
le encuentra dentro de
elta región crítica
2.5'10

0.2177 0.3 0.3823

FIGURA 5.3
El intervalo de confianza del 9SCJb para $2 según la hipótesis de que fJ2 = 0.3.
REGRESION CON DOS VARIABLES: ESnMACION POR INTERVALOS Y PRUEBA 115

Jet)

t = 5.86
se encuentra denLfo de esta
Región reglón crítica
crítica 2.5%
2.5%

-2.306 o +2.306

FIGURA 5.4
Intervalo de confumza del 95 %para t (8 g de 1).

como se muestra en el diagrama de la Figura 5.3. Puesto que el valor observa-


do de $2 se encuentra en la región crítica, podemos rechazar la hipótesis nula
de que el verdadero valor de P2 = 0.3.
En la práctica, no existe necesidad de estimar explíqitamente (5.7.2). Se
puede calcular el valor t que aparece en el centro de la doble desigualdad de
la ecuación (5.7.1) y observar si se'encuentradentro de los valores, t críticos
o fuera de ellos. En el caso de nuestro ejemplo.
0.5091 - 0.3
t= 0.0357 = 5.86 (5.7.4)

que claramente se encuentra dentro de la región crítica de la Figura 5..4. La


conclusión sigue siendo la misma: se rechazaBo .
Puesto que utilizamos la distribución t, el anterior procedimiento se
denomina prueba t. En el lenguaje de pruebas de significancia, se dice que un
estadístico es estadúticamente significativo si el valor del estadístico de prue-
ba se encuentra en la región-crí1ica. En nuestro ejemplo, el estadístico t es
significativo y por tanto procedemos a rechazar la hipótesis nula. Siguiendo

TABLAS.l
La prueba t de significancia:' reglas de decisión

Tipo de Ha: hipótesis H 1: hipótesis Regla de decisión:


hipótesis nula alterna rechazar Ho si

De dos Colas P2 .. Pf III "P! I tI> tl/~. g de 1


Cola derecha pz'S /lt fJz > P! t > t •. g de 1
Cola izquierda -Pl <!: pr Pi <P! t<-t.,gdel

Notas: Pi es el valor numérico hipotético de p,.


[tI significa valor absoluto de t.
t. Ó 1,,, significa valor t crítico a un nivel de significancia de a./2
g de 1: grados de libertad, (N - 2) para el modelo de dos variables,
(N - 3) para el modelo de tres variables, y así sucesivamente.
Sobra agregar que el mismo procedimiento es válido para evaluar la
hipótesis'con respecto a PI'
116 MODELOS UNIECUACIONALES DE REGRESION

. esa misma línea de razonamiento, se dice que una prueba es estadfsttcamente


insignificante si el valor del estadístico de prueba se encuentra en la región
de aceptación. En esta situación se puede aceptar la hipótesis nula. En el caso
de nuestro ejemplo, la prueba t es significativa y por tanto podemos rechazar
la hipótesis nula.
Antes de concluir el análisis de pruebas de hipótesis se debe observar
que el procedimiento de prueba que acabamos de describir se conoce como
procedimiento de significancia en dos colas o bilateral, debido a que consi-
deramos las dos colas extremas de la dis~ribución probabilística relevante, las
llamadas regiones de rechazo. Se decide rechazar la hipótesis nula si ésta se
encuentra en alguna de estas dos colas. Ilo anterior se debió a que H 1 era una
hipótesis compuesta de dos colas; /32 ::f: 0.3 significa que /32 es mayor o menor
que 0.3. Sin embargo, supóngase que la experiencia previa nos sugiere que el
valor esperado de la PMC es mayor que 0.3. En este caso, tenemos que:
Ho: /32:S;; 0.3yH 1: /32 > 0.3. Aunque H 1 sigue siendo una hipótesis compuesta,
ahora es de una sola cola. Para probar esta hipótesis u titizamos una prueba de
hipótesis de una cola, (la cola derecha) tal como se muestra en la Figura S.S.
(Considérese también el análisis que se presenta en la Sección 5.6).
El procedimiento de prueba es el mismo que el anterior, con la excep-
ción de que el límite de confianza superior o valor crítico corresponde ahora
atll = t.05' es decir, el nivel del 5%. Como se muestra en la Figura 5.5, para
este caso no necesitamos considerar la cola inferior de la distribución y, la
utilización de una prueba de significancia de una o dos colas dependerá de la
manera como se fonnule la hipóte'sis alterna, la cual a su vez dependerá de
consideraciones a priori o de previa experiencia empírica. (Este tema se am-
pliará en la Sección 5.8).
A través de la Tabla 5.1 se puede resumir la metodología de la prueba t
de significancia utilizada en las pru'ebas de hipótesis.

Prueba de significancia para (J2 : la prueba X'1.


Como ilustración adicional de la metodología de la prueba de significancia,
consideremos la siguiente variable:

(5.4.1)

x:
la cual, como vimos anterionnente, sigue una distribución con N - 2 g de
1. Para el 'ejemplo hipotético, q2 == 42.1591 Y los g de 1 = 8. Si postulamos
que Ho: (12 == 85 persus H 1: (12 ::f:.85, la ecuación (5.4.1) proporciona el esta-
dístico de prueba para H o. Al sustituir los valores correspondientes en (5.4.1),
se puede encontrar que bajo HO ,X2 == 3.97. Si suponemos queoc==5%,los valo-
res críticos de X2 son 2.1797 y 17.5346. Puesto que el valor calculado dex 2se
encuentra entre estos límites, los datos confirman la hipótesis nula, pudiendo
entonces aceptarla. (Véase Figura 5.1). Este procedimiento de prueba se
conoce muy acertadamente como prueba significancia ¡i-cuadrado.
REGRESION CON DOS VARIABLES: ESTIMACION POR INTERVALOS y PRUEBA 117 .

.....
95% ~-0.S091
se encuentra en
Región de esta región crítica
aceptación S'lt

0.3

1ft) •

Región de
t = 5.86
aceptación se encuentra en
esta región cr ítica
5%

o ,
1.860

'0.05 (8 g de 1)

FIGURA 5.5
Prueba de significancia de una cola.

5.8 PRUEBAS DE HIPOTESIS: ALGUNOS ASPECTOS PRACTICOS

El significado de "aceptar" o "rechazar" una hipótesis


Si con base en u~ prueba de significancia, por ejemplo la prueba t, decidi-
mos "aceptar" la hipótesis nula, 10 que realmente estamos diciendo es que
con base en la evidencia de la muestra no tenemos razón para rschazarla; no
estamos diciendo que la hipótesis nula sea cierta sin lugar a ninguna duda.
¿Por qué? Para responder este interrogante regresemos a nuestro ejemplo de
consumo-ingreso y supongamos que Ro: {J2 (PMC) = 0.50. Entonces el valo'r
estimado de la PMC es P2 = 0.5091 con un se <P2) = 0.0357. En' consecuen-
118 MODELOS UNIECUACIONALES DE REGRESION

cia, basad'o en laprueba t, encontramos que f = (0.5091 - 0.50)/0.0357 =


0.25, el cual no es significativo a todas luces. Por tanto, decimos que "acep-
tamos" Ho. Pero ahora supongamos que Ho: fJ2 = 0.48. Al aplicar la prueba t
obtenemos t = (0.5091-0.48)/0.0357 = 0.25, que tampoco es estadística-
mente significativo. Podemos entonces decir que "aceptamos" Ho. ¿Cuál de
estas dos hipótesis nula es la "verdadera"? No lo sabemos. En consecuencia,
al "aceptar" una hipótesis nula debemos estar conscientes de que puede exis-
tir otra hipótesis nula igualmente compatible con los datos. Es preferible
decir entonces que podemos aceptar la hipótesis nula en lugar de que de he-
cho la aceptamos. Es mejor aun expresarlo de la siguiente manera:

... así como una corte emite el veredicto de que "no es culpable", en lugar de decir
que "es inocente", asimismo la conclusión de una prueba estadística es de "no re-
chazo" en lugar de "aceptación"
, .14

La regla práctica del "2-t" y la hipótesis nula o "cero" "t"


Una hipótesis nula que frecuentemente se evalúa en trabajo empírico es
Ho: fJl = O, es decir, que el coeficiente de la pendiente es cero. Esta hipótesis
nula de "cero" es como un espantapájaros, cuyo objetivo es averiguar sr Y
está relacionada con X, la variable explicativa. Si inicialmente no existe rela-
ción alguna entre Y y X, entonces no tiene sentido alguno evaluar una hipó-
tesis del tipo fJl = 0.3 o una con cualquier otro valor.
Es fácil evaluar esta hipótesis nula utilizando el método del intervalo de
confianza o la prueba t mencionada en las secciones anteriores. Pero es muy
frecuente que estas evaluaciones formales se puedan acortar, adoptando la
regla práctica de significan cia· "2-t" que se puede enunciar de la síguiente
forma:

"'8
Regla práctica "2-t". Si el número de grados de libertad es de 20 o más y si ~ el ni-
vel de significancia, se ¡fija en 0.05, entonces la hipótesis nula " . O se puede re-
chazar en favor de la hipótesis alterna de que si el valor t [..~fJJJ
culado a partir de la ecuación (5.3.2) excede a 2 en valores absolutos.

El razonamiento detrás de esta regla no es difícil de entender. Utilizan-


do la ecuación (5.7.1), sabemos que rechazaremos Ho: fJ2 = O si

t= p2/se (ftl) > t"¡l cuando P2 > O


o

14 Jan Kmenta, Elements of Econometrics, The Macmillan Company, New York, 1971, p. 114.
REGRESION CON DOS VARIABLES: ESTIMACION POR INTERVALOS Y PRUEBA 119

o cuando
(5.8.1)

para los grados de,libertad adecuados y donde [ ] representa el valor absoluto.


Si examinamos la Tabla t dada en el apéndice, vemos que para g de 1 de
aproximadamente 20 o más, un valor t calculado superior a 2 (en términos
absolutos), por ejemplo 2.1, es estadísticamente significativo al nivel de signi-
ficancia del 5%, implicando el rechazo de la hipótesis nula en favor de la
hipótesis alterna de qué Pl :/:. O. En consecuencia, si encontramos que para 20
o más g de 1, el valor calculado de t es, digamos, 2.5 ó 3~ ni siquiera tenemos
que consultar la Tabla t para evaluar la significancia del coeficiente estimado
para la pendiente. Por supuesto, siempre se puede consultar la Tabla t para
obtener el nivel de significancia exacto y debe hacerse siempre en el caso en
que los g de 1 sean inferiores'a 20.
A propósito, obsérvese que si estamos evaluando una hipótesis unilate-
ral: P2 = O vs. Pl > O Ó P2 < O , entonces debemos rechazar la hipótesis
nula si
(5.8.2)
Si fijamos IX al 0.05, entonces, de acuerdo con la Tabla t observamos que para
20 o más g de 1, un valor t por encima de 1.73 es estadísticamente significa-
tivo a un nivel de significancia del S % (unilateral). En consecuencia, cuando
un valor t excede digamos 1.8 (en términos absolutos) y hay 20 o más g de 1,
no se tiene que consultar la Tabla t para obtener la significancia estadística
del coeficiente observado. Claro, si escogemos un valor de lX.del 0.01 o cual-
quier otro nivel, tendremos que' decidir el valor t adecuado como valor crí-
tico a observar. No obstante, en este momento el lector debe estar en capaci-
dad de hacerlo.

Planteamiento de las hipótesis nIda y alterna


Dadas las hipótesis nula y alterna. la evaluación de éstas para obtener el valor
de la significancia estadística no debe seguir siendo un misterio. Pero ¿cómo
se formulan estas hipótesis? No existen normas rápidas para hacerlo. Es muy
común que el fen6meno qu~ se está estudiando sugiera la naturaleza de las
hipótesis nula y alterna. Por ejemplo, en el ejercicio S.13 se le pide al alumno
estimar la línea de mercado de capital (LMC) de la teoría del portafolio,
donde se postula que: E¡ = P1 + P2(1¡, donde E = tasa de retomo esperada
del portafolio "y (1 = desviacion estándar de la. tasa de retomo, la cual es una
medida del riesgo. Puesto que se espera que el retomo y el riesgo estén rela-
cionados positivamente -cuanto mayor sea el riesgo, mayor será el retorno- la
hipótesis alterna natural a la hipótesis nula .de que Pl = O será Pl > O. Es de-
cir, no se considerarían valores de P2 inferiores a O.
Pero consideremos el caso de la demanda de dinero. Como demostra-
remos posteriormente. uno de los determinantes importantes de la demanda
120 MODELOS UNIECUACIONALES DE REGRESION

de dinero es el ingreso. Estudios previos de las funciones de demanda de di·


nero han demostrado que la elasticidad-ingreso de la demanda de dinero (la
variación porcentual en la demanda de dinero correspondiente a un cambio de
un 1% en el ingreso) se ha encontrado generalmente entre 0.7 y 1.3. En con-
secuencia, en un Lluevo estudio de la demanda de dinero, si se postula que el
coeficiente de la elasticidad-ingreso es de 1, la hipótesis alterna podría plan-
tear quep2 ~len otras .palabras, una hipótesis alterna de dos colas o bilateral.
Por tanto, las expecta,ivas teóricas o trabajo empírico previo pueden ser
confiables para formular hipótesis. No obstante, independientemente de cómo
se forman las hipótesis, es muy importante que el investigador establezca estas
hipótesis antes de llevar a cabo la investigación empz'rica. De otra manera, se
tendrá que caer en un razonamiento de tipo circular o caer en profecías que
se cumplen por sí mismas. Lo anterior implica que si se formulan hipótesis
después de examinar los resultados empíricos, puede surgir la tendencia de
formar hipótesis de tal forma que se justifiquen los resultado~ obtenidos. Es-
te procedimiento no es aceptable de ninguna maneta, y al menos en términos
de la objetividad científica. Por tanto, debe evitarse a toda costa.

Escogencia de ex. el nivel de significancia


Con base en los análisis efectuados hasta ahora, debe ser claro que la acepta-
ción o el rechazo de la hipótesis nula depende fundamentalmente de (x, el
nivel de significancia, o la probabilidad de cometer un error de tipo 1, o sea,
la probabilidad de rechazar la hipótesis verdadera. En diversos libros de esta-
dística se analiza extensamente la naturaleza del llamado error de tipo I y su
relación con el error de tipo 11 (la probabilidad de aceptar la hipótesis falsa).
Surge ahora la pregunta, ¿por qué generalmente se asigna a (X un valor del
1%, 5 % o máximo del 10%? De hecho, no hay nada sacrosanto respecto a
estos valores; cualquier otro valór sería también adecuado.
En un libro introductorio como este no es posible analizar en'profundi-
dad las razones por las cuales escogemos los niveles de significancia del 1, 5 ó
10%, puesto que tendríamos que entrar en el campo de la toma de decisiones
estadísticas, la cual constituye toda una disciplina en sí misma. No obstante,
podemos presentar. un breve resumen. Recordemos que si tratamos de reducir
el error de tipo 1, inmediatamente aumenta el error de tipo· 11 y viceversa. Es
decir, dado el tamaño de la muestra, si tratamos de reducir la probabilidad de
rechazar la hipótesis verdadera, al mismo tiempo estamos aumentando la
probabilidad de aceptar la hipótesis falsa. Así, existe una disyuntiva entre
estos dos tipos de errores, dado el tamaño de la muestra. Ahora bien, la única
manera en que podemos dilucidar esta disyuntiva consiste en averiguar los
costos relativos asociados a los dos tipos de errores. En consecuencia,

Si el error de rechazar la hipótesis nula cuando ésta sea verdadera (error de tipo 1) es
costoso en relación con el error de no rechazar la hipótesis nula cuando ella sea falsa
(error de tipo II), es razonable fijar la probabilidad del primer tipo de error a niveles
bajos. Si, por otra parte, el costo de cometer el error de tipo 1 es bajo en relación
REGRESION CON DOS VARIABLES: ESTIMACION POR INTERVALOS Y PRUEBA 121

con el costo de cometer el error de tipo IJ, vale la pena que la probabilidad del pri.
mer tipo de error sea alta (disminuyendo así la probabilidad del segundo tipo de
'error).15

Desde luego, pocas veces se conoce el costo resultante de cometer 'estos


dos tipos ,de errores. Esta es la razón por la cual los econometristas general-
mente establecen valores pará-« {fel I o del 5%, máximo, del 10% y escogén
qn estadístico de prueba que disminuya al máximo la probabilidad de come-
ter el error de tipo 11. Este es el enfoque de la estadística clásica, el cual en
general no es aceptado por los seguidores de la estadística bayesiana, escuela
que compite con la estadística clásica ..

Significancia estadística versus significancia práctica


Regresemos a nuestro ejemplo de consumo-ingreso y plantearnos la hipótesis
de que la verdadera PMC es de 0.61 (H o : P2 = 0.61). Con base en el resultado
de la muestra de que P2 = 0.5091,obtuvimos el intervalo (0.4268, 0.5914)
con un nivel de confianza del 95%. Puesto que este intervalo no incluye el
valor· 0.61, podernos, con un nivel de confianza del 95 %, decir que nuestro
estimativo es estadísticamente significativo, es decir, significativamente dife-
rente de 0.61.
Pero ¿cuál es la significancia práctica de nuestro resultado? Es decir,
¿qué diferencia existe si tornarnos una PMC de 0.61 en lugar de 0.5091? ¿Es
esta diferencia de 0.1009 entre las dos PMC, importante en la práctica?
La respuesta depende de lo que hagamos en realidad con 'estos estimati-
vos. Por ejemplo, de la teoría macro económica sabernos que elmultiplicador
del ingreso es 1/(1- PMC). En consecuencia, si la PMC es de 0.5091, el
multiplicador es 2.04, pero éste tiene un valor de 2.56 si la PMC es igual a
0.61. Es decir, si el gobierno aumenta sus gastos en $1 para sacar la economía
de una recesión, el ingreso eventualmente aumentará en $2,04, dado que la
PMCes de 0.5091, y de $2,56 si la PMC es de 0.61. Esa diferencia es muy
importante para reactivar una economía en recesión.
El punto fundamental de este análisis es que no se debe confundir la
signiflcancia estadfstica con la signiflcancia prdctica. Para decidir si un resul-
tado específico es significativo tanto estadística corno sustancial o práctica-
mente, tendremos que recurrir a la teoría de las decisiones, un campo que está
más allá del alcance de este libro. Por ahora trabajaremos en el supuesto de
que si un resultado es estadísticamente significativo, también puede ser im-
portante en la práctica.

5.9 ANALISIS DE REGRESION y ANALlSIS DE VARIANZA


En esta sección estudiaremos el análisis de regresión desde el punto de vista

15 Jan Kmenta, 0,. cit.• pp. 126-127.


122 MODELOS UNIECUACIONALES DE REGRESION

TABLA 5.2
Tabla de ADV para el modelo de regresión con dos variables

Fuente de variación se gde 1 scp.

Debidas a la regresión (SCE) ~.ílt = Pi ~ xt 1 p~ ~ xt


Debidas a los residuos (SeR) ~e~ N-2 et
-~- = ( 1-2
N-2

STe N -1

• Suma promedio de los cuadrados que se obtiene dividiendo se por


los g de 1 correspondientes. '

del análisis de varianza e introduciremos al lector a una forma complementa-


ria y esclarecedora de examinar el problema de la inferencia estadística.
En el Capítulo 3, Sección 3.5, desarrollamos la siguiente identidad:
L y; = L yt + L el = P~ L xl + L el (3.5.2)

es decir, STC = SCE + SCR, lo cual descompone la suma total de cuadrados


(STC) en dos: suma de cuadrados explicados (SCE) y suma de cuadrados de
'los residuos. Desde el punto de vista de la regresión, el estudio de los compo-
nentes de l~ STC se conoce como análisis de varianza (ADV). Asociados con
cualquier suma de cuadrados existen g de,l correspondientes los cuales tienen
que ver ~on el número de observaciones independientes en las cuales dicha
suma se basa. La STC tiene N - 1 g de 1 porque perdemos un grado de liber-
tad en el cálculo de la media muestral Y. La SCR tiene N - 2 g de 1 (¿por
qué?) (Nota: 10 anterior es cierto solamente para el modelo de regresión con
dos variables y con la intersección en el eje y, PI presente). La SCE tiene 1 g
de 1 (nuevamente válido para casos de dos variables), debido a que la SCE =
P~ L xl es una función de P2 solamente ya que se conoce L xl.
Recordemos las diferentes sumas de cuadrados y los g de 1 asociados
con ellas de la Tabla 5.2, que representa la forma estándar de una tabla de
ADV, la cual en ocasiones se denomina tabla de ANOV A. Dada la información
de la Tabla 5.2, consideremos la siguiente variable:
SCM de SCE
F =SCM de SCR

_ P~ L x;
- L et/(N - 2)
P~ L x;
(5.9.1)
0- 2

Suponiendo que las perturbaciones u¡ poseen una distribución normal y Ho:


P2 = O,se puede demostrar que F de (5.9.1) satisface las condiciones del teo-
rema 5.5 (Sección 5.2) y, por tanto, tiene una distribución F con 1 y N - 2 g
REGRESION CON DOS VARIABLES: ESTIMACION POR INTERVALOS Y pqUEBA 123

TABLAS.3
Tabla de ADV para el ejemplo consumo - ingreso

Fuente de variación se gde 1 SCP

Debidas a la regresión (SCE) 8552.73 8552.73 8552.73


F=--
42.159
Debidas a los residuos (SCR) 337.27 8 42.159 = 202.87
STC 8890.00 9

de l (véase Apéndice 5A, Sección 5A.2). ¿Cómo puede utilizarse esta tasa o
relación F? Se PUede demostrar que 16
(5.9.2)

~ e2
y E~ = E(&2) = (12 (5.9.3)
N-2
(Nótese que P2 y (12, alIado derecho de las ecuaciones, son los verdaderos pa-
rámetros). Por tanto, si P2 es en efecto cero, las ecuaciones (5.9.2) y (5.9.3)
nos dan estimadores idénticos del verdadero valor de (12. En este caso, la va-
riable explicativa X no ejerce ninguna influencia lineal sobre Y y la totalidad
de la variación de Y se explica por los errores aleatorios de perturbación Uj.
Si, por otra parte, P2 no es cero, (5.9.2) y (5.9.3) serán diferentes y parte de
la variación de Y podrá atribuirse a X. Por tanto, la razón F de (5.9.1) nos
proporciona una prueba de la hipótesis nula Ho: P2 = O. Dado que todas las
cantidades que componen esta ecuación se pueden obtener a partir de la
muestra disponible, esta razón F se constituye en un estadístico que sirve
para probar la hipótesis nula de que el verdadero P2 es igual a cero. Para
hacer esto, se debe proceder a calcula,r el valor F y compararlo con el valor
crítico F que se obtiene de las tablas F para el nivel de significancia que se
escoja.
A manera de ilustración, continuemos con nuestro ejemplo de consumo-
ingreso. La tabla de ADV correspondiente a este ejemplo se encuentra en la
Tabla 5.3. El valor calculado de F es 202.87. Si IX se escoge al 5%, el valor
crítico de F para 1 y 8 g de l es 5.32. Obviamente el valor calculado de Fes
estadísticamente significativo y, por tanto, ¡>odemos proceder a rechazar la
hipótesis' nula de que el ingreso X no tiene influencia alguna en los gastos de
consumo.
Recuérdese ahora el Teorema 5.6 de la Sección 5.2 que enuncia que el
cuadrado del valor t con k g de l corresponde a un valor F con 1 g de 1 en el

16 Pora una prueba, véase K. A. Brownlee, Statistical Theory and Methodology in Science and Engin·
eenng, Tohn Wiley_ & Sons, Ine., New York, 1960, pp. 278·280.
124 MODELOS UNIECUACIONALES DE REGRESION

numerador y k g de 1 en el denominador. Para el ejemplo de consumo-in-


greso, si suponernos que Ho: /32 = O, entonces se puede verificar usando
(5.3.2) que el valor t estimado es de 14.26. Este valor t tiene 8 g de 1. Bajo la
misma hipótesis nula, el valor F era de 202.87 con 1 y 8 g de 1. En conse-
,;uencia, (14.26)2 = valor F, exceptuando los errores de aproximación.
Por tanto, las pruebas t y F nos presentan dos maneras alternas y com-
plementarias para evaluar la hipótesis nula de que /32 = O. Si este es el caso,
¿por qué no basarse en la prueba t sin preocuparse por la prueba F y el co-
rrespondiente análisis de varianza? Para el modelo de dos variables no hay.·
necesidaQ de recurrir a la prueba F. Pero cuando consideremos el terna de
regresión múltiple veremos que la prueba F tiene diferentes aplicaciones inte-
resantes que 10 convierten en un método poderoso para evaluar hipótesis
estadísticas.

5.10 APLICACION DEL ANALISIS DE REGRESION:


EL PROBLEMA DE LA PREDICCION
Con base en los datos muestrales de la Tabla 3.2 se obtiene la siguiente regre-
sión muestra1:
r; = 24.4545 + 0.5091X¡ (3.6.2)

donde ~ es el estimador del verdadero E(Y¡) correspondiente a un X dado.


¿Para qué se puede utilizar esta regresión histórica? Una aplicación consiste
en "predecir" o "pronosticar" el futuro gasto de consumo Y correspondiente
a algún nivel dado de ingreso X. Existen dos clases de predicciones: (1) pre-
dicción .de1 valor medio condicional de Y correspondiente a un detenninado
X, digamos X o , que es un punto sobre la línea de regresión poblacional mis-
ma (véase Figura 2.2), y (2) predicción de un valor individual de Y corres-
pondiente a X o. Denominaremos a estas predicciones la predicción media y
la predicción individual.

Predicción media l7
Para concretar los conceptos, supongamos que X o =
100 Y que queremos
predecir E(Y I X o = 100). Ahora es posible mostrar que la regresión histórica
(3.6.2) proporciona la estimación puntual de esta predicción media de la
siguiente ·manera:
fo = PI + P2 X O
= 24.4545 + 0.5091(100)
= 75.,3645 (5.10.1)

17 Para las pruebas de los diferentes enunciados, consúltese a J. Johnston, Econometric Methods.
McGraw-Hill Book Company, 3 ed., New York, 1984, pp. 42-45.
REGRESION CON DOS VARIABLES: ESTIMACION POR INTERVALOS Y PRUEBA 125

donde f o·=: estimador deE(Y I X o).Puede demostrarse que este predictor pun-
tual es el mejor estimador lineal insesgado (MELI).
Puesto que ro es un estimador, es probable que sea diferente de su
verdadero valor. La diferencia entre los dos valores nos da una idea del error
de la predicción o del pronóstico. Para estimar este error se necesita encontrar
la distribución muestral de fo . También es posible demostrar que Yo tiene
una distribución normal con media (PI + P2 X o) y varianza dada por la siguiente
fórmula:

(5.10.2)

Remplazando el valor desconocido (72 por su estimador insesgado 0- 2 , se tiene


que la variable
fo - (PI + P2 X O)
(5.10.3)
t = se (fo)
sigue una distribución t con N - 2 g de l. La distribución t puede, por tanto,
emplearse para encontrar intervalos de confianza del verdadero E(Yo I X o) para
hacer pruebas de hipótesis usando el procedimiento acostumbrado, es decir,
• •lLlilS::Jlt'+ /J, t •.s #1 + pz X o + t lJl/ 2 se (fo)] = 1 - IX
(5.10.4)
en donde se obtiene se (ro) a partir de (5.10.2).
Para nuestros datos (véase Tabla 3.3).
1 (100 - 170)2J
var (fo) = 42.159 [ 10 + 33,000

= 10.4873
y se (fo) = 3.2383

Por tanto, el intervalo de confianza del95 % para el verdadero E(Y I X o) = Po +


PiXo estará dado por:
[75.3676- 2.306(3.2383) ::;; E(Yo I X = 100) ::;; 75.3676 + 2.306(3.2383)]
es decir,
[67.8965::;; E(Y I X = 100) ::;; 82.8325] (5.10.5)

De este modo, daqo X o = 100, en muestreos repetidos, 95 de cada 100 inter-


valos como el de (5.1 0.5), incluirán el verdadero valor promedio; la mejor
estimación de este valor medio verdadero es 'obviamente la estimación pun-
tual,75.3676.
Si obtenemos intervalos de confianza del 95%, como el de (5.10.5),
para cada uno de los valores de X dados en la Tabla 3.2, hallaremos lo que se
conoce como el intervalo de confianza o banda de confianza para la función
de regresión poblacional ilustrada en la Figura 5.6.
126 MODELOS UNIECUACIONALES DE REGRESION

I
/
170
//
Intervalo de cO!1fianza /
ISO para el promedio y /

130

110

90

70

0~0--~6~0--~870--~lOO~~12~0~·~14~0--1~~~-1~8-0--2~0-0--2~2-0--2~~---2~6-0-X

x
FIGURA 5.6
Intervalos (bandas) de confianza para promedio valor individual de Y.

Predicción individual
Si se tiene interés en predecir un valor individual de Y como Yo que corres-
ponde a un valor dado de X como X o , es posible probar que el mejor estima-
dor lineal insesgado de Yo también está dado por (5.10.1) pero que su varian-
za es
(5.10.6)

Se puede den Jstrar además que Yo también posee una distribución normal
con una media y una varianza dadas por (5.1 0.1) y (5.1 0.6) respectivamente.
Al sustituir ¡;-2 por el 0'2; desconocido, se tiene entonces que la variable t =
(Yo - Yo)/se (Yo) posee también una distribución t. Por tanto, se puede utilizar
la distribución t para realizar inferencias sobre el verdadero valor Yo. Para
continuar con nuestro ejemplo de consumo-ingreso, la predicción puntual de
Yo es 75.3676, la misma que para Yo , y su varianza es 52.6470 "(el lector
debe verificar este cálculo). Por tan to, eHntervalo de confianza del 95% para
Yo, correspondiente a X o = 100 está dado por
(58.6353 ~ Yo IX o = 100 ~ 92.0955) (5.10.7)
REGRESION CON DOS VARIABLES: ESTIMACION POR INTERVALOS Y PRUEBA 127

Al comparé1l" este intervalo con (5.10.5), se puede observar que el inter-


valo de confianza para el Yo individual es más amplio que el intervalo para el
valor medio de Yo. (¿Por qué?) Al calcular los intervalos de confianza como
el de (5.10.7), condicionados...a los valores de X de la Tabla 3.2, obtendremos
una banda de confianz#l del 95% para los valores individuales de Y que corres-
ponden a dichos valores de X. Esta banda de confianza, al igual que la banda
de confianza para f o ' §e}lustra en la Figura 5.6.
Nótese una característica importante de la9 bandas de confianza que se en-
cuentran en la Figura 5.6. La amplitud de las bandas esmtmor cuando X o = X.
(¿Por qué?) No obstante, la amplitud aumenta abruptamente cuando X o se
aleja de X. (¿Por qué?) Esto podría sugerir que la habiliaad predictiva de la
línea de regresión muestral histórica decrece apreciablemente a medida que
X o se aleja progresivamente de X. Por tanto, hay que ser muy cautelosos al
"extrapolar" la línea de regresión histórica cuando!se trata de pr~decir fo o
ro asociado' con un X o dado que se encuentra muy'eléja<Ío de .la media mues-
tral X.

5.11 INFORMES DE LOS RESULTADOS


DEL ANALISIS DE REGRESION
Existen diferentes maneras de informar los resultados obtenidos de 'un análi-
sis de regresión; sin embargo, en este texto emplearemos lasiguient6 presen-
tación, la cual describimos a continuación para el ejemplo de consumo-ingreso
del Capítulo 3.
f; = 24.4545 + 0.509IX¡ r 2 = 0.9621
(6.4138) (0.0357) g de 1 = 8
t = (3.8128) (14.2605) F 1,8 = 202.87 (5.11.1)

En la ecuación {5.J 1.1) las cantidades que aparecen en la primera serie de


parépt-:sis corresponden a los errores estándar de los diferentes coeficientes
de regresión, mientras que las cifras en la segunda serie de paréntesis corres-
ponden a los valores t, estimados a partir de la ecuación (5.3.2) bajo la hipó-
ae
tesis nula que el verdadero valor poblacional de cada coeficiente individual
de regresión es cero (por ejemplo, 3.8128 = 24.4545.;. 6.4138).
Una de las ventajas del hecho de prtsentar los resultados del informe de
, esta manera, consiste en que se puede apreciar muy rápidamente si cada uno
de los coeficientes de regresión es individualmente significativo desde el pun-
to de vista estadístico, es decir, significativamente diferente de cero. Como es
obvio, cualquiera otra hipótesis nula puede ser verificada haciendo uso de ,
(5.3.2) y de los errores estándares estimados que se presentan en (5.11.1). La
hipótesis nula igual a "cero" es como una especie de "comodín" usado con
fines estratégicos para "dramatizar" la significancia estadística de un coefi-
ciente estimado.
Como se mencionó antes, el valor F reportado sencillamente refuerza el
estadístico ten la prueba de la hipótesis de que el verdadero coeficiente de la
128 MODELOS UNIECUACIONALES DE REGRESION

pendiente P2 es cero. Cuando estudiemos los modelos de regresión múltiple


hablaremos de otros usos de la prueba F.

5.12 EVALUACION DE LOS RESULTADOS


DEL ANALÍSIS DE REGRESION
Una vez se reportan les -resultados del análisis de regresión con la representa-
ción de la ecuación (5.11.1), es natural hacer la pregunta ¿qué tan "buenos"
son los resultados? Necesitamos apelar a algunos criterios para responder a
esta pregunta. Ante todo, los signos de los coeficientes estimados deben estar
de acuerdo con las expectativas teóricas o previas. De esta manera, se espera
que la línea de mercado de capital (LMC) de la teoría del portafolio analizado
previamente tenga pendiente positiva. Si en una aplicación éste resulta ser el
caso, se puede decir que el resultado es satisfactorio. Segundo, si la teoría o
la experiencia previa nos lleva a creer que un coeficiente determinado es, en
términos estadísticos, significativamente diferel1te de cero, como se espera
sea el caso para la pendiente de la LMC, entonces si los resultados reales son
de hecho significativos, nuevamente se puede decir que éstos son consistentes
con la teoría. Tercero, puesto que el r'2 mide la bondad global del ajuste del
modelo de regres~ón estimado, se puede decir que el modelo es satisfactorio
si el valor de r'2 es razonablemente alto, digamos, alrededor de 0.8. Pero este
eriterio no se debe ponderar demasiado, puesto que siempre se puede aumen-
tar el r'2 éigregando al modelo variables explicativas adicionales. Por tanto,

TABLASA
Indice de compensación real (Y) e índice de productividad por hora
(X), sector comercial, Estados Unidos, 1960 - 1983

Año y. r Año ya r
1960 69.5 65.2 1972 95.7 92.4
1961 71.4 67.4 1973 97.3 94.8
1962 73.8 69.9 1974 95.9 92.5
1963 75.6 725 1975 96.4 94.6
1964 78.4 75.6 1976 98.9 97.6
1965 80.1 78.3 1977 100.0 100.0
1966 83.3 SO.8 1978 100.8 100.5
1967 85.3 82.6 1979 99.1 99.3
1968 88.3 85.3 1980 96.4 98.8
1969 89.7 85.5 1981 95.5 100.7
1970 90.8 86.2 1982 97.3 100.9
1971 92.8' 89.3 1983 98.4 103.7

Compensación por hora dividida por el índice de precios al consu-


=
midor para todos los consumidores, 1977 100.
Producto doméstico bruto en dólares de 1972 por hora, para
todas las personas, 1977 = 100.
Fuente: Economic Report of the President, 1985, tabla B-40, p. 278.
REGRESION CON DOS VARIABLES: ESTIMACION POR INTERVALOS Y PRUEBA 129

si los dos primeros criterios se cumple.n y r2 es razonablemente alto, todo


está bien. Pero si se satisfacen los dos primeros criterios y el valor de r 2 es
bajo, por ejemplo, menor que 0.6, no debemos desanimamos. De hecho pos-
teriortnente dernostraremos que para series .de corte transversal con varios
cientos de' observaciones se pueden obtener valores muy bajos para r 2 , pero
encontrando también que los coeficientes estimados tienen el signo correcto
y que un buen número de elfos son estadísticamente significativos y de acuer-
do a las expectativas previas. Reiterando 10 anterior no debe exagerarse la
importancia del criterio de un valor "elevado" de r 2 •
Existen algunos criterios adicionales de evaluación que incorporaremos
al análisis a medida que desarrollamos.el tema. 18

5.13 EJEMPLO ILUSTRATIVO:


LA RELACION ENTRE SALARIOS Y PRODUCTIVIDAD
EN LOS ESTADOS UNIDOS ENTRE 1960-83
La Tabla 5.4 presenta información sobre Y, el índice de compensación real por hora
y X, el índice de productividad por hora, para el sector comercial de la economía de
los Estados Unidos entre los años de 1960 y 1983.
Puesto que se espera que la compensación real y la productividad estén relacio-
nadas,19 se puede utilizar el siguiente modelo sencillo para averiguar hasta qué
punto las dos variables están relacionadas;

y, = Pt + plX, + u,; Pl > O(a priori) (5.13.1)

Al aplicar el método de MCO a los datos dados en la Tabla 5.4 obtuvimos los si-
guientes resultados:. (Véanse los resultados del programa estadístico SAS en el Apén-
dice SA. (Sección SA.3).
f, = 16.8978 + 0.8254 X, rl = 0.9566.
(3.3341) (0.0375) g del = 22 (5.13.2)
t = (5.0681) (21.9956) F(1, 22) = 483.808

Al examinar los resultados observamos que el Pl estimado es positivo, de acuer-


do con las expectatiYas previas. El coeficiente estimado de la intersección con el eje
Y es positivo, lo cual implica que aunque la productividad sea cero, existen ingresos
positivos. No obstante, como se mencionó en el Capítulo 3, ésta es una interpreta-
ción mecánica de la intersección con .el eje Y, y que en muchos casos no tiene una
verdadera significación económica.

18 Por ejemplo, agregaremos el estadístico d de Durbin-Watson para evaluar la correlación serial cuan-
do se sospeche que puede haber un problema de correlación~erial en los datos (véa$e Capítulq 10 pará
mayores detalles).
1 9 Se puede invocar la teoría microeconómica de la productividad marginal aplicada a nivel macro o
nacional, para hipotetizar una relación positiva entre las dos variables.
130 MODELOS UNlECUACIONALES DE REGRESION

. Volviendo a la significancia del coeficiente estimado para la pendiente,


se puede observar que, puesto que el valor t de 21.996 es muy superior a
nuestra regla "2-t", defmitivamente se puede rechazar la hipótesis nula de
que no existe rela~ión entre los ingresos y la productividad. De hecho, si con-
sultamos la Tabla t, vemos que para 22 g de 1, un valor t de 3.S()S o más es
estadísticamente significativo a.IQs.niveles del 1% (con una cola) y 2% (con
dos colas). En otras palabras, si la hipótesis nula "cero" fuera verdadera, la
probabilidad de obtener un valor t de 3.505 o mayor sería muy pequefta. Por
tanto, se puede rechazar la hipótesis nula, siendo muy pequefta la probabilidad
de cometer el error de tipo 1. lO
Consideremos cómo se aplicaría el análisis para la hipótesis Ho: Pl = 1.0,
la cual implica que existe una relación uno a uno entre los ingresos y la pro-
ductividad: si el índice de productividad aumenta en un punto, el de ingre-
sos también aumenta en un punto. Se puede evaluar fácilmente esta hipóte-
sis utilizando la Sección 5.3.2)
0.8254 - 1
t= 0.0375
= -4.656 (5.13.3)

También podemos rechazar esta hipótesis nula, puesto que .el valor t estima-
do (en términos absolutos) excede la regla crítica "2-t". Al consultar la tabla,
t, se verá que el valor t estimado es de hecho significativo al nivel del 1% (con
una cola) o al 2% (2 colas). No obstante, la prueba de una cola es más rele-
vante en este caso. (¿Por qué?) Por tanto, la conclusión global es que aunque
P2 es mayor que cero, es, sin embargo, menor que 1; los salarios o ingresos y
la productividad están relacionados positivamente, pero no a través de una
relación l a 1. Obsérvese, a propósito, que el valor F de 483.808 es el cuadra-
do del valor t de 21.996, descontando los errores de aproximación.
El valor del r l de 0.9566 implica que aproximadamente el 96% de la
variación en los ingresos se explica por la variación en la productividad, lo cual
es una explicación muy poderosa, considerando la simplicidad del modelo.
En general, los resultados que hemos obtenido son bastante buenos,
con base' en los criterios analizados en la sección 5.12. ¿Significa esto que
nuestro modelo es satisfactorio? Por ahora, digamos que el modelo es consis-
tente con la teoría de la productividad margínal. Posteriormente demostrare-
mos que nuestros resultados pueden estar plagados de problemas de correla-
ción serial. (Véase Capítulo 10).

20 Los valores t reportados en SAS y en otros programas de computación siempre suponen que la
hipótesis nula es /12 = O. Por tanto, si usted desea evaluar cualquiera otra hipótesis nula debe calcular
su propio valor t, lo cual puede hacerse fácilmente partiendo de la fórmula general (5.3.2) como se
muestra a continuación.
REGRESION CON DOS VARIABLES: ESTIMACION POR INTERVALOS Y PRUEBA 131

5.14 RESUMEN Y CONCLUSIONES


La estimación y la prueba de hipótesis constituyen las dos ramas de la esta-
. dística clásica. Habiendo analizado a fondo el problema de la estimación en
los Capítulos 3 y 4, en el presente capítulo -consideramos el problema de la
prueba de hipótesis. Enunciado en forma sencilla, la prueba de hipótesis
está relacionada con la pregunta ¿es un determinado resultado, compatible
con cierta hipótesis enunciada? Existen dos enfoques mutuamente comple-
mentarios para responder a esta pregunta: el intervalo de confianza y la prue-
ba de significan cia.
El concepto de la estimación por intervalos es la base del procedimiento
del intervalo de confianza. Un estimador de intervalos, a diferencia de un
estimador de punto, es un intervalo o rango construido de tal manera que
tiene una probabilidad específica de incluir dentro de sus límites el verdade-
ro valor del parámetro desconocido. El intervalo que se construye de esta
manera se conoce como intervalo de confianza. Si el valor hipotético (nulo)
del parámetro se encuentra dentro del intervalo de confianza, la hipótesis
se puede aceptar; si éste cae fuera de este intervalo, la hipótesis se puede
rechazar. Es decir, el intervalo de confianza proporciona un conjunto de hi-
pótesis posibles sobre los valores de parámetros desconocidos.
Dentro del procedimiento de la prueba de significancia, en lugar de cons-
truir un intervalo de confianza para el valor de un parámetro desconocido,
desarrolla un estadístico o criterio de prueba y examina la distribución mues-
tralque se encuentra bajo la hipótesis nula. El estadístico de prueba está
basado generalmente en una distribución probabilística bien definida, ya
sea normal, t o ji-cuadrado. El estadístico de prueba, calculado a partir de la
muestra disponible, se compara con los valores críticos que se obtienen de la
disfribucjón probabilística relevante. Si el estadístico de prueba calculado
excede el valor crítico, la hipótesis nula se puede rechazar; en caso contrario,
ésta se puede aceptar.
Después de analizar la teoría en la que se fundamenta la prueba de hipó-
tesis, consideramos diferentes aspectos prácticos sobre el tema en cuestión.
Primero analizamos la regla empírica "2-t", la cual plantea que si los grados
de libertad son razonablemente elevados, digamos de 20 o más y asumiendo
un nivel de significancia del 5 %, se puede rechazar la hipótesis nula de que el
verdadero coeficiente de la pendiente /32 ,es cero si el valor t estimado en tér-
minos absolutos, es superior a .2. En segundo lugar, anali~amos cómo se
formulan las hipótesis para las pruebas estadísticas. Expectativas a priori o
teóricas, trabajo empírico previo, o ambos, pueden utilizarse para formular
las hipótesis. No obstante, independientemente del método, se hizo énfas~s
en que el investighdor debe formular las hipótesis nula y alterna antes de rea-
lizar los cálculos estadísticos para evitar la tentación de formular las hipótesis
después de examinar los resultados. En tercera instancia, consideramos el
importante tema de cómo escoger el valor de IX, el nivel de significancia, la
probabilidad de cometer el error de tipo 1. Se ha hecho algo común el proce-
dimiento de utilizar en la práctica un nivel de significancia del 1% , del 5 % o,
máximo, del 10%. Sin embargo, 110 se puede asegurar que esta escogencia de
132 MODELOS UNIECUACIONALES DE REGRESION

la estadística clásica es arbitraria, ni se puede decidir verdaderamente el valor


de a:, sin evaluar los costos involucrados al cometer los errores de tipos 1 y 11
a diferentes niveles de IX. Finalmente, observamos que un estimativo, a pesar
de ser estádísticamente significativo, puede no serlo en la práctica. En este
caso, también se deben evaluar las conseeuencias, por ejemplo, en términos
monetarios, de no basarse sencillamente. en la significancia estadística de un
estimativo, tema A.ue pertenece al campo de la teoría de las decisiones.
En este capítulo consideramos también el enfoque del análisis de varian-
za en el análisis de regresión y mostramos la forma como complementa los
procedimientos de intervalos de confianza y de pruebas de significancia
con los que se efectúan las pruebas de 'hipótesis. Finalmente, demostramos
cómo la línea de regresión muestral que se obtiene de los datos puede utili-
zarse para fmes de proyección. Se analizaron, igualmente, los problemas in-
volucrados en la extrapolación de la línea de regresión muestral en forma
indiscriminada.

EJERCICIOS
5.1. Con referencia al Ejercicio 3.11.
(a) Calcule los errores estándar de las estimaciones de los parámetros y estime al.
(b) Establezca intervalos de confIanza del 95% para Plo P2' Y (12.
(e) Evalúe las siguientes hipótesis a un nivel de signrucancia del 5% (i) P2 = O, (ü) PI = O.
(el) ¿Puede usted probar la hipótesis de que P1 = P2 = O simultáneamente, apli-
~do la prueba t? Si no es posible, explique por qué.
(e) Haga una predicción de la tasa de variación promedio del cambio en los precios
de las acciones, dada una tasa de variación en los precios al consumidor del 6%.
Averigüe el error estándar de la predicción.
(j) Haga una predicción de la tasa de cambio del precio individual de una acción,
dado que la tasa de cambio en el precio al consumidor es del 6%. Averigüe el
error estándar de la predicción. .
(g) Evalúe la hipótesis de que pz = O utilizando la técnica del ADV. ¿Soporta la
pruebaFla conclusión dada en (cXi)? Por qué?
5.2. La tabla del ADV para el Ejercicio 3.9 es la siguiente:

Puente de wriaci6n A D v
Debidas a la regresi6n 2.153 1 2.153
Debidas a losreslduos 1.144 11 0.104

Total 3.297 12

Con base en los datos anteriores, evalúe la hipótesis nula según la cual la tasa de
retiro no está linealmente relacionada con la tasa de desempleo.
5.3. Para el ejemplo de salarios-productividad de la Sección 5.13 y basados en el resul-
tado de la regresión reportado en(S.13.2), ¿puede usted llenar la tabla de ADV? ¿Qué
información adicional necesita? Si se le dice que la suma de residuos al cuadrado
SRC es 99.11, ¿le servirá de ayuda? Muestre los cálculos necesarios.
REGRESION CON DOS VARIABLES: ESTIMACION POR INTERVALOS Y PRUEBA 133

5.4. Dada la "regresión consumo de café/precio, ecuación (3.7.1.). evalúe la hipótesis de


que para el período 1970-1980 no hubo relación entre el consumo y el precio del
café en los Estados Unidos. Utilice el nivel de significancia del 5%. ¿Utilizaría usted
la prueba de una cola, o la de dos colas? ¿Por qué?
5.5. Refiérase al Ejercicio 3.12 y evalúe la hipótesis de que 112 > 0, para las regresiones
del PNB tanto en términos corrientes como constantes,
5.6. Refiérase al Ejercicio 3.13. Prepare la Tabla de ADV para evaluar la hipótesis de que
los cambios en la oferta monetaria no tienen ningún efecto sobre el lPe.
5.7. Con referencia al Ejercicio 3.18,
. (a) ¿Existe alguna relación entre la propiedad de aparat.Qs telefónicos y el PDB per
eápita en Singapur para el período 1960-1981?
(b) Suponiendo que el PDB real per eápita en 1982 fue de US$5,752, ¿cuál es el
valor promedio estimado de Y, el número de teléfonos por cada población de
1000 personas para ese afio? Establezca un intervalo de confianza del 95% para
esta estimación.
5.8. Remítase al Ejercicio 1.1, para cada país que aparece allí, ajuste el siguiente mo-
delo:
y, = 111 + 112 X, + u,
donde Yt = tasa de inflación en el período t, Xt = tiempo, tomando valores de 1, ~
oo. 21, YUt = término de perturbación estocástica.
(a) ¿A qué conclusiones generales puede usted llegar sobre el comportamiento de
la inflación en cada país?
(b) Para la regresión de cada país, evalúe la hipótesis de que 112, el coeficiente de
tendencia, es mayor que cero: (Utilice un nivel de significancia del 5%).
5.9. Continúe con los datos del Ejercicio 1.1. y estime la siguiente regresión:
Y¡, = 111 + 112 X, + u,
donde Y it = tasa de inflacion en el país i, donde i corresponde a Gran Bretaña,
Japón, Alemania o Francia, y X t = tasa de inflación para los Estad'os Unidos.
(a) Para cada una de las cuatro regresiones, ¿existe alguna relación entre la tasa
de inflación de ese país y la tasa de inflación en los Estados Unidos?
(b) ¿Cómo evaluaría usted formalmente esta relación?
(e) ¿Se puede utilizar el modelo para predecir la tasa de inflación en los cuatro
pal~(ls después de 1980? ¿Por qué sí o por qué no?

5.10. En la siguiente tabla. se presenta informacion sobre el PNB y cuatro definiciones


de la masa monetaria para los Estados Unidos entre 1970 y 1983.
134 MODELOS UNIECUACIONALES DE REGRESION

El PNB Ycuatro medidas de la masa monetaria


PNB Medida de la masa monetaria
($ miles de ($ miles de millones)
Año millones) MI M2 M3 L

1970 997.2 216.6 628.2 677.5 816.3


1971 1077.6 230.8 7128 776.2 903.1
1972 1185.9 2S2.0 8OS.2 886.0 1023.0
1973 1326.4 26S.9 861.0 985.0 1141.7
1974 1434.2 277.6 908.S 1070.5 1249.3
1975 1549.2 291.2 1023.3 1174.2 1367.9
1976 1718.0 310.4 1163.6 1311.9 IS16.6
1977 1918.3 33S.4 1286.7 1472.9 1704.7
1978 2163.9 363.1 1389.1 1647;1 1910.6
1979 2417.8 389.1 1498.S 1804.8 2117.1
1980 2631.7 414.9 16326 1990.0 2326.2
1981 29S7.8 441.9 1796.6 2238.2 2S99.8
1982 3069.3 480.S 1965.4 2462S 2870.8
1983 3304.8 S2S.4 2196.3 2710.4 3183.1

Definiciones
MI = Efectivo + depósitos en cuenta corriente + cheques
viajeros y otros depósitos en cheque.
M, = MI + transacciones de recompra entre bancos y euro-
dólares + Saldos MMF + MMDA + ahorros y pequelios
depósitos.
M, = . M2 + depósitos a largo plazo + transacciones de com-
pra a largo plazo + MMMF institucional.
L = M, + otros activos líquidos

Fuente: Economic Report o[ the. President, 1985, Datos del


PNB de la tabla B-1, p. 232; los datos sobre agregados mone-
tarios provienen de la tabla B-61, p. 303.

Al hacer regresiones del PNB con respecto a las diferentes definiciones de dinero,
obtuvimos los resultados que aparecen en la tabla a continuación:
Regresiones para el PNB - agregados monetarios, 1970-1983

1) PNB. = -787.4723 + 8.0863 MI. ,2 = 0.9912


(77.9664) (0.2197)
2) PNB. = -44.0626 + 1.S87S M 2 • ,2 = O.990S
(61.0134) (0.0448)
3) 'PNB. = 159.1366 + 1.2034 M3. ,2 = 0.9943
(42.9882) (0.0262)
4) PNB. = 164.2071 + 1.0290 L. ,2 = 0.9938
(44.7658) (0.0234)

Nota: Las cantidades entre paréntesis corresponden a los


errores estándares estimados.
Los monetaristas afmnan que el ingreso nominal (esto es, el PNB nominal) se deter-
mina principalmente por cambios en la masa monetaria, aunque no existe un con-
senso con respe~to a la definición "correcta" del dinero. Dados los resultados en la
tabla anterior:
(a) ¿Cuál defmición monetaria parece estar más relacionada con el PNB nominal?
REGRESION CON DOS VARIABLES: ESTIMACION POR INTERVALOS Y PRUEBA 135

r
(b) Puesto que los son unifonnemente altos, ¿significa esto que no jmportacuál
defmici6n del dinero se escoja?
(e) Si el Banco de la Reserva Federal (de los .Estados Unidos) desea controlar la
oferta de dinero, ¿c~ de estas m~didas monetarias es más adecuada para tal
propósito? ¿Puede usted obtenerla basándose en los resultados de regresión?
5.11. R.A. Fisher ha derivado la distribución muestral del coeficiente de correlación defi·
nido en (3.5.10). Si se' alpone que las variables X y Y poseen una distribución nor·
mal conjunta, es dedr •. ".provienen de una distribución nonnal bivariada (véase
Apéndice 4A, Sección 4A.1. Ejercicio 4.1), entonces bajo el supuesto de que el'coe·
ficiente de correlación pob1acional es cero, se puede demostrar que t - , -.2/ JN
JI=? sigue la distribución t de Student con N - 2 g de 1.· Demuestre que este
valor tes idéJ;lüCO al valor t dado en (5.3.2) bajo la hipótesis nula de que 1J2 - o.
=
Por tanto, establezca que, bajo la misma hipótesis nula, F t 2 • (Véase Secci6n·S.9).
5.12. Suponiendo que la ecuación de una curva de indiferenc~ entre dos bienes es
X, y, = P1 + P2 X,
¿Cómo estimaría los parámetros de este modelo?
Aplique el modelo anterior a los siguientes. datos y comente acerca de lo.resul·
tados:

Consumo del bien X: 1 2 3 4 5

Consumo del bien Y: 4. 3.5 2.8 1.9 0.8

5.13. La línea de mercado de capital (LM'C) de la teoría del portafolio·· p~tu1auna rela·
ción lineal entre el retomo o rendimiento esperado y el riesgo (medido por la des-
viación estándar) pita portafolios eficientes, así:

E, = P1 + P2(J,
donde El = rendimiento esperado del portafolio i y (J, - desviación ell'tándar de
rendimiento. Se cuenta con la siguiente infonnación sobre el rendimiento esperado
y la desviación estándar del mismo para los portafolios de 34 fondos mutuos de in·
versión en los Estados Unidos para el período 1954·1963. Verifique hasta qué
punto las cifras. respaldan la teoría.

• Si de hecho es cero, Fisher ha demostrado que r posee la misma distribución t, dado que X o Y ten
gan una distribución normal. Pero si p no es igual a cero, ambas variables deben tener una distribución
normal. '
•• Véase William F. Sharpe, Portlolio Theory and Capital Markets, McGraw·Hill Book Company, New
York, 1970, p. 83. -
138 MODELOS UNIECUACIONALES DE REGRESION

COMPORTAMIENTO DE 34 FONDOS MUTUOS DE


INVERSION,1954-1963

DeBYiadón
Rendimiento estándu del
anual rendimiento anual
promedio % promedio %

Affiliated Fund 14.6 15.3


American Business Shares 10.0 9.2
Axc-Houghton. Fun4 A 10.5 13.5
Axc-Houghton. Futld B 120 16.3
Axc-Houghton. Stock Fund 11.9 15.6
Boston Fund 12.4 12.1
Board Strcet Investing 14.8 16.8
Bullock Fund 15.7 19,3
Commonwealth Investment. Company 10.9 13.7
Dclaware Fund 14.4 21.4
Dividend Shares 14.4 15.9
Eaton and Howard Balanced Fund 11.0 U.9
Baton and Howard Stock Fund 15.2 19,2
Eq¡Pty Fund 14.6 18.7
Fidelity Fund 16.4 23.5
Financial IndustriaL Fund 14.S 23.0
Fundamental Investors 16.0 21.7
Group Securities. Common Stock Fund 15.1 19.1
Group Securities. Fully Administered Fund 11.4 14.1
Incorporated Investors 14.0 25.5
Investment Company of America 17.4 21.8
Investors Mutual 11.3 125
Loomis·Sales Mutual Fund 10.0 10.4
Massachusetts Investors Trust 16.2 20.8
Massachusetts Investors--Growth Stock 18.6 22.7
National Investors Corporation 18.3 19.9
National Securities-Income Series 12.4 17.8
New .England Fund 10.4 10.2
Putnam Fund of Boston 13.1 16.0
Scudder, Stevens & Oark Balanced Fund 10.7 13.3
Selccted American Shares . 14.4 19.4
United Funds-Income Fund 16.1 20.9
Wellington Fund 11.3 12.0
Wisconsin Fund 13.8 16.9

Fuente:' William F. Sh arp e , "Mutual Fund Performance".


Joumal 01 Business, suplemento, enero, 1966, p. 125.

5.14. Suponienao que el nivel de significancia se Lija a un nivel del 0.01, ¿qué valor t pro-
pondría usted si tuviera 20 g de 1 Ó más para evaluar las hipótesis?

(a) H O:Pl=O;H 1 :Pl"#O

\b) H O :Pl=O;H 1 :Pl>O


. (N - 2)r"
5.15. ¿Se puede expresar la ecuac1ón (5.9.1) como F = (1 _ r")
REGRESION CON DOS VARIABLES: ES1IMACION POR INTERVALOS Y PRUEBA 137

(Sugerencia: ¿ ef = (1 - r2 ) ¿
y r2 = ~ xf I¿ yf)
yf ¿
¿Qué ventajas se tienen al expresar F de esta forma?
5.16. La ecuación (5.3.5) se puede expresar también como;
t>r [l1z - t./ 2 se (/12) < fJz < 112 + t./ 2-se (112)] = 1- IX

lo cual implica remplazar la desigualdad débil (:5:) por la desigualdad fuerte «).
¿Porqué? .
5.17. Utilicemos el ejemplo ilustrativo consumo-ingreso mencionado en este capítulo.
Obsérvese que no podemos escribir:
Pr (0.4268 :5: fJ2 :5: 0.5914) = 0.95
pero, si fJz = 0.3" podríamos decir que
Pr (0.2177 :5: 112 :5: 0.3823) = 0.95
¿Por qué? ¿Existe alguna diferencia clave entre los dos enunciados?
5.18. Si fJz = O , demuestre que
F¡.k = t¡ (teorema 5.6.)
[Sugerencia: comience con (5.9.1) y recuerde (5.3.2)].
5.19. Lo que se conoce como [(nea caracterz'stica del análisis de inversión moderno es
simplemente la línea de regresión obtenida del siguiente modelo:
r¡1 = C1.¡ + fl¡r ml + U,
donde '¡, = tasa de retorno del iésimo título valor en el período t
'mI tasa de retorno del portafolio del mercado en el período t
=
U, término de perturbación estocástica
=
En este modelo, Pi se conoce como coeficiente beta del iésimo título valor como
medida del riesgo en el mercado (o riesgo sistemático) de un título valor. *
Con base en 240 tasas de retorno mensuales para el período 1956-1976,
Fogler y Ganapathy obtuvieron la siguiente línea característica para las acciones de
IBM en relación con el índice de portafolio desarrollado en la Universidad de Chi-
cago:**
'¡, = 0.7264 + 1.{)598 'mI ,2 = 0.4710

(0.3001) (0.0728) df = 238

F 1.238 = 211.896
(a) Cuando un título valor tiene un coeficiente Beta mayor que 1, se dice que es
volátil o que es un valor agresivo. ¿Fueron las acciones de IBM valores volátiles
en el período de tiempo bajo estudio?
(b) ¿Es el coeficiente de intersección con el eje Y significativamente diferente de
cero? Si lo es, ¿cuál es su significado práctico?

* Véase Haim Levy y Marshall Sarnat, Portfolio and Investrrrent Selection: Theory and Practice. Pren-
tice-Han International, Englewood CHffs, N.J., 1984, Cap. 12 .
.. H. Russell Floger y Sudaram Ganapathy, Financial Econometrics. Prentice-Hall Inc., Englewood
Cliffs, N.J., 1982, p. 13.
138 MODELOS UNIECUACIONALES DE REGRESION

APENDICESA

SA.1 DERIVAClON QE LA ECUACION (5.3.2)


\ Sea

(1)

y (2)

Dado que el valor de (1 es conocido, Z 1 posee una distribución nonnal


estandarizada; es decir, ~ - N (0,1). (¿Por qué?) Za tiene una distribución
X2 con (N - 2) g de 1. (rara una prueba, véase nota de pie de página No. 9).
Además, se puede demostrar que Z2 tiene una distribución independiente
de Zl • . Por tanto, en virtud del teorema 5.4, la variable
Zl.;N=2
t= .¡z; (3)

tiene una distribucion t con N ~ 2 g de 1. Remplazando (1) y (2) en (3) se


obtiene (5.3.2).

5A.2 DERIVACION DE LA ECUACION (5.9.1)


La ecuación (1) muestra que Z1 - N (0,1). Por tanto, 5.2, la cantidad ante-
riqr

sigue una distribución X2 con 1 g de 1. Como se menciono en la Sección SAJ,

también posee una distribución X2 con N - 2 g de 1. Además, como se men-


cionó enla Sección 4.3, Z" está distribuido independientemente de Z1' En-
tonces, al aplicar el teorema 5.5, tenemos que
F = ZVl = (P2 - P2)2(¿ x~)
Z 2/(N - 2) L ef/(N - 2)

• Para una prueba, véase J. Johnston, Op. cit., pp. 181-182. (Se necesita tener conocimientos de álge-
bra matricial para seguir la prueba).
REGRESION CON DOS VARIABLES: ESTIMACION POR INTERVALOS Y PRUEBA 139
sigue una distribución F con 1 y N - 2 g de 1, respectivamente. De acuerdo
con la hipótesis nula .Ho: P2 = O , la anterior razón F se reduce a la ecuación
(5.9.1).
5A.3 SAS OUTPUT OF UNITED STATES
W AGES-PRODUCTIVITY REGRESSION
(5.13.2)

DEP VARIABLE: Y

SUM OF MEAN
SOURCE DF SOUAAES SQUARE F VALUE PROS> F
MODEl 1 2179.57536 2179.57536 483.8083 0.0001
ERROR 22 99.11087 4.50504
TOTAL 23 '2278.68623

Roor MSE 2.122508 R-SOUARE 0.9566


OEP MEAN 89.654167 ADJ R-SO 0.9546
C.V. 2.367439

PARA METER STANDARD T FOA HO:


VARIABLE DF ESTIMATE ERROR PARA METE A = o PROS> ITI

INTE~CEP ·1 16.8978 3.3341 5.0681 0.0001


X 0.8254 0.0375 21.9956 0.0001

COVARIANCE OF ESTIMATES
cove INTERCEP X2
INTERCEP 11.11622 -0.122308
X2 -0.122308 0.0014062

oes y X2 YHAT YRESID


1 69.5 65.2 70.7116 -1.21163
2 71.4 67.4 72.5274 -1.12744
3 73.8 69.9 74.5909 -0.79085
4 75.6 72.5 76.7368 -1.13680
5 78.4 75.6 79.2954- -0.89543
6 SO. 1 78.3 81.5239 -1.42392
7 83.3 SO.8 83.5873 -0.28733
8 85.3 82.6 85.0730 0.22701
9 88.3 85.3 87.3015 0.99852
10 89.7 85.5 87.4668 2.23345
11 90.8 86.2 88.0443 2.75570
12 92.8 89.3 90.6029 2.19706
13 95.7 92.4 93.1616 . 2.53842
14 97.3 94.8 95.1425 '2.15755
15 95.9 92.5 93.2441 2.65589
16 96.4 94.6 94.9774 1.42263
17 96.9 97.6 97.4535 1.44653
.18 l00.Q 100.0 99.4343 0.56565
19 100.8 100.5 99.a.70 0.95297
20 99:1 99.3 98.8566 ').24340
21 96.4 98.8 98.4439 -2.04391
22 95.5 10().7 100.012 -4.51210
23 97.3 100.9 100.1n -2.87718
24 98.4 103.7 102.488 -4.08820
OURBIN-WATSON d 0.239T
CAPITULO 6
EXTENSIONES DEL
MODELO DE REGRESION
LINEAL CON DOS
VARIABLES

Existen algunos aspectos del análisis de regresión lineal que se pueden intro-
ducir fácilmente dentro del marco del modelo de regresión lineal con dos va-
riabies, que hemos estudiado hasta ahora. En primer lugar, consideramos el
caso de la regresión a través del origen, situación en la cual el término de la
intersección con el eje Y, PI' no aparece en el modelo. A continuación consi-
deramos el tema relacionado con las unidades de medición, es decir, la mane-
ra como se miden las variables Y y X Y si un cambio en las unidades de medi-
ción afecta los resultados d.e la regresión. Finalmente, consideramos el tema
de la forma funcional de 1,In modelo de Tegresión lineal. Hasta ahora hemos
considerado modelos que' son lineales tanto en los parámetros como en las
variables. Sin embargo, recordemos que la teoría de regresión desarrollada en
los capítulos anteriores solamente requiere que los parámetros sean lineales;
las variables pueden o no entrar linealmente en el modelo. En este eapítulo,
al considerar modelos lineales en los parámetros, pero no necesariamente en
las variables, ilustramos cómo los modelos con dos variables pueden utilizarse
en ciertos problemas prácticos interesantes.
Después de comprender las ideas que introducimos en este capítulo, su
aplicación en los modelos de regresión múltiple es bastante clara.
140
EXTENSIONES DEL MODELO DE REGRESION LINEAL CON DOS VARIABLES 141

6.1 REGRESION A TRAVES DEL ORIGEN


Existen situaciones en que la FRP de dos variables toma la siguiente fonna:
(6.1.1)
En este modelo, el ténnino de intersección con el eje Y no existe o es cero,
recibiendo, por tanto, el nombre de regresión a r;avés del origen.
Como ilustración, consideremos el modelo de cotización de activos de
capital (MCAC) de la teoría moderna del portafolio, el cual, se puede expre-
sar com0 1
(ER¡ - TI) = p~ER", - TI) (6.1.2)

donde: ER, = retomo esperado de la inversión para el título valor i.


ER", = retomo esperado de la inversión sobre el portafolio de merca-
do, representado, por ejemplo, el índice de acciones compuesto
S &P 500
TI = retomo en la inversión libre de riesgo, por ejemplo, el retomo
sobre bonos del tesoro federal a 90 días en los Estados Unidos
p¡ = el coeficiente p o la medida del riesgo sistemático que no se
puede elim~ar a través de la diversificación. Además, una me-
dida del grado en que el retomo. en la inversión deliéSImo títu-
lo valor se mueve con el mercado. Un P, > 1 implica.un título
valor agresivo o volátil, mientras que p¡ < 1 .implica un título
valor conservador. (Nota: No confunda éste con el coeficiente
de la pendiente de la regresión de dos variables, P2')
Si los mercados de capital funcionan eficientemente, entonces el MCAC
postula que el premium diferencial de riesgo espérado para el valor i ( = ER¡ - TI)
es igual al coeficiente P del título valor multiplicado por el premium diferen-
cial de riesgo esperado en el mercado ( = ER", - TI)' Si lo anterior es válido, se
tiene la situación ilustrada en la Figura 6.1. La línea que se muestra en la
figura se conoce como linea del mercado de títulos valores (LMV).
Para propósitos empíricos, (6.1.2) comúnmente se expresa como
R¡ - T¡ =P~R", - T¡) + U¡ (6.1.3)
o
R¡ - TI = (X¡ + p~R", - TI) + U¡ (6.1.4)

Este último modelo se conoce como modelo del mercado. 2 Si el MCAC es


válido, se espera que «¡ sea éero. (Véase Figura 6.2).

1 YIae, por ejemplo, Diana R. Hatrington, Modern Portfolio Theory and the Capital Asret Pricing
. Prentice-Halllntemational, Englewood Cliffs, N.J., 1984, Cap. 14.
2 Yhue, por ejempli. Diana R. Hatrlngton, Modem Portafolio Theory and the Capital Asset Pricing
Modd: A U,er', Guille, Prentice· Hall,lnc., Englewood Cliffs, N.J., 1983, p. 71.
142 MODELOS UNIECUACrONALES DE REGRESION

-------------(3/ FIGURA 6.1


O Riesgo sistemático

A propósito, en la ecuación (6.1.4) la variable dependiente Y es (R¡ - r,)


y la variable explicativa X es Pi' el coeficiente de volatilidad y no (R m - r¡).
Por tanto, al calcular la regresión (6.1.4) se debe estimar primero PI' cuyo
valor se estima a partir de la Unea característica tal como se describe en el
Ejercicio 5.19.
Como muestra este ejemplo, en ocasiones la teoría dicta que el téI1nino
de la intersección de las ordenadas con el eje Y no esté presente en el modelo.
Otros casos en que un modelo donde la intersección con el eje Y es cero pue-
de ser el adecuado, son el modelo de Milton Friedman de la hipótesis del in-
greso permanente, el cual enuncia que el consumo permanente es proporcio-
nal al ingreso permanente. Otros casos similares son el de la teoría de análisis
de costos, donde se postula que el costo variable de produ~ción es propor-
cional al nivel de producción, y algunas versiones de la teoría monetarista
R/-r,

--------i4I~------- (3/
Riesgo sistemático

FIGURA 6.2
El modelo del mercado para la teoría del portafoDo.
EXTENSIONES DEL MoOl:LO DE REGRESION LINEAL CON DOS VARIABLES 143

que enuncian que la tasa de cambio de los precios (esto es, la tasa de inflaci6n)
es proporcional a la tasa' de cambio de la oferta monetaria.
¿C6mo estimamos modelos como (6.1.1) Y qué problemas especiales
presentan? Para responder a estos interrogantes, primero escribamos la FRM
de la ecuación (6.1,.1),
(6.1.5)
Aplicando ahora el método de MeO a la ecuaci6n (6.1.5) obtenemos las
siguientes f6rmulas para P2 v su varianza. (Las demostraciones se encuentran
en el Apéndice 6A, Sección 6A.l):

(6.1.6)

(6.1.7)

donde (12 se estima por medio de

(6.1.8)

Es interesante comparar estas fórmulas con las obtenidas cuando el término


de irltersección con las órdenes se incluía en el modelo:

6_~
~
P2 -2 (3.1.6)
t...X,
(12
Var <P2) = ~ 2 (3.3.1)
L.. X,

A2
(1
_.I.E.
-N-2 (3.3.5)

Las diferencias. entre los dos grupos de f6rmulas deben ser obvias: en el mo-
deló donde está ausente la intersección con el eje de las ordenadas, utiliza-
mos sumas de cuadrados y productos cruzados. Sin embargo, en el modelo
donde está presente la intersecci6n utilizamos sumas de cuadrados ajustadas
(desviaciones del promedio) y productos cruzados ajustados. En segunda ins-
tancia, los g de 1 para calcular son (N - 1), en el primer caso, y (N - 2) en el
segundo. (¿Por'qué?)
Aunque el modelo sin intersección o con cero intersecci6n con el eje
y puede 'ser adecuado en algunos casos, es necesario mencionar ciertas carac- ,
terísticas de este modelo. Primero, L e" que siempre es cero para el modelo
con el término de intersección presente (el modelo convencional), no necesa-
riamente es cero cuando dicho término está ausente. En resumen, L el no
es necesariamente cero para la regresión a través'del origen. En s~gundo lugar
144 MODELOS UNIECUACIONALES DE REGRESION

el coeficiente de detenninación,2 introducido en- el Capítulo 3, que siempre


es positivo para el modelo convencional, puede en algunos casos tornarse
negativo para el modelo sin intersección. Este anómalo resultado se presenta
depido a que el r2 que se introdujo en el Capítulo 3 asume explícitamente
que la intersección está incluida en el modelo. Por tanto, el r 2 calculado con-
vencionalmente puedé no ser adecuado para los modelos de regresión a través
delorigen. 3
Debido a estas características especiales del modelo se debe tener una
gran precaución al utilizar el modelo de regresión con intersección igual a
cero. A menos que existan muy fuertes expectativas a priori, es conveniente
aferrarse al modelo convencional que incluye la intersección. Lo anterior
tiene una doble ventaja. Primero, si el término de la intersección está incluida
en el modelo pero resulta ser estadísticamente no significativo (es decir, esta-
dísticamente igual a cero), para todos los fmes prácticos tenemos un modelo
de regresión a través del origen. 4 Segundo, y más importante aún, si de he-
cho existe una intersección con el eje Yen el modelo pero insistimos en ajus-
tar una regresión a través del origen, estaríamos cometiendo un e"or de espe-
cificación, violando por consiguiente el supuesto 5 del modelo de regresión
lineal clásico.

Ejemplo ilustrativo:
La línea característica de la teoría del portafolio
La Tabla 6.1 presenta información sobre las tasas anuales de retomo sobre la inver-
sión en el fondo Afuture, un fondo mutuo de inversión cuyo objetivo fundamental
es generar la ganancia máxima sobre el capital. La tabla muestra igualmente la tasa
anual de retomo del portafolio del mercado, medida a través del índice de Fisher
para el período 1971-1980. .
En el Ejercicio S.19 introdujimos la línea caracteristica del análisis de inversio-
nes, lo cual puede expresarse como:
Y; = /X¡ + p¡X¡ + U i (6.1.9)

donde Y; = tasa anual de retomo en la inversión (%) del fondo Afuture


Xi = tasa anual de retomo en la inversión (%) del portafolio de mercado
Pi = coeficiente de la pendiente, también conocido como coeficiente Beta en
la teoría del portafolio y
/Xi = la intersección
En la literatura correspondiente no existe un consenso sobre el valor a prion'
/Xi' Algunos resultados empíricos han demostrado que es positivo y estadísticamente

3 Para un análisis más detallado, véase Dennis J. Aigner, Basie Eeon om e tries, Prentice-Hall, Inc.,
Englewood Cliffs, N.J., 1971, pp. 85-88.
4 Henry Theil hace énfasis en que si en realidad está ausente la intersección, el coeficiente de la pen-
diente se puede estimar con una mayor precisión que para el caso en que el término de la intersección
quede incluido en el modelo. Véase su texto Introduetton to Eeonometries, Prentice-Hall, Inc., Engle-
wood Cliffs: N.J., 1978, p. 76. También, véase el ejemplo numérico dado a continuación.
EXTENSIONES DEL MODELO DE REGRESION LINEAL CON DOS VARIABLES. 146

significativo, mientras que otros han demosu.do que no es de.


el punto de vista
estadístico sjgnificativamente diferente de cero; ea este últimocaao. podríamos
expresar el modelo como:
1, - /I,X , +"1 (6.1.10)

es decir, una regresión a través del origen.


Si decidimos usar el modelo (~:1.1) obtenemos los siguientes resultados de re-
gresión. (Véase el listado SAS, en el Apéndice 6A, Sección 6A.2).
1. - 1.0899 X,
(0.1916) (6.1.11)
t - (5.6884)
lo cual muestra que /1, es sjgnificativamente ntáYor Que cero: La interpretación del
anterior resultado es que un aumento de 1w. en la tasa de retomo del mercado
implica, en promedio, un aumento de aproximadamente 1.09 w. en el retomo de la
inversi6n para el fondo Afuture.
¿Cómo podemos estar seguros de que es el modelo (6.1.1) y no el (6.1.9) el
adecuado, en vista del hecho de que no existe una certidumbre a priori en la hipóte-
sis de que tX, es en efecto igual a cero? Esto se puede verificar llevando a cabo la
,regresión (6.1.9). Utilizando la infonnaci6n dada en la Tabla' 6. 1 obtuvimos los si-
guientes resultados:

TABLA 6.1
Tasas anuales de retomo en la imersi6n
anual (%), Fondo Afuture e Indice de
Fisher (portafolio de mercado), 1971-1980
Retomo en la inversión Retomo en la iDwni6n
para el fondo Afuture 'lb para el índice ele Filher %
, Afto (Y) (X)

1971 67.5 19.5


1972 19.2 8.5
1973 -35.2 -29.3
1974 -42.0 -26.5
1975 63.7 61.9
1976 19.3 t 5.5
1977 3.6 9.5
1978 20.0 14.0
1979 40.3 35.3
1980 37.5 31.0

Fuente: HIIm Levy Y MenJWl Samat, Portlo-


lio and Inve8tment Selection: Theory and Prac·
tice, Prentlce-Ha1l lntemational, EllJIewood
CUffa, N.J., 1984, p. 730 Y p. 738. Los autores
obtuvieron estos datos de Welsenber¡ Invest-
ment Servlce. Inve8tmmt Compantes, edici6n
de 1981.
146 M.ODELOS UNIECUACIONALES DE REGRESION

TABLA 6.1 .
Jnversi6n doméstica privada bruta (lDPD) y el producto
nacional bruto (PNB) en d61ares de 1972, Estados Unidos,
1974-1983

PNB(mBesde PNB (mB1ooes


IDPB(mBesde IDPB (~nes dones de ded6luesde
milloneade de d6lares d61aresde
Aio dÓiare8 de 1972) de 1972) 1972) 1972)

1974 195.5 195,500 1246.3 1,246,300


1975 154.8 154,800 1231.6 1,231,600
1976 184.5 184,500 1298.2 1,298,200
1977 214.2 214,200 1369.7 1,369,700
1978 236.7 236,700 1438.6 1,438,600
1979 236.3 236,300 1479.4 1,479,400
1980 208.5 208,500 1475.0 1,475,000
1981 230.9 230,900 1512.2 1,512,200
1982 194.3 194,300 1480.0 1,480,000
1983 221.0 221,000 1534.7 1;534,700

Fuente: Economlc Report ofthe Presldent, 1985, p. 234 (para los


datos expresados en mUes de millones de dólares).

r. = 1.2797 + 1.0691 XI
(7.6886) (0.2383) (6.1.12)
t = (0.1664) (4.4860)

A partir de estos resultados se puede aceptar la hipótesis de -que la intersección ver-


dadera no es (estadísticamente) diferente de cero, justificando así la utilización de
(6.1.1) 10 cual implica que la regresión pasa a través del origen.
Nótese que no existe una gran diferencia entre los resultados de (6.1.11) y los
de (6.1.12), aunque el error estándar estimado de P es ligeramente inferior para el
modelo de regresión a través del origen, apoyando así el argumento de Theil dado
en la función 4, de que si 11.¡ es en efecto cero, el coeficiente de la pendiente se pue-
de medir con mayor precisión: utilizando los datos de la Tabla 6.1 y los resultados
de la regresión, el lector puede verificar fácilMente que el intervalo de confianza del
95 % para el coeficiente de la pendiente del modelo de regresión a través del origen
es (0.6566, 1.5232) mientras que para el modelo (6.1.2) dicho intervalo es (0.5381,
1.6081), hecho que implica que el primer intervalo de confianza es más estrecho
que el segundo.

6.2 ESCALAS Y UNIDADES DE MEDICION


Para comprender las ideas desarrolladas en esta sección, considérense los datos
de la Tabla 6.2. La información presentada allí se refiere a la inversión domés-
tica privada bruta en los Estados Unidos (lDPB) y el producto nacional bruto
(PNB) en dólares de 1972 para el período 1974-1983. En la columna (1) se
encuentran los datos sobre la IDPB en miles de millones de dólares, mientras
que en la columna (2) se presentan los datos en millones de dólares. En .las
EXTENSIONES DEL MODELO DE REGRESION LINEAL CON DOS VARIABLES 147

columnas 3 Y 4 se muestran los datos sobre el PNB en miles de millones de


dólares, y en millones de dólares respectivamente.
Suponiendo que en la regresión de la IDPB en el PNB un investigador
utiliza l()s datos expresados en miles de millones de dólares, mientras que
otro utiliza los datos sobre estas variables, medidos en millones de dólares,
¿serán los resultados de las dos regresiones, iguales en ambos casos? Si no es
así, ¿cuáles resultados se deben utilizar? En resumen, ¿afectan de alguna ma-
nera los resulta.dos de la regresión las unidades en que se miden las variables
y y X? Si es así, ¿qué se debe hacer al escoger las unidades de medición en el
análisis de regresión?
Para responder a estos interrogantes, procedamos en fonna sistemática.
Sea
(6.2.1)
donde Y = IDPB Y X = PNB~
Definamos
(6.2.2)
(6.2.3)
donde w, . y W2 son constantes denom.iandas factores de escala; Wl puede o
, no ser igual a W2 •
Partiendo de (6.2.2) y (6.2.3), és claro que n y Xr corresponden a Y i y
a Xi reesc(l/adas. Es decir, que si Y , y X, se miden en miles de millones de dó-
lares y se desea expresarlas en millones de dólares, tendremos que yr = 1000 Y ,
=
YXr 1000 X,; en este caso, Wl =W2 = 1000.
COflsideremos ahora la regresión en donde se utilizan las variables yry

(6.2.4)

donde yr = w1l'í, Xr = W2 X ¡ yer = W1 e¡ (¿Por qué?)


Queremos encontrar la relación entre:
1. P1 Y PT
2. P2Y P!
3. var (p 1) Y var <Pr>
4. var <P2) Y var <P1)
s. ¡,2 y &.2
6. r", y r,..,.
2 2

A partir de la teoría de los mínimos cuadrados sabemos que (Véase Ca-


pítulo 3) .
(6.2.5)
8_~ (6.2.6)
~ 2
#12 -
i... X¡
148 MODELOS UNIECUACIONALES DE REGRESION

(6.2.7)

(6.2.8)

(6.2.9)
y
Aplicando el método de MeO a la ecuación (6.2.4) obtenemos en forma
similar:
fJT = y* - fJ~X* (6.2.10)

R* _ "Le Xi*Yi* (6.2.11)


1'2 - L Xi2
2
L. Xi
var (p¡) = N L. xt2 . (1
R* *2 (6.2.12)

(1*2
var (fJ!) =" LXi
*2
(6.2.13)

*2 _ "~ e~2
, (6.2.14)
(1 - (N _ 2)

A partir de estos resultados se puede establecer fácilmente la relación exis-


tente entre los dos grupos de estimaciones de los parámetros. Todo lo que se
debe hacer es recordar las relaciones de definición Yi = W 1 Y¡ (o Yi = W1Y.); Xi
, = w2 X¡ (o xi = w2 xJ; ei = w 1e¡; y* =w 1 YyXt = w 2 X. Utilizando estasdefi-
niciones,,' el lector puede verificar fácilmente que

fJ! (::)112
= (6.2.15)

fJT = W1P1 (6.2.16)


(1*2 = W~U2 (6.2.17)
var (fJT) = w~ var <P1) (6.2.18)

var (fJ!) = (::Y var (112) (6.2.19)


2 2
r "1 -- r x*y" (6.2.20)

De los anteriores resultados debe quedar claro que, dados los resultados
de una regresión con base en una escala de medición, se pueden derivar los
resultados con base en otra escala, una vez que los factores de escalamiento,
los w, se conozcan. No obstante, en la práctica se deben escoger cuidadosa-
mente las unidades de medición. No tiene mucho sentido utilizar una gran.
EXTENSIONES DEL MODELO DE REGRESION LINEAL CON DOS VARIABLES 149

cantidad de ceros para expresar los números en millones o en miles de millo-


nes de dólares.
A partir de los resultados dados desde (6.2.15) hasta (6.2.20), se pue-
den derivar fácilmente algunos casos especiales. Por ejemplo,si W 1 = W2' es
decir, que los factóres de escalamiento son iguales, el coeficiente de la pendien-
te y su error estándar no se ven afectados cuando se pasa de (Yi , Xi) a (Yi , Xi),
10 cual debe ser intuitivamente claro. No obstante, la intersección y su error
estándar se ven multiplicados por Wl. Sin embargo, si la escala X no cambia
(es decir, W2 = 1), mientras que la escala Y cambia en un.factor igual a w 1 ,
los coeficientes de la pendiente y de la intersección y de sus respectivos erro-
res estándar se multiplican todos por el mismo factor W 1 • Finalmente, si la
escala Y no sufre ningún cambio (Wl = 1), pero la escala X cambia en un
factor W2' el coeficiente de la pendiente y su error estándar se multiplican
por el factor (l/w2)' pero el coeficiente de la intersección y su error están-
dar no se ven afectados.
Sin embargo, se debe observar que la transformación de la escala (Y, X)
a la escala (Y*, X*) no afecta las propiedades de los estimadores de MeO
analizados en los capítulos anteriores.

Ejemplo numérico:
la relación entre la IDPB y.el PNB en los Estados Unidos, 1974-1983
Para suStentar los anteriores resultados teóricos, regresemos al ejemplo de la Tabla
6.2 y examinemos los siguientes resultados de regresión. (Las cantidades entre parén-
tesis corresponden a los errores estándar estimados).
La IDRB Y el PNB en miles de millones de dólares:

IDPBt = -37.0015205 + 0.17395 PNBt (6.2.21)


(76.2611278) (0.05406)

r' = 0.5641
Tanto la IDPB como el PNB, en millones de dólares
IDPB t = -37001.5205 + 0.17395 PNB t (6.2.22)
(76261.1278) (0.05406)

r l =- 0.5641

Obsérvese que la intersección así como su error estándar es de 1000 veces, (Wl =
1000 cuando se pasa de miles de millones de dólares a millones de dólares) los valo-
1,
res obtenidos en regresion (6.2.21), pero el coeficiente d:e la pendiente, como su
error estándar, no cambian, lo cual está de acuerdo con la teoría.
La IDPB en miles de millones de dólares y el PNB en millones de d~lares.
IDPB t - -37.0015205 + 0.OOOq.395 PNB t (6.2.23)
(76.2611278) (0.00005406)

rl = 0.5641
150 MODELOS UNIECUACIONALES DE REGRESION

Como es de esperarse, tanto el coeficiente de la pendiente como su error es-


tándar son (l/IODO) del valor de la ecuación (6.2.21), puesto que solamente cambia
la escala de X o PNB.
La IDPB en millones de dólares y el PNB en miles de millones de dólares.
IDPB t = -37001.5205 + 173.95 PNB t (6.2.24)
(76261.1278) (54.06)

r2 = 0.5641
Nuevamente, obsérvese que los coeficientes de la intersección y de la pendiente, así
como sus respectivos errores estándar, son iguales a 1000 mil veces sus valores en
(6.2.21), de acuerdo con los resultados teóricos ..

Algunas palabras sobre la interpretación:


Puesto que el coeficiente de la pendiente, P2 es simplemente la tasa de cam-
bio, se mide en las unidades de la siguiente proporción: s

unidades de la variable dependiente (Y)


unidades de la variable explicativa (X)

Por tanto, en la regresión (6.2.21) la interpretación del coeficiente de la pen-


diente de 0.17395 es que si el PNB cambia en una unidad, es decir, mil mi-
llones de dólares, la IDPB cambia en promedio en 0.17395 miles de millo-
nes de dólares. En la regresión (6.2.23), un cambio de una unidad en el
PNB, que equivale a 1 millón de dólares, produce en promedio un cambio
de 0.00017395 miles de millones de dólares en la IDPB. Los dos resultados
son desde luego idénticos en relación con los efectos del PNB sobre la IDPB;
simplemente, ellos se expresan en unidades diferentes de medición.

6.3 FORMAS FUNCIONALES DE LOS MODELOS


DE, REGRESION
Como se mencionó en el Capítulo 2, este texto está relacionado principal-
mente con modelos que son lineales en los parámetros; dichos modelos pue-
den o no ser lineales con respecto a las variables. En esta sección considera-
mos algunos modelo!\ de regresión comúnmente utilizados, que pueden ser
no lineales en las variables pero que siguen siendo lineales en los parámetros
(o que se pueden hacer lineales efectuando adecuadas transformaciones de
las variables). También analizamos sUs características especiales e ilustramos
su utilización.

s Para un análisis más detallado y extendido al modelo de regresión múltiple, véare Donald F. Mom-
son, Applied Linear Statistical Methods, Prentiee-Hall, Ine., EngIewood CIiffs, N.J., 1983, p. 72.
EXTENSIONES DEL MODELO DE RI;GRES/ON LINEAL CON DOS VARIABLES 151
y In Y

1
i
~
'a


u

..
.!!
'a
110
L---------x
Precio
.s ' - - - -LOI
------InX
del precio
(a) (b)

PIGVRA6.3
Modelo de elasticidad constante.

Modelos log-Iog. doble log. loglineal o de elasticidad constante


Consideremos el siguiente modelo:
Y¡ = PI X(2e"1 (6.3.1)
6
que se puede expresar en forma alterna com0
(6.3.2)
en donde In = logaritmo natural (es decir, 10g en base e, donde e = 2.718).'
Si escribimos (6.3.2) como
In Y¡ =: IX + P2 In Xi + Ui (6.3.3)

donde IX = In PI' este modelo es lineal en los parámetros IX y P2' lineal en los
logaritmos de las variables Y y X y se puede estimar por el método de regre-
sión de MCO. Debido a esta linealidad, estos modelos se denominan lag-log,
doble log o log linea/o
Si se satisfacen los supuestos del modelo de regresión lineal clásico, los
parámetros de (6.3.3) se pueden estimar con el método de MCO haciendo
(6.3.4)

6Obsérvense estas propiedádes de los logaritmos: (1) In (AB) = In A = In B, (2} In (A/B) = In A - In B


Y (3) In (A k) = k In A, suponiendo que A y B son positivos y donde k corresponde a alguna constante.
, En la práctica se pueden utilizar los logaritmos comunes, es decir, logaritmo en base 10. La relación
entre el logaritmo natural y el logaritmo comúnes: Ine X= 2.30261og lO X. Por convención, In signi-
fica logaritmo natural y log significa logaritmo en base lO, por tanto, no hay necesidad de escribir
explícitamente los subíndices e y 10. .
152 MODELOS UNIECUACIONALES DE REGRESION

donde yr= In lí y Xr
= In XI' Los estimadores de MeO, & y $2 que se ob-
tienen s'erán los mejores estimadores lineales insesgados de ex y P2 respectiva-
mente.
Una característica atractiva del modelo log-log, por la cual se ha hecho
tan popular en ~conometría aplicada, es que el coeficiente de la pendiente
mide la elasticidad de Y con respecto a X, es decir, el cambio porcentual en
y ante un cambio porcentual (pequeño) en X. 8 Por tanto, si Y representa la
cantidad demandada de un bien y X corresponde a su precio unitario, P2 mi-
de la elasticidad-precio de la demanda, el cual es un parámetro de conside-
rable interés económico. Si la relación existente entre la cantidad demandada
y el precio es como la que se ilustra en la Figura 6.3a, la transformación do-
ble log, como la que aparece en la Figura 6.3b, proporcionará entonces una
estimación de la elasticidad-precio (- P2)'
Se pueden mencionar dos características especiales del modelo log lineal:
el modelo asume que el coeficiente de elasticidad entre Y y X, P2 permanece
constante. (¿Por qué?) De ahí el nombre alterno que recibe: modelo de elas-
ticidad contante. 9 En otras palabras, como muestra la Figura 6.3b, el cambio
en el In y por unidad de cambio en In X (es decir, la elasticidad, (32) perma-
nece constante, independientemente del In X donde midamos la elasticidad.
Otra característica del modelo consiste en que, a pesar de que & y P2 son es-
timativos insesgados de ex y P2' Pi (el parámetro que entra en el modelo ori-
ginal) cuando se estima como Pi = antilog (&) es en sí mismo un estimador
sesgado. Sin embargo en la mayoría de los problemas prácticos, el término de

8 El coeficiente de elasticidad, en la notación utilizada en cálculo, se define como (dY/Y)/(dX/X) =


[(dY/dX) . (X/Y)]. Los lectores familiarizados con el cálculo diferencial, fácilmente verán que
11 2 de hech? corresponde al coeficiente de elasticidad
Una nota técnica: el lector orientado hacia el cálculo observará que d(ln X)/dX = l/X o d(ln X) '" dX/X
es decir, que para pequeños cambios infinitesimales (obsérvese el operado diferencial d), el cambio en el
In X = cambio relativo o proporcional en X. No obstante, en la práctica si el cambio en X es pequeño,
esta relación se puede escribir como: cambio en In X = cambio relativo en X, donde = significa aproxi-
madamente. Por tanto, para cambios pequeños

(In X, - In X,_ ¡) == (X, - X,-l)/X,-l = cambio relativo en X


Incidentalmente, el lector debe observar estos términos que se presentan frecuentemente: (1)
cambio absoluto, (2) cambio proporcional o relativo y (3) cambio porcentual o tasa de crecimiento
porcentual. Por tanto, (X, - X,_l) representa un cambio absoluto, (X, - X'-l)/X'-l = (X,/X'_l - 1)
corresponde a un cambio proporcional o relativo y [(X, - X,-l)/X,_d corresponde al cambio porcen
tual o tasa de crecimiento. X, X'-l son, respectivamente, los valores actuales y previos de la variable X.
9 Un modelo de elasticidad constante proporcionará un cambio total constante en el ingreso ante un
cambio porcentual dado en el precio, independientemente del nivel absoluto de éste. Los lectores
deben contrastar este resultado con las condiciones de elasticidad que implica la función de demanda
lineal simple, Y¡ = P1 + P2 XI +u¡ .No obstante, una fúnción lineal simple proporciona una cantidad cons-
tante de cambio por unidad de cambio en el precio. Establezca un contraste con lo que el modelo log
lineal implica para un cambio dado en el precio en dólares.
EXTENSIONES DEL MODELO DE REGRESloN LINEAL CON DOS VARIABLES 153

la intersección tiene una importancia secundari8 y no.es importante obtener


su estimación insesgada. lO
En el modelo con dos variables, la manera máS fácil de decidir si .el mo-
delo log lineal ~usta los datos consiste en graficar el diagrama de dispersión
delln y, contra elln ~ y ver si los puntos de dispersión se encuentran apro-
ximadamente sobre una línea.recta, como en la Figura 6.3b.

Ejemplo Bustrativo: la función de demanda de café, reconsiderada:


Refiérase a la función de demanda de café de la Sección 3.7. Mi asistente de inves-
tigación me infomó que cuando se graftcaron los datos utilizando la escala In Y Y
In X, el diagrama de dispersióri parecía indicar que el modelo log log podría ajus-
tar mejor la infonnaci6n que el modelo lineal (3.7.1).11 Al llevar a cabo los cálcu-
los, él obtuvo los sjguientes resultados:

lnY, = 0.7774 - 0.2530 In X, r = 0.7448


(0.0152) (0.0494) Fu = 26.27 (6.3.5)
t = (51.1447) (-5.1214)

= =
donde 1t consumo de café, tazas por persona por día y Xt precio real del café,
$ porIb.
A partir de estos resultadospuede observarse que el coeficiente de elasticidad-
precio es de -0.25, lo cual implica que para un aumento del 1 % por libra en el pre-
cio real del café, la demanda de éste (medida en tazas de café consumidas por día)
en promedio disminuye aproximadamente en 0.25 % Puesto que el valor de 0.25
para la elasticidad-precio es inferior al, en ténninos absolutós, podemos decir que
la demanda de café es inelástica con respecto al precio.

Una preguntá interesante: al comparar los resultados de la función de


demanda log lineal versus la función de demanda lineal de la ecuación (3.7.1),
¿cómo decidimos realmente cuál es el mejor modelo? ¿Podemos decir que
(6.3.5) es mejor que (3.7.1) porque su valor r2 es superior (0.7448 versus
0.6628)? Desafortunadamente, no podemos aftrmar lo anterior cuando la
variable dependiente de los dos modelos no es la misma (en este caso In Y
versus Y), no siendo, por tanto, los dos valores de r2 directamente compara-
bles. Tampoco podemos comparar directamente los dos coeficientes de la
pendiente, puesto que en (3.7.1) el ooeficiente de la pendiente muestra el
efecto de un cambio unitario en el precio del café, digamos de $1 por libra,
sobre la cantidad constante absoluta (es decir, no relativa) de disminución
en el consumo de café, que corresponde a 0.4795 tazas por día. Por otra
parte, el coeficiente de -0.2530 que se obtuvo de la ecuación (6.3.5) mues-
tra la disminución porcentual constante en el consumo de café, como resul-

10 Con respecto a la naturaleza del sesgo y 10 que se puede hacer al respecto, véase Arthur S. Goldber-
ger, Topies in Regresion Ana/y,;s, The Macmil1an Company, New York, 1976, p. 120.
u Es claro que (3.7 .1)se introdujo únicamente para fines pedagógicos.
154 MODELOS UNIECUACIONALES DE REGRESION

ta,do de un aumento del 1% en el precio por libra de café; (esto es, se da la


elasticidad en el precio ).12
¿Cómo podemos entonces comparar los resultados de los dos modelos?
Esto hace parte de un tema mucho más amplio del llamado análisis de espe-
cificación, tema que se discutirá en el Capítulo 11. Por ahora, una manera
en que podemos comp;.:rar 105 dos modelos consiste en calcular una medida
aproximada de la elasticid¡¡d.-precio para el modelo (3.7.1). La fonna en que
se hace esto se indica mediante el Ejercicio 6.12.

Modelos semitog: modelos log Un y Un log


Los modelos del tipo
(6.3..6)
y (6.3.7)

se denominan modelos semilog, debido a que solamente X o Y se'éncuentran


en forma logarítmica. Para fines descriptivos, denominaremos a la ecuación
(6.3.6) como el modelo log Un y a la ecuación (6.3.7) como el modelo lin
log, dependiendo de si la variable dependiente o la variable explicativa son
las que están en forma logarítmica. '
Las propiedades de estos modelos son las siguientes: en el modelo log
lin (6.3.6), el co~fkiente di' 1:J prndien,te az mide el cambio proporcional o
relativo constante en Y para un cambio absoluto dado en X, es decir: 13
cambio relativo en Y
z =cambio absoluto en X
a (6.3.8)

Si multiplicamos el cambio relativo en Y por 100, (6.3.8) entonces nos pro-


porcionará el cambio porcentual en Y para un cambio absoluto en X.
El modelo log lin como (6.3.6) es especialmente útil en situaciones
donde X es una variable de tendencia en el tiempo, puesto que en ese caso
el modelo describe la tasa porcentual (1 O()¡(X2) o la tasa relativa ( = (X2 ) de cre-

12 Existe una diferencia entre el coeficiente de la p'lIlUlente y la medida de la elasticidad. Como mues-
tra la función 8, la elasticidad es igual a la pendiente (:=dY/dX) multiplicada por la razón (X/Y). El
coeficiente de la pendiente del modelo (3.7.1) solamente proporciona (dY/dX), mientras que el coefi
ciente de la pendiente de (6.3.5) proporciona la media de la elasticidad, (dY/dX) . (X/Y). En resumen,
para '!! modelo log limal. la pen(lie.1~c y los eoeficientes de elasticidad son los mismos; éste no es el
caso para el modelo lineal.
13 Utilizando el cá1culo diferencialsepuede demostrar que a 2 = d(ln Y)jdX = (ljY)(dYjdX) = (dYjY)jdX
lo cual corresponde a (6.3.8). Para cambios pequeños en Y y X, lo anterior se puede aproximar me di-
ante
(Y, - 1';-,)/1';-1
.--IX,---X-::¡'
donde el subíndice t indica el valor actual y el subíndice t - 1 indica el valor anterior.
EXTENSIONES DEL MODELO DE REGRESION LINEAL CON DO~ \J.III:¡IABLES 155

cimiento constante (lOO. (X2) (X2 >. O) o de disminución constante (a 2 < O)


en la variable Y, donde Y puede ser una variable como el PNB, la población,
la oferta monetaria, el empleo, los niveles de ganancias, las ventas, etc. Esta
es la razón por la cual a este modelo se le denomina modelo de crecimiento
(constante). Brevemente ilustraremos este modelo.
En el modelo lin lag de (6.3.7), el coeficiente de la pendiente P2 mide
el cambio absoluto en (el valor promedio o esperado) de Y ante un cambio
relativo o proporcional dado en X, es decir: 14
cambio absoluto en Y
(6.3.9)
P2:::; cam b'10 re 1arlVO en X
Este modelo es por tanto, adecuado en situaciones donde un cambio
relativo o proporcional dado en X produce un cambio absoluto constante
en Y. Por ejemplo, el Congreso de los Estados Unidos exige que el Banco de
Reserva Federal adopte y anuncie metas de crecimiento para los agregados
monetarios con un afio de anterioridad, los cuales se expresan en forma de
porcentajes. Las tasas de crecimiento monetario para M1 presupuestadas
para los afias 1976 a 1983, en porcentajes, fueron 4.5-7.5, 4.5-6.5, 4.5-6.5,
1.5-4.5, 4-0-6.5, 3.5-6, 2.5-5.5 y 4.0-8.0. Si se está interesado en averiguar,
por ejemplo, la manera como afectan estas tasas de crecimiento porcentual
de MI al nivel absoluto del PNB, el modelo (6.3.7) sería entonces adecuado.
(Véase Ejercicio 6.19).
A propósito, si deseamos calcular el coeficiente de elasticidad para los
modelos lag lin o lin lag, esto se puede hacer partiendo de la definición del
coeficiente de elasticidad, es decir, (dY/dX) (X/Y). De hecho, una vez se co-
nozca la forma funcional del modelo se pueden calcular las elasticidades apli-
cando 19 definición anterior. La Tabla 6.4, al final de esta sección, resume los
coeficientes de elasticidad para los diferentes modelos que hemos conside-
rado en este capítulo.

Ejemplo ilustrativo: la tasa de crecimiento del PNB real,


Estados Unidos, 1969-1983
En el Ejercicio 3.12 presentamos información sobre el PNB real en los Estados Uni-
dos para el período 1969-1983. Si ajustamos el modelo de crecimiento (6.36) a
estos da~os, obtenemos los sigUientes resultados (los errores estándar aparecen entre
paréntesis):
---
In PNBt = 6.9636 + 0.0269 Tiempo r1 = 0.9524
(0.0151) (0.0017) F 1 • 13 = 260.34 (6.3.10)

14 Utilizando nuevamente el cálculo diferencial,. dY/dX = fJ1(l/X). Por tanto, fJl = dY/(dX/X)
=(6.3.9).
156 MODELOS UNIECUACIONALES DE REGRESION

~ 7.32
...o-..
'O
g 7.25
:o'O •
.
'O 7.18
::c:
.s: In PNB, =6.9636+0.0269 tiempo
:::1
e 7.11
...,"
.,
"e
:::1
7.04
.
c:

1969 70 71 72 73 74 75 76 77 78 79 80 81 82 83
Año
FIGURA 6.4
PNB real, EE.UU., 1969-1983

Estos resultados ÚDplican que para el período 1969-1983, el PNB en los Esta-
dos Unidos estaba creciendo a una tasa del 2.69 % anual. 15 Geométricamente, la
línea de regresión estÚDada se muestra en la Figura 6.4.

Es interesante comparar los resultados del modelo de crecimiento


(6.3.10) con los del siguiente modelo lineal de tendencia:
/'o..
PNB t = 1040.1105 + 34.9978 Tiempo r2 = 0.9563 (6.3.11)
(18.8574) (2.0740) F 1 ,13 = 284.74

Como muestran los resultados, para el período 1969-1983 el PNB real en


los Estados Unidos estaba creciendo en una cantidad absoluta constante de
aproximadamente 35 mil millones por afio. La escogencia entre (6.3.10) y
(6.3.11) dependerá de si se está interesado en el cambio relativo o absoluto
en el PNB, aunque para muchos fines el cambio relativo es el importante. A
propósito, no podemos comparar los valores de para los dos modelos,2
puesto que las variables dependientes son diferentes.

15 Un punto técnico. a tener en cuenta: el coeficiente de la pendiente de 0.0269, que se obtuvo en


(6.3.10), o en forma más. general, el coeficiente a 2 del modelo de crecimiento (6.3.6) constituye la
tasa de crecimiento instant4nea (en un punto en el tiempo) y no la tasa de crecimiento compuesta (a
través de un período). Una manera sencilla de calcular esta última consiste en tomar el antüogaritmo
de 0.0269 en (6.3.10), restarle 1 y multiplicar la diferencia por 100. En el caso de nuestro ejemplo,
la tasa de crecimiento anual compuesta, de acuerdo con este procedimiento es de 2.73% (Nota Anti-
log de 0.0269 == 1.0273). Pata mayores detalles, véase Ejetcicio 6.15.
· EXTENSIONES DEL MODELO DE REGRESION LINEAL CON DOS VARIABLES 157

Transfonnaciones recíprocas
Los modelos del siguiente tipo se conocen como modelos recíprocos.

Ji = Pt + p~(~) + u, (6.3.12)

Aunque este modelo no es lineal en la variable X, debido a que está expresa-


do en fonna inversa o recíproca, el modelo es lineal en /3 1 y /32 y por tanto
es un modelo de regresión lineal. 16
Este modelo tiene dos características: a medida que X lumenta indefi-
nidamente, el término /3,,(l¡X) se acerca a cero (Nota: /32 es una constante)
y Y.se acerca al límite o valor asintótico PI' Por tanto, modelos similares a
(6.3.12) poseen una asíntota o valor límite que asumirá la variable depen-
diente cuando el valor de la variable X aumenta indefinidamente. 17
Algunas formas posibles de la curva que corresponde a (6.3.12) se mues-
tran en la Figura 6.5. Un ejemplo de la Figura 6.5a se encuentra en la Figura
6.6, donde se relaciona el costo de producción fijo promedio con el nivel de
producción. Como muestra la figura, el CFP declina continuamente a medida
que aumenta la producción (debido a que el costo fijo se distribuye entre un
gran número de unidades) y eventualmente se vuelve asintótico con el eje de
producción al nivel {JI'
Una de las aplicaciones importantes de la Figura 6.5b es la famosa curva
de Phillips de la macroeconomía. Con base en la información relacionada con
la tasa porcentual de variación de los salarios monetarios (Y) y la tasa pór-
centual desempleo (X) para el Reino'Unido durante el período 1861-1957,
Phillipsobtuvo una curva cuya forma general es similar a lh Figura 6.5b y
que reproducimos en la Figura 6.7. 18
Como muestra la figura, existe una asimetría en la respuesta de los cam
bios salariales al nivel de desempleo: los salarios aumentan mas rápidamente
a cambios unitarios en el desempleo si la tasa de desempleo está por debajo
de UN, a la cual los economistas denominan tasa natural de desempleo, de los
que disminuyen para un cambio equivalente cuando la tasa de desempleo
está por encima del nivel natural PI indicando el piso asintótico p~a el cam-
bio en los salarios. Es posible que esta característica especial de la curva de
Phillips se atribuya a factores institucionales, tales como el poder de negocia-
ción de los 'sindicatos, la existencia de salarios mínimos, las compensaciones
por desempleo, etc.

16 Si hacemos xr '"' (l/X,) entonces (6.3.12) es lineal en los parámetros como también en las variables
Y, yX1: ..
17 La pendiente de(6.3.12}dY/dX '"' -P2(1/X 2)lo cual implica que SiP2 espositivo, la."endíente es
negativa y que si fJ 2 es negativa, la pendiente es positiva. VéQ1Jge Figura 6 Sa y 6.5c respectivamente.
18 A. W. Phillips, "TIte relation between Unemployment and the Rate oC Change Money Wages in the
United Kingdom, 1861-1957", Económica, noviembre de 1958, vol. 25, pp. 283-299. Obsérvese que la
curva original se ajustó a los datos para el período 1861-1913 y no cruzó el eje del desempleo; sin
embargo, la Figura 6.7 representa la idea moderna de la versión de la curVa de Phillips.
158 MODELOS UNIECUACIONALES DE REGRESION

y y y

I
{jJ~-----='"

{jJI---------:;;;:;;;

o .--x o~-~Ik_---- X
O
L -...... -----x
-{jl
fJ J
(a) (b) (e)

FIGURA 6.S ( 1)
El modelo recíproco: Y = PI + fJ1 X .

Una aplicación importante de la Figura 6.5c es la curva de gastos de


Engel (que alude al estadístico alemán Ernst Engel, 1821-1896), la cual rela-
ciona el gasto que realiza un consumidor en un bien de consumo con su gaito
o ingreso total. Si Y corresponde al gasto en un bien de consumo determi-
nado y X al ingreso, entonces ciertos bienes tienen las siguientes caracterís-
. ticas: (a) existe un nivel crítico o umbral del ingreso, por debajo del cual el
bien no se compra. En la Figura 6.5c, este umbral de ingreso se encuentra al
nivel --(/32/fJ ¡), y (b) existe un nivel de consumo en que el consumidor se sa-
cia, más allá del cual éste no se ubicará, independientemente de qué tan
alto sea" su ingreso. Este nivel es precisamente la ásíntota que se muestra en

~I~-------------------X ~GURA6~
Producción Modelo de transformaci6n recíproca.
EXTENSIONES .DEL MODELO DE REGRESION LINEAL CON DOS VARIABLES 158

.s
1
.; La .u. de deaempleo ~.tural

! /
.,. O t----~~------ Tua de desempleo %

PlGURA6.7
-~ ---------------------- La ourva de Phi11ips.

la figura. Para dichos bienes, el modelo recíproco de la Figura 6.5c es el más


adecuado. 19 ..

Ejemplo Bustrativo: la curva de Pbillips para


el Reino Unido, 1950-1966
La Tabla 6.3 muestra infonnación sobre variaciones porcentuales anuales en la tasa
de salarios (Y) y de desempleo (X) para el Reino Unido, durante el período 1950-
1966.
Cuando se trató de ajustar el modelo recíproco (6.3.12), se obtuvieron los
siguientes resultados (véase listado SAS en el Apéndice 6A, Sección 6A.3).
1
1, = -1.4282 + 8.7243 X r l = 0.3849 (6.3.13)
t

(2.0675) (2.8478) F 1• 15 = 9.39


donde las cifras entre paréntesis corresponden a los errores estándar estimados.
La línea de regresión estimada se ilustra en la Figura 6.8. Al observar esta
("¡gura, es claro que el piso salarial es de -1.43%,10 cual implica que a medida que
X aumenta indefinidiamente, el porcentaje de disminución en los salari~s no será
supeñor al 1.43 <j(. anual.

Incidentalmente, obsérvese que el valor estimado para,2 es relativa-


mente bajo, aunque el coeficiente de la pendiente es estadísticament~ signi-

9 Para ejemplos concretos, véase S. 1. Prais y H. S. Houthakker, The AnalYlir af FamOy Budgets,
:ambridge Univetsity Presa, London, 1971, Cap. 7.
.180 MODELOS UNIECUACIONALES DE REGRESION

TABLA 6.3
Porc:entaje de aumento anual en Iu .... de salarios y en
la tasa de deaempleo, Reino Unido, 1950-1966 'l&
PorceDtIIje de aumento Dual en
Afto Iu ..... ele lllarida De8empleo t (%)
(Y) (X)

1950 1.8 1.4


1951 8.5 1.1
1952 8.4 1.5
1953 4.5 1.5
1954 4.3 1.2
1955 6.9- 1.0
1956 8.0 1.1
1957 5.0 1.3
1958 3.6 1.8
1959 2.G 1.9
1960 2.6 1.5
1961 4.2 1.4
1962 3.6 1.8
1963 3.7 2.1
1964 4.8 1.5
1965 4,3 1.3
1966 4.6 1.4

Fuente: CUff Pratten, Applied Macroeconomlcl, Oxford Unlver-


slty Press, Oxford, 1985, p. 8.

ficativo y diferente de cero y tie~e el signo correcto. Esto refuerza la adver-


tencia que hicimos anteriormente acerca de que no se debe hacer énfasis
innecesario sobre el valor de ,1. .

l

..,.'"
~
~
.
\:
fIl

:E Y(=-1.4282 + 8.7243 l/X,

~ /
..,..
.
Eo I---~~-------- Tasa de desempleo %
..
\:

~
~
-1.43 - - - - - - - - - - - - - - - - -

FIGURA 6.8
La curva de Phillips para el Reino Unido, 1950-1966.
EXTENSIONES DEL MODELO DE REGRESION LINEAL CON DOS VARIABLES 181

Resumen de las formas funcionales


En la Tabla 6.4 resumimos las principales características de las diferentes for-
mas funcionales consideradas hasta ahora.

6.4 RESUMEN Y CONCWSIONES


En este capítulo considerarnos algunos aspectos más detallados sobre el mo-
delo de regresión lineal, trabajando aun dentro del marco del modelo de dos
variables. Esto se hizo para fines expositivos. Una vez se comprendan las
ideas básicas de este' capítulo, su extensión a los modelos de regresión multí-
pIe es en muchos casos bastante sencilla.
Primero considerarnos el caso de la regresión a través del origen. En oca-
siones las expeclativas teóricas a priori o trabajo empírico previo, o ambos,
sugieren que la línea de regresión debe pasar a través del origen, implicando
que la intersecci(;ln debe omitirse del modelo. Después de presentar algunas
ilustraciones mostramos la mecánica de la estimación del coeficiente de la
pendiente para este modelo, el único valor desconocido dentro del mismo.
Puesto que este modelo no satisface las propiedades del modelo cgn-
vencional (esto es, el que presenta intersección) de que la suma de errores
(¿ el) sea cero y que para este modelo ~l r l .convencional calculado puede ser
negativo en algunos casos, el modelo debe utilizarse con precaución. En tér-
minos prácticos, podemos decir que mientras la información previa no sea
suficientemente fuerte, no se debe utilizar la regresión a través del origen por
las razones analizadas anteriormente y porque existe además la posibilidad
de cometer un error de especificación si ajustarnos este tipo de modelo, cuan-
do la sítuación verdadera requiera, por el contrario, que se incluya la inter-.

TABLA 6.4

. ln't·-iil +_j'X'
'r-#1-+R2 lai

Nota: El asterisco (*) indica que el coeficiente de elasticidad es variable, de-


pendiendo del valor que tome X o Y o ambos. Cuando no se especifica ningÚn
valor de X ni de Y, en la práctica estu elasticidades se miden muy comúnmen-
te en sus valores promedio, X y Y.
162 MODELOS UNIECUACIONALES DE REGRESION

sección en el modelo. Es claro que si la regresión a través del origen corres-


ponde al modelo verdadero, entonces, como se demostró median te un ejemplo
ilustrativo, el coeficiente de la pendiente se puede estimar con mayor preci-
sión (es decir, se puede estimar con un error estándar comparativamente más
pequeño) que cuando se incluye el término de 'la intersección (innecesaria-
mente) en la modelo.
A continuación se hizo re'ferencia al problema.práctico y muy impor-
tante de las escalas y unidades de medición. Mediante un ejemplo detallado
demostramos que los coeficientes de regresión se pueden afectar cambiando
las unidades en las que se expresan las variables X y Y. Desde luego, no existe
conflicto alguno en los resultados con base en unidades diferentes de medi-
ción, en tanto se conozcan los factores que relacionan una unidad de medi-
ción con otra. Mostramos la mecánica necesaria involucrada en el hecho de
pasar de una unidad de medición a otra.
Finalmente, consideramos los aspectos relacionados con la fonna fun-
cional de los modelos de regresión. Puesto que en este texto nos interesan
principalmente modelos que sean lineales en los parámetros y no necesaria-
mente en las variables, consideramos diferentes modelos que no son lineales
en las variables pero que sí lo son en los parámetros o que pueden serlo me-
dÍante transf6nnaciones adecuadas en las variables. Específicamente, consi-
deramos tres modelos de este tipo; (l) el modelo log lineal o modelo de
elasticidad constante, (2) el modelo semi log y (3) el modelo recíproco. Ilus-
tramos cada tipo de modelo, mostrando sus características especiales y sugi-
riendo las situaciones en que ellos p.ueden ser adecuados.
Los modelos de elasticidad constante se utilizan frecuentemente en es-
tudios de demanda para estimar las elasticidades precio e ingreso. En el mo-
delo semi log, donde la variable dependiente se expresa en fanna logarítmica
y la variable X corresponde al tiempo, el coeficiente de la pendiente esti-
mado (después de multiplicarlo por 100) mide la tasa de crecimiento en la
variable dependiente. Por tanto, tales modelos se denominan modelos de cre-
cimiento; son utilizados frecuentemente para estimar la tasa de crecimiento
en variables como el PNB, el empleo, las ganancias, las ventas, las importacio-
nes, exportaciones, etc. Los modelos recíprocos se han utilizado extensa-
mente en modelos macroecon6micos del tipo phillips, relacionando las varia-
ciones porcentuales en los salarios o en los precios con la tasa de desempleo.
Tales modelos también se han utilizado para estimar las curvas de gastos de
Engel, que relacionan los gastos que realiza el consumidor en un bien deter-
minado y su ingreso total. Estos modelos pueden fácilmente hacerse exten-
sivos a más de una variable explicativa.

EJERCICIOS
6.1 En la siguiente tabla se presenta infonnación sobre el deflactor del.POB (productc
doméstico bruto) para bienes domésticos, así como .el deflactor para las importa
ciones en Singapur para el período 1968-1982. El deflactor del POB se utilizl
EXTENSIONES DEL MODELO DE REGRESION LINEAL CON DOS VARIABLES 163

comúnmente como indicador de la inflación en lugar del IPC. Singapur es una pe·
queña economía abierta que depende signifi~ativamente del comercio exterior para
su sobrevivencia.

Deflactor dél PDa Deflactor de las


Afio para bienes importaciones
domésticos (Y) (X) .

1968 1000 1000


1969 1023 1042
1970 104Q 1092
1971 1087 1105
1972 1146 1110
1973 1285 1257
1974 1485 1749
1975 1521 1770
1976 1543 1889
1977 1567 1974
1978 1592 2015
1979 1714 2260
1980 1841 2621
1981 1959 2777
1982 2033 2735

Fuente: eolio Simkio, "Does Mooey Matter


in Sineapore", The Singapore Economic
Revtew. Vol. XXIX, No. 1, abril 1984,
Tabla 6. p. 8.

Para efectos de estudiar la relación entre los precios mundiales y domésticos, se dan
- a usted los siguientes modelos:
1. Y, = + !X2 X, + u,
!XI

2. y, = fJ2X, + U,
donde Y = deflactor del PDB para los bienes domésticos y X = deflactor del PDB
para las importaciones.
(a) ¿Cuál modelo escogería usted a priori?
(b) Ajuste los dos modelos a los datos y decida cuál es el más adecuado.
(e) ¿Qué otro u otros modelos pueden ser adecuados para estos datos?
6.2 Remítase a la función de demanda de café dada en la Sección 3.7. Supóngase que
los precios del café estuvieran dados en centavos en lugar de dólares por libra.
(a). ¿C6mo afectará esto la intersección con el eje de las ordenadas y la pendiente
. estimadas que se dieron en (3.7.1)? Presente los cálculos necesarios.
(b) ¿Cuál es el cambio, si existe alguno, en los errores estándar estimados?
(e) ¿Estará afectado r l ? ¿Por qué si o por qué no?
6.3 Regresión en varjables estandarizadas. Sea Xr = (XI - X)/S" y yr = (1'; - f)/S~ don-
de S" y Sy corresponden a las desviaciones estándar de X y Yen la muestra. De·
muestre que en el modelo:
164 MODELOS UNIECUACIONALES DE REGRESION

&1 = OY&l = r, el coeficiente de correlación entre X y Y. ¿Puede usted pensar en


alguna razón por la cual se quisiera utilizar el modelo de regresión usando variables
estandarizadas?
Nota: Las Yfy Xfantes defmidas se conocen como variables estandarizadas. Se
dice que una variable está estandarizada o se encuentra en unidades estándar (de
desviación) si se expresa en términos de la desviación de su promedio (es decir, un
cambio del origen) dividida por su desviación estándar muestral (es decir, el cambio
de escala). Así, la estandarizacion involucra tanto un cambio del origen como un
cambio de escala.
Las variables estandarizadas antes defmidas tienen estas propiedades: cada una
tiene un valor promedio de cero y una varianza de 1. Como consecuencia, un cam-
bio unitario en, digamos, X·, se convierte en un cambio de desviación estándar de
l. Por tanto, se puede decir que el coeficiente de la pendiente en el modelo anterior
muestra el número de desviacione~ estándar que cambia en promedio ·la variable
dependieme cuando la variable explicativa cambia en una desviación estándar. Inci-
dentalmente, el coeficiente de la pendiente en el modelo anterior se conoce como
,coeficiente Beta, el cual no debe confundirse con el coeficiente Beta de la teoría
del portllÍolio.
6.4 Considere los siguientes modelos:
Modelo 1:
Modelo 11: yr = (Xl + (Xl Xr + UI

dond.e Y· y X· son las variables estandarizadas defmidas en el Ejercicio 6.3. De-


muestre que &l = Pl(S,,/S,) establezca, por tanto, que aunque los coeficientes de
regresión son independientes del cambio del origen, no son independientes del cam-
bio de escala. .
6.S Refi~rase a los datos dados en el Ejercicio 6.1. Los promedios de Y y X son 1456 y
1,760, r~spectivamente, y las desviaciones estándar correspondientes son 346 y 641.
Estime la siguiente regresión:
yr = OC 1 + (XzXr + U,
donde las variables con asterisco corresponden a las variables estandarizadas. Inter-
prete los resultados.
6.6 Considere los siguientes modelos:
In yr ... al + al In Xr + ur
In lí =jJ1 + Pl In X¡ + U¡
yr
donde = Wllí Xr = Wl X¡ las w són constantes.
(a) Establezca la relación entre los dos conjuntos de coeficientes de regresión y sus
errores estáns1ar.
(b) ¿Es diferente el r2 entre los dos modelos?
6.7 Remítase a los datos del Ejercicio 1.1. Para cada país, estime la tasa de crecimiento
de Jainflación obtenida a partir del modelo:
In 1'; == {J1 + pz Tiempo + U,
donde Y es la tasa de inflación. Entonces, ¿cómo difieren estos resultados de los
que se obtienen en el Ejerci.cio S.8?
EXTENSIONES DEL MODELO DE REGRESION LINEAL CON DOS VARIABLES 165

6.8 Remítase a los datos del Ejercicio 3.10. Calcule la tasa de crecimiento del PNB de
los Estados Unidos en términos nominales para el período 1969-1983 y compare
'sus resultados con los dados en la ecuación (6.3.10). ¿Ayudarían los resultados de
las dos regresiones a estimar la tasa de inflación en los Estados Unidos para el mis-
mo período de tiempo? ¿Cómo?
6.9 Suponiendo que usted ajusta la siguiente versión de la curva de Phillips a los dalos
dados en la Tabla 6.3:
Y; = (Xl + (X,X, +,u,
donde Y = % de cambio anual en las tasas de salarios monetarios o nominados y
X = tasa de desempleo.
(a) A priori ¿cuál es el signo esperado para !Xl? .
(b) Estime la regresión anterior obteniendo las estadísticas acostumbradas.
(e) ¿Cómo se comparan estos resultados con los de la regresión (6.3.13)? ¿Existe
algún conflicto en los resultados?
(d) ¿Puede usted comparar los dos valores de r2 )
(e) ¿Qué modelo, prefiere usted? ¿Por qué?
6.10 Entre las regresiones (6.3.10) y (6.3.11), ¿qué modelo prefiere usted? ¿Por qué?
6.11 Dada la función de demanda de café estimada (6.3.5), ¿aceptaría usted la hipótesis
de que la elasticidad-precio de la demanda de café no es significativamente dife-
rente de cero? Utilice una prueba de una cola con un nivel de significancia del 5·'110.
Considere por qué es adecuada la prueb¡\ de una cola.
6.12 Para la función lineal de demanda de café (3.7.1) ¿cómo estimaría usted la elastici-
dad-precio? (Sugerencia: elasticidad-precio = (dY/dX)(XjY) y usted sabe que\Y =
2.43 tasas y X = $1.11). ¿Cómo se compara este valor de elasticidad con el valor
dado en (6.3.5)? ¿Cuál medida de la elasticidad es más confmble?
6.13 Para la regresión (6.3.10), evalúe la hipótesis de que el coeficiente de la pendiente
no es significativamente diferente de .03.
6.14 Partiendo de la curva de Phillips estimada, en (6.3.13), es posible calcular la tasa
natural de desempleo? ¿Cómo?
6.15 Considére el siguiente modelo:
(1) Y; = Yo(1 + g)'eU'
donde Yt = valor de la variable Yen el tiempo t, Yo = valor inicial de Y,g = tasa
de crecimiento anual compuesta, u = término del enor estocástico y t = tiempo.
La parte no estocástica de (1) es simplemente la fórmula fmanciera usual del
interés compuesto.
Tomando el logaritmo natural de (1), obtenemos
(2) In Y; = In Yo + t In (1 + g) + u,
=fJl+fJ,t+U,
donde {Jl = In Yo Y fJ2 = In (1 + g)
(a) ¿Cuál es la diferencia entre las ecuaciones (2) y (6.3.6) puesto que desde el
punto de vista de la regresión (después de hacer X = t), las dos ecuaciones pare·
cen iguales?
(b) Si se calcula la regresión (2), ¿cómo calcularía usted el parámetro g, o sea, la
tasa de crecimiento?
166 MODELOS UNIECUACIONALES DE REGRESION

(e) ¿Cómo difiere esta tasa de crecimiento de la que se obtuvo de la ecuación


(6.3.6)? ¿Es crucial la diferencia, si es que existe alguna?
6.16 Para el modelo log¡lin (6.3.6), si Y es la cantidad consumida de un bien y X es el
ingreso del consumidor, ¿cómo calcularía usted la elasticidad·ingreso (dY/dX)(X/Y)?
¿Cómo lo haría para el modelo lin lag (6.3.7)?
6.17 La curva Engel de gastos relaciona los gastos de un consumidor en un bien y su in·
greso total. Sea Y = gasto de consumo en un bien y X = ingreso del consumidor;
considere los siguientes modelos:
Yi = PI + pz(XJ + U¡
.
Yi = PI + pz(l/XJ + u¡
In Yi = In PI + pz In X¡ + U¡
In Yi = In PI + P2(1/X¡) + U¡
Yi = PI + pz In XI + U¡
¿Cuál de estos modelos escogería usted para la curva de gastos de Engel y por qué?
(Sugerencia: interprete los diferentes coeficientes de la pendiente, averigüe las ex.
presiones para la elasticidad de los gastos con respecto al ingreso, etc.).
6.18 Modelo recíproco logarítmico. En el Ejercicio 2.8 (e) introdujimos el siguiente
modelo, conocido como modelo semilogarítrnico inverso en recíproco o, más senci·
llamente, corno modelo logarítmico recíproco:

In Yi = PI - P2(~) + U¡
(a) . ¿Cuáles son las propiedades de este modelo: (Sugerencia: Considere el coefi·
ciente de la pendiente,,la asíntota, etc.).
(h) Si X = tiempo, ¿qué tipo de curva de crecimiento se traza con este modelo?
(e) ¿En qué situaciones consideraría usted utilizar este modelo?
6.19 La siguiente tabla presenta información
relacionada con el PNB y la oferta moneta· Afto PNB Oferta monetaria
ría (M) en millones de dólares para Canadá, ($, mAlones) ($, mBlones)
durante el período 1970-1984.
1970 85,685 9,027
1971 94.450 10.178
1972 105.234 11,626
1973 123.560 13.320
1974 147,528 14.555
1975 165,343 16,566
1976 191.857 17,889
1977 210.189 19,381
1978 232,211 21,328
1979 264,279 J2,823
1980 297.556 24,254
1981 339,797 25,379
Fu~nt~: Banco de Reserva Federal de San 1982 358,302 25,541
Luis. lnt~matto1Ull Economlc CondlttolU. 1983 390.340 .28,137
edición anual. junio, 1985. p. 14 (datos de 1984 420,819 28,798
M,) Y p. 17 (datos del PNB).
EXTENSIONES DEL MODELO DE REGReSlON UNEAL CON DOS VARIABLES 187

Utilice estos datos. para ajustar el siguiente mo@lo.Comente los resultados.


PNBt .. PI + P2 In dinero. +u.
6.20 So dan a usted los siguieBtes-datos:

1í XI Y, X,

86 3 62 35
79 7 52 45
76 12 51 55
69 17 51 70
65 25 48 120
(Fuente: adaptado de J. 10hnston, Eco-
nometrlc Methodl, ed.. McGraw·HID
Book Company, New York, 1984, p. 87.
En realidad, est' tomado de un examen
econométrico de la Universidad de
Oxford,1975).

Ajuste el siguiente modelo a los datos y obtenga las usuales estadísticas de regresión:

C~~ }) = PI + P2(:)
6.21 Para medir la elasticidad de sustitución entre el capital y la mano de obra, Arrow.
Chenery, Minhas y Solow. autores de la famosa función de producción CES (Función
de elasticidad constante de sustitución) utilizaron el siguiente modelo:

log (f) = log {JI + (J" log W + u


donde·(V¡L) = valor agregado por unidad de mano de obra, L = mano de obra y
W= tasa de salario real. El c~ficiente P2 mide la elasticidad de sustitución entre la
mano de obra y el capital (es decir, el cambio proporcional en las proporciones de
los fictores/cambio proporcional en los preCios relativos .de los factores). Para.los
datos dados en la siguiente tabla, verifique que la elasticidad estimada es de 1.3338
y que no es significativamente diferente de 1 desde el punto de vista estadístico.

Industria lo¡¡ (VIL) Io¡¡W

Harina de trigo 3.6973 2.9617


Azúcar 3.4795 2.8532
Pinturas y barnices 4.0004 3.1158
Cemento 3.6609 3.0371
Vidrio 3.2321 2.8727
Cerámica 3.3418 2.974S
Triplex 3.4308 2.8287
Textiles de algodón 3.31S8 3.0888
Textiles de lana 3.5062 3.0086
Textiles de yute 3.2352 2.9680
Químicos 3.8823 3.0909
168 MODELOS UNIECUACIONALES DE REGRESION

IDdustria loa (VIL) IoaW


Aluminio 3.7309. 3.0881
Hierro y acero 3.7716 3.2256
Bicicletas 3.6601 3.1025
Máquinas de coser 3.7554 3.1354

Fuen,.: Damodu Gujuati, "A Test of


ACMS Production Function: lndian InduJ-
tries, 1958," lndlll" JourruJI o{ lndunrlal
Re14t1onl, Julio 1966, vol. 2, No. 1, pp.
95-97.

APENDICE6A

6A.l DERIVACION DE LOS ESTIMADORES MINIMOS CUADRADOS


PARA LA REGRESION A TRAVES DEL ORIGEN
Queremos minimizar

con respecto a Pl.


Al diferenciar (1 ) con respecto. a Pl obtenemos
d¿ef
(2) dP;¡, = 2 ¿ (Y¡ - Pa Xi)( -Xi)
Haciendo (2) igual a cero y simplificando, obtenemos
8 ¿ Xi Y¡ .
(3) Pl = ¿ Xl = (6.1.6)
Ahora sustituyendo la FRP: Y¡ = P2 Xi + u, en esta ecuación, obtenemos,

(4) 6 = ¿ X¡CJJl XI + Ui)


P2 ¿Xl
_P ¿Xiu¡
- a+ ¿Xl
Por tanto,

(S) E(Pa - P2)2 = 1lii;IT


Expandiendo el lado derecho de (5) y observando que las X, no son estocás
ticas y las u, son homocedásticas y no correlacionadas, obtenemos:
(12
(6) Var ~2) = E<Pa - P2)a = ¿ Xl = (6.1.7)
EXTENSIONES Del MODELO DE REGRESION lINEAl CON DOS VARiABlES 169

Incidentalmente, obsérvese que de la ecuación (2) obtenemos, después


de igualar a cero
(1) L
e, X, == O
Del Apéndice 3A, Sección 3A.I, podemos ver que cuando el término de la
intersección está presente (\n. eJmodelo, obtenemos además de (7) la condi-
ción L e, == O. De los anteriores cálculos matemáticos debe quedar clara la
razón por la cual puede presentarse el caso de que para el modelo de regre-
sión a través del origen, la suma del error, L e, no sea igual á cero.
Supongamos que se quiere imponer la condición de que L e, == O . En
este caso tenemos.

(8) L lí == p" L X, + L e,
== p" ¿ X, (dado que¿ e, = Odada la construcción
.iiticial)
Tenemos entonces

(9) ~ lí,
1" == L,X
y Valor medio de Y
== 1 = Valor medio de X

Pero este estimador no es el mismo que (3)6 (6.1.6). Y puesto que elp" de
(3) es insesgado (¿por qué?), el p" d.e (9) no puede ser insesgado.
El punto clave a tener en cuenta es que en la regresión a través del origen
no se puede dar el caso en que tanto L elX,como L e, sean iguales a cero, co-
mo ocurrió en el modelo convencional. La única condición que se satisface es
que L elX,es cero.
Recordemos que
lí == ~ + e, (2.6.3)
Sumando esta ecuación en ambos lados y dividiendo por N, el tamafto de la
muestra, obtenemos
(lO) Y= f + e
.puesto que para el modelo con intersección igual a cero,L e, y, por tanto, e,
no necesariamente deben ser cero, entonces

(11) y#: t
10 cual implica que el promedio de los valores reales de Y no necesariamente
debe ser igual al promedio de los valores estimados de Y; por el contrario, los
dos valores promedios son idénticos para el modelo que posee intersección
con el eje Y, como se puede ver partiendo de-Ia ecuación (3.1.10).
. Se observó que para el modelo con intersección igual a cero,'" puede
¡er negativo mientras que para el modelo convencional éste nunca .es el caso.
~sto se puede demostrar de la siguiente manera:
170 , MODELOS UNIECUACIONALES DE REGRESION

Utilizando (3.5.4), podemos escribir.


(12) r l = 1 - SRC/STC = 1 -; ~ e~
t... YI
Ahora, para el modelo convencional, que posee. intersección el modelo (3.3.6)
muestra que
(13) SRC = L el = L yl - .O~ L xl ~ Y1
a no ser que .Ol sea cero, (es decir, que X no tenga ninguna influencia sobre
~. Por tanto, para el modelo convencional, SRC ~ STC, lo Gual implica que
,2 nunca puede ser negativo.
Para el modelo con intersección igual a cero, se puede demostrar análo-
gamente que
(14) SRG = L el = L Yl - .O~ L Xl
(Nota: La suma de los cuadrados de Y y X no está ajustada con respecto al
promedio). Entonces, no existe ninguna garantía de que esta SRC sea siem-
yr
pre inferior a L = L yt - Ny 2 10 cual sugiere que la SRC puede ser mayor,
implicando que ,2 ,
como se define convencionalmente, puede ser negativo.
Incidentalmente obsérvese que en este· caso el SRC será mayor que el STC si
.O~ L xt < Ny2.
6A.2 LISTADO SAS DE LA·LINEA CARACTERISTICA (6.1.11)

SU... OF MEAN
. sQuARES SQUARE
123&4.263 12364.263
343".147 381.905
15801.410

19.54239$ R-saUARE
19.390000 ADJ R-sa
100.786
TERM IS USEO. R-8QUARE IS REOEFINED.

PARAMETER STANDARD T FOR HO:


ESTlMATE eRROR PARAMETER '"' o
1 U189912' 0;191551 S:69O

oes y X YHAT YRESID


1 67.5 19.5 21.253 46.247
2 19.2 U 9.264 9.938
3 -35.2 -29.3 -31.934 -3.266
'4 -42.0 -26.5 -26.883 . -13.117
ti 63.7 t1.9 67. • -3.766
8 19,3 .45.5 49.691 -30.291
1 3.6 U 10.354 -6.754
8 20.0 '.Ul . 15• • 4.741
9 40.3 35.8 " .38..04' ¡1t.126
10 37.5 31.0 ..m. :·;•.1t$
DUhSIN-WATSON d 0.898
1ST ORDER AUTOOORRELATl0t4 ' ••239:
EXTENSIONES DEL MODELO DE REGRESION LINEAL CON DOS VARIABLES 171

6A.3 LISTADO SAS DE LA REGRESION DE LA CURVA DE PffiLLIPS


PARA E~ REINO UNIDO (6.3.13)

tI;:;¡~~~; ~<~~J<~t!~l'; . '.


., VAWE 'PROS> F
0.0079

,.
"~~~ ~­ 1A18887:1 fIl,.SQUARE
• MeAN 4.1882:11 ADJ R-SO
. >4'.·. 34.12281,

PARAfttETER STANDARD T FOR Ha:


'eOF ESTIMATE EFlROA PARAMETER .. O PROS > IT I
f -1. •177 2.087478 -0.891 0.5003

-
1 8.724344 2.841771 3.084 0.0079
y X X, .'11r- YHAT YMSID
O.'" ...8.50304 -:t.OO35
0._ U810
O.888t7 , 4.3880& 4.01'.
0.888t7 4.38805 0.1119
O." 5;84111 -1.5G1
1.18100
.. ~
7._17
1.50304
-0.-'
1.4970
0._
0.*'23 . S'" -O. •

-.......
.....
i4.... 0.1813
-0.-
u... _
.'0._'" .3.....
O.'" -1.7181
0.'"
o.fJ5I5IIe
-0.1035
0.1.,3
'.1: .' U781. U2I'l7 U737

"_. ......
;0..., . 0,411'

....
. 'O;'" s.IaI&
-..-
·· ...0. . .
CAPITULO 7
ENFOQUE MATRICIAL
PARA EL MODELO
DE REGRESION
LINEAL

En este capítulo se presenta el modelo clásico de regresión lineal con k va-


riables (Y y x 2 , x), ... X k ), en notación de álgebra matricial. Conceptual-
mente, el modelo de k variables es una extensión lógica de los modelos de
·2 Y 3 variables. Por tanto, en este capítulo se presentan muy pocos concep-
tos nuevos, a excepción de la notación matricial. 1
Una gran ventaja del álgebra matricial sobre el álgebra escalar (álgebra
elemental que trata con escalares,y números reales) consiste en que propor-
ciona un método compacto de manejar los modelos de regresión que invo-
lucran cualquier número de variables; una vez formulado y solucionado el
modelo con k variables mediante la utilización de notación matricial, la
solución se puede.aplicar a una, dos, tres, o cualquier número de variables.

* Este es un capítulo opcional y puede ser omitido sin que por ello haya pérdida de continuidad.
I Los lectores que no estén familiarizados con el álgebra matricial deben repasar los fundamentos co-
rrespondientes antes de seguir, los cuales son necesarios para comprender este capítulo.

172
ENFOQUE MATRICIAL PARA EL MODELO DE REGRESION LINEAL" 173

7.1 EL MODELO DE REGRESION LINEAL CON k VARIABLES


~

Generalizando los modelos de regresión lineal con dos y tres variables, el


modelo de regresión poblacional (FRP) con k variables que tiene la variable
dependiente Y y K-l variables explicativas X 2 , X 3 , ••• X k se puede escrl-
bir como
i = 1.2.3 •...• N
(7.11)
donde PI = la intersección, fJ2 a fJ" = coeficientes parciales de la pendiente,
u = término de perturbación estocástica, i = iésima observación, donde N
corresponde al tamafto de la población. La FRP (7.1.1) se debe interpretar
como siempre: nos proporciona la media o valor esperado de Y, condiciona-
do en los valores fijos (en muestreos repetidos) de X 2 , X 3 , ••• X k , es decir
La ecuación (7.1.1) es'una expresión abreviada del siguiente conjunto
de N ecuaciones simultáneas:
. Yi = fJI + fJ2 X 21 + fJ3 X 31 + ... + fJ"X u +"1
Y2 = fJI + fJ2 X 22 + fJ3 X 32 + ... + fJ"X u +"2 (7 .l~2)

Escribamos el sistema de ecuaciones (7.1.2) en' una forma alterna, aunque


más ilustrativa:

[~1
X 21 X3~

= [j X 22

X 2N
X 32

X 3N
x"rl m
X 12
··
X"N
·
fJ2
..
.
fJ"
+ (7.1.3)

y = x p + u
N xl N xk k x 1 N xl
2
donde
y = un vector columna N X 1 que contiene las observaciones de la va-
riable dependiente Y.
X = matriz N X k que muestra las N observaciones de las k - 1 varia-
bles explicativas X 2 a X k , con la primera columna de unos para
representar el término de intersección. (Esta ma:triz también se
conoce c"mo matrjz de datos).
11 = vector columna k X l de los parámetros desconocidos fJ" P2"'" fJ"
u = vector columna N X 1 de N las perturbaciones U¡

2Los vectores serán representados por letras minúscUlas en negrillas y las matrices serán representadas
por letras mayúscUlas en negrillas.
174 MODELOS UNIECUACIONALES DE REGRESION

Utilizando las reglas de suma y multiplicación de matrices, el lector debe ve-


rificar que los sistemas (7.1.2) Y (7.1.3) son equivalentes.
El sistema (7.1.3) se conoce como representación matricial del modelo
general de regresión lineal (con k variables). Se puede escribir en forma más
concreta como
y == ,X: , + u
(7.104)
Nxl N'kkkxl N xl
Donde no existe ninguna confusión sobre las dimensiones u 6rdenes de la
matriz X y los vectores y, p, y u; la ecuación (7.1.4) se puede escribir senci-
llamente como
y = Xp + u (7.1.5)
Como ilustración de la representación matricial, consideremos el mode-
lo consumo-ingreso de dos variables utilizado en el Capítulo 3; más específi-
camente, 1'; = /Ji + /J2 X ¡ + U¡, , donde Y son los gastos de consumo y X es el
ingreso. Utilizando los datos dados en la Tabla 3.2 la formulación matricial
es la siguiente:
70 1 80 U1
65 1 100 U2
90 120 U3
95 1 140 u4

[~~
110 1 160 Us
115
=
1 180
+ u6
(7.1.6)
120 1 200 U7
140 1 220 U8
155 240 '"9
150 1 260 "10
Y X P + u
10 x 1 10 x 2 2 x 1 10 x 1
Como fue el caso para 'el modelo de dos variables, nuestro objetivo con-
siste en estimar los parámetros de la regresión múltiple (7.1.1) Y hacer infe-
rencias acerca de ellos a partir de los datos que se tienen a la mano. En
notación matricial, esto implica estimar p y hacer inferencias sobre su valor.
Para efectos de estimación, podríamos utilh'lr el método de mínimos cuadra-
dos ordinarios (MCO) o el método de máxima verosimihtud (MV). Sin
embargo, como se mencionó anteriormente, estos dos métodos arrojan idén-
ticos estimadores de los coeficientes de regresión. 3 En consecuencia, limita-
remos nuestra atención al método de (MCO).

3 La prueba de que esto se cumple en el caso de k variables se encuentra en las referencias de las notas
de pie de página del capítulo cuarto.
ENFOQUE MATRICIAL PARA EL MODELO DE REGRESION LINEAL' 175

7.2 SUPUESTOS DEL MODELO CLASICO DE REGRESION


UTILIZANDO NOTACION MATRICIAL
En la Tabla 7.1 se presentan los -supuestos en los que se basa el modelo clásico
de regresión lineal en notación escalar, así como sus equivalentes en notación
matricial. El supuésto 1 dado en (7.2.1) implica que el valor esp~rado del
vector de perturbación u, es decir, el valor de cada uno de sus elementos, es
cero. Expresado más explícitamente, E(u) = O implica que

E[::] = [:::::] = l~] (7.2.6)


UN E(UN) O

El supuesto 2 [ecuación (7.2.2)1 es una forma concreta de expresar los


dos sUp'uestos dados en (3.2.2) y (3.2.3), utilizando notación escalar. Para
poder apreciarlo, escribamos:

TABLA 7.1
Supuestos del modelo clásico de regresión lineal
Notación escalar
------------------~----
Notación matricial

1. E(u¡) == o, pata cada; (3.1.1) 1. E(u)=O (7.2.1)


donde 11 y O son vectores
columna de N xl. siendo O
un vector nulo
2. E(ufU¡) = O i =1= i. (3.1.2) 2. Eluu') _ 6 1 1 (7.2.2)
:,(12;=; (3.1.3) donde I es una matriz
identidad de N x N
3. X,. Xl' .. , • Xk son no 3. La matriz X de N x k es no
estocásticas o fijas (3.2.4) estocástica; es decir. consta de
un conjunto de números fijos. (7.2.3)
4. No existe relación lineal 4. El rango de X. ¡¡(xl"" k, donde k
exacta entre lal variables X. es el número columnas en X y k
es decir, no existe multicoli· es menor que N, número de
nealidad. (7.1. 7) observaciones. (7.2.4)
5. Para pruebas de hipótesis: 5. El vector u tiene una distribución
"1 -N(O, (11) normal multivariada, es decir
(4.2.4) u - N(O, 0'21) (7.2.5)
176 MODELOS UNIECUACIONALES DE REGRESION

donde u' es la traspuesta del vector columna u, el cual es un vector fila.


Efectuando la multiplicación, obtenemos

Aplicando el operador de valor esperado E a cada elemento de la matriz


anterior, obtenemos
E(u¡) E(utuz) E(utu N ) ]

E(uu') =
[
~~~~.~~~ ....~~~~! .... '.:: ...~~~.2. ~~). (7.2.7)
E(uNu t ) E(UNU2) ... E(u~)

Debido a los supuestos de homocedasticidad y no correlación serial, la


matriz (7.2.7) se reduce a

E(uu) ~ r~:'~~ . ~.: :.....~l


loo O ... (12

= (1Z[.~.... ~....~ .........~.]


O O O .. , 1
(7.2.8)
donde 1 corresponde a una matriz identidad o matriz unitaria N X N.
A la matriz (7.2.7) y su representación dada en (7.2.8) se le denomina
matriz de varianza-covarianza de las perturbaciones U¡; los elementos sobre
la diagonal principal de esta matriz (los que van de la esquina superior iz-
quierda a 1~ esquina inferior derecha) muestran las varianzas, mientras los
elementos que se encuentran4 fuera de la diagonal principal corresponden a
las covarianzas. Obsérvese que la matriz de varianza-covarianza es simétrica:
los elementos localizados a la derecha de la diagonal principal son imagen
idéntica de los de la izquierda. '
El supuesto 3 afirma que la matriz X de orden N X k es no estocástica,
lo cual implica 'que está formada por número fijos. Como se mencionó pre-
viamente, nuestro análisis de regresión es un análisis de regresión condicional,
por lo cual los valores de Y dependen de los valores fijos de las variables X.

4 Por definición, la varianza de u¡ = E[u¡-E(u¡)]2 mientras que la covarianza entre u¡ y Uj =E[u¡-E(uJ


[u j- E(u j )). Sin embargo, en razón al supuesto de que E(u¡) = O para cada i, tenemos la matriz de

varianza-covarianza de la ecuación (7.2.7).


ENFOQUE MATRICIAL PARA EL MODELO DE REGRESION LINEAL' 177

El supuesto 4 afirma que la matriz X tiene un rango de columna com-


pleto igual a k, el número de columnas en la matriz. Lo anterior significa que
las columnas de la matriz X son linealmente independientes, lo que implica
que no existe una relación lineal exacta entre las variables X.< En otras pala-
bras, no existe multicolinealidad. En notación escalar, esto es equivalente a
decir que no existe un conjunto de números Al, A2' ... , Ak donde no todos son
cero, tales que [cf (7.1.8)].
(7.2.9)
donde X 11 = 1 para todo i (para dar lugar a la columna de unos en la matriz
X). En notación matricial, la ecuación (7.2.9) se puede representar como
)..'x =0 (7.2.10)
donde A' es un vector fila de 1 X k Yx es un vector columna de k X 1.
Si existe una relación lineal exacta como la de la ecuación (1.2.9), se
dice que las variables son colineales. Por otra parte, si la ecuación (7.2.9)
es ve"dadera solamente si Al = A2 = A,3 = ... = O, entonces se dice que las
variables X son linealmente independientes. En el Capítulo 8 proporcionare-
mos una justificación más profunda del supuesto de no multicolinealidad.

7.3 ESTIMACIONES UTILIZANDO MeO


Para obtener el estimador de MCO para p, escribamos primero la regresión
muestral p.,.q k variables (FRM):
(7.3.1)
que se puede escribir más concretamente en notación matricial como
y= Xp + e (7.3.2)
y en forma de matrices como

(7.3.3)

y = X P + e
N xl N xk kx 1 N x 1
donde ~ es un vector columna de k elementos de los estimadores de MCO
para los coeficientes de regresión y donde e es un vector columna de N X 1
para los N residuos.
Como ocurre en los modelos de dos y" tres variables, en el caso de k
variables los estimadores de MCO se obtienen minimizando

L ef = L (Y¡ - PI - P2 X 2i -'" - ptXkl (7.3.4)
178 MOOELOS UNIECUACIONALES DE REGRESION

donde r et
es la suma de los residuos al cuadrado (SRC). En notación ma-
tricial, esto equivale a minimizar e'e puesto que

e'e = [el e2 ... eNJ [:::] = ei + ei.+··· + e~ = ¿ el (7.3.5)

. eN
Ahora, partiendo de la ecuación (7.3.2) obtenemos
e = y - Xp (7.3.6)
Por tanto,
e'e = (y Xp)'(y - XP)
j

= y'y - 2P'X'y + p'X'XP (7.3.7)


donde se utilizan las propiedades de la trasposición de una matriz, es decir,
(Xp)'= P'X'; y puesto que P'X'y es un escalar (un número real), él es igual a su
traspuesta y'XIl.
.la ecuación (7.3.7) es la representación matricial de (7.3.4). En notación
escalar, el método de MCO consiste en estimar de esta manera 131.132' ... , Pie
donde ¿ el es tan pequeña como sea posible. Esto se hace diferenciando
parcialmente (7.3.4) con respecto a PI' P2' ... , Pie e igualando las expresiones
resultantes a O. Este proceso arroja k ecuaciones simultáneas para k incógnitas,
las ecuaciones normales de la teoría de los mínimos cuadrados. Como se
muestra en el Apéndice 7A, Sección 7A.l, esta~ ecuaciones son las siguientes:
NPI + P2 L X 2i + P3 ¿ X 3i + ... + Pie L X lei = L Y¡
PI ¿ X 2i + P2 ¿ X~i + P3 L XU X3i + ... + Pie ¿ X 2i X lei = ¿ X u Y¡
PI ¿ X 3i + P2 ¿ X 3 /X 2/ + P3 ¿ X~/ + ... + Pie ¿ X 3i X ki = ¿ X 3i Y¡
~ ................................................................................. (7.3.8)5
PI ¿X lci + P2 ¿X Ie /X 2/ + P3 ¿ X ki X 31 + ... + Pie ¿ Xfi = ¿ X lei Y;
En forma matricial, las ecuaciones en (7.3.8) se pueden expresar como
N IX 2i IX 3i IX lci

I X 2i I xii I X 2i X li .,. I X 2i X li X 21 X 22 .,. X 2N


IX 3i I X 3i X li I xii ... I X X 3i lci
X 3! X l2 .. , X 3N

I X ki I X ki X 2i I X ki X 3i •. , I X;i
(X'X) X' Y
(7.3.9)
5Estas ecuaciones pueden recordarse fácilmente. Comience COR la ecuación Y¡ = p\ + P2 X 2i + P3 X 3i +
.. + Pie X lei' Sumando esta ecuación sobre los N valores se obtiene la primera ecuación en (7.3.8);
al multiplicarla por X 2 a ambos lados y sumar sobre las N, obtenemos la segunda ecuación; tnultipli
cándola por X, a ambos lados y sumando sobre las N obtenemos la tercera ecuación; y así sucesiva-
mente. Nótese que la primera ecuación en (7.3.8) equivale Clirectamente a p\ = Y - P2 X 2:" Pie X k
[cf. (7.4.6)].
ENFOQUE MATRICIAL PARA EL MODELO DE REGRESION LINEAL' 179

o en forma más concreta como


(X'X)~ = X'y (7.3.10)
. Obsérvense las siguientes características de la matriz (X'X): (1) propor-
ciona las sumas brutas de los cuadrados y los productos cruzados de las varia-
bles X, uno de los cuales es la intersección, la cual toma el valor de 1 para
cada observación. Los elementos en la diagonal principal muestran las sumas
brutas de los cuadrados, mientras que aquellos que se encuentran fuera de la
diagonal principal presentan las sumas brutas de los productos cruzados (el
término bruto implica que está en las unidades originales de medición. (2) Es
simétrica puesto que el producto cruzado entre X 2i X 3i es el mismo que entre
X 3;' X 2;' (3) El orden de la matriz es de (k X k), es decir, k. filas y k columnas.
En la ecuación (7.3.10) las cantidades conocidas son (X'X) y (X'y) (el
producto cruzado entre las variables X y n, siendo ~ el valor desconocido.
Utilizando ahora álgebra matricial, si existe la inversa de (X'X), es decir,
(X'X)-l, entonces premultiplicando ambos lados de la ecuación (7.3.1 O) por
su inversa obtenemos .
(X'X)-l(X'X)~ = (X'X)-IX'y
pero debido a que (X'X)-l (X'X) == J, una matriz identidad de orden k X k,
obtenemos
IP = (X'X)-IX'y
o
P= (X'X)-lX'y (7.3.11)
k xl, k x k (k x NXN x 1)

La ecuación (7.3.11) es un resultado fundamental de la teoría de MCO


en notación matricial. Muestra como el vector íi se puede estimar partiendo
de los datos dados. Aunque la ecuación (7.3.11) se obtuvo partiendo de
(7.3.9), se puede obtener directamente de (7.3.7) diferenciando e'e' con
respecto a ~. La prueba se encuentra en el Apéndice 7 A, Sección 7 A.2.

Ilustración
Para ilustrar el método matricial desarrollado hasta el momento, examinemos
el ejemplo de consumo-ingreso del Capítulo 3, cuya información se reprodu-
ce en la ecuación (7.1.6). Para el caso de dos variables, tenemos

Xl

LJ 1 ~: -[tx, f~¡J
180 MODELOS UNIECUACIONAlES DE REGRESION

Empleando la i.nformación dada en (7.1.6), obtenemos,

X'X = [10 1700 ]


1700 322000

I [1110 ]
y Xy = 205500

Al utilizar las reglas de inversión de matrices, se puede observar que la inversa


de la matriz (X'X) anterior es

(X'X)-1 = [ 0.97576 -0.005152 ]


-0.005152 0.0000303

por tanto,
~ = [P1J = [0.97576 -0.005152 J[ 1110J
P2 -0.005152 0.0000303 205500

= [24.3571J
0.5079
Previamente obtuvimos P1 = 24.4545 y P2 = 0.5091, utilizando el
computador. La diferencia entre las dos estimaciones se debe únicamente a
errores de aproximación. A propósito, obsérvese que cuando se trabaja con
una calculadora de escritorio es esencial obtener los resultados a un nivel
significativo de dígitos, para efectos de minimizar los errores de aproxima-
ción.

Matriz de varianza-covarianza para ~


Los métodos matriciales nos permiten desarrollar fórmulas, no solamente
para la varianza de Pi' cualquier elemento dado de ~, sino también para la
covarianza entre dos elementos cualesquiera de p, por ejemplo, Pi y P1 .
Necesitamos estas varianzas y covarianzas para efectos de realizar inferencia
estadística.
Por definición, la matriz varianza-covarianza para P es [cf. (7 .2.7)J:

var-cov (,B) = E{[P - E(~)][P - E(P)]'}

que se puede escribir explícitam~nte como


ENFOQUE MATRICIAL PARA EL MODELO DE REGRESION LINEAL" 181

var-cov (j) = [~~~W~1.,l. .~:.~r~;:l . ::. ~:~:: .~~] (7.3 .12)


COy (Pk' Pl) COy (p", Pl) ... var (Pk)

En el Apéndice 7 A, Sección 7 A.3, se demuestra que la anterior matriz de


varianza-covarianza se puede obtener a partir de la siguiente fórmula:
(7.3.13)
donde q2 es la varianza homocedástica de u¡ y (X'Xt 1 es la matriz inversa
que aparece en la ecuación (7.3.11), fórmula de la cual se obtiene el estima-
dor ~,de MCO.
En los modelos de regresión lineal de dos o tres variables, las expresio-
nes (¡2 = ¿ ef/(N ~ 2) Y (¡2 = ¿ et/(N - 3), arrojaban el estimador insesgado
para q2 , respectivamente. En el caso del modelo de k variables, la fórmula
correspondiente es

e'e
=N-k (7.3.14)

en cuyo caso existen N - k g de 1. (¿Por qué?)


A pesar de que en principio e'e se puede calcular a partir de los residuos
estimados, en la práctica se puede obtener directamente de la' siguiente mane-
ra. Si recordamos que ¿ et (= SRC) = STC - SEC, para el caso de dos va-
riables,
"t.. e¡1 -_ t..
" y¡2 - 82"
pz t.. X¡2 (3.3.6)
y en el caso de tres variables
¿ ef = ¿ yf - Pl ¿ Y/X2i - P3 ¿ y¡X3¡ (7.4.17)
Extendiendo este principio al modelo con k variables, se puede ver
¿ et = ¿yt - Pl ¿Y¡X 2i - ' " - ¡JI< ¿Y¡x,,¡ (7.3.15)
En notación matricial,
, STC Ln·_·~,<::"Nf:~:~~~h~,:;:\::\~~~j' (7.3.16)
SEC:P: Ly,X;Af'" ··(,... I,Itlt~~f~t.:.:;~!~ (7.3.17)
donde el término Ny2 se conoce como corrección de la media. 6 Enton'ces,
e'e == 1Y - "X'y "'(7.3.18)

,6 Nota: L yf = L (Yj - y)2 = L Yf - Ny 2 = y'y - NYz. Por tanto, sin el término de corrección, y'y
nos dará silJlplemente la suma bruta de cuadrad.u y no la suma de desviaciones al cuadrado.
182 MODELOS UNIECUACIONALES DE REGRESION

a
Una vez estimado el valor de e'e, 2 se puede calcular fácilmente partiendo
de (7.3.14), lo cual a su vez nos permite estimar la matriz de varianza-cova-
rianza (7.3.13).
Para el caso de nuestro ejemplo ilustrativo,

e'e = 132100 - [24.4545 O.5091][20~~~J


= 337.273
Por tanto, a =
2
(337.273/8) = 42.1591, que corresponde aproximadamente
al valor obtenido previamente en el Capítulo 3.

Propiedades del vector pde MCO


Para el caso de dos variables, sabemos que los estimadores de MCO son linea-
les, insesgados y, dentro de la clase de todos los estimadores lineales, inses-
gados, tienen varianza mínima (la propieda,d de Gauss-Markov). En resumen,
los estimadores de MCO son los mejores estimadores lineales insesgados
(MELI). Esta propiedad es extensiva a todo el vector ti; es decir, p]es lineal
(cada uno de sus elementos es una función lineal de Y, la variable dependien-
te). E(P) = p, lo cual implica que el valor esperado de cada elemento de P'es
igual al correspondiente elemento del 11, verdadero y en la clase de todos los
estimadores lineales insesgados de 11, el estimador ti de MCO tiene varianza
mínima.
La prueba está dada en el Apéndice 7 A, Sección 7A.4. Como se enun-
ció en la introducción, el caso del modelo de k variables es en la mayoría
de las circunstancias una extensión directa de los casos de dos y tres varia-
bles.

-.7.4 EL COEFICIENTE DE DETERMINACION R 2


y EL COEFICIENTE DE DETERMINACION AJUSTADO R'l
EN LA NOTACION MATRICIAL
El coeficiente de determinación R'l se ha definido como

R2 = SEC
STC
En el caso de dos variables,

(3.5.6)

yen el caso de tres variables


ENFOQUE MATRICIAL PARA EL MODELO DE REGRESION LINEAL> 183

Generalizando, para el caso de k variables tendremos

R2 = P2 L Y/X2/ + P3L Y/X31 + ... + ¡JI< l: YIXIcI (7.4.1)


LY?
Usando (7.3.16)'· y (7.3.17), la ecuación (7.4.1) se puede escribir como

R2 -
"X',
- 1'y - NY"
_Ny2
=--..=-..~:-:- (7.4.2)

lo cual nos muestra la representación matricial de R 2 •


Para nuestro ejemplo ilustrativo,

p~, X,Y = [24.3571 0.5079] [ 205500


1110J

= 131409.831
y'y = ,132100
y Ny2 = 123210
Al remplazar es~os valores en (7 .4.2) se puede apreciar que R'1. = 0.9224, el
cual es aproximadamente el mismo valor que se obtuvo anterionnente,
excepto por los errores de aproximación.
Para efectos de comparar dos iP , es necesario tener en cuenta el núme':
ro de variables explicativas presentes en el modelo. Lo anterior puede hacerse
fácilmente si se considera un coeficiente de determinación alterno, como el
que presentamos a continuación:

iP =:: 1 _1; eU(N- k) (7.4.2.1)


, Lfl/(N ';;'.1)
en dondé k = número de parámetros en el modelo, incluyendo el término de
intersección con el eje Y. (En el modelo de 3 variables, por ejemplo, k = 3).
El R'1. definido de esta manera se denomina R2 ajustado. El ténnino ajustado
implica que el coeficiente se ajusta por los grados de libertad asociados con
las sumas.de cuadrados que entran en la ecuación (7.4.2.1): L tieneN - k et
g de 1 en un modelo que incolucra k parámetros y que incluye la intersec-
ción, en tanto que L yf tiene N - 1 g de l. Para el caso del modelo de tres
er
variables, sabemos que L tiene N - 3 g de l. .
La ecuación (7.4.2.1) puede escribirse alternativamente de la siguiente
manera:
f¡2
iP=l--Z (7.4.2.2)
Sy

en donde f¡2 es la varianza de los residuos, un estimador insesgado del verda-


dero (12, yS: es la varianza muestral de Y.
Es fácil establecer la relación existente entre el iP y el R 2 , puesto que
184 MODELOS UNIECUACIONALES DE REGRESION

al sustituir la definición del R2 del Capítulo 3, ecuación(3.5.4), en la ecua-


ción (7.4.2.2); en donde, después de alguna manipulación algebraica,

en la ecuación (7.4 ..2:2), se obtiene la siguiente expresión:

(7.4.2.3)

¿Qué R" deberá usarse en la práctica? Theil nos proporciona un buen argu-
mento acerca de las razones por las cuales debe utilizarse el R" :
... es buena práctica utilizar el R" en lugar del R 1 debido a que este último nos
proporciona un cuadro demasiado optimista de la regresión, p~icularmente cuando
el número de variables explicativas no es muy pequeño en comparación con el nú-
mero de observaciones.
En el Capítulo 5 desarrollamos la técnica de ADV para probar la signi-
ficancia global de la regresión estimada, hecho que implicaba probar la hipó-
tesis nula de que el valor verdadero del coeficiente de la pendiente era igual
a cero.
En este capítulo haremos extensivo el ADV al modelo d~ k variables,
buscando (1) probar la significancia de la hipótesis nula de que los coeficien-
tes verdaderos (parciales) de las pendientes son simultáneamente iguales a
cero y (2) estimar la contribución incremental de una variable explicativa.

7.S LA MATRIZ DE CORRELACION


En los ~apítulos anteriores nos encontramos con los coeficientes de correlación
rn, '13, '23 de orden cero o simple, así como los coeficientes de correlación
parcial o de primer orden '12.3, '13.2' '23.1 Y sus respectivas interrelaciones.
En el caso de k variables, se tendrán en total k (k - 1)/2 coeficientes de
correlación de orden cero. (¿Por qué?) Estas correlaciones k(k - 1)/2 se
pueden colocar en una matriz denominada matriz de correlación R, de la si-
guiente manera:

(7.5.1)
ENFOQUE MATR1CIAL PARA EL MODELO DE REGRESION LINEAL' 185

donde el subíndice 1, como en el caso a)1terior, denota la variable dependiente


y (r12 repres~nta el coeficiente de correlación entre Y y X" y así sucesiva-
mente) y donde se apela al hecho de que el coeficiente de correlación de una
variable con respecto a sí misma es siempre igual a 1 ('11 = '22 = ... = 'kk
= 1).
Partiendo de la matriz de correlación R se pueden obtener los coeficien-
tes de correlación de primer orden y de órdenes más elevados, tales como
'12.34 ••• k· (véase Ejercicio 7.4). Muchos programas de computador calculan
rutinariamente la matriz R. Analizaremos la matriz de" correlación en un
capítulo posterior(véase Capítulo 8).

7.6 PRUEBAS DE HIPOTESIS CON RESPECTO A LOS


COEFICIENTES INDIVIDUALES DE REGRESION EN
NOTACION MATRICIAL
Con base en razones ya expuestas en los capítulos anteriores, si nuestroobje-
tivo es tanto la inferencia como la estimación, tendremos que asumir que
las. perturbaciones u¡ siguen alguna distribución probabilística. Además, por
razones dadas previamente, en el análisis de regresión suponemos normal-
mente que cada Uf posee una distribución normal con un promedio o media
de cero y una varianza constante 0'2. En notación matricial tenemos que
(7.6.1)
londe u y O son vectores columna de N Xl, mientras que I es una matriz -
ientidad de N X N YO corresponde al vector nulo.
Según "el supuesto de normalidad, sabemos que para los modelos de
~resión con dos y tres variables: (1) los estimadores de MCO, ¡Ji y los
imadores de MV Pi son idénticos, aunque el estimador de MV (12 es ses-
o, este sesgo se puede eliminar utilizando el estimador insesgado de MCO
y (2) los estimadores Pi de MeO también tienen una distribución nor-
En términos generales, para el caso de k variables se puede demostrar

(7~6.2)

ir, que cada elemento de ; tiene una distribución normal, distribuido


la media igual al elemento correspondiente del valor verdadero de
\ varianza dada por 0'2 multiplicado por el elemento adecuado en la
1
1. de la matriz inversa (X'Xt • .
!sto que en el práctica se desconoce 0'2, ésta se estima empleando
nces, utilizando en lugar de la distribución normal, la distribución
~luye que cada elemento de ~ posee una distribución t con N-k g
)ólicamente,

(7.6.3)
186 MODELOS UNfECUACfONALES DE REGRESION

con N - k g de 1, donde fl¡ es un elemento de p.


Por tanto, la distribución t se puede utilizar para evaluar hipótesis
acerca del verdadero valor de Pi' como también para establecer intervalos
de confianza con respecto a dicho vector. Los procedimientos correspondien-
tes ya se han' ilustrado en el Capítulo 5. Si se desea un ejemplo completo,
véase Sección 7.10.

7.7 PRUEBAS DE SIGNIFICANCIA GLOBAL DE LA REGRESION:


ANA LISIS DE VARIANZA EN NOTACION MATRICIAL
La técnica de ADV 'se puede, por tanto, hacer extensiva fácilmente al caso
de un modelo de k variables. Recordemos que la técnica de ADV consiste
en descomponer la STC en dos componentes: la SEC y la SRC. Las expre-
siones matriciales para estas tres sumas de cuadrados ya se han dado en
(7.3.16) , (7.3.17) y (7.3.18), respectivamente. Los grados de libertad aso-
ciados con esta suma de cuadrados son N - 1, k - 1 Y N - k, respectiva-
mente. (¿Por qué?) En la Tabla 7.2 se presentan estas expresiones.
Suponiendo que las perturbaciones u¡ tienen distribución normal y
que la hipótesis nula P2 = P3 = ... = Pk = O , se puede demostrar que
F _' (P'X'y - Ny2)/(k - 1)
(7.7.1)
- (y'y - j'X'y)/(N - k)

TABLA 7.2
Fonnulación matricial del cuadrado de ADV
para el modelo de regresión lineal de k variables
Fuente de variación SC gde I SMC

~'X'y - Nf 2
Debido a la regresión _'X'y - Nf l k- 1
k- 1
(es decir, debida a X l' X)' ...• X.)
y'y - ~'X'y
Debido a los residuos y'y - j'X'y N -k
N- k

Total y'y - Nf 2 N -1

TABLA 7.3
Tabla de ADV para k variables en fonna matricial en ténninos del R 2
Fuente de variación SC gdel SMC

RVyrNf2)
Debido a la regresión R1(y'y _ Nf l ) k-l
k-l
(Es decir, debido a X 2' X 3' , .• , Xi)
., (1 - R2)(y'y - J
Debido a los residuos (1 - R1)(y'y - Nf2) N-k
N-k

Total y'y - Nyl N-l


ENFOQUE MATRICIAL PARA EL MODELO DE REGRESION LINEAL· 187

posee unad.istribución F, con k - 1 Y N - k g de l.


Se puede demostrar que existe una relación muy estrecha entre el F y
el R 2 , de la siguiente forma:
2
F= R /(k-l)
(1 - R 2 )/(N - k)

Por tanto, la Tabla 7.2 de ADV se puede expresar también en la Tabla 7.3.
Una ventaja de la Tabla 7.3 sobre la Tabla 7.2 es que todo el análisis se
puede desarrollar en términos del R2 ; no se necesita considerar el término
(y/y - Ny2) , puesto que éste se cancela en la relación F. .

7.8 PRUEBA DE RESTRICCIONES LINEALES:


PRUEBAS GENERALES F UTILIZANDO NOTACION MATRICIAL
En la sección anterior introdujimos la prueba general F para evaluar la vali-
dez de restricciones lineales impuestas sobre 1 o más parámetros del modelo
de regresión lineal con. k variables. Derivemos ahora la notación matricial
para la prueba estadística respectiva.
Sea
eR = vector de residuos de la regresión de mínimos cuadrados restringi-
dos.
eUR = vector de residuos de la regresión de mínimos cuadrados sin res-
tringir.
Entonces
e~ e!l = L e¡ = SRC de la regresión restringida y
eUR eVR = L e~R = SRC de la regresión sin fe.Stringir
m = número de restricciones lineales.
k = número de parámetros (incluyendo la intersección) en la regre-
sión sin restringir.
N = número de observaciones.
La contraparte matricial es entonces
F'= (e~eR - eutev.J/m (7.8.l)
(euReu.J/(N -k)
¡ue posee una distribución F con (m, N - k) g de 1. Como siempre, si el
alor calculado d<!~ de (7 .8.}) excede el valor crítico de F, podemos re-
hazar la regresión restringida; de otra manera, procedemos a aceptarla.

9 ' PREDICCION UTILIZANDO REGRESION MULTIPLE:


FORMULACION MATRICIAL
\ esta se'cción mostraremos cómo utilizar la regresión múltiple estimada
ra predecir valores' (l) promedios y (2) individuales de Y dados los valores
188 MODELOS UNIECUACIONALES DE REGRESION

d~ X, utilizando notación matricial. También presentamos las fórmulas


para calcular las varianzas y errores estándar de los valores proyectados.

Predicción med.ia o promedio

Sea (7.9.1)

el vector de valores de las variables X para los cuales deseamos pronosticar


Yo , la predicción media o promedio de Y.
La regresión múltiple estimada en forma escalar es:

Y; = Pl + P2 X 2i + P3 X 3i + ... + PkXki (7.9.2)


que, en notación matricial, puede escribirse en forma correcta como
Y¡ = x;~ (7.9.3)

. '
La ecuación (7.9.2) o (7.9.3) corresponde desde luego a la predicción media
de Y , correspondiente a los x; dados.
Si xí es como el que se presenta en (7.9.1), entonces (7.9.3) se convier-
te en
(7.9.4 )
donde, como es obvio, se especifican los valores de Xo . Nótese que (7.9.4)
proporciona una predicción in sesgada de E(Y¡lx~), puesto que E(x~¡J) = xo~.
(¿Por qué?)

Predied6n individual
Como se 'consideró en el Capítulo S, la predicción individual de Y , Yo tamo
bién está dada ((.n general por (7.9.3) o específicamente por (7.9.4). Es decir
(Yolx~) = xóP (7.9.5

Para ilustrar la meéánica de la predicción media e individual, consideremos I


modelo en el cual se intenta estimar los gastos de consumo personal en l(
Estados Unidos en los últimos años utilizando el siguiente modelo
en donde Y = gastos de consumo personal (GCP)'
ENFOQUE MATRICIAL PARA EL MODELO DE REGRESION LINEAL" 189

X2 = ingreso personal disponible (IPD )


X3 = tiempo, en años.
Para la estimación del anterior modelo se utilizó la información que aparece
en la Tabla 7.4, para el período 1956-1970
TABLA7.4
Gastos de consumo personal per capital
(GCPP) e ingreso personal disponible per
cápita (IPDP) en Estados Unidos en
1956-1970, en dólares de 1985
GCPP, Y IPDP, Xl Tiempo, X 3

281.4 309.3 1956 = 1


288.1 316.1 1957 = 2
290.0 318.8 1958 = 3
307.3 333.0 1959 =4
316.1 340.3 1960 = 5
322.5 350.5 1961 = 6
338.4 367.2 1962 = 7
353.3 381.2 1963 = 8
373.7 408.1 1964 = 9
397.7 434.8 1965 = 10
418.1 458.9 1966 = 11
430.1 477.5 1967 = 12
452.7 499.0 1968 = 13
469.1 513.5 1969 = 14
476.9 533.2 1970 = 15

Fuente: Economic Report o{ the P1'es/dent enero


1972, Tabla B-16

la función estimada es la siguiente:


f; = 53.1603 + O.7266X 2i + 2.7363X 3i
(13.0261) (0,0487) (0.8486)
t = (4.0811) (14.9060) (3.2246)
R 2 = 0.9988
gdel= 12 F Z• 12 = 5128.88
iP = 0.9986
Supóngase ahora que se desea estimar los gastos de consumo para el primer
trimestre de 1971, -dado que se conoce que el ingreso personal disponible
~s de $567 mil millones. .
~emplazando los dos valores, X 2 = 567 Y X 3 = 16, se obtiene

(Y1m/X, =' S·67,X. = 16)= 53.1603 +0.7266 (567) + 2:7363 (16)


= 508.9297
190 MODELOS UNIECUACIONALES DE REGRESION

De otro lado, en términos matriciales, la predicción media y la individual de


Jos gastos de consumo personal son:

• [53.1603]
P= 0.7266
2.7363
por .tanto
53.1603]
(Y1971Ix'1971) = [1 567 16]
[
0.7266
2.7363
= 508.9297 (7.9.6)

(Y1971 I X'1971) = 508.9297


.
(7.9.7)

Varianza de la predicción media o promedio


l3 fórmula para calcular la varianza de(Yolxó) es la siguiente:?

(7.9.8)
donde (12 es la varianza de U¡, x~ son los valores dados de las variables X a las
que deseamos predecir y (X'X) es la matriz dada en (7.3.91, es decir. la ma-
triz utilizada para estimar la regresión múltiple. Al remplazar (12 por su esti-
mador insesgado &2, podemos escribir la fórmula (7.9.8) como

(7.9.9)
Para el ejemplo ilustrativo antes considerado, tenemos los siguientes valores:
26.3858 -0.0982 1.6532]
&l = 6.4308 X'X- 1 = [ -0.0982 0.0004 -0.0063
1.6532 -0.0063 0.1120

7 Para la derivación, v~Qse J. Johnston, Econometric Methods. McGraw-HiII Book Company, 3 cd.
Nueva York, 1984, pp. 195-196.
f
ENFOQUE MATRICIAL PARA EL MODELO DE REGRESION LlN~AL' 191

Utilizando la Ínfonnación de (7.9.9), obtenemos

(Var t 1971 1Xí971) = 6A308[1 567

-= 6.4308
= 3.6580 (7.9.10)

y
(7.9.11)

Entonces, siguiendo el análisis del Capítulo 5, el intervalo de confianza del


100(1 _oc ) por ciento de la respuesta promedio, dado x o és:

to - t./2JU2xo{X'X)-lXO S E(Ylxo) S ro + t./2JU2xo{X'X)-lXO (7.9.12)


Para nuestro ejemplo, el intervalo de confianza del 95 %, para la respuesta pro-
medio es: 504'.7518 S E(Y 1971) ~ 513.0868.

Varianza de la predicción individual


r~a fórmula para la varianza de una predicción individual es la siguiente: 8

(7.9.13)
f. (5.10.6)]
tevamente, utilizando la información con que se cuenta, obtenemos:

Var (Y1971Ix 1971 ) = 6.4308(1 + 0.5688)


= 10.0887 (7.9.14)

se (Y1971lx1971) = J10.0887 = 3.1763 (7.9.15)

',eamos establecer un intervalo de confianza del 100(1 - IX) por ciento


a predicción individual, procedemos como en (7.9.12), excepto que
Ir estándar de la producción se obtiene ahora a partir de (7.9.13).
decir que el error estándar de la predicción para la predicción indivi-
mayor que el de la predicción promedio.
192 MODELOS UNIECUACIONALES DE REGAESION

7.10 RESUMEN DEL ENFOQUE MATRICIAL:


EJEMPLO ILUSTRATIVO

Para resumir el enfoque matricial al análisis de regresión, presentaremos a continua-


ción un ejeIl}plo numérico desarrollado para tres variables. Recordemos el ejemplo
de la regresión del consumo personal agregado en el ingreso personal disponible
agregado para el período de 1956-1970. En dicho modelo se incluye una tercera
variable, la de teñdéncia X 3, que puede representar entre otras cosas la población
total: se espera que el consumo agregado aumente a medida que la población
aumenta. Una manera de aislar la influencia de la población consiste en convertir
el consumo agregado y el ingreso agregado en cifras per cápita, dividiendo tales
valores por la población total. La regresión de los gastos de consumo per cápita
en el ingreso per cápita nos proporcionaría la relación entre los gastos de consumo
y el ingreso neto de los cambios que experimente la población (o efecto de escala).
La variable de tendencia se puede mantener en el modelo como una variable que·
"toma" todas las demás influencias que afectan los gastos de 9onsumo (por ejem-
plo, la tecnología), Por tanto, para fmes empíricos el modelo de regresión es

(7.10.1)
donde Y = gastos de consumo per cápita, Xz = ingreso disponible per cápíta y
X 3 = tiemp,o. Los datos necesarios para procesar la regresión (7.10.1 )se presentan
en la Tabla 7:5.

TABLA 7.5
Gastos de' consumo personal per
cápita (GCPP) e ingreso personal
disponible per cápita (IPDP) en
Estados Unidos en 1956-1970, en
dólares de 1985

GCp'p. Y IPDP X 2 Tiempo, X3

1673 1839 1 (=1956)


1688 1844 2
1666 1831 3
1735 1881 4
1749 1883 5
1756 1910 6
1815 1969 7
1867 2016 8
1948 2126 9
2048 2239 10
2128 2336 11
2165 2404 12
2257 2487 13
2316 2535 14
2324 2595 15 (= 1970)

Fuente: Ecanamic Repart al the Presi


dent.enero 1972, Tabla 8·16.
ENFOQUE MATRICIAL PARA EL MODEl,.O DE REGRESION LINEAL· 193

En notación matricial, el problema puede escribirse de la siguiente manera:

1673 1 1839 1 el
1688 1 1844 2 e¡
1666 1 1831 3 e3
1735 1881 4 e.
1749 1883 5 es
1756 1910 6 e6

[~:] +
1815 1 1969 7 e7
1867 = 1 2016 8 es (7.10.2)
1948 1 2126 9 eg
2048 1 2239 10 elO
2128 2336 11 eu
2165 1 2404 12 eu
2257 1 2487 13 eu
2316 1 2535 14 ea
~324 1 2595 15 eu
y = X + e
15 x 1 15 x 3 -
3x 1 15 x 1

De la información ant~rior se pueden obten~r loto siguientes valores:

f = 1942.333 X2 = 2126.333 X3 = 8.0


L (l'j - f}l = 830121.333 L (Xli - X~)2 = 1103111.333 L (X 31 - X3)l = 280.0
1 X 21 X31

n-V, X22 X 23 ...


X X32 X33 .. X
31
1 ...

,
L]
3N
1 X l2 X32
1 X:u X 33

1 X X
2N 3N

+:~.
LX lI
LX~, L LX"
X 21 X 31
]
LX 31 L X lI X 31 LX~,

[ 15
31895
1~ ]
= 31895 68922513 272144 (7.10.3)
120 272144 1240.

[ ~135] (7.10.4)
X'y = 62905821
247934
194 MODELOS UNIECUACIONALES DE REGRESION

Utilizando las reglas de inversión de matrices se puede apreciar que

37.232491 -0.0225079 1.3366965]


(X'X)-l = -0.0225079 0.0000137 -0.0008319 (7.10.5)
[
, 1.3366965 -0.0008319 0.054034

300.28625]
por consiguiente, • =(X/X)-lX/y = 0.74198 (7.10.6)
(
8.04356

La suma de los residuos al cuadrado puede computarse como


L el = e'e
= 1Y - ,'X/y

= 57420003 - [300.28625 0.74198 8.04356](62~:!~~]


247934
= 1976.85574 (7.10.7)

de donde obtenemos
e'e
8'2 = - = 164.73797 (7.10.8)
12
La matriz de varianza-covarianza para _ puede escribirse entonces de la siguiente
manera: .
6133.65151 - 3. 70794 220.20634]
var-cov <p) = &2(X'X)-1 = -3.70794 0.00225 -0.13705 (7.10.9)
[
220.20634 -0.13705 8.90155
Los elementos de la diagonal de esta matriz constituyen las varianzas de PI' P2,yP3
respectivamente, mientras que sus raíces cuadradas positivas corresponden a los res-
pectivos errores estándar. De los datos anteriores se puede verificar fácilmente que

y SEC: P'X'y - Nf 2 = 828144:47786 (7.10.10)


2 (7.10.11)
STC: y'y - Nf = 830121.333
2
P'X'y - Nf
por tanto, R2 = _
y'y _ Ny2

828144.47786
830121.333
= 0.99761 (7.10.12)
Se puede ver que el coeficiente ajustado de determinación es
R2 = 0.99722 (7.10.1:
Reorganizando los resultados que hemos tenido hasta ahora, se tiene
1; = 300.28625 + 0.74198X u + 8.04356X 3i
ENFOQUE MATRICIAL PARA EL MODELO DE REGRESION LINEAL' 195

(78.31763) (0.04753) (2.98354) (7.10.14)


t= (3.83421) (15.61077) (2.69598)
2
R = 0.99761 iP = 0.99722 g de 1= 12

La i'nterpretación de (7.10.14) es la siguiente: SiX 2 y X 3 se fijan en cero,


el valor promedio del gasto de consumo per cápita se estima del orden de
$300. Como es constumbre, esta interpretación mecánica de la intersección
debe tomarse con cautela. El valor del coeficiente de regresión parcial de
0.74198 implica que, manteniendo todas las demás variables constantes, un
aumento en el ingreso per cápita de, digamos, un dólar, va acompañado de
un aumento en el consumo personal promedio per cápita de alrededor de
74 centavos. En resumen, la propensión marginal a consumir estimada es de
cerca de 0.74 o del 74%. De igual manera, manteniendo todas las demás va-
riables constantes, el consumo personal promedio per cápita aumentó a una
tasa de $8 por año durante el período estudiado, 1956-1970. El R 2 Y el/P
de 0.9976 y 0.99722 demuestran que las dos variables explicativas recogen
cerca del 99% de la variación en el consumo per cápita en los Estados Unidos
durante el período 1956-1970. Aunque el iP disminuye ligeramente, sigue
siendo suficientemente alto.
Analizando la significancia estadística de los coeficientes estimados, ve-
mos a 'partir de (7.10.14) que cada uno de los coeficientes estimados es esta-
dísticamente significativo en forma individual a un nivel.de significancia, de,
por ejemplo, el 5%: las razOnes de los coeficientes estimados con respecto a
sus errores estándar (es decir, las razones t) son 3.83421,15.61077 y 2.69598,
respectivamente. Utilizando la prueba t en dos colas a un nivel de significan-
cia del 5 %, se puede apreciar que el valor crítico t para 12 g de 1 es 2.179.
~ada uno de los valores t calculados excede este valor crítico. Por tanto, indi-
idualmente podemos rechazar la hipótesis nula de que el valor poblacional
~rdadero para el coeficiente relevante es cero.
Como se mencionó previamente, no podemos aplicar la prueba t tradicio-
1 para evaluar la hipótesis de que fJ2 = fJ3 = O simultáneamente, debido a
e el procedimiento de la prueba t supone que se toma una muestra indepen-
nte cada vez que se aplica dicha prueba. Si se utiliza la misma muestra
1 evaluar la hipótesis acerca de fJ2 y fJ3 simultáneamente, es probable que
estimadores Pl y P3 estén correlacionados, violando así el supuesto funda-
tal del procedimiento de la prueba t. De hecho, al observar la matriz de

.A 7.6
,la de ADV"para los datos de l8 Tabl8 7.S

de variación sc gde I SMC

a Xi' Xa 828144.47786 2 414072.3893


t residuos 1976.85574 12 164.73797

830121.33360 14
196 MODELOS UNIECUACIONALES DE REGRESION

varianza-covarianza para' dada en (7.10.9), se demuestra que los estimado-


res P2 y P3 están correlacionados negativamente (la covarianza entre los dos
es -0.1 3705). Por tanto, no podemos utilizar la prueba t para evaluar la hipó-
tesis nula de que P2 = P3 = O.
Pero recordemos que una hipótesis nula como P2 = P3 = O, simultánea-
mente se puede evaluar utilizando la técnica de análisis de varianza y la prueba
F. En el caso de este problema la tabla para el análisis de varianza es la Tabla
7.6. Bajo los supuestos usuales obtenemos
F = 414072.3893 = 2513 52 (7.10.15)
164.73797 .
la cual tiene una distribución F con 2 y 12 g de 1. El valor calculado F es
obviamente muy significativo; podemos rechazar la hipótesis nula de que
P2 = P3 = O , es decir, que el gasto de consumo personal per cápita no está
linealmente relacionado con el ingreso disponible y la tendencia.
En la Sección 7.9 estudiamos la mecánica para realizar proyecciones,
ya sea la predicción promedio, como también la predicción individual. Su-
pongamos que para 1971 el valor del IDPP (Ingreso doméstico privado per-
sonal) es de $2610 y que se desea predecir los gastos de consumo personal
per cápita GCPP correspondiente a estas cifras. Entonces, la predicción
individual y la predicción promedio para los GCPP para 1971 son las mis-
mas y están dadas como
GCPP 1971 IDPP 19710 X 3 = 16) = x1971'

300.28625]
= [1 2610 16]
[
0.74198
8.04356
= 2317.29 (7.10.16'
donde se utillia (7.9.3).
Las varianzas de 9'1971 y Y1971 , que se dieron en la Sección 7.9, son cJ
ferentes y son las siguientes:
Var (fI971lxl971) = q2[X'1971(X'X)-lX 1 971]

-164.73797 [1 2610 16)(X'x)-{26:~r (7.10

donde (X'X)-"t se muestra en (7.1 0.5). Sustituyendo esto en (7.1 O


el lector debe yerificar que

(7.1
y, por tanto.
ENFOQUE MATRICIAL PARA EL MODELO DE REGRESION LINEAL" 197

Dejaremos que el lector verifique, utilizando (7.9.13), que

Var (Y1971 1X'1971) = 474.7389 . (7.10.19)


y $e (Y1971Ixí971) = 21.7885

En la Sección 7.5 introdujimos la matriz de correlación R. Para nues-


tros datos, la matriz de correlación es la siguiente:
y X2 X3
y [1
R = X 2 0.9980 1
0.9980 0.9743]
0.9664 (7.10.20)
X 3 0.9743 0.9664 1
Obsérvese que en (7.10.20) hemos enmarcado la matriz de correlación con
los nombres de las variables del modelo para que podamos identificar fácil-
mente cuáles variables están involucradas en el cálculo' del coeficiente de
correlación. De esta manera, el coeficiente 0.9980 en la primera fila de la
matriz (7.10.20) es el coeficiente de correlación entre Y y X 2 (es decir,
'12)' Partiendo de las correlaciones cero, dadas en la matriz de correlación
(7.1 0.20), se pueden derivar fácilmente los coeficientes de correlación de
primer orden. (véase Ejercicio 7.7).

7.11 RESUMEN Y CONCLUSIONES


El propósito fundamental de este capítulo fue introducir el enfoque matri-
cial al modelo clásico de regresión lineal. Aunque se introdujeron muy po-

TABLA 7.7
Ifodelo de regresión de k variables en las unidades originales y en forma
'e desviaciones .
,idades originales Forma de desviaciones

(9.3.2) y==X_+e
La columna de 1 s en la matriz X
desaparece. (¿Por qué?)
(9.3.11) La misma
(9.3.13) La misma
(9.3.18) La misma
(9.3.16) r. y; = y'y (9.11.1)
(9.11.2)
(9.3.17) SEC= _'X'y
(9.4.2) R2 = _'X/y (9.11.3)
y'y

e que aunque en ambos casos los símbolos para vectores y matrices son los
en el modelo en forma de desviaciones se supone que los elementos de las
y de lo. vectores son desviaciones de la media en lugar de adoptar la forma
de la información. Nótese ademÍl que en la forma de desviaciones, ,es de
• 1 Yla matriz var-cov (1) es de orden ,(k - IXk - 1).
198 MODELOS UNIECUACIONALES DE REGRESION

cos conceptos sobre el análisis de regresión, la notación matricial proporciona


un método concreto de manejar los modelos de regresión lineal que invo-
lucran cualquier número de variables.
Al cerrar este capítulo vale la pena observar que si las variables X y. y
se miden en forma de desviaciones, es decir, como desviaciones de sus medias
muestrales, se presentan algunos cambios en las fórmulas presentadas previa-
mente, los cuales se enumeran en la Tabla(7.7.9).Comomuestra esta tabla, al
estimar el modelo en la forma de desviación la corrección para la media de
Ny2 desaparece de la STC y de la SECo (¿Por qué?) Esto produce un cam-
bio en la fórmula del R'l. Por otra parte, la mayoría de las fórmulas desarro-
lladas en las unidades originales de medición continúan siendo válidas cuando
se estima el modelo en forma de desviaciones.

EJERCICIOS
7.1 Para el ejemplo ilustrativo analizado en la sección 7.10, X'X y X'y utilizando los
datos en forma de desviaciones son los siguientes:
X'X = [ll03111.333 16984J
16984 280

y , _ [955099.333]
X Y- 14854.000

(a) Calcule P2 y P3'


(b) ¿Cómo estimaría usted PI?
(c) Estime la varianza de P2 y P3 Y sus covarianzas.
(d) Obtenga R2 y ji2.
(e) Comparando los resultados con los de la Sección 7.10, ¿cuáles son las ventaja
de la estimación en forma de desviaciones?
7.2 Evaluación de la igualdad entre dos coeficientes de regresión. Suponiendo que
tiene el siguiente modelo de regresión:
Yj = Pt + P2 X 21 + P3 X 31 +"1
Y se desea evaluar la hipótesis de que P2 =P3 . Suponiendo que los Ut tienen una
tnbucíón normal, se puede demostrar que
t = P2 - P3
Jvar <P2) + var <P3) - 2 COy (P2' P3)
tiene una distnbuciÓn t con N -; 3 g de 1 . (En general, para el modelo de kvari
los g de 1 son N - k). Por tanto, se puede utilizar esta prueba t para evaluar la
tesis nula P2 = P3' Aplique la anterior prueba t para evaluar la hipótesis de e
valores verdaderos de P2 y P3 en la regresión (7.1 0.14) son idénticos.

9 En estos días de poderosos computadores no hay tanta necesidad de estimar el modelo en


desviaciones. Esto, sin embatgo, SÚIlpUfic:a las fórmulas y por tanto los cálculos cuando se ti
una calculadora de escritorio y con cifras grandes.
ENFOQUE MATRICIAL PARA EL MODELO DE REGRESION LINEAL' 199

Sugerencia: Utilice la matriz de var-cov de Pdada en (7.1 0.9).


7.3 Expresión de co"elaciones de alto orden en térlninos de correlaciones de órdenes
más bajos. Los coeficientes de correlación de orden p pueden expresarse en térmi-
nos de los coeficientes de correlación de orden p - 1 utilizando la siguiente fórmula:

r _ r 12.345 ... (rl) - [r lp. 345 ... !e-lrap. 345 ... !e-1J
12.345 ... , - JI. 2
[ -rlp.34L.(p-1I]
2J
[ l - r l P.345,..(P-1J

por tanto,

Utilizando la siguiente matriz de correlación:


y Xl X3 X4 X,
y 0.44 -0.34 -0.31 -0.14
X2 0.25 -0.19 -0.35
R=X 3 1 0.44 0.33
X4 0.85
X5 1
Halle
(a) r 12.345 (b) r 12.34 (e) r 12.3
(d). r13.245 (e) r 13.24 (f) r l 3.l

7.4 Expresión de coeficientes de regtesión de orden más alto en términos de coeficien-


tes de regresión de orden más bajo. Un coeficiente de regresión de orden p puede
expresarse en términos de los coeficientes de regresión de orden p - 1 usando la
siguiente fórmula de reducción

Ii _ 1112.345 ... (p-l) - [111P. 345 ... (P- 1I I1,2.345 ... (,,-11]
11 12.345 ... P - 1 _ Ii Ii
112p.345 ... (,-1)11,2.345 ... (p-1)

Ii _ 1112 - 11131132
Por tanto, 1112.3 - 1 D D
-1123P32

en donde (J12.3 es el coeficiente de la pendiente en la regresión de YenX 2 , mante-


niendo constante X 3' En forma similar, P12.34 es el coeficiente de la pendiente en la
regresión de Y en X 2, manteniendo X 3 YX 4 constantes.
Utilizando la fórmula anterior, halle las expresiones de los siguientes coeficien-
tes de regresión en términos de los coeficientes de regresión de orden inferior: 1112.3456'
1112.345' y RI2.34'

Establezca la siguiente identidad:

6 Ii Ii
1112.31123.11131.2 -
- r 12.3 r 23.1 r 31.2

Para la matriz de correlación R dada en (7.l0.20), halle todos los coeficientes de


correlación parcial de primer orden.
200 MODELOS UNIECUACIONALES DE REGRESJON

7.7 Estudiando las tasas de criminalidad en ciertas grandes ciudades de los Estados Uni·
dos. Ogburn obtuvo los siguientes datos: •
y Xl X3 X. Xs
r = 19.9 SI = 7.9 Y 1 0.44 -0.34 -0.31 -0.14
Xl = 49.2 S2 = 1.3 Xl 1 0.25 -0.19 -0.35
1'3 == 10.2 8 3 "", 4.6 R=X 3 1 0.44 0.33
X.';" 481.4 S. = 74.4 X. 1 0.85
X, =41.6 Ss = 10.8 X, 1

donde
y = tasa de criminalidad. número de delitos por cada mil habitantes
X2 = porcentaje de hombres
X3 = porcentaje de hon:tbres extranjeros
X. = número de nifios menores de 5 años por cada mil mujeres casadas con edades
entre 15 y 44 años
X, = religión; número de feligreses de 13 afios o más por cada 100 habitantes de
13 años o más;Sl a Ss son las desviaciones estándar muestrales de las variables
y hasta Xs y R es la matriz de correlación. .
(a) Tomando Y como variable dependiente, obtenga la regresión de Y ert las cuatro
variables X e interprete la regresión estimada.
(b) Obtenga 'U.3. '1 •. 35 Y'15.3.·
(e) Obtenga el R' y verifique la hipótesis de que todos los coeficientes parciales
(pendientes) son simultáneamente iguales a cero.
7.8 La siguiente tabla presenta infonnación relacionada con la producción y el costo
total de producción de un bien en el corto plazo.

Producción Costo toíal, $

1 193
2 226
3 24() ,
4 244
5 257
6 260
7 274
8 297
9 3.50
10 420

Para verificar si la anterior infonnación comprueba que las curvas de costo rr


ginal y costo medio tiene la fonna de U típicas en el corto plazo, podemos usa
siguiente modelo:

• W. F. Ogbutn, "Factot5 in the Variation of Crime among Cities". Joumal 01 American Stat
Association. vol. 30, p. 12, 1935.
ENFOQUE MATRICIAL PARA EL MODELO DE REGRESION LINEAL> 201

donde Y = costo total y X = producción. Las variables explicativas adicionales


Xfy Xfse obtienen a partir de X
(a) Exprese la información en forma de desviación y obtenga (X'X)•• (X'y), (X'X)-t.
(b) Estime P2. P,. Y P.. '
(e) Estime la matriz de var-cov para ,. ,
(ti) Estime PI.Interprete PI en el contexto del problema.
(e) Obtenga e1R 2 yellP.
(j) ¿Cuáles son a priori los signos de Pl' P3' Y 'P.? ¿Por qué?
(g) A partir de la función de costo total anteriormente dada, obtenga expresiones
para las funciones de costos medio y marginal. .
(h) Ajuste las funciones de costos medio y marginal a las cifras, comentando el
ajuste.
'(1) Si P3 = P. = O, ¿cuál es la naturaleza de la fUnción de costo marginal? ¿Cómo
verificaría la hipótesis de que P3 = P. = 01
(j) ¿Cómo obtendría las funciones de costo total variable y costo variable medio a
partir de las cifras dadas?
7.9 Para estudiar la participación de la fuerza de trabajo de familias pobres urbanas
(familias con ingresos inferiores a $3943d61ares en 1969), se obtuvieron a partir
,del censo de población de 1970 las cifras que aparecen a continuación.
(a) Utilizando el modelo de regresi6n lí = PI + P2XlI + P3X31 + P.X., + "" ob-
tenga una estimaci6n de los coeficientes de regresión e interprete los resultados.
(b) ¿Cuáles son lo signos 16gicos apriorl para los coeficientes de regresi6n? ¿Por
qué? '

Participación de la fuerza de trabajo, familias pobres urbanas:


áreas del censo, ciudad de Nueva York, 1970
% en la fue~ Ingreso familiar Tamaño medio Tasa de desempleo,
Area No. de trabajo, y. promedio, XJ de la'familia,X3 X4t
137 64.3 1998 2.95 4.4
139 45.4 1114 3.40 3.4
141 26.6 1942 3.72 1.1
142 87.5 1998 4.43 3.1
143 71.3 2026 3.82 7.7
145 824 1853 3.90 5.0
147 26.3 1666 3.32 6.2
149 61.6 1434 3.80 5.4
151 529 1513 3.49 12.2
153 64.7 2008 3.8S 4.8
l55 64.9 1704 4.69 2.9
IS7 70.5 IS25 3.89 4.8
1S9 87.2 1842 3.53 3.9
161 81.2 1735 4.96 7.2
163 67.9 1639 3.68 3.6
• y _ cabezas de familia con menos de 6S años
t X. - porcentaje de la fuerza de trabajo civil desempleada
Fllente: Cenaua Traets: New York, Bureau of the Censua, U.S. Department
of Commeree, 1970.
202 MODELOS UNIECUACIONALES DE REGRESION

(e) 'Cómo se verifica la hipótesis de que la tasa global de desempleo no tiene


;fecto alguno sobre la participación de la fuerza de trabajo de familias urbanas
pobres?
(d) ¿Deberían excluirse del modelo algunas variables? ¿Por qué?
(e) ¿Qué otras variables debería usted tener en cuenta para que se incluyeran en el
modelo?
7.1 O En una aplicación de la función de producción Cobb-Douglas se obtuvieron 10$ si-

-
guientes resultados:
In Y¡-- 2.3542 + 0.95761n X 21 + 0.82421n X 31
(0.3022) (0.3571)
R2 =0.8432 g de 1= 12
donde Y = producción, X 2 =mano de obra y X 3 =capital. Las cifras entre parénte-
sis corresponden a los errores estándar estimados.
(a) Los coeficientes de los insumos capital y trabajo en la anterior ecuación repre-
sentan las elasticidades de la producción con respecto al capital y al trabajo.
Verifique la hipótesis de que dichas elasticidades son individualmente iguales
al.
(b) Verifique la. hipótesis de que las elasticidades del trabajo y del capital son igua-
les, suponiendo que (i) la covarianza de los coeficientes estimados de capital y
trabajo es igual a cero y que (H) dicha covarianza es igual a -0.0972.
(e) ¿Cómo haría usted para verificar la significancia global de la ecuación de regre-
sión estimada? •
7.11 Exprese la fúnción de verosimilitud para el modelo de regresión de k variables utili-
zando notación matricial, y demuestre que j, el vector de estimadores de máxima
verósimilitud, es idéntico a S, el vector de estimadores de MCO para el modelo de
regresión con k variables.
7.12 Regresión utilizando variables estandarizadas. Considere las siguientes funciones de
regresión muestral (FRM):
y¡ = Pl + P2 X U + P3 X 3¡ + e¡ (1)

yr = b 1 + bzX!¡ + b3 X;¡ + er (2)

y¡ - y
donde y!"=--
, Sy

y donde las s denotan las desviaciones estándar muestrales. Como vimos en el e


tulo 6, Ejercicio 6.3, las variables con asterisco se" conocen como variables estan
zadas. Estas variables tienen medias iguales a cero y desviaciones estándar uní!
(= 1). Expresando todas las variables en forma de desviación, demuestre que p
modelo (2):
ENFOQUE MATRICIAL PARA EL MODELO DE REGRESION LINEAL' 203

(fl) X'X = [1
'23
r 23JN
1

(b) X'y = [rI2JN


ru

(e) b 1 =O
Yestablezca la relación entre las b y las p.
(Obsérvese que en las anteriores relaciones, N denota el tamafio de la muestra,
'12. '13 Y '23 denotan las correlaciones entre Y y X 2 , entre Yy X 3 y Y2 Y X 3
respectivamente). '
7.13 Verifique las ecuaciones (7.10.18) y (7.10.19).
*7.14 Mínimos cuadrados ,estringidos. Suponiendo que
y=XIS+u (1)
lo cual deseamos estimar sujetos a un conjunto de restricciones de igualdad o limita-
ciones:
RIS = r (2)
donde R = es una matriz conocida de orden qxk I(q S k) Yr es un vector de q ele-
mentos. Para efectos de ilustración, supongamos que nuestro modelo es:
(3)

y suponiendo que deseamos calcular este modelo sujeto a las siguientes restriccio-
nes:
fJl - fJ3 =O (4)
fJ. + fJ, = 1

Podemos utilizar ciertas técnicas para incorporar estas restricciones (por ejemplo,
P2 = fJ3 y P. = 1 - fJ, , eliminando así Pl y fJ. del modelo) y evaluando la validez de
estas restricciones utilizando la prueba F. Sin embargo, existe una manera más sen-
cilla de estimar (3) incorporandt> las restricciones (4) directamente en el procedi-
miento de estimación y expresando primero las restricciones en la forma de la ecua-
ción (2), que en el caso presente se convierte en:

~J r=[~J
R=[O 1 -1 O
(5)
O O O 1

pcional.
204 MODELOS UNIECUACIONALES DE REGRESION

Si p. denota los mínimos cuadrados restringidos, o el estimador de los mínimos cua-


drados restringidos, se puede demostrar que dicho vector se puede estimar utilizan-
do la siguiente fórmula: *
(6)

donde _ es el estimador usual (sin restricciones) calculado a partir de la fórmula


tradicional de MCO (X'Xr lX'y.
(a) ¿Cuál es el vector P en (3)?
(b) Dado este 'vector P, verifique que la matriz R y el vector r dados en (5) incor-
poran de hecho las restricciones en (4).
(e) Escriba los valores de R y r para los siguientes casos:
(i) P2 = P3 = P. = 2
(ii) Pl = P3 Y P. = P5
(iii) P2 - 3P3 = SP.
(iv) P2 + 3P3 = O
(d) ¿Cuándo será p. = p?

APENDICE7

7A.l DERIVACION DE k ECUACIONES NORMALES


O SIMULTANEAS
Diferenciando
¿ ef = ¿ (Y¡ - PI - P2X2' -'" - tJt X",)2
parcialmente son respecto a PI' P2' ... , p" obtenernos

~
aPI = 2 ¿ (Y¡ - PI - P2 X2i - ' " - ¡I"X"iX-l)

a¿ef
aP2 = 2 ¿ (Y¡ - Pl - P2 X U -'" - ¡I"X,,¡X -Xu)

Igualando a cero las anteriores derivadas parciales y reordenando términos,


obtenernos las k ecuaciones normales dadas en (7.3.8).

• Y;a,e J. Johnston, op. cit., p.20S.


ENFOQUE MATRICIAL PARA EL MODELO DE REGRESION LINEAL" 205

7A.2 DERIVACION MATRICIAL DE LAS ECUACIONES


NORMALES
Partiendo de (7.3.7), obtenemos
e'e = y'y - 2~'X'y + ~'X'X~
utilizando las reglas de la diferenciación matricial, obtenemos

o~~e) = _ 2X'y + 2X'X~


Igualando la anterior ecuación a cero tenemos que
(X'X)~ = X'y
donde ~ = (X'X)-lX'y , siempre que la inversa exista.

7A.3 MATRIZ DE VARIANZA-COVARIANZA DE 11

Partiendo de (7 .3.11), obtenemos

~ = (X'X)-lX'y
Sustituyendo y = XIJ + u en la anterior expresión tenemos que
~ = (X'X) - 1 X'(XIJ + u)
= (X'X) - 1 X'XIJ + (X'X) - 1X'u
= IJ + (X'X)-lX'U (1)

Por tanto, ~ -IJ = (X'X)-lX'U (2)


Por defmición
var-cov (~) = E[(Il- 1J)(1l- IJ)'J
= E{[(X'X)-lX'U][(X'X)-lX'U]')
= E[(X'X) - 1 X'uu'X(X'X) - 1] (3)

:londe en el último paso se utiliza el hecho de que (AD)' = D'A'.


Observando que las X no son estocástiCas, al calcular el valor esperado
I,e (3) obtenemos
var-cov (~) = (X'X)-lX'E(uu')X(X'X)-r
= (X'X) -1 X' 0'2IX(X'X) - 1

= 0'2(X'X) - 1
cual es el resultado obtenido en (7 .3.13). Obsérvese que para llegar al ante-
,r resultado se hizo uso del supuesto E(uu') = 0'21.
206 MODELOS UNIECUACIONAlES DE REGRESION

7AA PROPIEDAD MELI DE LOS ESTIMADORES DE Meo


Partiendo de (7.3.11), tenemos que

p= (X'X)-lX'y (1)

PuesIO que (X'X)-l X. es una matriz de números fijos, Pes una función li-
neal de Y. Por tanto, es por definición un estimador lineal.
Recordemos que la FRP es:
y = Xp + u (2)
Sustituyendo (2) en (1), obtenemos
p= (X'X) - 1 X'(XP + u), (3)
(4)
puesto que (X'X)-lX'X = 1.
Tomando la expectativa de (4), tenemos
E(P) = E(P) + (X'X}-lX'E(u)
=p ~5)

puesto que E(P) = P (¿por qué?) y E(u) = O (según supuesto inicialmente


formulado), lo cual demuestra que P es un estimador insesgado de p.
Si P* es cualquier otro estimador lineal de P, el cual se puede escribir
de la sigUiente forma
p* = [(X 'X) - 1 X' + C]y (6)
donde e es una matriz de constantes.
Sustituyendo (2) en (6) para y, obtenemos
P* = [(X'X) - 1 X' + C](XP + u)
= P + CXp + (X'X)-lX'U + Cu (7)
Entonces, para que P* sea un estimador insesgado de p debe darse que
CX = O (¿por qué?) (8)
Utilizando (8), (7) se puede expresar como
P* - P= (X'X)-lX'U + Cn (9)
Por definición, la var-cov (P*) es:
E(P* -P)(P* -P), = E[(X'X)-lX'U + Cu][(X'X)-lX'U + Cu]' (10)
Utilizando las propiedades de la inversión y trasposición de matrices y des-
pués de simplificación algebraica, obtenemos:
Yar-Cov (P*) = (T2(X'X) - 1 + (T2Ce
= Yar-Cov (P) + (T2Ce (1
ENFOQUE MATRICIAL PARA EL MODELO DE REGRESION LINEAL" 207
lo cual demuestra que la matriz de varianza-covarianza del estimador lineal
insesgado alterno ,.* es igual a la m'atriz de va~anza-covarianza del estimador
, de MeO, adicionada en (/" multiplicado por ce', la cual es una matriz po-
sitiva semidefinida*. Por tanto, las vatianzas de un elemento dado de p. deben
necesariamente ser iguales o mayores al elemento correspondiente de ~. lo
cual demuestra que , es MELI. Desde luego que si e es una matriz nula, es
decir, e = O. entonces JI. = " otra manera de decir que si hemos encontrado
un estimador MELl, éste debe corresponder al estimador, de mínimos cua-
drados.
PARTE II
VIOLACION DE LO'S
SUPUESTOS DEL
MODELO CLASICO

n la Parte 1 del libro consideramos extensamente el modelo clásico de re-


·esión lineal e ilustramos la manera como se puede utilizar para estudiar los
'oblemas claves de la inferencia estadística: la estimación y las pruebas de
Jótesis, así como el importante tema de la predicción. No obstante, recor-
nos que este modelo está basado en varios supuestos simplificadores que
ncibnaremos nuevamente a continuación.

Supuesto 1. El valor promedio condicional del término de perturbación


acional Uf, condicionado en los valores dados de la variable explicativa
n, es igual a O.
Supuesto 2. La varianza condicional de U¡ es constante u homocedás-

upuesto 3. No existe auto correlación alguna entre las perturbaciones.


lpuesto 4. Las variables explicativas.son no estocásticas (es decir, fijas
uestreos repetidos) o, si son estocásticas están distribuidas indepen-
ente de las perturbaciones Uf.
209
210 VIOlACION DE LOS SUPUESTOS DEL MODELO CLASICO

Supuesto 5. No existe multicolinealidad entre las variables explicativas


(las X).
Supuesto 6. Las u poseen una distribución normal cuyo promedio y
varianza están dados por los supuestos 1 y 2.
Supuesto 7. El modelo de regresión está correctamente especificado, es
decir, no existe ningún sesgo de especificación.
Con estos supuestos en mente, vimos que los estimadores de mínimos
cuadrados ordinarios (MCO) de los coeficientes de regresión son los mejores
estimadores lineales insesgados (MELI)l y que a través del supuesto de nor-
malidad están distribuidos normalmente. Como resultado de ello fue posible
obtener para estos estimadores, intervalos de confianza, pudiendo además
evaluar hipótesis sobre los verdaderos coeficientes de regresión poblacional.
En la Parte 11 del libro anali~amos más de cerca estos supuestos e inten-
tamos averiguar qué ocurre con las propiedades de los estimadores de MCO si
uno o más de los supuestos no se cumplen, buscando, entonces, medidas
remediales para dichas violaciones.
No analizaremos en detalle los supuestos 1, 4 Y 6, por las siguientes
razones:
Supuesto 1: Cero perturbación esperada. Recordemos el modelo de regre-
sión lineal con k variables:
Y¡ = PI + P2 X 2I+ P3 X 31 + ... + PtXkl + UI (l}

Supongamos ahora que


(2)

donde w es una constante; obsérvese que en el modelo estándar w = 0, pu-


diéndose, sin embargo, asignarle una constante cualquiera.
Tomando la expectativa condicional de (1), obtenemos:
E(Y¡IX 2;, X 31 • ... , Xli) = PI + P,X 21 + P3X31 + ... + P"X"I + W
= (PI + w) + P2 X 21 + P3 X 3; + ... + p"Xtl
= (X + P2X2I + P3X31 + ... + P"X"I
donde (X = (PI + w) y donde al tomar las esperanzas se debe mencionar qUf
X se manejan como constantes. (¿Por qué?)
Por tanto, si no se cumple el supuesto 1 se puede apreciar que no p
mos estimar el intersecto original PI; lo que obtenemos es IX, que con
PI' y E(uJ = w. En resumen, obtenemos una estimación sesgada de PI
Pero, como mencionamos en varias ocasiones, en una gran cantid
VIOLACION DE LOS SUPUESTOS bEL MODELO CLASICO 211

situaciones prácticas el término de intersección PI no tiene mucha importan-


cia; las cantidades más significativas son los coeficientes de las pendientes, los
cuales no se ven afectados, aun cuando se viole el Supuesto 1. 2 Además, en
muchas aplicaciones el término de intersección no tiene interpretación física
alguna.
Supuesto 4: El caso de regresores estocásticos. Recuérdese que nuestro aná·
lisis de regresión está basado en el supuesto de que los regresores son no esto-
cásticos y que toman valores fijos en muestreos repetidos. Existe una buena
razón para esta estrategia. A diferencia de los científicos en las ciencias físi-
cas, como se mencionó en el Capítulo 1, los 'economistas generalmente no •
tienen control sobre los datos que utilizan. Es muy frecuente que ellos de-
pendan de información secundaria, es decir, información recolectada por
alguien más, bien sea un organismo del gobierno u organizaciones privadas.
Por tanto, una estrategia práctica a seguir consiste en suponer que para el
problema en cuestión los valores de las variables explicativas sean dados, aun-
cuando las variables mismas puedan ser intrínsecamente estocásticas o alea-
torias. En consecuencia, los resultados del análisis de-t:egresión son condicio-
nales con respecto a estos valores dados.
Sin embargo, supóngase que no podemos determinar que las X sean no,
estocásticas o fijas. Este es el caso de regresores estocásticos o aleatorios. En
este caso, la situación es un poco más complicada. Los Uf en sí mismos, se-
gún los supuestos antes enunciados, son estocástidos. Si la$ X también lo son,
entonces debemos especificar cómo son las distribuciones probabilísticas
tanto de las X como de los Ui' Si, como parte del enunciado del Supuesto 4,
se desea asumir que 'las X aunque sean aleatorias están distribuidas indepen-
dientemente de los Ui, entonces para cualquier fin práctico podemos conti-
nuar operando como si las X fueran no estocásticas. Como menciona Kmenta:
"De esta manera, al violar el supuesto de que X es no estocástica y al remplazarlo
por el supuesto de que es estocástica e independiente de [u] no se modifican las
propiedades deseables y la factibilidad de la estimación de mz'nimos cuadrados. 3
En resumen, mantendremos el Supuesto 4 hasta cuando nos enfrente-
lOS a los modelos de ecuaciones simultáneas estudiados en los Capítulos
i-17.
'puesto 6: ,Normalidad de u. Este supuesto 'no es esencial si nuestro objeti-
es únicamente la estimación. Como se mencionó en el Capítulo 3, los esti-
dores de MCO son MELI, independientemente de que los Ui posean una
ribuc16n normal o no. No obstante ello; con el supuesto de normalidad

vcry important to note that thís statement is true only if E(uJ = w Cor each i. However, ir
, 1fl ' that is, a díft'ereJít constant ror each 1, the partial slope coefficients may be biased as well as
stent In tbis case violation of Assumption 1 will be critical. For proof and further details, lee
:hmidt, Econonretrlcs, Man:el Dekker, Ine., New York, 1976, pp. 36-39.
:menta, Elements of Econometrics, The Macmi1lan Company,New York, 1971, p. 301.
lÍa in the ori¡inal.)
212 VIOLACION DE LOS SUPUESTOS DEL MODELO CLASICO

podemos establecer que los estimadores de MCO para los coeficientes de


regresión tienen una distribución normal, que (N - k)q2/(12 tiene una distri-
bución '1. 2 y que se pueden utilizar las pruebas t y F para evaluar las diferen-
tes hipótesis estadísticas, independientemente del tamaño de la muestra.
Sin embargo, ¿qué ocurre si los Uf no tienen una distribución normal?
Nos basamos entonces en la siguiente extensión del teorema del límite cen-
tral; recordemos que fue este teorema el que invocamos para justificar el
supuesto de normalidad en primer lugar:
Si las perturbaciones [ud están distribuidas en fonna independiente e idéntica, con
un promedio de cero y una varianza (12 (constante) y si las variables explicativas
están fijas en muestreos repetidos, los estimadores de los coeficientes de Meo
poseen una distribución asintóticamente nonnal, cuyos promedios son iguales a los
p's corresponnientes.4
Por tanto, los procedimientos de evaluación tradicionales, las pruebas
t y F, continúan siendo válidas asinfóticamente, es decir para muestras gran-
des. No así para muestras finitas o pequeñas. '
El hecho de que las perturbaciones no posean una distribución normal y
que, por tanto, los estimadores de MCO continúen teniendo una distribución
normal asintóticamente (bajo el supuesto de varianza homocedástica y valo-
res fijos de las X) no es, sin embargo, tan alentador para el economista practi-
co, quien frecuentemente no se puede dar el lujo de contar con una muestra
grande de información. Por tanto, el supuesto de normalidad se toma muy
importante para fines de pruebas de hipótesis y proyección de cifras. Por tan-
to, teniendo presente la necesidad de realizar estimaciones e hipótesis, y
dado que las muestras pequeñas son la regla general y no la excepción en la
mayoría de los análisis económicos, continuaremos utilizando el supuesto de
normalidad. s
Nos quedan entonces los Supuestos 2, 3, S y 7, que analizaremos en los
siguientes cuatro capítulos. En el Capítulo 8 estudiamos el tema de la multi-
colinealidad. tema de no mucho interés teórico pero de una importancia
práctica muy significativa. En el Capítulo 9 consideraremos el tema de 1:
heterocedasticidad. El Capítulo 10 estará dedicado al análisis de autoCO"é
lación. Finalmente, en el Capítulo 11 estudiaremos el tema del sesgo pe
especificación.
Por razones pedagógicas, en cada uno de estos capítulos seguimos
misma metodología, la cual consiste en averiguar la naturaleza del problen
examinar sus consecuencias, sugerir métodos para detectarlo y considera'
analizar' las medidas remediales conducentes a hacer que los estimade
posean las adecuadas propiedades estadísticas analizadas en la Parte 1.

" Henó Thcíl,lntroduction to Econometrics, Prentice-Halllne., Englewood C1iffs, NJ., 1978, p. 24<J
must be noted the assumptions'oCfixed X's and constant (11 are crucial Cor this result.
5 In passing note that the elfccts oC departure !rom normality and related topies are olten díscu
under the topie oC robust estí"Wion in the literature, a topie beyond the scope óf tbis book.
CAPITULO 8
MULTICOLINEALIDAD

Uno de los supuestos del modelo clásico de regresión lineal es que no existe
multicolinealidad entre las variables explicativas incluidas en el modelo. En
este capítulo entraremos a estudiar mucho más detalladamente este supuesto,
buscando dar, más específicamente, respuesta a las siguientes preguntas:
t. ¿Cuál es la naturaleza de la multicolinealidad?
¿Es la multicolinealidad realmente un problema?
¿Cuáles son sus consecuencias prácticas?
¿Cómo se detecta?
¿Qué medidas remediales se pueden tomar para aliviar el problema de la
multicolinealidad?

NATURALEZA DE LA MULTICOLINEALIDAD
énnino multicoltnealidad se atribuye a Ragnar Frisch. 1 Originalmente
Icaba la existehcia de una relación lineal "perfecta o exacta" entre algu-

. FriIch, Stlltlstical Con/blence Analym by Mean. of Complete Regresaion s,atema. lnatitute


mica, Oslo University. publ. No. S. 1934.

213
214 VIOLACION DE LOS SUPUESTOS DEL MODELO CLASICO

nas o la totalidad de las variables explicativas de un modelo de regresión. 2


Para la regresión en k variables, con las variables explicativas, Xl, X 2, . . . ,
X k (donde Xl = 1 para todas las observaciones de tal manera que se permita
la inclusión de la intersección), se dice que existe una relación lineal exacta
si se satisfacen las siguientes condiciones:
(8.1.1)
donde Al' A2' ... , Al son constantes tal que no todas sean simultáneamente
cero.'
No obstante, en la actualidad el término multicolinealidad se utiliza en
un sentido más amplio para incluir el caso de multicolinealidad perfecta,
como se ilustra en (8.1.1), corno también aquella situación en donde las
variables X están intercorrelacionadas, pero no en forma perfecta, de la
siguiente manera: 4
(8.1.2)

donde Vi es un término estocástico de error.


Para apreciar la diferencia existe entre multicolinealidad perfectll y
multicolinealidadmenos que perfecta, supongamos, por ejemplo, que A2 :f: O.
En consecuencia, (8.1.1) se puede expresar como
Al A3 Al
X 2i = - - X 11 - - X 3/ - ••• - - X 1d (8.1.3)
A2 A2 A2
lo cual muestra que X 2 está exactamente relacionada en forma lineal con
otras variables o que se puede derivar a partir de la combinación lineal de las
restantes variables X En esta situación, el coeficiente de correlación· entre la
variable X 2 y la combinación lineal del lado derecho de (8.1.3) debe ser igual
a uno.
En forma similar, el A2 :f: O, la ecuación (8.1.2) se puede expresar como
Al A3 Al 1
X2j= -¡-X 1I - , X 3 / - " ' - , X k¡-,v¡ (8.1.4:
2 11.2 11.2 11.2

2 Hablando estrictamente, el término multicolinealidad se refiere a la existencia de más de una relad


lineal exacta, mientras que el término colinealidad se refiere a'la éxistencia de una sola relación Iin
Sin embargo, esta distinción raramente se mantiene en la práctica, hablándose entonces de multic
nealidad para ambos casos.
3 Las posibilidades de obtener una muestra de valores donde los regresores estén relacionados de
manera son realmente muy pequeñas en la práctica, excepto cuando se hace PO\; diseño cuando
ejemplo, el número de, observaciones es menor que el número de regresores o si uno cae en la "tr
de la variable dicotómica", como se mencionará posteriormente en el Capítulo 12. (vease Ejetcici(
4 Si existen solamente dos variables explicativas, la interco"eIación se puede medir por el coef
de correlación simple o de orden cero. Pero si existen más de dos variables X, la intercorrela
puede medir a través de los coeficientes de correlación parcial o por el coeficiente de correlació¡
pIes R de una variable X con las demás variables X consideradas conjuntamente.
MULTICOllNEALIDAD 215

lo cual muestra que X 2 no es exactamente una combinación lineal de las res-


tantes X's debido a que también está deterniinada por el término del error
estocástico v,.
Como ejemplo numérico, consideremos las siguientes cifras hipotéticas:

Xz X3 X·3
10 50 52
15 75 75
18 90 97
24 120 129
30 150 152

Es aparente que X 31 = 5X zI • Por tanto,existe una!Colinealidad perfecta entre


X 2 y X 3 puesto que el coeficiente de correlación 723 es igual a 1. La variable
Xr de otro lado, fue creada partiendo de X 3 , por medio de'la adición de los
siguientes números tomados de la tabla de números aleatorios: 2, O, 7,9,2.
En este momento deja de' existir una colinealidad pefecta entre X 2 y Xr. No
obstante, las dos variables continúan estando altamente correlacionadas
porque los cálculos muestran que el coeficiente de correlación entre ellas es
de 0.9959.
El enfoque algebraico antes presentado al problema de la multicolinea-
lidad se puede expresar adecuadamente mediante un diagrama de Ballentine.
En esta figura, los círculos Y, X 2 Y X 3 representan respectivamente las varia-
ciones en Y (la, variable dependiente) y X 2 y X 3 (las variables explicativas).
El grado de collnealidad se puede medir por la magnitud de la sobreposición
o intersección (área sombreada) de los círculos X 2 Y X 3' En la Figura 8.1
(a), no existe sobreposición alguna entre los círculos X 2 y X 3 , por tanto no
~xiste colinealidad. En las Figut:as 8.1(b) a 8.1(e) existen grados de colineali-
lad que van desde uno "muy bajo" (8.l)(b) hasta uno muy alto 8.1(e).
'uanto mayor sea la superposición entre X 2 y X 3 (esto es, cuanto mayor
~a el área sombreada), mayor será el grado de colinealidad. En el extremo, si
\ y X 3 estuviera superpuesto completamente (o si X 2 estuviera completa-
mte dentro de X 3 o viceversa), la colinealidad sería perfecta.
A propósito, obsérvese que la multicolinealidad, de acuerdo con nues-
definición, excluye únicamente las relaciones lineales entre las variables
Elimina las relaciones lÍo lineales, existentes entre ellas. Por ejemplo, con-
remos el siguiente modelo de regresión:
= Po + PI X ¡ + PzX~ + P3 X t + U¡
Y¡ (8.1.5)
l,e digamos que Y = costo total de producción y X = producción. Es
I que las variables XI (producción. de cuadrado) y XI (producción al
, están funcionalmente relacionadas con Xi> pero la relación no es lineal.
mto; hablando estrictamente, modelos similares a (8.1.5) no violan el
ltO de no multicolinealidad. Sin embargo, en aplicaciones concretas el
ente de correlación convencionalmente medido demostrará que Xi>
rr están estrechamente correlacionadas, lo cual, como demostraremos
216 VIOLACION DE LOS SUPUESTOS DEL MODELO CLASICO

(a) No existe cOlineaJida<\ (b) Baja colinealidad

(e) CoJinealidad moderada (d) Collnealidad alta (e) Muy alta collnealidad
FIGURAS.1
Gráfico de Ballentine de la multicolinealidad

posteriormente, dificultará la estimación de los parámetros de (8.1.~) con


mayor precisión (es decir, con errores estándar más pequeños).
¿Por qué supone el modelo clásico de regresión líneal que no e~iste
multicolinealidad entre las X? El razonamiento es el siguiente: si la multicolí·
nealidad es perfecta en el sentido de (8. L 1), los coeficientes de regresión df
las variables X son indeterminados y sus errores estándar son infinitos. Si 1
multicolinealidad es menos que perfecta, como en (8.1.2), los coeficientf
de regresión, aunque determinados o finitos, poseen errores estándar dem
siado grandes (en relación con los coeficientes mismos), lo cual implica ql
los coeficientes no se pueden estimar con gran precisión o exactitud. 1
pruebas de estos enunciados se presentan en las siguientes secciones.

8.2 ESTIMACION EN EL CASO


DE MULTICOLINEALIDAD PERFECTA
Se estableció previamente que en el caso de multicolinealídad perfect.
coeficientes de regresión son indeterminados y sus errores estándar infiJ
MULTICOLlNEALIDAD 217

~o anterior se puede demostrar fácilmente en ténninos del modelo de regre-


sión con tres variables. Utilizando la estimación del modelo en fonna de des-
viaciones de sus medias muestrales, el modelo de regresión con tres variables
se puede escribir como:
Yi= Pl Xli + P3 X3i+ el (8.2.1 )
se puede demostrar entonces que
P _ (L y/xl/)(L x~¡) - (L y¡x3i)(L Xl¡X31)
1 - (L X~I)(L x~¡) - (L Xli X3i)l

P _ (L y/x 3¡)(L xii) - (L y¡xlI)(L Xl/X3i)


)- (L xil)(L X~¡) - (L Xl¡X)I)l
Supóngase que X 31 = ),X 21. donde A. es una constante diferente de cero (por
ejemplo 2, 4, 1.8, etc.) Sustituyendo esto, obtenemos
8 _ (L Y¡Xl I)(A 2 L X~i) - (A L YIX ll)().. Lxii)
112 - (L xii)()..l Lxii) - )..l(k xil)2 .
O
= O (8.2.2)

que es una expresión indetenninada. El lector puede verificar que P3 es tam-


bién indetenninada.
¿Por qué se obtiene el resultado que se muestra en (8.2.2)? Recordemos
el significado de P2: Este muestra la tasa de cambio promedio en Y. a medida
que X 2 cambia en una unidad, manteniendo X 3 constante. Sin embargo, si
l"3 y X 2 son perfectamente colineales, no existe fonna alguna de mantener
. X 3 constante: a medida que X 2 cambia, también lo hace X 3 en un factor
~ual a A.. Lo q\le esto significa entonces es que no existe manera alguna de
\parar las influencias individuales de X 2 y X 3 de la muestra dada: para fines
ácticos, X 2 y X 3 no se pueden diferenciar. En econometría aplicada,éste
un problema muy serio puesto que la idea consiste en separar los efectos
'ciales de cada X sobre la variable dependiente.
Para ver esto en fonna diferente, sustituyamos X31 = AX 2i en (8.2.1) y
engamos:

YI = P2 X21 + P3(A.x2¡) + eí
= (P2 + )..P3)X21 + ei
. (8.2.3)

a= <P2 + )..P3)·
plicando la fónnula tradicional de Méo a· (8.2.3) obtenemos

a= (Pl + )..P3) = 1:21i


X21
(8.2.5)
218 VIOLACION DE LOS SUPUESTOS DEL MODELO CLASICO

Por tanto, aunque podemos estimar (X en forma única, no existe manera de


obtener una única estimación de/32 y P3; matemáticamente,
&= P2 + ;'P3 (8.2.6)
nos proporciona una única ecuación con dos incógnitas (obsérvese que;' está
dada), existie,ndo un número infinito de soluciones a (8.2.6) para valores
dados de & y l. Para dar una idea de lo anterior, si &= 0.8 Yl = 2 , tenemos:
(8.2.7)
o,
(8.2.8)

Ahora escojamos un valor arbitrario para P3 y tendremos la solución para P2.


Escojamos otro valor para P3 y obtendremos una solución diferente para P2.
Independientemente de lo que hagamos, no existe un valor único para P2.
La conclusión del análisis anterior es que, en el caso de multicolinealidad
perfecta, no se puede obtener una solución única para los coeficientes indivi-
duales de regresión. Sin embargo, obsérvese que se puede obtener una solu-
ción única para combinaciones lineales de dichos coeficientes. La combina-
ción lineal (P2 + lP3) se estima en forma única para (x, dado el valor de l.s
A propósito, obsérvese que en el caso de multicolinealidad perfecta,las
varianzas y los errores estándar para P2 y P3 individualmente son infinitos.
(véase Ejercicio 8.22).

8.3 ESTIMACION EN EL CASO DE "ALTA"


MULTICOLINEAUDAD PERO "IMPERFECTA"
La situación en el caso de la multicolinealidad perfecta e~ un extremo (
tipo patológico. Generalmente no existe una relación lineal exacta entre J
variables X, especialmente con información relacionada con series de tiem
en Economía. Por tanto, regresando al modelo con tres variables dado
(8.2.1), en lugar de multicolinealidad exacta, podemos tener
(8.'

donde A. =f ()1 Y Vi es un término de error estocástico, tal que L Xz¡ Vi = O. (


qué?)
En este caso es factible la estimación de los coeficientes de regr
P2Y f33, por ejemplo, sustituyendo (8.3.1) en la solución paraf3t, en e
del modelo de tres variables, obtenemos:
¡J - L' (Yi X2i)(l2 L X~i + LV;) - (l L Yi Xli + L Yi v¡)(A. L X~i)
2 - L X~¡{l2 L X~í + LV;) - (l L X~í)2

5 En la literatura eco no métrica, una función tal como (fJ2 + ;'P3 ) se conoce como función I
MUlTICOLlNEALlDAD 219

donde se utiliza el hecho de que L X2iV¡ = O. Una expresión similar se puede


derivar para P3'
Ahora, a diferencia de (8.2.2), no existe razón alguna para creer e priori.
que (8.3.2) no se puede estimar. Desde luego que si Vi es suficientemente
pequefta, por ejemplo, muy cercana a cero, (8.3.1) indicará la existencia de
una colinealidad casi perfecta, retornando entonces al caso indeterminado
de (8.2.2).

8.4 MULTICOLINEALIDAD:
CONSECUENCIAS TEORICAS DE LA MULTICOLINEALIDAD
Recordemos que si se satisfacen los supuestos del modelo clásico, los estima-
dores de MCO son MEL! (o MEL si se adiciona el supuesto de normalidad).
Se puede entonces demostrar que, aun en el caso de multicolinealidad muy
alta, aquella situación de casi multicolinealidad, los estimadores de MCO con-
tinúan manteniendo su propiedad de ser estimadores MEL/. 6 Por tanto,
¿cuáles son entonces los inconvenientes de la multicolinealidad? Comenta
Christopher Achen: .
Los alumnos principiantes en el estudio de la metodología ocasionalmente se preo·
cupan por el hecho de que sus variables independientes estén correlacionadas, ellla·
mado problema de multicolinealidad. Sin embargo, la multicolinealidad no viola los
supuestos básicos de regresión. Se presentarán estimativos consistentes-e insesgados
y sus errores estándar se estimarán en forma correcta. El único efecto de la multí·
colinealidad tiene que ver con la dificultad de obtener las estimaciones de los coefi·
cientes conpequeftos errores estándar. Sin embargo, se tiene el mismo problema al
contar con un número reducido de observaciones, de la misma forma que cuando se
tIenen variables independientes con varianzas pequefias. (De hecho, a nivel teórico,
,multicolinealidad, un número reducido de observaciones y varianzas pequefias en las
variables independientes, son todos esencialmente el mismo problema). Por tanto,la
pregunta de " ¿qué debo hacer entonces acerca de la multicolinealida~" es similar
al interrogante de "¿qué debo hacer si no tengo muchas observaciones?" Respecto a
estos planteamientos no se puede dar una respuesta estadística.'
El punto en el que Achen quiere hacer énfasis es adecuado. No obstante,
. problema de la casi multicolinealidad o alta multicolinealidad se presenta
ecuentemente en análisis de tipo empírico y presenta problemas de estima-
;n suficientemente importantes para garantizar que le consideremos como
a violación al modelo clásico de regresión lineal".8
En primer lugar, es cierto que aun en el caso de casi multicolinealidad,
estimadores de MCO continuarán siendo insesgados. Sin embargo, el inses-

110 que la snwt1coUnealidad por sí mislna no vioJa o'tros supuestos, los estimadores de MeO, son

tophet. H. Achen, ·¡ntopreting tmdCTring ~egre,rio", Sage Publications, Beverly Hilla, Calif.,
!p; 82-83.
Kennedy,A Guide toEconometrlcs, TheMlfPreu, CaJnbridge, Mass., 1979, p. 128.
220 VIOLACION DE LOS SUPUESTOS DEL MODELO CLASICO

gamiento es una propiedad de muestras múltiples o de muestreo repetido.


Lo que esto implica es que al mantener fijos los valores de las variables X, si
se re.alizan muestreos repetidos y se calculan los -estimadores MCO para cada
una de estas muestras, el promedio de ws valores muestrales convergerá
hacia los verdaderos valores poblacionales de los..estimadores a medida que
aumenta el número de muestras. ~ero lo anterior no nos dice nada acerca de
las propiedades de los estimadores para una muestra dada.
En segundo lugar, también es cierto que la colinealidlKt n.Q destruye la
propiedad de la varianza mínima: en la clase de todos los estimatíote§ line.il.e,
insesgados, los estimadores de MCO tienen varianza mitlima, lo cual implica
que son eficientes. Lo anterior no significa, sin embargo, que la varianza de
un estimador MCO sea necesariamente pequeña (en relación con el valor del
estimador) para una muestra dada, como demostraremos brevemente.
Tercero, la mu/ticolinealidad es esencialmente un fenómeno muestral
(de regresión), en el sentido de que aunque las variables X no estén lineal-
mente relacionadas en la población, pueden relacionarse en la muestra espe-
cífica que se tenga a mano: Cuando postulamos la función de regresión pobla-
cional teórica (FRP) , se postula que todas las variables X incluidas en el
modelo tienen una influencia separada o independiente sobre la variable
dependiente Y. Pero puede ocurrir el caso de que en cualquier muestra dada
que se esté utilizando para evaluar la FRP, algunas o la totalidad de las varia~
bIes X tengan una colinealidad tan alta que no sea factible aislar su influencia
individual sobre Y. Lo anterior implica que la muestra contradice la teoría,
a pesar de que ésta última nos diga que todas las X son importantes. En con-
clusión, nuestra muestra puede no ser suficientemente "rica" para incluir
todas las variables X en el análisis.
Como ilustración, reconsideremos el ejemplo consumo-ingreso del Capí-
tulo 3. Los economistas teorizan que además del ingreso, la riqueza del con-
sumidor también es un determinante importante en los gastos de consumo.
Por tanto, podemos escribir:
Consumo j = Pi + P2 Ingresoj + P3 Riqueza¡ + Uj
Puede ocurrir entonces que cuando obtengamos información sobre los ingr
sos y la riqueza, las dos variables puedan estar altamente, si no perfectame
te, correlacionadas: las personas más ricas generalmente tienden a tener n
yores ingresos. Por tanto, aunque en teoría el ingreso y la riqueza sean
candidatos lógicos para explicar el comportamiento de los gastos de consur
en la práctica (es decir, en la muestra) puede ser difícil separar las influen
individuales de dichas variables sobre los gastos de consumo.
En forma ideal, para evaluar los efectos individuales de la riqueza)
ingresos sobre los gastos de consumo, lo que necesitamos es un número
ciente de observa¡::icmes muestrales de individuos ricos con bajo nivel d
greso e individuos con alto ingreso y baja riqueza. Aunque esto puec
posible en estudios de series de corte transversal (aumentando el tama
la muestra) es muy difícil lograr información agregada de series de ti
con la cual trabajar.
MULTICOllNEAlIOAO 221

Por todas estas razones, el hecho de que los estimadores de MCO sean
MELI a pesar de la multicolinealidad, es poco importante en la práctica.
Debemos ver qué ocurre o qué puede ocurrir en una muestra determinada,
tema que se analizará en la pr6xinla sección. :

8.5 CONSECUENCIAS PRACTICAS DE LA MULTICOLINEALIDAD


Los casos de casi multicolinealidad o de alta multicolinealidad pueden traer
consigo las siguientes consecuencias:

Varianzas y covarianzas amplias para los estimadores de MCO


Para apreciar 10 anterior, recordemos que para el modelo (8.2.1) las varianzas
y las covarianzas de Pl y P3 están dadas por:
(Jl
var<Pl)=X: Xl2~1 - 2)
rl3

en donderz3es el coeficiente de correlación entre X 2 y X 3 •


Es aparente que a medida que '23 tiende al, es decir, a medida que
mmenta la colinealidad, las varianzas de los dos estimadores aumentan y, en
\1 límite, cuando '23 = 1,ellas son infinitas. Tambien es claro que a medida
ue '23 aumenta hacia 1, la covarianza de los dos estimadores también
lmenta en valores absolutos. (Nota: cov cJl' P3) = cov cJ3' P2'» .
Para dar idea acerca de que tan rápido aumentan las varianzas y cova-
\nzas a medida que aumenta '23, consideremos la Tabla 8.1 donde aparecen
as varianzas y covarianzas para valores s.eleccionados de '23' Como demues-
esta tabla, aumentos en '23 tienen un ef~cto dramático .sobre las varianzas
ovarianzas estimadas para los estimadores de MeO. Cuando '23 = 0.50,
ar <Pl) es 1.33 veces la varianza de aquel caso en que '23 es O; pero cuando
llega a 0.95 la "arianza de (P2) es aproximadamente 10 veces mayor que
tdo no existe colinealidad. Adicionalmertte, cuando '23 aumenta de 0.95
195, la varianza estimáda es 100 veces mayor que cuando la ~olinealidad
ro. El mismo efe.,;.tc dramático se puede apreciar en la co~arianza estima-
'odos estos resultados se pueden expresar gráficamente a través de la
18.2.
~stos resultados que -acabamos de mencionar se pueden extender fácil-
al modelo con k variables (véanse Ejercicios 8.15 y 8.16).
222 VIOLACION DE LOS SUPUESTOS DEL MODELO CLASICO

TABLA 8.1
El efecto de aumentar'23 sobre la var(j2)Y eov (j2' 13)

VII' (Ja) : '23 ,. O


Valorderu VII' (Ja) COY (Ja./,)
VII' (la) :'23 - O

(1) (2)* (3) (4)


2
11
0.00 --=A O
¿xf,
0.50 1.33 x A 1.33 0.67 x B
0.70 1.96 x A 1.96 1.37xB
0.80 2.78 x A 2.78 2.22 x B
0.90 5.26 x A 5.26 4.73 x B
0.95 10.26 x A 10.26 9.74 x B
0.97 16.92 x A 16.92 16.41 x B
0.99 50.25 x A 50.25 49.75 x B
0.995 100.00 x A 100.00 99.50 x B
0.999 500.00 x A. SOO,OO 499.50 x B
ul
Nota: Á--
LX~.
_ul
B-
vtx~,LX~,
x .. Tiempos

• Para hallar el efecto de aumentar,u sobre var (13), obsérvese


que A - u fi X~, cuando'1)= O, pero los factores de magnificaci6n
l

de la varianza y la covarianza permanecen Iguales.

Var (f3iJ

el
A=-
1:4

5.26A

1.33A FIGURA 8.2


A ....- - - - - -
Comportamiento de var(J12)com
L - - -_ _ _ _-L_ _ _-L---''----L- rl funcion de r1J'
l
O 0.5 0.8 0.9 1.0
MULTICOLlNEALIDAD 223
Mú ampllios intervalos de cOJÜl8DZa
Debido a la presencia de errores estándar grandes, los intervalos de confianza
para los parámetros poblacionales relevantes tienden a ser más amplios, como
se puede apreciar en la Tabla 8.2. Como muestra la tabla, cuando '23 = 0.95,
el intervalo de confianza para fJ2 es mayor que cuando '23 = O en un factor de
JI0.26 o de aproximadamente 3.
Por tanto, en casos de alta multicolinealidad la información muestral
puede ser compatible con un conjunto diverso de hipótesis. Por consiguiente,
la posibilidad de aceptar una hipótesis falsa (es decir, de cometer el error de
tipo 11) aumenta.

Razones t "no significativas"


Recordemos que para evaluar la hipótesis nula de que, por ejemplo, fJ2 = O,
utilizamos la razón t:· P2/se <fl2) y comparamos el valor estimádo de t con el
valor crítico de t, utilizando la tabla t. Sin embargp, como hemos visto, en
casos de alta colinealidad los errores estándar estimados aumentan dramática-
mente disminuyendo con esto los valores t. Por tanto, en tales casos se tiende
a aceptar con mayor facilidad la hipótesis nula de que el verdadero valor po-
blacional relevanté es cero. 9

Un valor elevado para el R2 pero pocas razones t significativas


Consideremos el modelo de regresión lineal con k variables.

En casos de alta colinealidad es posible encontrar, como acabamos de mencio-


lar, que uno o más coeficientes parciales de las pendientes sean individual-
nente no significativos en términos estadísticos con base en la prueba t. No
bstante, el D..2 en tales situaciones puede ser tan elevado, digamos superior a
.9, que con base en la prueba F se puede convincentemente rechazar la
pótesis de que Pz = P3 = .. , {J" = O. De hecho, ésta es una de las sefiales de
ulticolinealidad: valores t no significativos pero un elevado R2 , así como
valor F bastante alto. Aunque demostraremos el anterior resultado en la
uiente. sección, no debe ser sorprendente para nosotros dicho resultado si
emos en cuenta el análisis de las pruebas individuales, en comparación
las pruebas conjuntas. Como usted ha de recordar, el problema r.eal en
• caso consiste en que las covarlanzas entre los estimadores están relacio-
18 con las correlaciones entre los regresores.

\minos de intervalos de confianza, el valor fJl = O'se encontrará cada vez más en la región de
ión a medida que aumenta el grado de colinealidad.
224 VIOLACION DE LOS SUPUESTOS DEL MODELO CLASICO

TABLA 8.2
El efecto de aumentar la colinealidad so-
bre el intervalo de confmnza del 95 %
para fl1: tJ1 ± 1.96 es <tJ1)

Nota: Obsérvese que estamos utilizando la distri-


bución normal porque, por conveniencia, se
supone asume 'que ".' se conoce. De ahí el uso
de 1.96, el factor del 95% de confianza prove-
niente de la distribución normal.
Los errores estándar correspondientes a los dife-
rentesvaloresder 23 provienente de la Tabla 8.1.

Sensibilidad de los estimadores de MeO


y sus errores estándar ante cambios pequeftos en los datos
Mientras la multicolinealidad no sea perfecta, es posible la est}mación de los
coeficientes de regresión; sin embargo, los estimadores y sus errores estándar
se tornan muy sensibles, aun al más ligero cambio en los datos.
Para ver esto analicemos la Tabla 8.3. Con base en estos datos, obten e
mos la siguiente regresión múltiple.

TABLAS.3
Datos hipotéticos sobre Y,
X 2 yX3
y Xz X3
1 2 4
2 o 2
3 4 12
4 6 o
S 8 16
MULTICOUNEALIDAD
225
TABLA 8.4
Datos hipotfticos sobre Y,
XayX,
y Xa x,
1 2 4
2 O 2
3 4 O
4 6 12
.5 8 16.

f, = 1.1939 + 0.4463X 2 / + 0.0030X3 /


(0.7737) (0.1848) (0.0851)
t == (1.5431) (2.4151) (0.0358) (8.5.1)
2
R = 0.8101 '23 = 0.5523
cov <P2, P3) = -0.00868 g de 1 = 2

La regresión (8.5.1) muestra que ninguno de los coeficientes de regresión


son individualmente significativos a los niveles de significancia convenciona-
les del 1 o deiS % , a pesar de que P2 sea significativo al nivel del 10 % con
base en la prueba t de una cola. •
Consideremos ahora la Tabla 8.4. La única diferencia entre las Tablas
8.3 y 8.4 es que el tercer y cuarto valores de X 3 han sido int~rcambiados.
Utilizando los datos de la Tabla 8.4, obtenemos
f, = 1.2108 + 0.4014X2i + 0.0270X 3/
(0.7480) (0.2721) (0.1252)
t = (1.6187) (1.4752) (0.2158) (8.5.2)
R2. == 0.8143 r23 = 0.8285
cov <P2' P3) = -0.0282 g de 1=.2

Como resultado de un ligero cambio en los datos, vemos que P2 que era
estadísticamente significativo anteriormente, a un nivel de significancia del
10 • deja ahora de serlo aun a ese nivel. También obsérvese que en (8.5.1),
la cov <P2' P3) = - 0.00868. mientras que en (8.5.2) ésta es -0.0282, un
aumento supérior a tres veces su' valor inicial. Todos estos cambios se pueden
atribuir a un aumento en la multicQlinealidad:en (8.5.1) 'a3= 0.5523. mien-
tras que en (8.5.2) este coeficiente es de 0.8285. En forma similar, los erro-
res estándar de $2 y P3 aumentan entre las dos regresiones. como síntoma
claro de la colinealidad.
Se mencionó anteriormente que en presencia de una alta colinealidad
no se pueden estimar los coeficientes de regresión individuales en forma pre-
226 VIOLACION DE LOS SUPUESTOS DEL MODELO CLASICO

TABLA 8.5
Datos hipotéticos sobre el
psto de consumo Y,
el ingreso Xz y la riqueza X 3'

Y. $ Xl' $ Xl' $
70 80 810
65 100 1009
90 120 1273
95 140 1425
110 160 1633
115 180 1876
120 200 2052
140 220 2201
155 240 2435
150 260 2686

TABLA 8.6
Tabla de ADV para el ejemplo
coDSUmo-ingreso-riqueza
Fuente de variación SC gde 1 SCM

Debido a la regresión 8565.5541 2 4282.7770


Debido a los residuos 324.4459 7 46.3494

cisa, pero que las combinaciones lineales de estos coeficientes se pueden esti-
mar más precisamente. Lo anterior se puede respaldar observando las regre-
siones (8.5.1) y (8.5.2). En la primera regresión, la suma de los dos coefi-
cientes parciales de las pendientes es 0.4493, en tanto que en la segunda re-
gresión dicha suma es igual a 0.4284, prácticamente la misma. Sin embargo,
esa no es la única coincidencia. Los errores estándar son prácticamente los
mismos, 0.1550 versus 0.1823. 10 No obstante, obsérvese que el coeficiente
de X 3 ha cambiado ostensiblemente, pasando de 0.003 a 0.027.

8.6 EJEMPLO ILUSTRATIVO: GASTOS DE CONSUMp


EN RELACION CON INGRESO Y LA RIQUEZA
Para ilustrar los diferentes puntos mencionados hasta ahora reconsideremos el ejem-
plo consumo-ingreso del Capítulo 3. En la Tabla 8.5, hemos reproducido los datos

10 Estos errores estándar se obtienen de la fórmula :

se <fl2 + $3) = Jvar (jJ2) + var (jJ3) + 2 cov </2' /3)


Obsérvese que al aumentar la colinea1idad aumentan las varianzas de 12 y P3.éstas se'pueden compensa!
si existe una alta covarianza negativa entre las dos, como indican claramente los resultados.
MUlTICOllNEAlIDAD 227

de la Tabla 3.2, agregándole información sobre la riqueza del consumidor. Si supo-


nemos que existe una relación lineal entre los gastos de consumo y el ingreso y la
riqueza, eptonces con base en la Tabla 8.5 obtenemos la siguiente regresión.
f¡ = 24.7747 + 0.9415X 11 - 0.0424X 31
(6.7525) (0.8229) (0.0807)
t = (3.6690) (1.1442) (-0.5261) (8.6.1)
R Z
= 0.9635 iP = 0.9531 g de 1= 7
La regresión (8.6.1) muestra que el ingreso y la riqueza explican conjuntamente
el 96 % de la variación de los gastos de consumo. A pesar de esto, ninguno de los
coeficientes de las pendientes es significativo estadísticamente. Adicionalmente, no
solamente es la variable riqueza no significativa estadísticamente, sino que también
tiene el signo incorrecto. A priori, se podría esperar una relación positiva entre el
consumo y la riqueza. A pesar de que P2 y P3 no son significativas individualmente
en términos estadísticos, si evaluamos la hipótesis de que P2 = P3 =.0 simultánea-
mente, esta hipótesis se puede rechazar como lo demuestra la Tabla 8.6. Bajo el
supuesto tradicional, obtenemos
F = 4282.7770
46.3494
= 92.4019 (8.6.2)
Este valor F es obviamente muy significativo.

Es interesante observar este resultado desde un punto de vista geomé-


trico (véase Figura 8.3). Con base en la regresión (8.6.1) hemos establecido
intervalos de confianza individuales del 9S % para PI y P3' Como muestran
estos intervalos, cada uno de ellos en forma individual incluye el valor de
cero. Por tanto, individualmente podemos aceptar la hipótesis de que las dos
pendientes parciales son cero. Sin embargo, cuando establecemos el intervalo
de confianza conjunto para evaluar la hipótesis de que PI = P3 = 0, sea hipó-
tesis no se puede aceptar puesto que el intervalo de confianza conjunto, en
realidad una elipse, no incluye el origen. u Como ya se hizo énfasis anterior-
mente, cuando la colinealidad es alta, las pruebas que' se realicen sobre los
regresores individuales no son confiables; en tales casos es la prueba F gto-
baIla que mostrará si Y está relacionada con los diferentes regresores.
Nuestro ejemplo muestra en forma dramática las consecuencias de la
multicolinealidad. El hecho de que la prueba F sea significativa mientras que
los valores t para X 2 y X 3 no son significativos individualmente, implica que
las dos variables están tan altamente correlacionadas que es imposible aislar
el impacto individual del ingreso o la riqueza sobre el consumo. De hecho, si
regresamos Xl en X 3 obtenemos

11 Como se mencionó en la Sección S.3, el tema de intervalo de confianza conjunto es bastante compli-
cado. El lector interesado puede consultar la.referencia mencionada allí.
228 VIOLACION DE LOS SUPUESTOS DEL MODELO CLASICO

{JJ

í Intervalo de confianza
conjunto del 95% para {32 and {3J

------------.-----~-r~------~~------~------~2
-1.004 2.887

~ Intervalo de confianza
del 95 % para {32

-0.2332

FIGURAS.3
Intervalos de confianza individuales para pz y P3
e intervalos de confianza conjuntos (elipse) para PI y P3 •

X3i = 7.5454 + 10.l909X:2i


(29.4758) (0.1643) (8.6.3) •
t = (0.2560) (62.0405) R2 = 0.9979
lo cual demuestra que existe una colinealidad casi perfecta entre X 3 y X 2 .
Veamos entonces qué ocurre si regresamos Yen X 2 únicamente:
Y; = 24.4545 + 0.5091X 2i
(6.4138) (0.0357) (8.6.4)
t = (3.8128) (14.2432) R2 = 0.9621
En (8.6.1) la variable ingreso no era estadísticamente significativa, mientras
que ahora pasa a ser altamente significativa. Si, en lugar de regresar Y en X 2 ,
regresáramos Yen X 3 , obtendríamos
Y; = 24.3480 + 0.0498X 3i
(6.3837) (0.0037) (8.6.5)
t = (3.8141) (13.3576) R2 = 0.9567
Vemos ahora que la riqueza tiene un impacto significativo sobre los gastos de
consumo, mientras que en (8.6.1) no tenía ningún efecto sobre éstos.
Las regresiones (8.6.4) y (8.6.5) muestran muy claramente que en situa-
ciones de extrema colínealidad, eliminar la variable altamente colineal traerá
MULTICOLINEALlDAD 229
frecuentemente como resultado que la otra variable X se torne estadística-
mente significativa. Esto sugeriría que una manera de evadir la extrema coli-
nealidad consistiría en eliminar la variable colineal, tema al cual nos referire-
mos más en detalle en la Sección 8.8.

8.7 COMO DETECTAR MULTICOLINEALIDAD


Habiendo estudiado la naturaleza y las consecuencias de la multicolinealidad,
la pregunta más lógica que se puede a continuación formular es ¿cómo se
sabe que está presente la colinealidad en una determinada regresión, especial-
mente· en aquellos modelos que involucran más de dos variables explicativas?
~n este aspecto es importante mantener en mente las advertencias de Kmenta:

1. La multicolinealidad es un problema de grado y no de tipo. La distinción signifi-


cativa no es entre la presencia y la ausencia de. multicolinealidad, sino entre sus
diferentes grados y magnitudes.
2. Puesto que la multicolinealidad se refiere a la condición de las variables explicati-
vas, que se supone que son no estocásticas, ella es una característica de la muestra
y no de la población.
Por tanto, no tenemos que "llevar a cabo pruebas de multicolinealidad" pero si
lo deseamos podemos medir su grado para cualquier muestra determinada. 12
Dado que la multicolinealidad es esencialmente un fenómeno de tipo
muestral que surge de información principalmente no experimental, que se
recopila ,en la mayoría de las ciencias sociales, no se cuenta con un método
único para detectarla o medir su fuerza. Lo que tenemos en realidad son cier-
tas reglas generales, algunas de ellas formales y otras informales, pero sola-
mente reglas generales. Consideremos a continuación algunas de éstas.
1. Un R2 elevado pero pocas razones t signiFICativas. Co~o se mencionó
anteriormente, éste es un síntoma "clásico de multicolinealidad". Si el
R2 es alto, digamos, por encima de 0.8, la prueba F en la mayoría de los
casos rechazará la hipóteSIs de que los coeficientes parciales de las pen-
dientes son simultáneamente iguales a cero. Sin embargo, las pruebas t
individuales mostrarán que ningún coeficiente parcial de las pendientes, o
muy pocos de ellos, son estadísticamente diferentes de cero. Lo anterior
se demostró claramente en nuestro ejemplo de consurno-ingreso..riqueza.
Aunque este diagnóstico es sensible, su gran desventaja consiste en
que "es demasiado fuerte, en el sentido de que la multicolinealidad se
considera daflina, únicamente cuando la totalidad de las influencias de las
variables explicativas sobre Y no se pueden separar" .1~
Altas co"elaciones pares entre regresores. Otra regla general que... sesugie-
re utilizar consiste en observar el coeficiente de correlación de orden cero

Jan Kmenta, Elements 01 Econometrlc., The MacMillan Company, New York, 1971." p. 380.
"'Id., p. 390.
230 VIOLACION DE LOS SUPUESTOS DEL MODELO CLASICO

o par entre dos regresores. Si éste es alto, digamos, superior a 0.8, enton-
ces la multicolinealidad es un problema serio. El problema con este crite~
rio es que aunque las altas correlaciones de orden cero pueden sugerir la
presencia de colinealidad, no es necesario que dichas correlaciones sean
altas para contar con la presencia de colinealidad en un determinado'caso
específico. Para plantearlo en términos un poco técnicos, correlaciones
elevadas de orden cero son una condición suficiente pero no necesaria
para la existencia de multicolinealidad, debido a que ésta puede existir, a
pesar de qu~ .las correlaciones de orden cero o correlaciones simples sean
comparativamente bajas (digamos, inferiores a 0.50). Para apreciar esto,
supongamos que tenemos un modelo de cuatro variables:
Yi = {J1 + {J2 X 2i + {J3 X 3i + (J4,X~i + Ui
y suponiendo que

donde A. 2 Y A3 son constantes, sin que las dos sean simultáneamente igua-
les a cero. Obviamente, X 4 es una combinación lineal exacta de X 2 y
X 3 dando como resultado que el coeficiente de determinación en la regre-
sión de X 4 sobre X 2 y X 3 ,R¡.23 es igual a 1 se puede comprobar que,

(8.7.1)

Pero puesto que R¡.23 = 1 debido a la existencia de colinealidad perfecta,


tenemos

(8.7.2)

Ahora bien no es difícil ver que (8.7.2) se satisface conr42 = 0.5 r43 =
0.5 Yr23 = -0.5, los cuales no son valores realmente altos.
Por tanto, en los modelos que involucren más de dos variables explica-
tivas la correlación simple o de orden cero no proporcionará una guía
infalible sobre la presencia de multicolinealidad. Claro está que si sola-
mente existen dos variables explicativas, bastará con las correlaciones de
orden cero.
3. Andlisis de las correlaciones parciales. Debido al problema que acabamos
de mencionar, cuando nos basamos únicamente en las correlaciones de
orden cero, Farrar y Glauber han sugerido que se deben observar en lugar
de ello los coeficientes de correlación parcial. 14 De, esta forma, si se en-
cuentra en la regresión de Yen X 2 • X 3 , y X 4 que Rt234 es muy elevado,

14 D. E. Farrar y R. R. Glauber, "Multicolinearity in Regression Analysis. The Problem Revísited'


Review of Econometrics and Statistics, vol. 49, pp. 92-107. '
MULTICOUNEALIDAO 231

pero r72.34, r13.24, y rfU3 son comparativamente bajos, esto puede impli-
car que las variables X 2 • X 3 y X4 están altamente intercorrelacionadas y
que por lo menos una de estas variables es superflua.
Aunque puede ser lltU un estudio de las correlaciones parciales, no
hay garantía. de que éstas proporcionen una guía infalible para detectar
multicolinealidad, puesto que puede suceder que tanto el R' ~omo todas
las correlaciones l'8!ciales sean suficientemente altas. Sin embargo, y tal
vez más importante, C. Robert Wichers15 ha demostrado que la prueba
de correlación parcial'de Farrar-Glauber es ineficaz en el sentido de que
una determinada correlación parcial puede ser compatible con patrones
de multicolínealidad diferentes. La prueba Farrar-Glauber ha sido también
muy criticada por
T. Krishna Kumar,16 John O'Hagan y Brendan Me
Cabe. 17
4. Regresiones auxiliares. Puesto que la multicolinealidad .surge debido a
que uno o más regresores son combinaciones exactas o aproximadamente
lineales de los otros regresores, una manera de averiguar qué variable X
está relacionada con otras variables X consiste en regresar cada X, en las
restantes variables X, procediendo entonces a calcular el R' correspon-
diente que designamos como R~; cada una de estas regresiones se deno-
mina regresión auxiliar, auxiliar a la regresión principal de Y en las X.
Entonces, siguiendo la relación existente entre el F y el R' , la variable

(8.7.3 )

posee una distribución F con k - 2 y N· - k + 1 g de 1. En la ecuación


(8.7.3), !ti significa el tamafto de la muestra, k representa el número de
variables explicativas incluyendo el término de la intersección y R~i' X2X~ .. ' x~
es el coeficiente de determinación en la regresión de la variable X, en las
restantes variables X. 18
Si el F calculado excede al F, crítico al nivel de significancia escogido,
se dice entonces que una X, determinada es colineal con las restantes X;
de otro lado, si el F calculado no excede al F, crítico, decimos entonces
que la variable X considerada no es colineal con las restantes X, en cuyo
caso podemos retener la variable en el modelo. Si F, es estadísticamente

15 "Tbe Detection of Multico1linearity; A Comment", Review oí Eeonomtc. and Statistie8,. vol. 57,
1975, pp. 365·366.
16 "Multico1linearity in Regression Analysls", Review o/ Eeonomtc. and StatiBtic., vol. 57, 1975, pp.
366-368.
17 "Test for the Severity of MulticoUinearity in Regtession Analysls A Comment", Review o/ Eeono-
micsand StatiltiCs, vol. 57,1975, pp. 368-370.
} 18 Por ejemplo,R~J se puede obtener haciendo la regresi6n deX 2i ,de la siguiente manera: X 2i = al + a3
X3i + a.X.í + ... + a,.Xij + ej'
232 VIOLACION DE LOS SUPUESTOS DEL MODELO CLASICO

significativo, tendremos aun que decidir si la Xi que se está considerando


debe eliminarse del modelo. Este aspecto ~e analizará más detalladamente
en la Sección 8.8.
Sin embargo, este método no deja de tener sus desventajas, puesto que
... si la multicolinealidad involucra únicamente unas pocas variables, ,de tal manera
que las regresiones auXiliares no sufren multicolinealidad extensa, los coeficientes
estimados puec;len 'Te\relar la naturaleza de la dependencia lineal existente entre los
regresores. Infortunadamente, si existen diferentes ásociaciones lineales muy com-
plejas, este ejercicio de ajuste puede no ser muy valioso puesto que será difícil iden-
tificar las interrelaciones independientes. 19

5. Valores propios o específicos* e índice de condición. Si se examina el


listado SAS de la función de producción Cobb-Douglas se podrá apreciar
que SAS utiliza valores específicos y el z'ndice de condiciones para diag-
nosticar muIticolinealidad. No analizaremos aquí el tema de los valores
específicos, puesto que nos llevaría a involucrarnos en los temas de álge-
bra matricial, que están fuera del enfoque de este libro. Partiendo de estos
valores específicos, podemos desarrollar lo que se conoce como número
de condición k, definido como: .
k = Valor específico máximo
Valor específico mínimo
y el z'ndice de condición (IC), el cual se define como
Valor específico máximo
le=
Valor específico mínimo
Entonces, tenemos la siguiente regla general. Si k está entre 100 Y 1000,
existe una multicolinealidad que va desde moderada a fuerte, mientras
que si excede a 1000, existe una multicolinealidad severa. En forma alter-
nativa si el IC (= Jk)
está entre 10 Y 30, existe una multicolinealidad
entre moderada y fuerte, en tanto que si excede a 30, existe una multico-
linealidad sev\.,ra.
Para el ejemplo ilustrativo, k = 3.0/0.00002422 o aproximadamente
123864 y ei IC = J123864 = aproximadamente 352. En consecuencia,
tanto k como el IC sugieren la presencia de una multicolinealidad severa.
Claro está que k y el IC se pueden calcular entre el valor específico máxi-
mo y cualquier otro valor específico como se hace en el listado. (Nota:
El listado no calcula explícitamente el valor de k; es simplemente elcua-
drado det IC). A propósito, obsérvese que un bajo valor específico (en

19 George G. Judge, R. Carter Hill, William E. Griffiths, Helmut Lütkepohl, y Tsoung-chao Lee, ln-
troduction to The Theory ami Practice 01 Econometrics, John Wiley & Sons, Inc., New York, 1982,
p.621.
*N. de C. Eigenvalues, expresión que también puede traducirse como valores característicos.
MUlTICOLlNEALlDAO 233

relación con el máximo valor específico,es una indicación de dependen-


cias casi lineales en los datos.
Algunos autores creen que elíndice de condición es el mejor diagnóstico
de multicolinealidad existente. Sin embargo, esta opinión no es ampliamente
aceptada. P.ara nosotros, entonces, el IC és solamente una regla general, tal
vez un poco más sofisticada. Para mayores detalles, el lector puede consultar
las referencias bibliográficas 11 este respecto. 20
Para concluir nuestro estudio sobre cómo detectar multicolinealidad, se
debe hacer énfasis en que los diferentes métodos que hemos mencionado son
esencialmente "método de pesca" puesto que no podemos decir si ellos fun-
cionan para una determinada aplicación. Sin embargo, no se puede hacer
mucho al respecto puesto que la multicolinealidad es un problema de tipo
muestral sobre el cual el investigador puede no tener mucho control, especiál-
mente si los datos son de naturaleza no experimental, el caso común que en-
frentan los investigadores en las ciencias sociales.

8.8 MEDIDAS REMEDIALES


¿Qué se puede hacer si la multicolinealidad es grave? Como sucedió cuando
intentábamos buscar maneras para detectarla, no existen guías infalibles de-
bido a que la multicolinealidad es esencialmente un problema muestral. No·
obstante, se puede intentar ut,i}izar las siguientes reglas generales, dependien-
do el éxito de las mismas de la severidad del problema de colinealidad.

1. Información a priori. Suponiendo que consideramos el modelo


Y¡ = {Jl + {JIX 1¡ + {J3 X 3¡ + U¡
donde Y = consumo, X 2 = ingreso y X 3 = riqueza.
Como se mencionó
anteriormente, las variables ingreso y riqueza tienden a ser altamente co-
lineales. Sin embargo, supongamos que a priori creemos que {J3 = O.10{J2;
es decir, que la tasa de cambio del consumo con respecto a 1a riqueza
corresponde a una décima parte de la tasa de variación con respecto al
ingreso. Podemos entonces realizar la siguiente regresión:
Y¡ = {Jl + {J2 X 2¡ + 0.10{J2 X 3¡ + U¡
= {Jl + {J2 X ¡ + U¡
donde Xi = Xli + 0.1 X3~' Una vez que obtengamos P2 podemos estimarP3
a partir de la relación postulada entre {J2 y {J3'
¿Cómo se obtiene información a priori? Puede provenir de trabajos
empíricos previos donde el problema de colinealidadsea menos serio o,

28 Véase especialmente D. A. Belsley, E. Kuh y R. E. Welsch, Regresrion PÚlgnOStiCS, Identifying


Injluenttal Data and Sources 01 Collinearity, John Wiley & Sons, Inc., New York, 1980, Cap. 3. Sin
embargo, este libro no es para un principiante.
234 VIOLACION DE LOS SUPUESTOS DEL MODELO CLASICO

de otro lado, basándose en la teoría 'relevante fundamental en el campo


bajo estudio. Por ejemplo, para el caso de la función de producción tipo
Cobb-Douglas, si se espera obtener retornos a escala constantes, entonces
(Pz + P3) = 1, en cuyo caso podríamos llevar a cabo la siguiente regresión:
In (Yt!X21 ) = PI + pzln (J(3t!X U )
donde Y = producción, X 2 = mano de obra o trabajo, X 3 = capital.
En dicha regresión, se regresa la relación producto/trabajo en la rela-
ción capital/trabajo. Si existe colinealidad entre la mano de obra y el
capital, generalmente es el caso de la mayoría de los datos, esa transfor-
mación puede reducir o eliminar el problema de colinealidad. Sin embar-
go, es preciso hacer una advertencia en este caso con respecto a la imposi-
ción de tales restricciones a priori. " ... puesto que en general estamos in-
teresados en evaluar las predicciones a priori de la teoría económica, en
lugar de sencillamente imponerlas sobre los datos sobre los que puedan o
no ser ciertas". 21 No obstante, ya hemos diseñado mecanismos para
evaluar la validez de restricciones lineales en el modelo en fonn~ explí-
. cita, como se vio en el Capítulo 7.
2. Combinación de series de corte transversal y de series de tiempo. Una
variante a la técnica de obtener infonnación a priori, sugerida previamen-
te, consiste en combinar cifras de corte transversal y de series de tiempo,
técnica que se conoce como mezcla de datos. Supongamos que queremos
estudiar la demanda de automóviles en los Estados Unidos y que dispo-
nemos de series de tiempo para el número de autos vendidos, el precio
promedio de cada auto y el ingreso del consumidor. También supongamos
que
In y, = PI + pz In P, + P3 In 1, + U,
donde Y = número de autos vendidos, P = precio promedio, 1 = i~greso
y t = tiempo. Nuestro objetivo consiste en estimar la elasticidad-preciopz
y la elasticidad-ingreso P3'
Ahora bien, tratándose de series de tiempo, las variables precio e in-
greso tienden a ser altamente colineales. Por tanto, si corremos la anterior
regresión nos enfrentaremos al problema de la multicolinealidad. Una
manera de solucionarlo ha sido sugerida por Tobin. 22 Afirma que si tene-
mos infonnación de corte transversal (como la que se genera a través de
páneles de consumidores o de estudios presupuestales como los que lle:"
van a cabo agencias privadas o gubernamentales), podemos obtener una
estimación relativamente precisa de la elasticidad ingreso P3 puesto que

21 Mark B. Stewart y Kenneth F. Wallis, lntroductory Econometrics, 2a. ed., John Wiley & Sons, Inc"
A Halstead Press Book, 1981, p. 154..
22 J. Tobin, "A Statistical Demand Function for Food in the U.S.A.Jouma/ ofthe Royal Statistical
society, seto A, pp. 113-141, 1950.
MULTICOLlNEALlDAD 235

con estos datos, que están en un punto en el tiempo, los precios no


varían mucho. Sea P3 la elasticidad-ingreso, estimada a partir de los datos
de corte transversal. Utilizando esta estimación, la anterior regresión de
series de tiempo puede escribirse como:
y~ = Pl + P2 In Pf + Uf
donde Y· = In Y - P3 In 1, que representa el valor de Y después de supri-
mirle el efecto del ingreso. Podemos proceder a obtener una estimación
de la elasticidad - precio P2 a partir de la anterior regresión.
Aunque es una técnica atractiva, combinar cifras de corte transver-
sal con las de series de tiempo puede crear problemas de interpretación
debido a que en este caso estamos suponiendo implícitamente que la
elasticidad - ingreso, estimada a partir de cifras de corte transversal, es
igual a la que se habría obtenido a partir del análisis de series de tiempo.23
Sin embargo, la técnica ha tenido muchas aplicaciones y es particular-
mente valiosa en situaciones en donde los estimativos de corte transversal
no varían sustancialmente de una muestra a otra. Un ejemplo de esta téc-
nica se encuentra en el Ejercicio 8.12.
3. Eliminación de una(s) variable(s) y el sesgo de especificación. Cuando
encaramos el problema de multicolinealidad severa, una de las soluciones
más "simples" consiste en omitir del modelo una de las variables colinea~
les. En nuestro ejemplo consumo-ingreso-riqueza, al omitir la variable
riqueza obtenemos la regresión (8.6.4), la cual muéstra que mientras en
el modelo original la variable ingreso no era estadísticamente significativa,
ahora se vuelve "muy" significativa.
Sin embargo, al eliminar una variable del modelo podemos cometer el
sesgo de especificación o error de especificación. El sesgo en la especifi-
cación del modelo surge debido a la especificación incorrecta del modelo
utilizado en el análisis. Por tanto, si la teoría económica plantea que el
ingreso y la riqueza deben incluirse en el modelo que explica los gastos
de consumo, al eliminar la variable riqueza estaríamos cometiendo un
sesgo de :especificación.
Aunque estudiaremos el tema del sesgo en la especificación de un
modelo en el Capítulo 11, podemos ilustrarlo a continuación. Si el mode-
o poblaeional verdadero es:
~ = Pl + P2 X 2j + P3 X 3¡ +u¡
pero ajustamos erradamente el modelo:
y¡ = bl + bu X 2i + e¡

23 Para un análisis completo y una aplicación de la técnica de combinación de datos, v¿ase Edwin Kuh,
Oipital Stock Growth: A Micro-Econometrlc Approach, North-Holland Publishing Company, Amster-
dam, 1963, Caps. S y 6.
236 VIOLACION DE LOS SUPUESTOS DEL MODELO CLASICO

entonces
E(b 12 ) = P2 + P3 b32
donde b 32 = coeficiente de la pendiente en la regresión de X 3 en X 2 • Por
tanto, es obvio a partir de la expresión (b) que b 12 será una estimación
sesgada de P2 en la medida en que b 32 sea diferente de cero (se supone
que P3 es diferente de cero; en caso contrario no tendría sentido incluir
X 3 en el modelo original).24 Claro está que si b32 fuera cero, no tendría..:
mos el problema de multicolinealidad. También es claro observando (b)
que si b 32 y P3 son positivas, E(b 12 ) será mayor queP2; por tanto, en pro-
medio b 12 sobreestimará P2' ocasionando por ende un sesgo positivo. En
forma similar, si el producto b 32 P3 es negativo, en promediob 12 subesti-
mará P2 ocasionando un sesgo negativo.
A partir del análisis anterior es claro que al eliminar una variable del
modelo para aliviar el problema de la multicolinealidad, se puede producir
un sesgo en la especificación del mismo. Por tanto, el remedio puede ser
peor que la enfermedad misma en algunas situaciones debido a que mien-
tras la multicolinealidad puede prevenir la estimación precisa de los pará-
metros del modelo, omitir una variable del mismo puede llevar a equivo-
carse seriamente con respecto a los verdaderos valores de los parámetros.
. Recordemos que los estimadores de MCO son MELI, a pesar de la presen-
cia de colinealidad menos que perfecta.
4. Transformación de variables. Supongamos que poseemos información en
forma de series de tiempo para los gastos de consumo, ingreso y riqueza.
Una razón que puede explicar la alta multicolinealidad entre el ingreso y
la riqueza en estos datos consiste en que en el tiempo ambas variables
tienden a moverse en la misma dirección. Una manera de minimizar esta
dependencia es procediendo de la siguiente forma:
Si la relación
(8.8.1)
se cumple en el período t, también debe cumplirse en el período t - 1,
en razón de que el origen del tiempo es, de todas fórmas, arbitrario. Por
tanto, se tiene que
(8.8.2)

Si restamos' (8.8.2) de (8.8.1), obtenemos:


(8.8.3)

donde v, = u, - U,-l La ecuación (8.8.3) se conoce como la forma de


primeras diferencias, puesto que se está corriendo la regresi6n, no sobre

14 Adicionalmente, obsérvese que si bu no se acerca a cero a medida que el tamaño de la ~uestra


aumenta indefinidamente, entonces b l2 no solamente será sesgado sino también será inconsistente.
MULTICOllNEAlIDAD 237

las variables originales, sino sobre las diferencias de los valores sucesivos
de dichas variables.
El modelo de regresión utilizando las primeras diferencias, con fre-
cuencia reduce la severidad de la multicolinealidad debido a que aunque
los niveles de X 2 y X 3 puedan tener una alta correlación, no existe una-
razón a priori para creer que sus diferencias también tengan una alta co-
rrelación.
Sin embargo, la transfonnación que utiliza las primeras diferencias
crea algunos problemas adicionales. El ténnino de erro.r Vt que aparece en
(8.8.3) puede no satisfacer uno de los supuestos del modelo clásico de
regresión lineal, según el cual las perturbaciones no están correlacionadas
serialmente. Como veremos en el Capítulo 10, si el Uf es serialmente in-
dependiente o no correlacionado, el ténnino de error Vt obtenido previa-
mente, en la mayoría de los casos estará serialmente correlacionado. Nue-
vamente, el remedio puede ser peor que la enfennedad. Adicionalmente,
se pierde una observación debido al procedimiento de diferenciación y
por. tanto los grados de libertad se reducen en 1. Con una muestra
pequefía, este hecho puede ser un factor que se debe por lo menos tener
en cuenta. Además, el primer procedimiento de diférenciación puede no
ser el adecuado en los datos de corte transversal donde no hay un ord&na-
miento lógico de las observaciones.
5. Datos nuevos o adicionales. Ya que la multicolinealidad es una caracterís-
tica de la muestra, es posible que en otra muestra que involucre las mis-
mas variables la colinealidad puede no ser tan seria como en la primera
muestra. A veces, con sólo aumentar el tamafío de la muestra (si es posi-
ble), se puede atenuar el problema de colinealidad. Por ejemplo, en el
caso del modelo de tres variables se puede obtener que
ql
var <fil) = L x~~l - r~3)
Ahora, a medida que el tamafío de la muestra aumenta, L X~i general-
mente aumentará. (¿Por qué?) En consecuencia, para cualquier r23 dado,
la varianza de Pl disminuirá, disminuyendo así el error estándar, lo cual
nos permite estimar en forma más precisa el valor de Pl
La obtención de datos adicionales o de "mejor" información no siem-
pre es tan sencilla, puesto que como lo mencionan Judge et al:
Infortunadamente, los economistas muy pocas veces pueden obtener datos adi-
cionales sin tener que incurrir en costos significativos, y mucho menos escoger
los valores de las variables explicativas que desean. Adicionalmente, cuando ~
agregan nuevas variables en situaciones que no se controlan, debemos estar cons-
cientes de agregar observaciones que fueron generadas en un proceso diferente
del asociado con el conjunto original de datos; es decir, debemos estar seguros de
que la estructur¡l económica asociada con las nuevas observaciones es la misma
que la de la estructurá original.25

25 Judge et al., op. cit., 625, véase también Seccion 8.9.


238 VIOLACION DE LOS SUPUESTOS DEL MODELO CLASICO

6. Reducción de la colinealidad en las reducciones polinomiales. Una carac-


terística especial de los modelos de regresión polinomial es que las varia-
bles explicativas aparecen elevadas a diferentes potencias. Por tanto, en la
función cúbica de costos totales que involucra la regresión del costo total
de la producción (producción)2 y (producción)3 ,los diferentes términos
de la producción elevados a las diferentes potencias van a estar correla-
cionados, dificultando así la estimación precisa de los diferentes coefi-
cientes de las pendientes. 26 No obstante, en la práctica se ha encontrado
que si las variables explicativas se expresan en formas de desviación (es
decir, en forma de desviaciones de sus valores promedios), se reduce sus-
tancialmente la multicolinealidad. Pero aun entonces el problema puede
persistir ~ 27 en cuyo caso se podrían considerar técnicas como la de los
polinomios ortogonales. 28
7. Otros métodos de remediar la mu/tico/inealidad. Técnicas estadísticas
multivariadas, tales como el análisis factorial y la de componentes prin-
cipales o técnicas tales como la ridge regression con frecuencia se utilizan
para "solucionar" el problema de la multicolinealidad. Infortunadamente,
estas técnicas están más allá del enfoque de este libro y no se pueden
analizar en forma adecuada sin acudir al álgebra matricia1. 29
Para concluir nuestro análisis de las medidas remediales, es importante
una nota de advertencia. En el análisis de regresión, cuando obtemos valores
t no significativos para' los éoeficientes de regresión, con frecuencia existe la
tentación de culpar por esta falta de significancia a la multicolinealidad. Pero
el verdadero culpable puede no ser la multicolinealidad sino algún otro factor
diferente. Como mencionan Douglas Montgomery y Elizabeth Peck, ese
factor puede ser: 30
1. El método de recolección de datos empleado; por eJemplo, muestreo so-
bre un rango limitado de valores que pueden tomar los regresores en la
poblacion.
2. Limitaciones en el modelo o en la población que se está muestreando.
Por ejemplo, en la regresión del consumo de electricidad en el ingreso
(X2) y en el tamaño del hogar (X3) existe una limitación física en la po-

Como se mencionó, puesto que la relación entre X, x y X' ~o es lineal, hablando en forma estricta
2
26
las relaciones polinomiales no violan el supuesto de no multicolinealidaddel modelo clásico.
27 Véase R. A. Bradley y S. S. Srivastava, "Correlation and Polynomial Regression", American Statisti·
cian, vol. 33, 1979, pp. U·l4.
28 Véase Norman Drapper and Harry Smith, Applied Regression Analysis, 2 ed., John Wiley & Sons,
Inc., New York, 1981, pp. 266·274.
29\ Una explicación sencilla de estas técnicas desde un punto de vista aplicado, se puede encontrar en
Samprit Chatterjee and Betram' Price, Regression Analyris by Example, John Wiley & Sons, Inc., New
York, 1977, Caps. 7 y 8. .
30 Véase su Introduction to Linear Regression Analyris, John Wiley & Sons, Inc., New York, 1982,
Cap. 8, pp. 289·290. La siguiente discusión se basa principalmente en sus análisis. Este capítulo tamo
bién proporciona un estudio detallado de los diagnósticos de multicolinealidad y de la rldge regresrion.
MULTICOLlNEALlDAD 239

blación,que radica en el hecho de que "familias con ingresos más altos


generalmente tienen un número de personas a cargo más grande que las
familias con ingresos más bajos. [Por tanto] ... la multicolinealidad exis-
tirá, independientemente del método de muestreo utilizado". 31
3. EspecifICación del modelo, por ejemplo, agregar términos polinomiales
al modelo de regresión, especialmente cuando el rango de la variable X
es pequefto.
4. Un modelo sobredefinido. Esto ocurre cuando el modelo tiene más varia-
bles explicativas que número de observaciones. Lo anterior puede ocurrir
en la investigación médica, donde puede haber un número pequefio de
pacientes sobre los cuales se recolecta información sobre una gran canti-
dad de variables.

8.9 ¿ES LA MULTICOLINEALlDAD NECESARIAMENTE


MALA? TAL VEZ NO, SI EL OBJETIVO ES
UNICAMENTE LA PREDICCION
Se dice que si el único propósito del análisis de regresión es el pronóstico o la
predicción, .entonces la colinealidad no se constituye en un problema serio
porque cuanto mayor sea el R'", mejor será la predicción. 32 Pero este puede
ser el caso, " ... en la medida en que los valores de las variables explicativas
para las cuales se desea obtener predicciones obedezcan a las mismas depen-
dencias lineales casi exactas de la matriz X de [datos] de disefio original". 33
Por tanto, si en una regresión estimada se encontró que X:i = 2X 3 aproxima-
damente, entonces en una futura muestra utilizada para predecir Y, X 2 de-
bería también ser aproximadámente igual a 2X 3 , lo cual es una condición,
difícil de cumplir en la práctica (véase Fn. 25), en cuyo caso la predicción se
tornará cada vez más incierta. 34 Adicionalmente, si el objetivo del análisis no es
solamente la predicción sino también la estimación confiable de los paráme c
tros, la presencia de alta Iriulticolinealidad puede ser un problema serio debi-
do a que, como hemos visto, puede producir grandes errores estándar para
los estimadores.
Sin embargo, existe un caso en donde la multicolinealidad puede no
representar un problema serio. Este es el caso en que se tiene un elevado R'2
y en donde los coeficientes de regresión son individualmente significativos,

31 lbid.
32 Véase R. C. Geary, "Some Results about Relations between Stochastic Variables: A Discussion
Document", Review o[ IntematioTIIJI Statistical lnstituté, vol. 31, 1963, pp. 163-181.
33 Judge et al., op. cit., p. 619. También encontrará en esta página una prueba de por qué, a pesar de la
existencia de colinealidad, se pueden obtener mejores predicciones medias si la estructura de la colinea-
lidad existente tambienpersiste en muestras futuras.
34Para un excelente análisis del tema, véase E. Malinvaud, Statistical Methods 01 Econometrics, 2 cd.,
North-H.,:>lland Publishing Company, Amsterdam, 1970, pp. 220-221.
240 VIOLACION DE LOS SUPUESTOS DEL MODELO CLASICO

como demuestran los altos valores t. Aun así, los diagnósticos de la multi-
colinealidad, por ejemplo el que arrojaría el índice de condición, indican
que existe una seria colinealidad en los datos. ¿Cuándo puede presentarse
tal situaciórr? Como menciona Johnston:
Lo anterior puede surgir si los coeficientes individuales resultan estar numérica-
tnente por encima del valor verdadero, de tal manera que el efecto se siga mostran-
do, a pesar de estar inflados los errores estándar y/o debido a que el valor verda-
dero mismo en tan grande que aun cuando se obtenga una estimación bastante
subestimada, ésta continúe siendo significativa. 35

8.10 RESUMEN Y CONCLUSIONES


Uno de los supuestos del modelo clásico de regresión lineal es la inexistencia
de multicolinealidad entre las variables explicativas, las X. En términos gene-
rales, la multicolinealidad se refiere a la existencia de una relación lineal
exacta o aproximaqamente exacta entre las variables X.
Las consecuencias de multicolinealidad son las siguientes: Si existe una
perfecta colinealidad entre las X. sus coeficientes de regresión son indetermi-
nados y sus errores estándar son infinitos. Si la colinealidad es alta pero no
perfecta, la estimación de los coeficientes de regresión es posible, pero sus
errores estándar tienden a ser grandes. Por consiguiente. los valores pobla-
cionales de los coeficientes no pueden estimarse en forma precisa. No obs-
tante, si el objetivo consiste en estimar combinaciones lineales de estos coe-
ficientes, las funciones estimables, esto se puede hacer aun en presencia de
multicolinealidad perfecta.
, Aunque no existen métodos exactos para detectar la colinealidad, existe
'~iferentes indicadores de ésta tales como:
1. El signo más diciente de la existencia de colinealidad tiene lugar cuando
el R 2 es muy alto, pero ninguno de los coeficientes de regresión es esta-
dísticamente significativo, con base en la tradicional prueba t. Este es,
naturalmente, un caso extremo.
2. En el modelo con dos variables explicativas se puede obtener una idea
relativamente buena de la colinealidad examinando el coeficiente de
correlación simple o de orden cero entre las dos variables. Si esta corre-
lación es alta, el culpable es generalmente la colinealidad.
3. No obstante, los coeficientes de correlación de orden cero pueden ser
engañosos en modelos con más de dos variables X, puesto que es posible
tener pequeñas correlaciones de orden cero y existir simultáneamente
una altamulticolinealidad. En situaciones como éstas, es necesario exa-
minar los coeficientes de correlación parcial.
4. Si el R 2 es alto pero las correlaciones parciales son bajas, la multicolinea-
lidad es una posibilidad. En este caso pueden ser superfluas una o más

35 J. Johriston, Econometric Methods, 3 ed., McGraw-Hill Book Company, New York, 1984, p. 249.
MULTICOLlNEALI.DAD 241

variables. Per~ si el R 2 es alto y las correlaciones parciales son también


elevadas, la multicolinealidad no puede ser detectada tan directamente.
Además, como plantean C. Robert, Krishna Kumar, John O'Hagan y
Brendan McCabe, existen algunos problemas estadísticos con la prueba
de correlación parcial sugerida por Farrar y Glauber.
5. Por tanto, se puede proceder a correr una regresión de cada una de las
variables Xi sobre las variables X restantes en el modelo y calcular los
correspondientes coeficientes de determinación R? Un alto Rf sugeriría
que Xi está altamente correlacionado con el resto de las X. En conse-
cuencia se puede proceder a eliminar esa Xi del modelo, dado que no
produce un serio sesgo de especificación en el modelo.

La detección de multicolinealidad es la mitad de la batalla. La otra mi-


tad está relacionada con hallar cómo deshacerse del problema. Nuevamente,
no existen métodos seguros, solamente unas pocas reglas generales. Algunas
de éstas son: (1) utilizar información obtenida en forma previa o externa al
modelo, (2) combinando información de series de tiempo y de corte trans-
versal, (3) omitiendo una variable altamente colineal, (4) transformando la
información, (5) obteniendo información nueva o adicional. Naturalmente,
para saber cuál de estas reglas utilizar en la práctica tendremos que consi-
derar la naturaleza de los datos y la severidad del problema de colinealidad.
Finalmente, mencionamos el papel de la multicolinealidad en la predic-
ción o .proyección de cifras e hicimos énfasis eh que, en tanto que la estruc-
tura de la multicolinealidad continúe en la futura muestra, es difícil utilizar
una regresión estimada que esté plagada por problemas de multicolinealidad
para fines de predicción.

EJERCICIOS
8.1 En el modelo de regresión lineal de k variables existen k ecuaciones normales para
estimar k incógnitas. Estas ecuaciones normales se dan en (7.3.8). Suponga que X k
es una combinación lineal perfecta de las restantes variables X. ¿Cómo mostraría
usted que en este caso es imposible estimar los k coeficientes de regresión?
8..2 Considere el siguiente conjunto
de datos hipotéticos: y X1 X3

-10 1 1
-8 2 3
-6 3 5
-4 4 7
-2 5 9
O 6 11
2 7 13
4 8 15
6 9 17
8 10 19
10 11 21
242 VIOLACION DE LOS SUPUESTOS DEL MODELO CLASICO

Supongamos que usted desea ajustar el modelo:

a los datos anteriores.


(a) ¿Puede usted estimar las tres incógnitas? ¿Por qué sí o por qué no?
(b) Si no lo puede hacer, ¿qué funciones lineales de estos parámetros, las funciones
estimables, puede usted calcular? Muestre los cálculos necesarios aparte.
8.3 Sila relación A¡X li + A2 X 2i + A3 X 3i = O se cumple para todos los valores de A¡, Ah
Y A3 , estime '12.3' '13.2' Y '2:i.!· También encuentre Rt23,RL3' y R~.¡2· ¿Cuál
es el grado de multicolinealidad en esta situación?
Nota: R~ .23 es el coeficiente· de determinación en la regresión de X en X 2 Y X 3. Los
restantesR 2 dében interpretarse de la misma manera.
8.4, Considere el siguiente modelo:

y, = p¡ + P2 X , + P3 X ,-¡ + P4 X ,-2 + PS X'-3 + P6X,-4 + U,


donde Y = consumo, X = ingreso y t = tiempo. El modelo anterior postula que el
consumo en el tiempo t es una función del ingreso, no sólo en el período t sino
también del ingreso en períodos anteriores. De esta forma, el consumo en el primer
trimestre de 1976 es una función del ingreso en ese trimestre y en los cuatro trimes-
tres de 1975. Tales modelos se denominan modelos de rezagos distribuidos, los cua-
les serán estudiados más adelante. .
(a) ¿Esperaría hallar multicolinealidad en tales modelos? ¿Por qué?
(b) Si espera hallar multicolinealidad ¿cómo solucionaría el problema?
8.S Considere el ejemplo ilustrativo de la Sección 8.6. ¿Cómo reconciliaría usted las
diferencias en las propensiones marginales a consumir obtenidas en (8.6.1) Y(8.6.4)?
8.6 En información de series de tiempo de variables económicas como en PNB. la ofertá
de dinero, precios, ingresos, desempleo, etc., se sospecha generalmente la existencia
, de multicolinealidad. ¿Por qué?
8.7 Suponga que en el modelo

'ü,coeficiente de correlación entre X 2 y X 3 , es cero. Por tanto, alguien sugiere que


se debe correr la siguiente regresión:
y, = %1 + C(2 X 2i + U¡¡

(a) ¿Será i 2 = P2 Y 1'3 = P3? ¿Por qué?


(b) ¿Será PI igual a i l o a YI o alguna combinacion de ellas?
(e) ¿Será var (P2) = vac (i 2 ) y var (/3 3 ) = var (Y3)?
8.8 Supóngase que para cierta regresión, la matriz de correlación es la siguiente:
Xi xf X¡
Xi .1 0,9742 0.9284
Xl 1.0 0.9872
X~I 1.0
MULTICOLlNEALlDAD 243

(a) "P\:leSto que las correlaciones de orden cero son muy altas, debe existir una
seria multicolinealidad". Comente respecto a dicha afirmación.
(b) ¿Eliminaría usted del modelo las variables
(e) Si las elimina, ¿qué ocurrirá con el valor del coeficiente de XI?
8.9 Regresión por etapas o tramos (step.wise). Para escoger el "mejor" conjunto de va·
riables explicativas para un modelo de regresión, los investigadores acuden con freo
cuencia al método de regresión por etapas o step 'wise. En este método se procede
ya sea introduciendo las variables X una a la vez, (regresión en etapas hacia adelan·
te) o incluyendo todas las posibles variables X en una posible regresión múltiple y
rechazándolas una a la vez (regresión en etapas hacia atrás). La decisión de agregar
o eliminar una variable generalmente se hace con base en la contribución de esa
variable a la SEC de acuerdo con lá prueba F. Según lo que usted ya ha aprendido
hasta ahora, ¿recomendaría alguno de estos dos procedimientos? ¿Por qué sí o por
qué no? *
8.10 Klein Y Goldberger intentaron ajustar el siguiente modelo de regresión a la econo·
mía de los Estados Unidos:

Y¡ = PI + P2 X 2i + P3 X 3i + P4 X 4i + Ui
= =
donde Y = consumo, X 2 ingreso por salarios, X 3 ingreso diferente a salarios o
diferente a ingresos agrícolas y X 4 ingresos agrícolas. Pero, puesto que se espera que'
X 2 , X 3 Y X 4 tengan una alta colinealidad, ellos obtuvieron estimaciones paraP3Y
P4utilizando análisis de series de corte transversal de la siguiente máneraP3 = 0.75 Pl
Y f34 =O.625f32.Utilizando estas estimaciones, formularon su función consumo de la
siguiente manera.
Y¡ = PI + P2(X 2i + O.75X 3i + O.625X 4i ) + Ui = PI + P2 Z i + Ui
donde Zi = X 2i + O.75X 3i + O.625X 4i ·
(a) Ajuste el modelo a los siguientes datos y obtenga estimadores de PI a P4'
(b) ¿Cómo interpretaría usted la variable Z? ¿Por qué?

Año Y Xl X3 X. Año Y Xl X3 X.
1936 62.8 43.41 17.10 3.96 1946 95.7 7(,:;3 28.26 9.76
1937 65.0 46.44 18.65 5.48 1947 98.3 75.91 27.91 9.31
1938 63.9 44.35 17.09 4.37 1948 100.3 77.62 32.30 9.85
1939 67.5 47.82 19.28 4.51 1949 103.2 78.01 31.39 7.21
1940 71.3 51.02 23.24 4.88 1950 108.9 83.57 35.61 7.39
1-941 76.6 58.71 28.11 6.37 1951 IOS.5 90.59 37.58 7.98
1945· 86.3 87.69 30.29 8.96 1952 111.4 95.47 35.17 7.42

Fuente: L. R. KIein y A. S. Goldberger, An Economic Modelo ofthe United StJJtes,


1929·1952, North Holland Publishing Company, Amsterdam, 1964, p. 131.
.~Faltan los datos para los años de guerra entre 1942.1944. Los datos para los demás
años están dados en mUes de millones de dólares de 1939.'

* Analice si su razonamiento está de acuerdo con los planteamientos de Arthur Goldberger y D. B.


Jochems, "~te on Stepwise Least-Squares", Joumal of the American Statistical Association, Marzo
1961, pp. 105-110.
244 VIOLACION DE LOS SUPUESTOS DEL MODELO CLASICO

8.11 (a) Demuestre que si ru = Opara i = 2, 3, ... , k, entonces

(b) ¿Cuál es la importancia de este resultado para la regresión de la variable Xl


(= Y) en las variables X 2, X 3 , ... , X k ?
8.12 Suponiendo que todos los coeficientes de correlación de orden cero para Xl (= Y).
X 2 • .... X k son i~uales a r,
(a) ¿Cuál es el valor de R;.23 ... k?
(b) ¿Cuáles son los valores de los coeficientes de correlación de primer orden?
"'8.13 En notacion matricial, ocurre que
P= (X'X)-IX'y
ti
(a) ¿Qué sucede con cuando existe colinealidad perfecta entre las X?
(b) ¿Cómo sabría usted si existe colinealidad perfecta?
'8.14 Utilizando notacion matricial, resulta
var-cov (P) = (72(X'X) - 1

¿Qué ocurre con la anterior matriz de var-cov cuando (a) existe colinealidad per-
fecta y (b) cuando la colinealidad es alta pero no perfecta?
*s.15 Considere la siguiente matriz de correlación:
X2 X3 ... Xk

_ ¿Cómo averiguaría usted a partir de la matriz de correlacion, (a) si existe colinea-


lidad perfecta, (b) si existe colinealidad menos que perfecta y (e) si las X no están
correlacionadas?
Sugerencia: Utilice IR I para responder a estas preguntas, IR I denota el deter-
minante de R.

8.16 Variables explicativas ortogonales. Suponiendo que en el modelo X 2 a X k no están


correlacionadas. A tales variables se les denomina variables ortogonales. Si es este
caso,
(a) ¿Cuál será la estructura de la matriz (X'X)
(b) ¿Cómo obtendría usted P= (X'X) -1 X'y?
(c) ¿Cuál será la naturaleza de la matriz de var-cov de p?

* Opcional.
MULTICOLlNEALlDAD 245

(d) Suponga que usted ya ha corrido la regresión y que pOSterionnente desea intro-
ducir otra variable ortogonal, digamos la variableXu t en el modelo. ¿Se tienen
que volver a calcular todos los coeficientes anteriores desde Pt hasta Pt? ¿Por
qu6 sí o por qué no?
8.17 Considere el Siguiente modelo:
PND, = Pt + P2 M , + P3 M,-t + P4(M,- M,-t) + U,
donde PNBt = PNB en el período t, Mt = oferta de dinero en el período t,Mt -l
oferta de dinero en el período (t - 1) Y (Mt - 1 ) = variación de la oferta de
dinero entre el período t y el período (t - 1). Este modelo postula entonces que el
nivel del PNB en el período t está en función de la oferta de dinero en el período
t y el período (t - 1), como también de la variacion en la oferta de diBero entre
~stos períodos.
(a) Suponiendo que usted tiene la información necesaria para estimar el modelo
anterior, ¿tendría éxito en estimar todos los coeficientes para este modelo?
¿Por qué sí o por qué no?
(b) Si no es éste el caso, ¿qué coeficientes se pueden estimar?
(e) Suponiendo que el términoP~ M,-t estuviera ausente del modelo, ¿sería su res-
puesta a la pregunta (a) la misma?
(d) Repita (e) suponiendo que el ténninoP2 M,no esta presento en el modelo.
8.18 Demuestre que (7.4.7) y (7.4.8) también se pueden expresar cOmo:
p _ (L Y¡X2i)(L xii) - (¡y¡x 3 ¡)(L X2¡X~¡J
2 - (L X~¡)(L x~¡)(l - r~3)
p _ (L Y¡X3¡)(¡ xii) - (L y¡x?¡)(L X2¡X 3.)
3 - (L xi¡)(L x~¡)(l - ri3)
donde r 23 es el coeficiente de Merchandise imports, GNP lUId epI,
correlacion entre X2 YX3 • United States, 1976-1983
8.19 La siguiente tabla proporciona
datos sobre importantes, PNB Mercbandise CPI
imporú GNP AH ....
e índice de precios al consumidor Year (S, millioa) (S, llillioa) (1967 -100)
(IPC) para los Estados Unidos
durante el período 1970-1983. 1970 39866 992.7 116.3
1971 45579 1077.6 121.3
1972 55797 1185.9 125.3
1973 70499 1326.4 133.1
1974 103811 1434.2 147.7
1975 98185 1549.2 161.2
1976 124228 1718.0 170.5
1977 151907 1918;) 181.5
1978 176020 2163.9 195.4
1979 212028 2417.8 2l'i.4
1980 249781 2631.7 246.8
1981 265086 2957.8 272.4
1982 247667 3069.3 289.1
1983 261312 3304.8 298.4

Source: Eco"omic Report of tire Preside,,', 1985. Data on


imparts from table 8-98 (p. 344), GNP from table 8-1 (p. 232)
and ePI from table 8-52 (p. 291).
246 VIOLACION DE LOS SUPUESTOS DEL MODELO CLASICO

Se le solicita con~iderar el siguiente modelo:

In importaciones r = fJI + fJ2 In PNB t + fJ3 In IPC t + Ur


(a) Calcule los parámetros de este modelo utilizando la información dada en la
tabla.
(b) ¿Sospecha usted que existe multicolinealidad en los datos?
(e) Examine la naturaleza de la colinealidad utilizando el índice de condición.
(d) Regrese: (l) In importacionesr = Al + A 2 In PNB t \
. (2) In importacionesr = BI + B 2 In IPC t
(3) In PNB t = C I + C 2 In IPC t
Con base en estas regresiones, ¿qué puede decir usted sobre la naturaleza de
la multicolinealidad en los datos?
(e) Suponiendo que existe multicolinealidad en los datos pero que P2 y P3 son in-
dividualmente significativas al nivel deiS % Y que la prueba global F también
es significativa; en este caso, ¿debemos preocuparnos sobre el problema de la
multicolinealidad?
8.20 Utilizando (3.3.1) y (3.3.2) para el caso de regresión simple para el caso de regre-
sión múltiple, demuestre que cuando existe una colinealidad perfecta las varianzas
de los parámetros estimados son infinitas.
8.21 Verifique'que los errores estándar de las sumas de los coeficientes de las pendientes
estimadas utilizando (8.5.1) y (8.5.2) son respectivamente 0.1992 y 0.1825 (Véase
Sección 8.5). .
8.22 Para el modelo de regresión (7.1.1.) con k variables, se puede demostrar que la va-
rianza del coeficiente de regresión parcial késimo (k = 2, 3, .... , K) se puede expre-
sar como:·

donde 0'; = varianza de Y,O'; = varianza de la késima variable explicativa, R; = R 2


de la regresión de X k en las restantes variables X y R 2 = coeficiente de termina-
ción de la regresión múltiple (7.7.1), es decir, la regresión de Y sobre la totalidad
de las variables X.
(a) Permaneciendo constantes otros factores, si 0'; aumenta, ¿qué ocurre con la
var (Pk)? ¿Cuáles son las implicaciones de esto en el problema de multicolinea-
lidad?
(h) ¿Qué ocurre con la fórmula anterior cuando la colinealidad es perfecta?
(e) Verdadero o falso: "La varianza de Pk disminuye a medida que aumenta el
R 2 , de tal manera que el efecto de un elevadOR; puedecontrarrestarseconR 2
elevado". ¿Por qué?

• Esta fórmula está dada por Stone, ,R. uThe Analysis of Market Demand" ,Journal o[ the Royal Sta-
tistical Socíety, vol. B7, 1945, p. 297. Para un amplio análisis, véase Peter Kennedy •• ~ Cuide to Eco:
nometrics, 2 ed., The MIT Press, Cambridge, 1985, p. 156.
CAPITULO 9
HETEROCEDASTICIDAD

Un supuesto importante del modelo clásico de regresión lineal es que las per-
turbaciones u 1 de la función de regresión poblacional son homocedásticas, es
decir, que todas tienen la misma varianza. En este capítulo examinaremos la
validez de este supuesto y averiguaremos qué ocurre si no se cumple. Como
en el Capítulo 8, buscamos respuestas a las siguientes preguntas:

1. ¿Cuál es la naturaleza de la heterocedasticidad?


2. ¿Cuáles son sus consecuencias?
3. ¿Cómo se detecta?
4. ¿Cuáles son las medidas remediales?

9.1 NATURALEZA DE LA HETEROCEDASTICIDAD


Como se mencionó en el Capítulo 3, uno de los supuestos importantes en el
modelo clásico de regresión lineal es que la varianza de cada término de per-
turbación u" condicional a los valores escogidos de las variables explicativas,
es un número constante igual a (12. Este es el supuesto de homocedasticidad
o igual (horno) dispersión (cedasticidad), es decir, igual varianza. En símbolos,
i = 1,2, ... , N (9.1.1)
Gráficamente, para el modelo de regresión lineal de dos variables se puede
ilustrar la homocedasticidad a través de la Figura 3.5 que por conveniencia se
reproduce en la Figura 9.1. Como ilustra la figura, la varianza condicional de
Y¡ (la cual es igual a la de u¡), condicional al Xi dado, sigue siendo igual,
independientemente de los valores que tome la variable X.
247
248 VIOLACION DE LOS SUPUESTOS DEL MODELO CLASICO

..,
..,•
.
.~

FIGURA 9.1
Perturbaciones homocedásticas.

En contraste, obsérvese la Figura 9.2 en la cual se muestra que la varianza


condicional aumenta a medida que X aumenta. En este caso, las varianzas de
Y¡ no son las mismas. Por tanto, existe heterocedasticidad. En símbolos,

E(Uf) = qf (9.1.2)
Obsérvese el subíndice de q2, que nos recuerda que las varianzas condi-
cionales de U¡ (= varianza condicional de Y¡) no continúan siendo constantes.
Para aclarar' la diferencia existente entre la homocedasticidad y la heteto-
cedasticidad, supongamos que en el modelo de dos variables, Y¡ = PI + P2 X¡
+ U¡. Y representa los ahorros y X el ingreso. Las Figuras 9.1 y 9.2 muestran
que a medida que aumenta el ingreso también aumentan los ahorros en pro-
medio. Sin embargo, en la Figura 9.1 la varianza de los ahorros permanece
igual a todos los niveles de ingresos mientras que en la Figura 9.2' dicha va-
rianza aumenta con el ingreso. Al parecer, en la Figura 9.2 no sólo las familias
de mayores ingresos ahorran en promedio

..,
•.,
~
5
Q, y

x
FIGURA 9.2
Perturbaciones heterocedásticas.
HETEROCEDASTICIDAD 249

FIGURA 9.3
Ilustración de la heterocedastioidad.

más que las familias de ingresos inferiores, sino que también existe una ma-
yor variabilidad en sus ahorros.
Existen diferentes razones que explican la variación en las varianzas de
u, j algunas de las cuales se mencionan a continuación .1
l. Siguiendo modelos de aprendizaje por error, a medida que las personas
aprenden, sus errores de comportamiento se hacen mas pequefios a través
del tiempo. En este caso, se espera que uf disminuya. A manera de
ejemplo, consideremos la Figura 9.3 que relaciona el número de errores
mecanográficos cometidos durante un tiempo en un examen en relación
con las horas dedicadas a la práctica de la mecanografía. Como muestra la
Figura 9.3, a medida que el número de horas de práctica aumenta, dismi-
nuye el número promedio de errores mecanográfi~os como también su
varianza.
2. A medida que aumenta el ingreso, las personas tienen un· mayor ingreso
discrecionaP y por tanto, un mayor número de posibilidades en las cua-
les utilizar su ingreso. En consecuencia, uf puede aumentar con el ingre-
so. Como resultado de ello, en la regresión del ahorro en el ingreso es
probable encontrar que uf aumenta con el ingreso (como en la Figura
9.2), debido a que las personas tienen un número mayor de formas alter-
nas en las cuales colocar sus ahorros. En forma similar, se espera que las
empresas con mayores ganancias muestren generalmente mayor variabili-

1 VhI.e Stefan VaJavanis, Econometrlc., McGraw-Hill Book Company, Nueva York, 1959, p. 48.
2 Tomando las palabras de VaJavanis, "el in¡relO crece y la gente entonces escasamente diferencia los
dólares, mientras que anteriormente escasamente diferenciaban las monedas de 10 centavos". lbid,
p.48.
250 VIOLACION DE LOS SUPUESTOS DEL MODELO CLASICO

TABLA 9.1
Salarios por empleado ($) en las industrias manufactureras de artículos no durables,
de acuerdo con el tamaño del empleo del establecimiento.
Tamaño del empleo (número promedio de empleados)

Industria 1-4 S-9 1&-19 lé)..49 50-99 100-149 250-499 500-999 1000-1499
Alimentos y productos 2994 3295 3565 3907 4189 4486 4676 4968 5342
afines
Productos del tabaco 1721 2057 3336 3320 2980 2848 3072 2969 3822
Prod uctos textiles 3600 3657 3674 3437 3340 3334 3225 3163 3168
Vestidos y productos 3494 3787 3533 3215 3030 2834 2750 2967 3453
relacionados
Papel y productos 3498 3847 3913 4135 4445 4885 5132 5342 5326
relacionados
Impresi6n y 3611 4206 4695 5083 5301 5269 5182 5395 5552
publicaci6n
Productos químicos 3875 4660 4930 5005 5114 5248 5630 5870 5876
Y relacionados
Petróleo y productos 4616 5181 5317 5337 5421 5710 6316 6455 6347
del carbón
Productos de caucho 3538 3984 4014 4287 4221 4539 4721 4905 5481
Y plástico
Cuero y productos 3016 3196 3149 3317 3414 3254 3177 3346 4067
derivados

Salario promedio 3396 3787 4013 4104 4146 4241 4387 4538 4843
Desviación estándar 743.7 851.4 727.8 805.06 929.9 1080.6 1243.2 1307.7 1112.5
Productividad promedio 9355 8584 7962 8275 8389 9418 9795 10281 11750

Fuente: The Cenaus 01 ManrJlacturers, U.s. Department of Commerce, 1958 (calculado).

dad en sus políticas de distribución de dividendos que la que mostrarían


empresas con menores ganancias. De igual manera, empresas orientadas
hacia el crecimiento muestran probablemente una mayor variabilidad en
sus tasas de dividendos pagados que las que presentan empresas ya esta-
blecidas.
3. A medida que mejoran las técnicas de recolección de datos, es probable
que uf tienda a disminuir. Por tanto, bancos que cuentan con equipos
de procesamiento de datos muy sofisticados probablemente tiendan a co-
meter menos errores en los extractos bancarios mensuales y trimestrales
que envían a sus clientes, que aquellos bancos que no poseen este tipo de
herramientas.

Conviene señalar que el problema de heterocedasticidad tiende a ser mas


común en series de corte transversal que en series de tiempo. Por lo general,
en datos de corte transversal se trabaja con miembros de una población en un
momento determinado en el tiempo, tales como consumidores individuales y
sus familias, empresas, industrias y subdivisiones geográficas, como países,
HETEROCEDASTICIDAD 251

ciuQades o estados, etc. Además, dichos miembros pueden ser de diferentes


tamaños, tales como empresas grandes, medianas o pequeñas o firmas con ni-
veles\ de ventas altos, bajos o medianos. Por otra parte, en los datos de series
de tiép1po las variables tienden a tener órdenes de magnitud similares porque
generalmente se recolectan los datos para la misma entidad durante un tiem-
po. Como ejemplo de ello podemos citar los casos del PNB, los gastos de con-
sumo, los ahorros o las tasas de desempleo en los Estados Unidos durante el
período cómprendido entre 1950 y 1986.
Para ilustrar el hecho de que la heterocedasticidad tiende a encontrarse
en análisis de series de corte transversal, consideremos la Tabla 9.1 en la cual
se presenta información relacionada con la compensación por empleado en
10 industrias manufactureras de bienes perecederos, clasificadas según el nú-
mero de empleados de cada empresa para el año 1958. En la tabla también se
presentan los niveles de productividad promedio para 9 clases de empleos.
Aunque las industrias difieren en la composición de su producción, la
Tabla 9.1 muestra claramente que en promedio las empresas grandes pa~an
más que las pequeñas. Como ejemplo de ello se tiene que las empresas que
emplean entre uno y cuatro individuos pagaron en promedio aproximada-
mente $3396 pesos, mientras que aquellas que emplearon entre 100 Y 2499
empleados en promedio pagaron cerca de $4843. Obsérvese, sin embargo,
que existe una considerable variabilidad entre los salarios ,de las diferentes
clases de empleados, como lo comprueban las desviaciones estándar 'estima-

® Salario promediol t 1 Rango


$7000

6000
o
'O
os
.Sl SOOO
s:>.
..e
..
o
s:>. 4000
o
'5-¡¡¡ •
<Il
3000

.:::IL-__-L__
1-4
~
5-9
____-L__
10-19
~ ~ ~, ~~~~~~~--
____
20-49
__
50-99
____
100-249 250-499 500-999 1000-2499
Número promedio de empleados

FIGURA 9.4
Salarios por empleado, en relación con el tamaño del empleo.
252 VIOLACION DE LOS SUPUESTOS DEL MODELO CLASICO

das de los ingresos recibidos. Lo anterior se puede observar también en la


Figura 9.4 que muestra el rango de ingresos laborales para cada catego-
ría de empleados. Como muestra la figura, el rango (la diferencia entre el
valor más alto y el más bajo), una medida general de variabilidad, difiere de
una clase a otra, indicando la presencia de heterocedasticidad en los ingresos
para las diferentes categorías de empleados.

9.2 LA ESTIMACION DE MCO EN PRESENCIA DE


HETEROCEDASTICIDAD
¿Qué ocurre con los estimadores de MeO y sus varianzas si introducimos he-
terocedasticidad, haciendo E(ut) = qt pero manteniendo los restantes supues-
tos del modelo clásico? Para responder a este interrogante, regresemos al
modelo de dos variables:
Y¡ = /31 + /32X¡ + U¡
.
Al aplicar la fórmula tradicional, el estimador de MeO para P2 es igual a:

(9.2.1)

Sin embargo, su varianza está ahora dada por (véase Apéndice 9.A, Secciór
9.A.l):

(9.2.2)

que es obviamente diferente a la fórmula tradicional de la varianza de /32 obte-


nida bajo el supuesto de homocedasticidad, la cual era igual a

(9.2.3)

Claro está que si qt = q2 para cada i, las dos fórmulas serán idénticas. (¿Por
qué?)
Recordemos que P2 es el mejor estimador lineal insesgado (MELO si se
cumplen los supuestos del modelo clásico, incluyendo el de homocedasticidad.
¿Continúa siendo /32 MELI cuando eliminamos el supuesto de homocedastici-
dad y lo remplazamos por el supuesto de heterocedasticidad? Es fácil probar
que $2 sigue siendo lineal e insesgado. De hecho, como se muestra en el
Apéndice 3A, Sección 3.A.3, para establecer el insesgamiento de /12 no se
requiere que las perturbaciones (u¡) sean homocedásticas. En efecto, la va-
rianza de U¡, homocedástica o heterocedástica no juega papel alguno en la
determinación de la propiedad de insesgamiento.
HETEROCEDASTICIDAD
253
Dado que p2continúa siendo lineal e insesgada, ¿es "eficiente" o "el
mejor" estimador? o en otras palabras, ¿tiene varianza mínima en la clase de
estimadores lineales insesgados? ¿Y está e~a varianza mínima dada por la
ecuación (9.2.2)? La respuesta a ambas preguntas es no: #2 no continúa sien-
do mejor estimador y la varianza mínima no está dada por (9.2.2). Enton<;es,
¿qué es MELI en presencia de heterocedasticidad? La respuesta la encontra-
remos en la siguiente sección.

9.3 EL METODO DE LOS MINIMOS CUADRADOS


GENERALIZADOS (CMG)
¿Por qué no está el estimados tradicional de MCO de (J2 dado en (9.2.1)
. como el mejor estimador, a pesar de ser aún insesgado? Intuitivamente pode-
mos ver la razón de lo anterior, a partir de la Figura 9.4. Como muestra esta
figura, existe una variabilidad considerable en los ingresos .laborales de las
diferentes clases de empleos. Si procediéramos a regresar los salarios por em-
pleado en la cantidad de empleos existentes, probablemente estaríamos inte-
resados en utilizar el hecho de que conocemos que existe una variabilidad
considerable en los ingresos entre las diferentes clases. Idealmente, nos gus-
taría establecer un esquema de estimación tal que aquellas observaciones
provenientes de poblaciones con mayor variabilidad reciban un menor "peso"
que aquellas que' provienen de poblaciones con una variabilidad más pcquefia.
Al examinar la Figura 9.4 posiblemente nos gustaría "ponderar" las observa-
ciones provenientes de las clases de empleo 10-19 Y 2049 con un "peso"
mayor que el que se le asignara a aquellas provenientes de las clases de empleo,
digamos, 5-9 y 250499, puesto que las primeras están más a~padas alrede-
dor de sus valores promedio que las últimas, permitiéndonos así estimar la
FRP en forma más exacta. .
Infortunadamente, el método usual de MCO no sigue esta estrategia y,
por lo tanto no utiliza la "ínformación" contenida en la variabilidad desigual
de la variable dependiente Y, (por ejemplo, los salarios de los empleados de
la Figura 9.4): asigna una ponderación o un peso o una importancia igual a
cada observación. Sin embargo, un método de estimación conocido como
método de mínimos cuadrados generalizados (CMG) toma en cuenta esta
información explícitamente, produciendo, por tanto, estimadores que
sean MELI. Para ver cómo se logra 10 allterior, continuemos con nuestro ya
conocido modelo de dos variables:
(9.3.1)
el cual, en aras de facilitar las manipulaciones algebraicas, se expresará de la
siguiente manera:
Y¡ = {J1XO¡ + {JzX¡ + U¡ (9.3.2)
donde X O¡ = 1 para cada i. El lector puede verificar que estas dos formulacio-
nes son idénticas.
Ahora supongamos que se conocen las varianzas heterocedásticas (11 . Di-
vidiendo (9.3.2) por (1, , obtenemos: '
254 VIOLACION DE LOS SUPUESTOS DEL MODELO CLASICO

(9.3.3)

que, para efectos de simplificar la exposición, se escribirá de la siguiente


forma:
(9.3.4)

donde las variables con asterisco o transformadas corresponden a las varia-


bles originales divididas por el (valor conocido) Ui' Utilizamos la notación
P! y fJ!, los parámetros del modelo transformado, para distinguirlos de los
parámetros normales de MCO PI y P2' .
¿Cu~l es el propósito de transformar el modelo original? Para compren-
derlo, observemos la siguiente característica del término de error transforma-
d o u¡*..

var (un = E(un = E(~r


2

1
= 2" E(uf) dado uf se conoce
Ui

=1 (9.3.5)

la cual es una constante. En otras palabras, la varianza del término de pertur-


bacÍón transformado u¡* es ahora homocedástica. Puesto que continuamos
reteniendo los restantes supuestos del modelo cIásicv, el hecho de encontrar
que u* sea homocedástica sugiere que si aplicamos el mé.todo de MCO al
nlodelo transformado (9.3.3) se obtendrán estimadores que sean MELI. En
resumen, los PT y /31 estimados serán ahora MELI, a pesar de que los esti-
madores MCO P1Y Pl no lo sean.
Este procedimiento de transformar las variables originales de tal manera
que las variables transformadas satisfagan los supuestos del modelo clásico, y
de aplicar a continuación MCO se conoce como el método de mínimos cua~
drados generalizados (MCG). MCG es MCO aplicados sobre las variables
transformadas que satisfagan los supuestos tradicionales de los mínimos cua-
drados. Los estimadores obtenidos de esta manera se conocen como estima-
dores de MCG, los cuales son MELI.
La mecánica específica para estimar Pt y P1 es la siguiente. Primeró, se
determina la FRM para (9.3.3)

Y;
~
= P!(X Oi ) +
~
P!(X
~
i
) + (~)
~
o (9.3.6)
HETEROCEDASTICIDAD 257

lo cual implica que ambos son estimadoresinsesgados. Sin embargo, sabemos


. que Pi es eficiente, es decir, que tiene la varian?:a más pequeña. ¿Qué ocu-
rre con nuestros procedimientos para establecer intervalos de confianza,
pruebas de hipótesis, etc., si continuamos utilizando el estimador P2 de
MCO? En esta situación, tenemos que distinguir dos casos.

Estimación de MCO permitiendo heterocedasticidad


Suponiendo que utilizamos #2 y la fórmula para la varianza dada en (9.2.2),
que toma en cuenta la presencia de heterocedasticidad en forma explícita.
Utilizando esta varianza y suponiendo que se- conocen losa; , ¿podemos
establecer intervalos de confianza y pruebas de hipótesis utilizando las pruebas
t y F? La respuesta generalmente es negativa, puesto que se puede demostrar
que var ({Ji) s var (#2),4, lo cual implica que los intervalos de confianza
basados en esta última serán innecesariamente mayores. Como resultado, las
pruebas t y F posiblemente producirán resultados inexactos puesto que la
var de (P2) es excesivamente grande y l!l que parece a primera vista ser un coe-
ficiente estadísticamente no significativo (porque el valor t es más pequeño
que lo adecuado), de hecho puede s'er significativo si los correctos intervalos
de confianza se establecieran con base en el procedimiento de MCG.

ESTIMACION DE MCO SIN TENER EN CUENTA LA PRESENCIA DE


HETEROCEDASTICIDAD
La situación· se complica si no solamente utilizamos #2, sino que continua-
mos usando la fórmula de la varianza tradicional (homocedástica) dada en
(9.2.3), aun en d caso en que esté presente o se sospeche que exista hetero-
cedasticidad: obsérvese que este puede ser el caso común a los dos que men-
cionamos aquí, porque al correr un paquete de regresión estándar de MCO e
ignorar (o no conocer) la heterocedasticidad producirá uria varianza de P2
dada por (9.2.3). Ante todo. var (#2) dada en (9.2.3) es un estimador ses-
gado de var (#2) dada en (9.2.2), hecho que implica que, en promedio, se
está sobreestimando o subestimando esta última. En general, no podemos
darnos cuenta de si dicho sesgo es positivo (sobreestimacion) o negativo (sub-
estimación), porque él depende de la naturaleza dela relación existente entre
af y los valores que toma la variable explicativa X, como se puede ver clara-
mente en (9.2.2) (véase Ejercicio 9.17). El sesgo surge del hecho de que q2 .
el estimador convencional de a 2 , es decir, ¿ ef/(N - 2) no continúa sien-
do un estimador insesgado de este último cuando se cuenta con la presencia

4 Una prueba formal se puede encontrar en Phoebus J. Dhrymcs, Introductory Econometrics, SpTin-
gcr-Vcrlag, Nueva York, 1978, pp. 110-111. A propósito. con respecto a la pérdida de eficiencia de
¡i,(es decir, en cuánto excede la var (/3 2 ) a la var (/ij) depende de los valores 'lluestrales de las varia-
bies X y del valor de r1¡.
258 VIOLACION DE LOS SUPUESTOS DEL MODELO CLASICO

de heterocedasticidad. Como resultado de ello, no podemos continuar basán·


donos en los intervalos de confianza calculados convencionalmente ni en las
pruebas t yP utilizadas convencionalmente. En resumen, si continuamos
utilizando los procedimientos de prueba usuales a pesar de la presencia de
heterocedasticidad, independientemente de las conclusiones o inferencias
que realicemos, podemos llegar a cometer serios errores.
De la anterior discusión, es claro que la heterocedasticidad es un proble-
ma potencialmente serio que el investigador necesita conocer si está presente
en una situación dada. Si se detecta su presencia, entonces se pueden tomar
acciones correctivas como utilizar la regresión de mínimos cuadrados ponde-
rados ~ alguna técnica alterna. Sin embargo, antes de examinar los diferentes
procedimientos correctivos, debemos primero averiguar si está presente o si
existe alguna posibilidad de que esté presente la heterocedasticidad en un
caso dado. Este tema se tratará en la siguiente sección.

9.5 COMO DETECTAR LA HETEROCEDASTICIDAD


Como hicimos con la multicolinealidad, es preciso preguntarnos ¿cómo sabe-
mos que en una situación dada se presenta heterocedasticidad? Nuevamente,
como en el caso de la multicolinealidad, no existen reglas fijas y seguras para
detectarla, sino solamente unas cuantas normas muy generales. Esto es ine-
vitable, ya que sólo se conoce uf cuando conocemos la totalidad de la po-
blación Y correspondiente a las X escogidas, como fue el caso de la pobla-
ción que se presenta en las Tablas 2.1 Ó 9.1. Sin embargo, tales datos son una
excepción antes que una regla en la mayoría de las investigaciones económi-
cas. En esto difieren los econometristas de los científicos de otros campos
como la agricultura y la biología, en donde se puede tener suficiente control
sobre los temas de investigación. Lo más común es que en los estudios eco-
nómicos sólo exista un valor muestral de Y para cada valor particular de X y
por esto no existe manera de conocer ut a partir de una sola observación de
Y. Es así como en la mayoría de investigaciones econométricas, la hetero-
cedasticidad puede ser el resultado de la intuición del investigador de un tra-
bajo educado de prestidi$itación, de experiencia empírica previa o de pura
especulación.
Teniendo en cuenta la anterior advertencia, examinemos algunos de los
métodos formales e informales para detectar la heterocedasticidad. Como
revelará la discusión siguiente, la mayoría de estos métodos están basados en
el examen de los residuos e¡ de MCO, puesto que éstos son los que observa-
mos y no las perturbaciones U¡ • Esperamos que los e¡ sean buenas estimacio-
nes de u¡ , lo cual se puede cumplir si el tamaño de la muestra es relativamen-
te grande.

5 De la ecuacion (5:3.6) sabemos que el intervalo de confianza del 100(1 - IX) % para /32 es
[$2 ± t./ 2 ($2)]. Sin embargo, si ($2) no se puede estimar en forma insesgada, ¿cómo podemos con·
fiar en el intervalo de confianza calculado convencionalmente?
HETEROCEDASTICIDAD 259

••••••••
•• •• •• • ••••
e••••••••••••••
: ._ •• e.e. •• • ••

~--------------y o'"'-----------------y ~~~-----------y


V
(a) (b) (e)

oL---------------~~-y

(d) (e)

FIGURA 9.6
Patrones hipotéticos de los residuos estimados al cuadrado.

Naturaleza del problema. Muy a menudo la naturaleza del problema que se


está considerando sugiere la existencia de heterocedasticidad. Por ejemplo,
siguiendo el trabajo pionero de Prais y Houthakker sobre el tema de los pre-
supuestos familiares. en el cual encontraron que la varianza de los residuos
alrededor de la regresión del consumo en el ingreso aumentaba con el ingre-
so, se asume generalmente en la actualidad que en encuestas, similares se pue-
den esperar varianzas desiguales entre las perturbaciones. 6 De hecho, en las
series de corte transversal que involucren unidades heterogéneas la hetero-
cedasticidad puede ser la regla general en lugar de la excepción. De esta for-
ma, en un análisis de corte transversal que involucre los gastos de inversión
en relación con las ventas, la tasa de interés, etc., se espera generalmente la
presencia de heterocedasticidad si se incluyen en la muestra en conjunto
empresas pequeñas, medianas y grandes.

Método gráfico. En la práctica, c.uando no existe información a priori o


empírica acerca de la heterocedasticidad, se puede llevar a cabo el análisis
de regresión sobre el supuesto de que no existe heterocedasticidad y luego
realizar un examen posterior (post mortem) de los residuos estimados al cua-

6 S. J. Prais y H. S. Houthakker, The Analysis o[ Family Budgets. The Cambridge University Press,
. Nueva York, 1955.
260 VIOLACION DE LOS SUPUESTOS DEL MODELO CLASICO

••••••••
•• •• • •••
••• •••••••••
••
••
•• •• •• • •••
• • •• • ••
x ~--------------x L-::~------------x
O O
(a) (b) (e)

x L--------------------x
O O
(d) (e)

FIGURA 9.7
Diagrama de dispersión de los residuos estimados al cuadrado grafieados contra X.

drado e¡ para ver si ellos presentan algún patrón sistemático. Aunque e~ y


u~,no son la misma cosa, pueden usarse como aproximaciones, especialmente
cuando la muestra es suficientemente grande. 7 Al examinar los e¡ podemos
encontrar patrones como los que aparecen en la Figura 9.6.
En la Figura 9.6, los e~ se grafican contra Y; , el valor estimado de Y¡
para ~a línea de regresión, siendo la idea averiguar si el valor promedio esti-
mado de Y está sistemáticamente relacionado con el residuo al cuadrado. En
la Figura 9.6 a se advierte que ,no existe un patrón sistemático entre las dos
variables, 10 cual sugiere la inexistencia de heterocedasticidad en la informa-
ción. No obstante, las Figuras 9.6 b a e presentan patrones definidos. Por
ejemplo, la Figura 9.6 e sugiere una relación lineal mientras que las Figuras
9.6 d y e indican una relación cuadrática entre e¡ y Y;. Utilizando estos
conocimientos, aunque sean informales, se pueden transformar los datos de
tal manera que éstos, una vez transformados, no presenten heterocedastici-
dad. En la Sección 9.6 examinaremos alguna de estas transformaciones.
En lugar de graficar los er
contra los Y; ,podemos trazarlos contra una
de las variables explicativas, especialmente si al graficar er
contra Y; se pro-

7 Sobre la relación entre ei y,u¡. véase E. Malinvaud, Statistical Methods of Econometrics. North-"lo-
lland Publishing Company, ,Amsterdam, 1970, pp, 88-89. "
HETEROCEDASTICIDAD 261

duce el patrón que se ilustra en la Figura 9.6 a.Este diagrama. que se mues-
tra en la Figura 9.7, puede revelar patrones similares a aquellos dados en la
Figura 9.6. (En el caso del modelo de dos variables. graficar contra Y; es er
equivalente a graficar e¡ contra X¡, siendo la Figura 9.7, por tanto, similar a
la Figura 9.6. Sin embargo, éste no es el caso cuando consideramos un mode-
lo que involucre dos o más variables X¡ en esta situación ef se puede graficar
contra cualquier variable X incluida en el modelo).
U n patrón como el que se ilustra, en la Figura 9.7 C, por ejemplo, sugiere
que la varianza del término de perturbación está linealmente relacionada con
la variable X. Por tanto, si en la regresión de los ahorros en el ingreso se en-
cuentra un patrón tal como el que se ilustra en la Figura 9.7 C, se puede con-
cluir que la varianza heterocedástica puede ser proporcional al valor de la
variable ingreso. Este conocimiento puede ayudarnos a transformar nuestros
datos, de tal manera que en la regresión que utilice los datos transformados.
la varianza de la 'perturbación sea homocedástica. Regresaremos a este tema
en la siguiente sección.

Prueba de Park. 8 Park ha formalizado el método gráfico sugiriendo que (J; es


una función de la variable explicativa Xi. La forma funcional propuesta por
él es

o In (Jf = In (12 + {3 In Xi + Vi (9.5.1)

donde Vi es el término estocástico de perturbación.


Dado. que (J? es por lo general desconocida. Park propone que se useef
como aproximación y que se realice la siguiente regresión:

In ef = In (12 + {3 In Xi + Vi
= IX + {3 In Xi + Vi (9.5.2)

Si {3 resulta ser estadísticamente significativa, puede implicar la existencia de


heterocedasticidad en los datos. Si resulta ser no significativa, podemos acep-
tar el supuesto de homocedasticidad. La prueba de Park es, por tanto, un
procedimiento en dos etapas. En la primera etapa, corremos la regresión de
MeO independientemente del problema de heterocedasticidad. Obtenemos
e¡ de esta regresión y entonces, en la segunda etapa se corre la regresión
(9.5.2) ..
Aunque es empíricamente llamativa, la prueba de Park tiene algunos
problemas. Goldfeld y Quandt han argumentado que el término de error Vi
que entra en (9.5.2) puede no satisfacer los supuestos de MeO, pudiendo ser

~ R.[. Park, "Estimation with Hcteroscedastic Error Terms", Econométrica, vol. 34, No. 4, p. 888,
octubre, 1966. .
262 VIOLACION DE LOS SUPUESTOS DEL MODELO CLASICO

en sí mismos heterocedásticos. 9 Sin embargo, se puede usar ~omo un méto-


do estrictamente indicativo.
Para ilustrar el enfoque de Park, utilicemos los datos de la Tabla 9.1
para realizar la siguiente regresión:
Y¡ = /31 + /32 X¡ + U¡
donde Y = salario proinedio en miles de dólares, X = productividad prome-
dio en miles de dólares, i = iésima escala del empleo del establecimiento. Los
resultados de la regresión son los siguientes:
~ = 1999.0466 + 0.2323X¡
(0.1000) (9.5.3)
t = (2.323) . R2 = 0.4356
Los resultados nos indican que el coeficiente estimado de la pendiente es sig-
nificativo a un nivel del 5 %, con base en una prueba t de una cola. La ecua-
ción muestra que a medida que la productividad de la mano de obra aumenta
en un dólar, por ejemplo, la remuneración media del trabajo aumenta en
cerca de 23 centavos.
Los residuos obtenidos de la regresión (9.5.3) se regresaron contra la
variable X¡, como se sugiere en la ecuación (9.5.2), obteniéndose los siguien-
tes resultados:
In ef = 35.9010 - 2.8099 In X¡
(4.216) (9.5.4)
t = (-0.667) R2 = 0.0595
Obviamente, no existe una relación estadísticamente significativa entre las
dos variables. Siguiendo la prueba de Park se puede concluir que no existe
heterocedasticidad en la varianza del error .10
Prueba de Glejser. l l La prueba de Glejser es similar en concepción a la de
Park. Después de obtener los residuos e¡ de la regresión de MeO, Glejser
sugiere regresar los valores absolutos de e¡,.1 e¡ 1, sobre la variable X que se
cree está más asociada con uf. En sus experimentos, Glejser utilizó las siguien-
tes formas funcionales:

9 Stephen M. Goldfeld 'y Richard E. Quandt, Nonlinear Methods in Econometrics, North-Holland Pu-
blishing Company, Amsterdam, 1972, pp. 93-94.
10 La forma funcional específica escogida por Park es solo una sugerencia. Una forma funcional dife-
rente puede revelar una relación significativa. Por ejemplo, se puede utilizar ef en lugar del In ef como
variable dependiente.
11 H. Glejser, "A New Test for Heteroscedasticity", Joumal of the American Statistical Association,.
vol. 64, pp,,}16-323, 1969.
HETEROCEDASTICIDAD 263

le;! = PI + PZX¡ + V¡
Ie¡ I = PI + Pz}X; +'V¡
. 1
le;! = PI + pz X¡ + V¡
, 1
le¡j=Pl+Pz r,;+v¡
...;X¡
le;! = Jpl + P2 X ¡+ V¡
le;! = Jpl + P2 X f + Vi

donde Vi es el ténnino de error.


El método de Glejseres nuevamente una solución empírica o práctica;
sin embargo, Goldfeld y Quandt señalan que el término de error Vi tiene al-
gunos problemas y que su valor esperado es diferente de cero, está serial-
mente correlacionado (véase Capítulo 10) e irónicamente es heterocedástico. 12
Una dificultad adicional del método de Glejser consiste en modelos tales
como
y

son no lineales en los parámetros, y por tanto no pueden ser estimados con
el procedimiento usual de MCO.
Glejser ha encontrado que pará muestras grandes, los cuatro primeros
modelos proporcionan generalmente resultados satisfactorios para detectar la
heterocedastidad. En la práctica, la técnica de Glejser puede usarse entonces
para muestras grandes, pudiendo utilizarse muestras pequeñas como recurso
cualitativo dirigido a conocer más a fondo el problema de heterocedasticidad.
Prueba de correlación de rango de Spearman. El coeficiente de correlación
de rango de Spearman está dado por

(9.5.5)

donde di = diferencia en los rangos asignados a dos diferentes características


del iésimo individuo o fenómeno y N = número de individuos o fenómenos
clasificados. Este coeficiente de correlación de rango se puede utilizar para
detectar heterocedasticidad, de la siguiente manera: Supóngase que Y¡= Po +
PIX¡ + U¡.
Paso 1. Ajuste la regresión a los datos sobre Y y X Y obtenga los residuos ei.

12 Para mayores detailes véase Goldfeld y Quandt, op. cit., Cap. 3.


264 VIOLACION DE LOS SUPUEnOS DEL MODELO CLASICO

Paso n. Ignorando el signo de e¡, es decir, tomando el valor absoluto Ie¡j, ordene
tanto Ie¡ I como x¡ en forma ascendente y descendente y proceda a calcular elcoefi·
ciente de cOlTelación de rango de Speannan dado previamente.
, Paso 111. Suponiendo que el coeficiente de correlación de rango poblacional P. es
cero y N ~ S"la significancia del rs muestral se puede evaluar por medio de la prue·
ba t de la siguiente manera Y

( 9.5.6)

con g de 1 = N - 2.
Si el valor calculado de t excede el valor crítico de t, podemos aceptar
la hipótesis de heterocedasticidad; si 'no es así, podemos rechazarla. Si el
modelo de regresión involucra más de una variable X, el puede calcularse 's
entre I e¡ I y cada una de las variablex X separadamente, pudiendo evaluarse la
significancia estadística utilizando la prueba t dada anteriórmente.

TABLA 9.2
Prueba de correlación de rango para la heterocedasticidad

0'. d
E. Desviación Diferencia
Retorno estándar del I e.I** entre los
Nombre del promedio retorno Residuos Rango de Rango de dos d'-
fondo mutuo anual, % anual, % t*• I(E. - t.> I I e.l 0' • ordenamientos

Fondo de Boston 12.4 12.1 11.37 1.03 9 4 5 25


Fondo de Delaware 14.4 21.4 15.64 1.24 10 9 1 1
Fondo de equidad 14.6 18.7 14.40 0.20 4 7 -3 9
Inversionistas
Fundamental 16.0 21.7' 15.78 0.22 5 10 -5 25
Fondomutuo 11.3 12.5 11.56 0.26 6 5
de inversionistas
Fondo mutuo de 10.0 10.4 10.59 0.59 7 2 5 25
ventas de Loomis
Fondo mutuo de 16.2 ' 20.8 15.37 0.83 8 8 O O
Massachussetts 10.4 10.2 10.50 0.10 3 2 4
Fondo de Nueva'lnglaterra
Fondo Putnam de Boston 13.1 16.0 13.16 0.06 2 6 -4 16
Fondo de Wellington 11.3 12.0 11.33 0.03 3 -2 4

O 110

• Obtenido de la regresión: E, = 5.8194 + 0.4590 (1, •


•• Valor,absoluto de los residuos
Nota: El ordenamiento está en orden asceniJente de los valores.

13 Véase G. Udny Yule y M.G. Kendall, An lntroduction to the Theory 01 Statistics, Charles Griffin &
Company, Ltd., Londres, 1953, p. 455.
HETEROCEDASTICIDAD 265

Para ilustrar la prueba de correlación de rango, considérense los datos


de l~ Tabla 9.2, la cual es una submuestra de los datos de la tabla que perte-
necen al Ejercicio 5.13 Y que solicitan al estudiante estimar la línea de mer-
cado de capital para la teoría del portafolio, E¡ = PI + P2 u¡, donde E es la
tasa de retorno esperada sobre el portafolio y u es la desviación estándar de
la tasa de retorno. Puesto que los datos se refieren a 10 fondos mutuos de
inversión de diferentes tamaños y metas de inversión, se podría esperar
a priort la existencia de heterocedasticidad. Para evaluar ésta hipótesis apli-
camos la técnica de correlación de rangos. Los cálculos necesarios también
aparecen en la Tabla 9.2.
Aplicando la fórmula (9.5.s), obtenemos:
110
r. = 1 - 6 10(100 _ 1)

= 0.3333 (9.5.7)
Aplicando la prueba t, dada en (9.5.6), obtenemos
t = (0.3333)(J8)
JI - 0.1110
= 0.9998 (9.5.8)
Para 8 g de 1 este valor t no es significativo, aun a un "nivel de significancia
del 10%. Por tanto, no existe evidencia de una relación sistemática entre la
variable explicativa y los valores absolutos de los residuos, lo cual puede su-
gerir que no existe hete~ocedasticidad.

Prueba de Goldfeld-Quandt. 14 Este popular método es aplicable si se supone


que la varianza heterocedástica uf está positivamente relacionada con una de
las variables explicativas en el modelo de regresión. Por simplicidad, consi-
deremos el modelo tradicional de dos variables:
Y¡ = PI + P2 X¡ + U¡
Supongamos que ut está relacionada positivamente con Xi de la siguien-
te forma:
(9.5.9)
donde u 2 es una constante. 15
El supuesto (9.5.9) postula que uf es proporcional el cuadrado de la va-
riable X. Prais y Houthakker han encontrado que tal supuesto es útil en su
estudio de los presupuestos familiares.

14 Goldfeld y Quandt, op. cit.



15Este es úni"amente un supuesto factible. En realidad lo que se necesita es queO'~ esté monotónica-
mente relacionáQa con Xi.
266 VIOLACION DE LOS SUPUESTOS DEL MODELO CLASICO

Si (9.5 .9) es adecuada, significa que uf sería mayor cuanto mayor fueran
los valores de Xi' Si éste resulta ser el 'Caso, es probable que haya heteroce-
dasticidad en el modelo. Pa~a evaluar lo anterior' explícitamente, Goldfeld y
Quandt sugieren los siguientes pasos.

Paso 1. Ordenar las observaciones de acuerdo con los valores de X, comenzando con
el valor más bajo de X.
Paso 2. Omitir e observaciones centrales, donde e es especificada a priori y dividir las
restantes (N - e) observaciones en dos grupos de (N - e)/2 observaciones cada una.
Paso 3. Ajustar, regresiones separadas de MeO a las primeras (N - e)/2 observaciones
y a las últimas (N - e)j2 observaciones y obtener las sumas de residuos al cuadrado
respectivas SRC ¡ y SRC 2 , donde SRC¡, representa las SRC de la regresión correspon-
diente a los valores más pequeños de Xi (el grupo de varianzas pequeñas) y la SRC 2
de los valores más grandes de Xi (el grupo de varianza grande). Estas SRC tienen indi-
vidualmente
(N - e) (N - e - 2k)
-2- - k o 2 g de 1,

donde k corresponde al número de parámetros a estimar, incluyendo la intersección.


(¿Por qué?) Para el caso de dos variables, k es, por supuesto, igual a 2.
Paso 4. Calcular la relación:
SRC 2 /g de l
A=-- (9.5.10)
SRC 1 /g de l
Si se supone que los Ui tienen una distribución normal (lo cual es normalmente el caso)
y si el supuesto de homocedasticidod es válido, entonces se puede demostrar que;' de
(9.5.1 O) posee una distribución F donde los g de 1 del numerador y del denominador
son (N - e - 2k)j2.

Si en una aplicación el valor calculado ,1" (= F) es mayor que el valor


crítico de F al nivel de significancia que se haya escogido, podemos proceder
a rechazar la hipótesis de homocedasticidad, pudiendo entonces decir que
existe una gran probabilidad de que haya heterocedasticidad.
Antes de ilustrar la prueba mencionemos algo sobre la omisión de las
observaciones centrales c. Estas observaciones se omiten buscando acentuar
la diferencia exist~nte entre el grupo de varianza pequeña (es decir, SRC¡) y
el grupo de varianza grande (es decir, SRC 2 ). Sin embargo, la habilidad de la
prueba de Goldfeld-Quandt para llevar a cabo lo anterior en forma exitosa
depende de la manera como se escoja c. 16 Para el modelo de dos variables,

16 Técnicamente, la potencia de la prueba depende de cómo se escoge c, En estadística, la potencÚl de


una prueba se mide de acuerdo con la probabilidad de recoozar la hipótesis nula cuando ésta sea falsa,
[es decir, a través de 1 - Prob (error tipo 11)]. En este caso la hipótesis nula es que las varianzas de los
dos grupos son las mismas, es decir, existe homocedasticidad.
HETEROCEDASTICIDAD 267

TABLA 9.3
Datos hipotéticos sobre los gastos de
consumo (Y, $) y el ingreso (X, $)
para ilustrar la prueba de Goldfeld-
Quant
Los datos están ordenados de
acuerdo con los valores de X
y X Y X

55 80 55 80
65 100 70 85
70 85 75 90
80 110 65 100
79 120 74 J05
84 115 80 110
98 130 84 115
95 140 79 120
90 125 90 125
75 90 98 130
74 105 95 140
110 160 108 145
113 150 113 150
125 165 110 160
108 145 125 165 4 observaciones
115 180 115 180 intermedias
140 225 130 185
120 200 135 190
145 240 120 200
130 185 140 205
152 220 144 210
144 210 152 22Ó
175 245 140 225
180 260 137 230
135 190 145 240
140 205 175 245
178 265 189 250
191 270 180 260
137 230 178 265
189 250 191 270

los experimentos de Monte CarIo llevados a cabo por Goldfeld y Quand su-
gieren que e tiene un valor aproximado de 8, si el tamaño de la muestra es de
aproximadamente 30, siendo de aproximadamente 16 si el tamaño de la
muestra es de más o menos 60. Sin embargo, Judge et al. mencionan que e =
4 si N = 30 y e '= 10 si N es aproximadamente 60 se han encontrado satis-
factorios en la práctica. 17

17 George G. Judge, R. Carter HilI, Wi1Iiam E. Griffiths, Helmut Lutkepohl, Tsoung-Chao Lee, Intro-
duction to the Theory and Practice o{ Econometrics, John Wiley & Sons, Inc., Nueva York, 1982, p.
422.
268 VIOLACION DE LOS SUPUESTOS DEL MODELO CLASICO

Antes de continuar adelante se puede mencionar que en el caso de que


exista más de una variable X en el modelo, el ordenamiento de las observa-
ciones, primer paso en la prueba, se puede hacer de acuerdo a cualquiera de
ellas. Por tanto, en el modelo: Y¡ = Pi + P2 X 2i + P3X3i + P4X4i + U¡ , pode-
mos ordenar por rango los datos de acuerdo a cualquiera de estas variables
X. Si a priori no estamos seguros de cuál variable X es la adecuada, podemos
llevar a cabo la prueba sobre cada una de las variables X o por medio de la
prueba de Park sobre cada X.

Ejemplo ilustrativo
Para ilustrar la prueba de Goldfeld-Quandt, presentamos en la Tabal9.3 información
sobre los gastos de consumo en relación con diferentes niveles de ingreso para una se-
rie de corte transversal para 30 familias. Supóngase que postulamos que los gastos de
consumo están linealmente relacionados con el ingreso, pero que existe heterocedas-
ticidad en los datos. Asúmase adicionalmente que la naturaleza de la heterocedastici-
dad es similar a la que está dada en (9.5.9). El reordenamiento neceSlirio de los
datos para la aplicación de la prueba se presenta asimismo mediante la Tabla 9.3.
Al eliminar las cuatro observaciones intermedias se obtienen las regresiones de
MCO basadas en las primeras 13 observaciones y en las últimas 13 y sus sumas de
cuadrados residuales asociadas, las cuales se presentan a continuación (los errores.
tlstándar aparecen entre paréntesis).
Regresión con base en las primeras 13 observaciones:

f; = 3.4094 + 0.6968X i
(8.7049) (0.0744) r 2 = 0.8887

SCR! = 377.17
g de 1 = 11

Regresión con base en las 13 últimas observaciones:


Y; = -28.0272 + 0.7941X¡
(30.6421) (0.1319) r 2 = 0.76in

SCR 2 = 1536.8
g de 1 = 11

De los resultados anteriores obtenemos:


A. ,. SCR 2 / g de 1 = 1536.8/11
SCR¡/gdel 377.17/11
A. = 4.07
El valor crítico F para los 11 g del numerador y dtl los 11 g de 1 del denominador a
un nivel del 5% es igual a 2.82. Puesto que el valor estimado de F(=A.) excede el
valor crítico, podemos concluir que existe heterecedasticidad en la varianza del error.
No obstante, si el nivel de significancia se fija en 1 % , no podemos rechazar el supuesto
de homocedasticidad. (¿Por qué?).
HETEROCEDASTICIDAD 269

TABLA 9.4
Ilustración de la regresión de los mínimos cuadrados ponderados
Salarios Tamaño del empleo
(Y) (X) (J, Y,/(J, X,/(J,
3396 1 743.7 4.5664 0.0013
3787 2 851.4 4.4480 0.0023
4013 3 727.8 5.5139 0.0041
4104 4 805.06 5.0978 0.0050
4146 5 929.9 4.4585 0.0054
4241 6 1080.6 3.9247 0.0055
4387 7 1243.2 3.5288 0.0056
4538 8 1307.7 3.4702 0.0061
4843 9 1112.5 4.3532 0.0081

Fuente: Los datos de Y y 11, (desviación estándar de los salarios) co-


rresponden a la Tabla 9.1. Tamaño del empleo: 1 = 1-4 empleados,
2 = 'S -9 empleados, etc. Estos ultimos datos aparecen también en la
Tabla 9.1.
Nota: En la regresión (9.6.2), la variable dependiente es (Y¡/I1,) y las
variables independientes son (1/11,) y (X,!I1,).

Otras pruebas de heterocedasticidad. Existen otras pruebas diferentes. de


heterocedasticidad, cada, una basada en diferentes supuestos. Algunas de es-
tas pruebas son las siguientes: (1) Prueba de Bartlett de homogeneidad de la
varianza (véase Ejercicio 9.3), (2) Prueba de Breuscb-Pagan (véase Ejercicio
9.13), (3) Prueba de pico o prueba mdxima, (4) Prueba de heterocedasticidad
general de White 18 y (5) Prueba CUSUMS. 19 El lector interesado puede con-
sultar las refe~encias bibliográficas para obtener mayores detalles sobre di-
chas pruebas.

9.6 MEDIDAS REMEDIALES


Como hemos visto anteriormente, la heterocedasticidad no destruye las pro-
piedades de insesgamientc y de consistencia de los estimadores de MCO; sin
embargo, ya no son eficientes ni siquiera asint6ticamente (es decir, en mues-
tras grandes). Esta falta de eficiencia resta credibilidad a los procedimientos
de pruebas de hipótesis. Por esto es necesario introducir medidas remediales.
Existen dos enfoques para remediar el problema de heterocedasticidad: el
primero tiene que ver cuando se conoc'e uf , mientras que en el segundo, uf
no se conoce.

18 Un análisis relativamente concreto de la prueba del máximo y de la prueba de White se pueden en-
contrar en Thomas B. Fomby, R. Carter Hill, Stanley R. Johnson, Advanced Econometric Methods,
Springer·Verlag, Nueva York, 1984, pp. 194-197.
19 Véase A.C. Harvey, The Econometric Analysis of Time Series, John Wiley & Sons, Inc., Nueva York,
Halstead Press Book, 1981, pp. 151-153.
270 VIOLACION DE LOS SUPUESTOS DEL MODELO CLASICO

, 2
Cuando se conoce CTi : el método de mínimos cuadrados ponderados
Como vimos' en la Seccion 9.3, si se conoce I1r el método más directo de co-
rregir heterocedasticidad es a través de los llamados mínimos cuadrados pon-
derados, método en el cual los estimadores obtenidos son MELI.
Para ilustrar el método, supongamos que queremos estudiar la relación
existente entre los salarios y los niveles de empleo para los datos presentados
en la Tabla 9.1. En aras de la simplicidad, medimos el tamaño del empleo en
las siguientes nueve categorías: 1 (1-4 empleados), 2 (5 - 9 empleados), ... 9
(1000-2499 empleados), aunque también pudimos haberla medido utilizando
los puntos medios de las diferentes clases de empleos dados en la tabla (véase
Ejercicio 9-18).
Ahora bien, si Y representa el salario promedio por empleado ($), mien-
tras que X representa el número de empleados, procedamos a correr la si-
guiente regresión [véase ecuación (9.3.6)]
(9.6.1)
donde 11. son las desviaciones estándar de los salarios como se reportan en la
Tabla 9.1. Los datos necesarios para correr esta regresión están dados en la
Tabla 9.4.
Antes de analizar los resultados de la regresión, obsérvese que (9.6.1) no
tiene término de intersección. (¿Por qué?) Por tanto, se requiere utilizar el
modelo de "regresión a través del origen" para estimarPt y P! , tema que
ya se discutió en el Capítulo 6. Sin embargo, la mayoría de los paquetes eco-
nométricos 'de computador actualmente tienen una opción para eliminar el
término de intersección (véase SAS, por ejemplo). Adicionalmente 'nótese
una segunda característica interesante de (9.6.1): tiene dos variables explica-
tivas, (1/11;) y (X¡/I1¡) , mientras que si fuéramos a utilizar MCO, al regre-
sar los salarios en el tamaño del empleo, esa regresión tendría únicamente
una variable explicativa Xi' (¿Por qué?)
Los resultados de regresión utilizando CMP son:

--
(li/I1¡) = 3406.639(1/I1¡) + 154.l53(X¡jI1¡) (9.6.2)
(80.983) (16.959)
t = (42.066) (9.090)
R 2 = 0.9993 20

Para efectos de comparar estos resultados con los de MCO no pondera-


dos, a continuación presentamos estos últimos:

2
20 El R 2 de la regresión que pasa a través del origen no es directamente comparable con el R de la
regresión sin términos de intersección. El R 2 de 0.9993 obtenido toma en cuenta 10 anterior. (Véase
el paquete SAS para mayores detalles acerca de la manera como se corrige el R 2 ;para tener en cuenta
la ausencia del término de intersección).
HETEROCEDASTICIDAD 271

~ = 3417.833 + 148.767 X¡ (9.6.3)


(81.136) (14.418)
t = (42.125) (10.318) R 1 = 0.9383
En el Ejercicio 9.15 se pide al estudiante comparar estas dos regresiones.

Cuando se desconoce uf
En estudios econométricos, en muy contadas ocasiones se tiene conocimien-
to previo de los u~. Por tanto, si deseamos utilizar el metodo de mínimos
cuadrados ponderados previamente discutido, tendremos que recurrir a cier-
tos supuestos ad hoc, con cierto grado de razonabilidad sobre u~ para pro-
ceder a transfonnar el modelo de regresión original de tal manera que el mo-
delo transformado cumpla con el supuesto de homocedasticidad. Los MeO
pueden entonces aplicarse al modelo transfonnado, puestc. que los CMP no
son mds que los MCO aplicados a los datos transformados. . Si no se realizan
algunas de tales transfonnaciones, el problema de heterocedasticidad se torna
prácticamente insoluble. Ilustraremos a continuación algunas de dichas trans-
fonnaciones, con la ayuda del modelo de dos variables.
Y; = P1 + P1X¡ + U¡
Se pueden considerar a continuación diferentes supuestos posibles sobre el
patrón existente de heterocedasticidad.

Supuesto 1
(9.6.4)21
Si, como resultado de "especulación", a partir de los métodos gráficos o
del enfoque de Park y Glejser se cree que la varianza de Uf es proporcional al
cuadrado de la variable explicativa X, se puede proceder a transformar el
modelo original de la siguiente manera. Dividimos el modelo original por Xi:
l'í. PI P +-
-=-+ UI
Xi Xi 2 Xi
1
== PI X, + P2 + V, (9.6.5)

donde V¡ es el ténnino de perturbación transfonnado e igual a ut!X¡. Es fácil


entonces verificar que
E(v¡)
2
1
=E
()2 =

X.
2
X~ E(u¡)
. I I

= (12 utilizando (9.6.4)

21 Recuérdese que ya hemos Ilncontrado anteriormente este supuesto en nuestro análisis de la prueba
de Goldfeld-Quandt.
272 VIOLACION DE LOS SUPUESTOS DEL MODELO CLASICO

Por tanto, la varianza de Vi es ahora homocedástica, pudiéndose por tanto


proceder a aplicar MCO a la ecuación (9.6.5) traRsformada, regresando Y;/XI
en l/XI'
Obsérvese que en la regresión transformada el término de intersección
/32 corresponde al coeficiente de la pendiente en la ecuación original y que el
coeficiente de la pendiente /31 es el término de intersección en el modelo
original. Por tanto, para regresar al modelo original tendremos que multipli-
car el valor estimado de (9.6.5) por XI' Una aplicación de esta transforma-
ción está dada en el Ejercicio 9.7.

Supuesto 2
(9.6.6)

Si se cree que la varianza de Ui, en lugar de ser proporcional al cuadrado


de Xi es proporcional a XI misma, entonces el modelo original se puede
transformar de la siguiente manera:
1'; . 131 IV U,
IV = IV + PZyX, + IV
yX i yX i yX.

(9.6.7)

donde Vi = uJ~ y Xi> O.


Dado el supuesto 2, se puede verificar fácilmente que el E(v¡) = a 2 , la
cual es una situación homocedástica. Por tanto, se puede proceder a aplicar
MCO a (9.6.7), regresandoY;/~'en 1/~ yenJX:.
Obsérvese una característica importante del modelo transformado: no
tiene término de intersección. Por tanto, se tendrá que utilizar el modelo de
"regresión. a través del origen" para estimar /31 y /32' Al correr (9.6.7) se
puede regresar al modelo original, simplemente multiplicando (9.6.7) por
JX:.

Supuesto 3
(9.6.8)
La ecuación (9.6.8) postula que la varianza de U¡ es proporcional al cua-
drado del valor esperado de Y (véase Figura 9.6 e). Entonces
E(Y;) = /31 + /32 Xi
Por tanto, si transformamos la ecuación original de la siguiente manera:
Y; /31 Xi Ui
E(Y;) = E(Y;) + /32 E(Y;) + E(Y;)
1 ) X· (9.6.9)
= /31( E(Y;) + /32 E(~) + Vi
HETEROCEDASTICIDAD 273

donde Vi = u;/E(Y;); se puede apreciar que E(vf) = (12 ; lo cual implica que
las perturbaciones Vi son homocedásticas. Por tanto, es la regresión (9.6.9)
la que satisface el supuesto de homocedasticidad del modelo clásico de re-
gresión lineal.
Sin embargo, la transformación (9.6.9) no es operativa puesto que E (1';)
depende de PI y P2 , los cuales se desconocen. Desde luego, conocemos
•Y; = PI + P2 X¡ ,el cual es un estimador de E(Yi ). Por tanto, podemos pro-
{:ederen dos pasos: primero, corremos la regresión usual de MeO sin tener
en cuenta el problema de heterocedasticidad, obteniendo Y; . A continua-
ción, utilizando el valor estimado. Y;; transformamns nuestro modelo de la
siguiente manera:

(9.6.10)

donde V¡ = (uJY;) . En el paso 2, corremos la regresión (9.6.10). Aunque los


Y; no son exactamente E (1';) , son estimadores consistentes; hecho que
implica que a medida que aumenta el tamaño de la muestra indefinidamente,
ellos convergen al valor verdadero de E (1';) . En consecuencia, la transforma-
ción (9.6.10) será útil en la práctica si el tamaño de la muestra es razonable-
mente grande.
Supuesto 4. Transfonnación logarítmica. Si en lugar de correr la regresión
Y; = PI + P2 X¡ + u¡ ,corriéramos
In 1'; = /31 + /32 In X¡ + u¡ (9.6.11)
se tiene que muy frecuentemente se reduce. el problema de heterocedastici~
dad. Esto se debe a que las transformaciones logarítmicas comprimen las
escalas en las que se miden las variables, reduciendo aSl una diferencia de 10
veces a 'una de dos veces. De esta manera, el número 80 es 10 veces el nume-
ro 8, pero In 80 (=4.3820} es aproximadamente dos veces mayor que In
8 (=2.0794).
Una ventaja adicional de la transformación logarítmica es que el coefi-
ciente de la pendiente /32 mide la elasticidad de Y con respecto a X, es decir.
el cambio porcentual en Y ante un cambio porcentual en X. Por ejemplo, si
y es el consumo y X es el ingreso f32 en (9.6.11). medirá la elasticidad-ingreso.
mientras que en el modelo original /32 mide únicamente la tasa de cambio del
consumo promedio por un cambio en una unidad en el ingreso. Esta es una
de las razones por las cuales los modelos logarítmicos son tan populares en
econometría empírica. (Para algunos problemas asociados con las transfor-
maciones logarítmicas, véase Ejercicio 9.10).
Para concluir nuestro análisis de las medidas remediales, se debe hacer
énfasis en que todas las transformaciones'mencionadas previamente son ad
hoc; esencialmente, estamos especulando sobre la naturaleza de O'~. De las
transformaciones mencionadas anteriormente, la que funcione. dependerá de
la naturaleza del problema y de la severidad de la heterocedasticidad. Existen
algunos problemas adicionales con las transformaciones que hemos consi-
derado y que deben mantenerse en mente.
274 VIOLACION DE LOS SUPUESTOS DEL MODELO CLASICO

1. Cuando se va más allá del modelo de dos variables, podemos no conocer


a priori cuál de las variables X se debe escoger para transformar los da-
toS. 22
2. Las transformaciones logarítmicas, como se mencionó anteriormente en
el supuesto 4, no es aplicable si algunos de los valores de Yo X son cero
o son negativos. 23
3. Existe también el problema de la correlación espúrea. Este término, crea-
do por Karl Pearson, se refiere a aquella situación en donde se encuentra
que existe una correlación entre las relaciones de las variables a pesar de '
que las variables originales no estén correlacionadas o sean aleatorias. 24
Por tanto, a pesar de que en el modelo Y¡ = f31 + f32 Xi + Ui ,Y y X pue-
den no estar correlacionadas, en el modelo transformado Y¡ I Xi = f31(1/X¡}
+ f32' Y¡/XiY l/Xi con frecuencia se encuentra que están correlacionadas.
4. Cuando o} no se conocen directamente y son estimados a partir de una o
más de las transformaciones que se mencionaron anteriormente, todos
nuestros procedimientos de prueba utilizando las pruebas t. F, etc.,
estrictamente hablando son válidas únicamente para muestras grandes. En
consecuencia, se debe tener cuidado al interpretar los resultados obteni-
dos en las diferentes transformaciones cuando se cuenta con muestras
pequeñas o finitas. 25

9.7 RESUMEN Y CONCLUSIONES


Un supuesto crítico del modelo clásico de regresión lineal es que los términos
de perturbación U¡ tienen todos la misma varianza. Si no se cumple este su-
puesto, se presenta el fenómeno de heterocedasticidad. La heterocedastici-
dad no destruye el insesgamiento ni las propi~dades de consistencia de los
estimadores de MCO. Sin embargo, estos estimadores no poseen varianza mí-
nima, no siendo, por tanto, eficientes. En otras palabras, ellos dejan de ser
MELI. Los estimadores MELI se obtienen utilizando el método de mínimos
cuadrados ponderados.

et
22 Sin embargo, como aspecto práctico se puede graficar contra cada una de las variables y decidir
cuál variable X se pu~de utilizar para transformar los datos. (véase Figura 9.7).
23A veces podemos utilizar in (Y¡ + k) o In (X¡ + k), donde k es un número positivo escogido de tal
manaera que todos los valores de Y y X se tornen positivos; véase Ejercicio 9.19.
24 Por ejemplo, si XI' X 2' Y X, no están mutuamente correlacionadás, r 12 = r 13 = r13 = O Y si encon-
tramos que los valores de las razones xlix, 'y X2 Ix, están correlacionadas, entonces existe una corre-
lación espúrea. "En términos más generales, la correlación se puede describir como espúrea si es indu-
cida por el método de manejo de datos y no está presente en el material original". M.G. Kendall y
W.R. Buckland, A Dictionary of Statistical Terms, Hafner Publishing Company, Inc., Nueva York,
1972, p. 143.
25 Para mayores detalles, véase George G. Judge et. al., op. cit., seco 14.4, pp. 415-420.
HETEROCEDASTICIDAD 275

Si continuamos utilizando los estimadores usuales de MCO en casos de·


heterocedasticidad, las varianzas de estos estimadores dejan de ser dadas por
medio de las fórmulas usuales de MCO. Por ejemplo, en el caso del modelo
de dos variables el estimador de la varianza. de $2 es u2 ~ xf ,mientras que
cuando existe heterocedasticidad ésta está dada por I. xfu¡ / (I. xf)2. Por tan-
to, en situaciones de heteroscedasticidad debemos utilizar por lo menos este
último estimador. Pero obsérvese que esta última varianza deja de ser una va-
rianza mínuna; en consecuencia, los intervalos de confianza basados en esta
última son innecesariamente amplios y las pruebas de significancia, menos
poderosas.
La situación puede tornarse potencialmente seria si (erróneamente) des-
cartamos la presencia de heterocedasticidad y utilizamos los estimadores
convencionales de MCO para las varianzas. Por tanto. en el caso de dos va-
riables, si utilizamos u2/I. xf en lugar de L xfuf /(I. Xf)2 (lo cual, para co-
menzar es ineficiente), las pruebas de significan cia. t y F basadas en ella nos
llevarán a conclusiones erradas, debido a que en situaciones de heterocedas-
. ticidad el estimador tradicional para u2 , ¡¡.l, deja de ser insesgado. Como
resultado de ello, la varianza u 2 /I. xf tampoco es in sesgada, no pudiendo, en
general, establecer la dirección del sesgo. En resumen, en esta situación los
procedimientos de prueba convencionales son de dudosa credibilidad.
Aunque es fácil documentar las consecuencias teóricas de la heterocedas-
ticidad, no es tan fácil detectarla por cuanto en investigación econométrica
es muy común que solamente se tenga un valor Y correspondiente a un valor
de X dado, imposibilitando averiguar uf con base en esa única observación.
Como consecuencia, se han creado algunos métodos informales y de aproxi-
mación para detectar la presencia de heterocedasticidad. Estos métodos ge-
neralmente examinan los residuos obtenidos del procedimiento de mínimos
cuadrados normales para buscar en ellos patrones sistemáticos. Si ellos pre-
sentan dichos patrones se puede sugerir maneras de transformar el modelo
original bajo consideración, de Úll manera que en la ecuación transformada
las perturbaciones tengan una varianza constante.
Si las varianzas heterocedásticas uf se conocen, el método más directo
para resolver el problema consiste en utilizar la técnica de mínimos cuadra-
dos ponderados, que minimizan la iniportancia de las perturbaciones con va-
lores externos ponderándolas en proporción inversa a sus varianzas. Sin
embargo, es muy raro que se conozcan los uf . Como resultado, generalmen-
te se plantean algunos posibles supuestos sobre la naturaleza de los af , trans-
formándose a continuación los datos para hacer que las perturbaciones en
los datos transformados sean homocedásticas. En este capítulo analizamos
algunas de las más comunes transformaciones que se utilizan, haciendo énfa-
sis en sus características especiales. También mencionamos algunos proble-
mas asociados con tales transformaciones.
276 VIOLACION DE LOS SUPUESTOS DEL MODELO CLASICO

EJERCICIOS
9.1 Para los datos de la Tabla 9.1, haga una regresión de los salarios promedio Y en la
productividad promedio X, tomando la cantidad de empleos como unidad de
observación. Interprete sus resultados y ve.a si ellos están de acuerdo con los dados
en (9.5.3).
(a) De la anterior regresión, obtenga los residuos ej.
(h) Siguiendo la prueba de Park, haga una regresión del In ef en el In X¡ y verifique
la regresión (9.5.4).
(e) Siguiendo el enfoque del Glejser, haga una regresión dell e¡ len X¡ y a continua-
ción regrese Ied en~ y comente acerca de los resultados obtenidos.
(d) Halle la correlación de rango entre e¡ y Xi Ycomente sobre la naturaleza de la
heterocedasticidad presente en los datos, si es que existe alguna.
9.2 La tabla a continuación presenta los datos sobre la relación ventas/efectivo en las in-
dustrias manufactureras de los Estados Unidos clasificadas de acuerdo con la
cantidad de activos de las firmas para el período 1971-1 a 1973-IV. (Los datos son
trimestrales). La relación ventas/efectivo puede tomarse como una medida de la
velocidad del ingreso en el sector corporativo, es decir, el número de veces que se
negocia con cada dólar.

Tamaño de los activos (millones de dólares)


Año y
trimestre 1-10 1~25 25-50 ~100 1~250 _ ~1000 1000 +

1971-1 6.696 6.929 6.858 6.966 7.819 7.557 7.860


-11 6.826 7.311 7.299 7.081 7.907 7.685 7.351
-111 6.338 7.035 7.082 7.145 7.691 7.309 7.088
-IV 6.27;2 6.265 6.874 6.485 6.778 7.120 6.765
1972-1 6.692 6.236 7.101 7.060 7.104 7.584 6.717
-11 6.818 7.010 7.719 7.009 8.064 7.457 7.280
-111 6.783 6.934 7.182 6.923 7.784 7.142 6.619
-IV 6.779 6.988 6.531 7.146 7.279 6.928 6.919-
1973-1 7.291 7.428 7.272 7.571 7.583 7.053 6.630
-11 7.766 9.071 7.818 8.692 8.608 7.571 6.805
-111 7.733 8.357 8.090 8.357 7.680 7.654 6.772
-IV 8.316 7.621 7.766 7.867 7.666 7.380 7.072

Fuente: Quarterly FinanciDI Repon for Manufacturing Corporations. Federal Trade


Commission and the Securities and Exchange Commission, gobierno de los Estados Unidos,
diferentes volúmenes (calculados).

(a) Para cada tamaño de activos, calcule la medida y la desviación estándar de la rela-
ción ventas-efectivo.
(h) Grafique el valor promedio contra la desviación estándar calculadas en (a), uti-
lizando el tamaño de los activos como unidad de observación.
(e) Por medio de un modelo adecuado de regresión, decida si la desviación estándar
de la anterior relación aumenta con el valor promedio. Si no es así, ¿cómo racio-
nalizaría el resultado?
(d) Si existe una relación estadísticamente significativa entre los dos, ¿cómo trans-
formaría usted los datos de tal manera que desaparezca la heterocedasticidad?
HETEROCEDASTICIDAD 277

9.3 Prueba de Bartlett de homogeneidad de la varianza. * Suponiendo que existen k va-


rianzas muestrales independientes s~, s~, ... , s¡ ,con f¡,f2' ... ,h. g de 1, cada una
proveniente de poblaciones con una distribución normal, con promedio igual a JI y
varianza a¡. Suponiendo adicionalmente que deseamos evaluar la hipótesis nula
Ho: ai = a~ = ... = af = a 2 ; es decir, que cada varianza muestral es una estimación
de la misma varianza poblacional a 2 .
Si la hipótesis nula es verdadera, entonces
k

2 ¡~l/;sf ¿/;S7
s =---=--
¿ /; f
proporciona una estimación del estimador común de la varianza poblacional a 2 ,
donde /; = (N¡ - 1), \ Y Ni es el número de observaciones en el iésimo grupo y
f= I~=l /;. .
Bartlett ha demostrado que la hipótesis nula se puede evaluar por medio de la
relación A/B, que está aproximadamente distribuida de acuerdo a una distribución
X2 con k - l g de 1, donde

A = f In 52 - ¿ (/; In s7)
y

B = 1 + 3(k ~ 1) [ ¿ (~) - y]
Aplique la prueba de Bartlett a los datos de la Tabla 9.1 Y verifique que la hipótesis
de que las varianzas poblacionales de los salarios de los empleados son las mismas
para cada grupo de empleo de cada lipo de establecimientú, no se puede rechazar a
un nivel de significancia del 50/0.
Nota: [¡, los g de l para cada varianza muestral, es 9, puesto que Ni para cada
muestra (es decir, la clase de empleo) es 10.
9.4 Los datos en la siguiente tabla se refieren a los salarios medianos de economistas,
. hombres y mujeres, por campo de especialización, para el año de 1964.
(a) Halle el salario promedio y la desviación estándar del salario de los dos grupos
de economistas.
(b) ¿Existe una diferencia significativa entre las dos desviaciones estándar? (puede
utilizar la prueba de Bartlett).
(e) Suponiendo que se desea predecir el salario mediano.de los economistashom-
bres a partir del salario mediano de las mujeres économistas, desarrolle un
modelo adecuado de regresión para este fin. Si se espera que exista heteroce-
dasticidad en este modelo, ¿cómo la manejaría?

* La prueba de Bartlett se presentó por primera vez en el artículo "Properties of Sufficiency and Sta-
tistical test," Proceedings o[ the Royal Society o[ London, A, 160, p. 268, 1937 ..
278 VIOLACION DE LOS SUPUESTOS DEL MODELO CLASICO

Salarios medianos (miles de dólares)


Campo de especialización Mujeres Hombres
Finanzas empresariales, etc. 9.3 13.0
Economía laboral 10.3 12.0
Monetaria - fiscal 8.0 11.6
Teoría económica general 8.7 10.8
Población, programas de seguridad social, etc. 12.0 11.5
Sistemas económicos y desarrollo 9.0 12.2
Fuente: "The Structure of Economists' Employment and Salaries", Committee on
the National Science Foundation Report on the Economics Profession, American
Economic Review, vol. 55, No. 4, p. 62, diciembre 1965.

9.5' Los siguientes datos proporcionan los salarios medianos de economistas, clasificados
de acuerdo con los grados académicos obtenidos y la edad: .

Salarios medianos (miles de dólares)

Edad, años M.A. Pb.D.

25-29 8.0 8.8


30-34 9.2 9.6
35-39 11.0 11.0
4()..44 12.8 12.5
45-49 14.2 13.6
5(}-54 14.7 14.3
55-59 14.5 15.0
6(}-64 13.5 15.0
65-69 12.0 15.0

Fuente: "The Structure of Economists' Employment


and Salarles", Commlttee on National Science Foun-
dation Report on the Economics Profession, American
Economic Review, vol. SS, No. 4, p. 37, diciembre de
1965.

(a) ¿Son las varianzas de los salarios medianos de los economistas con máster y
Ph.D., iguales? .
(b) Si lo son, ¿cómo evaluaría usted la hipótesis de que los salarios medianos de los
dos grupos son iguales? .
(e) Economistas GOn un máster ganaron más que sus contrapartes con un Ph.D. con
edades comprendidas entre 35 y 54 afios. ¿Cómo explicaría usted este resulta-
do, si se .cree que un economista con un Ph.D. debería ganar más que. un econo-
mista con máster?
9.6 Refiérase a los datos sobre productividad promedio ya la desviación estándar de la
productividad dados en la siguiente tabla .. Suponga que:

y, = !Ji + !J1X¡ + U¡
HETEROCEDASTICIDAD 279

Donde Y , =productividad promedio en la iésima clase de empleo, x, =tllmafto de em-


pleo medido por 1 = 1 - 4 empleados, 2 =5 - 9 empleados, ... , 9 = 1000 - 24999.
Utllizando estos datos, estime dos regresiones utilizando mínimos cuaarados
ponderados y no ponderados en forma similar a las ecuaciones (9.6.2) Y (9.6.3) Y
comente acerca de los resultados obtenidos.

Tamaño del empleo Productividad Desviaci6n etÜnctar de


(número de empleados) promedio, $ la productividad, $
1--4 93SS 2487
5-9 8S84 2642
10--19 7962 30SS
20-49 827S 2706 ,
50--99 8389 3119
100--249 9418 4493
2S0-499 979S 4910
SOO--999 10,281 S893
1000--2499 11,750 SSSO
Fuente: The Cenms 01 Manufactures, U.S. Department of Commerce,
1958, (calculado). .

9.7 En una encuesta de más de 9966 economistas en 1964 se obtuvieron los siguientes
datos: '

Edad,años Salarios medianos, $

20--24 7800
25-29 8400
30--34 9700
35-39 II,SOO
40-44 13,000
45--49 14,800
SO--S4 IS,OOO
S5-S9 IS,OOO
60--64 IS,OOO
65-69 14,SOO
70+ 12,000

Fuente: "The Structure of Economists' EmpJooyment


and Salaries", Committee on the National Sclence
Foundation Report on the Economics Profession,
American Economlc Revlew. vol. SS, No. 4, p. 36,
diciembre de 1965.

(a) Desarrolle un modelo adecuado de regresión que explique el salario mediano en


relación con la edad. ,
Nota: Para fmes de la regresión, suponga que los salarios medianos se refie-
ren al punto medio del intervalo de edades. Por tanto, 7800 se refiere a la edad
de 22.5 años y así sucesivamente. Para el último intervalo de edades, suponga
que la edad máxima es 75 aflos. ,
280 VIOLACION DE LOS SUPUESTOS DEL MODELO CLASICO

(b) Suponiendo que la varianza del término de perturbación es proporcional al cua-


drado de la edad, transforme los datos de tal manera que el término de pertur-
bación resultante sea homocedástico.
(e) Repita (b) suponiendo que la varianza es proporcional a la edad. ¿Cuál de las
transformaciones parece plausible?
(d) Si ninguna de las transformaciones anteriores paFece razonable"suponga que el
término de varianza es proporcional a la expectativa condicional del salario
mediano, condicionado a la edad dada. ¿Cómo transformaría usted los datos
para que la varianza resultante sea homocedástica?
9 ..8 La siguiente tabla proporciona datos sobre derechos especiales de retiro (DERs),
también conocidos como papel oro y la balanza de pagos para'diez países durante
el año 1974.
Puesto que los DERs se utilizan como moneda internacional, se espera que su
tamaño esté relacionado con la posición de la balanza de pagos de un país.
(a) De los datos dados, ¿existe una relación que se pueda discernir entre los DERs
y la balanza de pagos? Presente su respuesta regresando la primera variable so-
bre la segunda.
(b) Utilizahdo los resultados obtenidos en (a), evalúe en forma separada la siguien-
te hipótesis: la varianza de perturbación es proporcional al (i) valor de la balan-
za de pagos, (ii) valor esperado condicional de los DERs , condicionados con el
valor qe la balanza de pagos.
(e) ¿Puedé usted utilizar la transformación logarítmica analizada en el texto para
transformar los datos? ¿Por qué sí o por qué no?
(d) Aplique la prueba de correlación de rangos a ei obtenida de la regresión en (a) y
los valores de la balanza de pagos. ¿Puede usted decir algo sobre la heterocedas-
ticidad con basé en esta prueba?

Balanza de pagos
País DERs (millones de dólares) (mülonés de dólares)

Bélgica 715 346


Canadá 574 26
Francia 248 -83*
Alemania 1763 -466
Italia 221 -4633
Japón 529 1241
Países Bajos 595 985
Suecia 131 -802
Irigla terra 843 -4355
Estados Unidos 2370 -8374

* El signo negativo indica un déficit en la balanza de pagos.


Fuente: International Financial Statistics. Internacional Monetary
Fund, diciembre de 1975.

9.9 (a) ¿Puede usted hacer una estimación de los parámetros de los modelos

le¡j = Jf31 + f3zX¡ + Vi


le¡j = Jf31 + f3zX¡ + Vi
HE"fEROCEDASTICIDAD 281

utilizando el método de mínimos cuadrados ordinarios? ¿Por qué sí o por qué


no?
(h) Si no, ¿puede usted sugerir un método, bien sea formal o informal, de estimar
los parámetros para tales modelos?
9.10 A pesar de que los modelos logarítmicos como los que se presentan en la ecuación
(9.6.11) con frecuencia reducen la heterocedasticidad, se debe prestar una gran
atención a las propiedades del término de perturbación para tales modelos. Por ejem-
plo, el modelo

(1)
se p~ede escribir ~omo I

In Y¡ = In PI + P2 In X¡ + In U¡ (2)

(a) Si In Uf va a tener una expectativa de cero, ¿cuál debe ser la distribución de u¡?
(h) Si E(u¡) == 1, ¿será E(ln Uf = O? ¿Por qué si o por qué no?
(e) SiE(ln Uf) no es cero, ¿qué se puede hacer para volverlo cero?
9.11 Demuestre quep~ de (9.3.8) también se puede expresar como:

2 -
"
p. _ L... w¡y¡ X¡
L w¡xr 2
..
y var(p!) dada en (9.3.9) también se puede expresar como:
.) _ 1
var (P2 -"
L... W¡X¡.2

donde yr = Y¡ - Y· xr = X¡ - X·representan desviaciones de lo~ promedios ponde-


rados de Y· y X· definidos como
Y· = L W¡ Y¡!L W¡

X· = L w¡X¡!L W¡

9.12 Suponga que se le proporciona a usted la siguiente información:


SCR l con base en las primeras 30 observaciones = 55, g de 1 = 25
SCR2 con base en las últimas 30 observaciones = 140, g de 1 = 25
Lleve a cabo la prueba de Goldfeld-Quandt para heterocedasticidad a un nivel de
significancia del 5% .
9.13 Prueba de Breusch-Pagan. Considere el modelo de k variables:
Y¡ = PI + P2 X 2¡ + ... + PtXti + Ui (1)

Suponiendo que la varianza del error uf se describe como:


uf = f(a l + a2 Z2i + ... + a .. Z ..¡) (2)

es decir, que uf es cierta función de las variables Z no estocásticas; algunas o la tota-


lidad de las X pueden utilizarse como variables Z. Específicamente suponga que:
uf = al + a2 Z 2¡ ...... + a", Z",¡ (3)
esdecir,uT es unafunci6n lineal de lasZ. Si a2 = a3 = ... = a.. = O, uf = al'
la cual es una constante. Por tanto, para evaluar si uf es homocedástica, se puede
evaluar la hipótesis de que a2 = a3 = ... = a.. = O. Esta es la idea básica de la prueba
de Breusch-Pagan. El procedimiento de la prueba en la práctica es el siguiente:
282 VIOLACION DE LOS SUPU~STOS DEL MODELO CLASICO

Paso 1. Estimar (1) por medio de MeO y obtener los residuos el' e2' ... , eN'
Paso 2. Obtenerü 2 = L
e;/N.Recordemos del Capítulo 4 que éste es el estimador de
máxima verosimilitud (MV) de (12. [Nota: el estimador de MCO es L ef/(N - k)].

Paso 3. Construir las variables Pi, las cuales se definen como:

que cClrresponden sencillamente a cada residuo elevado al cuadrado, dividido por ¡¡2.

Paso 4. Regresar los Pi construidos en el paso 3 en las variables Z, de la siguiente


forma:
(4)

donde Vi es el término residual de esta regresión.

Paso 5. Obtener la SCE (suma de cuadrados explicada) del paso (4) y definir:
1
e = 2' (SCE) (5)

Se puede demostrar que si existe homocedasticidad y el tamaño de la muestra N


aumenta indefinidamente, entonces

e- X!-l (6)

10 cual implica que e tiene un distribución ji-cuadrado con (m - 1) grados de liber-


tad.
Por tanto, si en una aplicación el valor calculado e (= x2 ) excede el valor críti-
co x2 al nivel de significancia escogido, se puede rechazar la hipótesis de homoce-
dasticidad; de otra forma, ésta se puede aceptar. Para familiarizarse con la prueba
de Breusch-Pagan, considere el siguiente modelo:

donde Yt = inventarios en el sector manufacturero de los Estados Unidos y X t =


ventas en el sector manufacturero de los Estados Unidos, ambos para el período
1950-1983.
Lleve a cabo la prueba de Breusch-Pagan asumiendo que

,(Nota: Z = X en este ejemplo). UtITice los datos de la siguiente tabla y complete lo.s
resultados.
HETEROCEDASTICIDAD 283

Inventarios y ventas en las empre-


sas manufactureras de los EstadQs
Unidos, 1950-1983 (miles de millo-
nes de dólares)

Año Inventarios Ventas

1950 31:1 18.6


1951 39.3 21.7
1952 41.1 22.5
1953 43.9 24.8
1954 41.6 23.3
1955 45.1 26.5
1956 50.6 27.7
1957 51.9 28.7
1958 50.2 27.2
1959 52.9 30.3
1960 53.8 30.9
1961 54.9 30.9
1962 58.2 33.4
1963 60.0 35.0
1964 63.4 37.3
1965 68.2 41.0
1966 78.0 44.9
1967 84.7 46.5
1968 90.6 50.2
1969 98.2 53.5
1970 101.6 52.8
1971 102.6 55.9
1972 108.2 63.0
1973 124.6 72.9
1974 157.8 84.8
1975 159.9 86.4
1976 175.2 98.8
1977 189.2 113.2
1978 210.4 126.9
1979 240.9 143.9
1980 264.1 154.4
1981 282.1 168.1
1982 264.6 159.2
1983 260.4 170.6

Fuente: Economic Report 01 the Pre'¡-.


dent, 1985, Tabla 8-49, p. 288.
Nota: Las cifras se aproximan a un deci-
mal.

9.14 Para fmes p.dagógicos. Hanushek y Jackson estimaron el siguiente modelo:

er = /JI + /J2 PNB r + /J3 Dr + Ur (1)

donde Ct = gastos de consumo privado agregado en el período t, PNB t = producto


=
Ilacional bruto en el período t y Dt gastos de defensa nacional en el período t,
donde el objetivo del an41isis es estudiar el efecto de los gastos de defensa sobre
otros gastos en la economía.
284 VIOLACION DE LOS SUPUESTOS DEL MODELO CLASICO

Postulando que a; = a (pNBt)2 , ellos transforman (1) y estiman


2

C,/PNB, = p¡(1/PNB,) + P2 + P3(D,/PNB,) + u,/PNB, (2)

Los resultados empíricos Corl base en los datos para el período 1946-1975 fueron
los siguientes (errores estándar entre paréntesis).*
C, = 26.19 + 0.6248 PNB, - 0.4398 D,
(2.73) (0.0060) (0.0736) R 2 = 0.999
C,/PNB, = 25.92(I/PNB,)
-------- + 6246 - 0.4315 (D,/PNB,)
(2.22) (0.0068) (0.0597) R 2 = 0.875

(a) ¿Qué supuesto plantean los au~res acerca de la naturaleza de la heterocedas-


ticidad? ¿Puede usted justifi<;a'rlo?
(b) Compare los resultados d~1as dos regresiones. ¿Han mejorado los resultados la
transformación del mptlelo original? En otras palabras, ¿han reducido los
errores estándar estimados? ¿Por qué si o por qué no?
(e) ¿Puede usted comparar los dos valores del R 2 ? ¿Por qué si o por qué no?
(Sugerencia: Examine las variables dependientes).
9.15 Refiérase a las regresiones estimadas (9.6.2) y (9.6.3). Los resultados de la regresión
son muy similares. ¿Cómo se puede explicar esto? (Sugerencia: refiérase al Ejerci-
cio (9.3).
9.16 Demuestre que si w¡ = W es una constante para cada i,p!, y P2 de igual manera que
sus varianzas son idénticas.
9.17 Refiérase a las fórmulas (9.2.2) Y (9.2.3). Suponga que

donde u2 es una constante y k¡ son ponderaciones conocidas y no necesariamente


todas iguales.
Utilizando este supuesto, demuestre que la varianza dada en (9.2.2) se puede
expresar como:

El primer tém'¡no al lado derecho de la ~cuación corresponde a la fórmula de la


v.arianza dada en (9.2.3), es decir, var (P2) bajo homocedasticidad. ¿Qué puede decir
acerca de la naturaleza de la relación entre var{P2) bajo heterocedasticidad y bajo
homocedasticidad? (Sugerencia: Examu,e el segundo término alIado derecho de la
fórmula anterior). ¿Puede obtener usted alguna conclusión general sobre la relación
entre (9.2.2) y (9.2.3)?

* Etic A. Hanushek y John E. Jackson, Statistical Methods lor Social Scientists, Academic Press,
Nueva York, 1977, p. 160.
HETEROCEDASTICIDAD 285

APENDICE 9

9A.l PRUEBA DE LA ECUACION (9.2.2)


Del Apéndice 3A, Sección 3A.3, se tiene que
var (pz) = E[kIuI + k~ u~ + ... + k~ u~ + 2 ténninos de productos
cruzadaS
= E[kIuI + k~u~ + ... + k~u~]
Puesto que las esperanzas de los términos de los productos cruzados son cero
debido al supuesto de correlación no serial.
= kIE(ul) + k~ E(un + .,. + k~ E(u~)
dado que se conocen los k¡. (¿Por qué?)
= kIuI + k~ u~ + ... + k~ u~
dado que E(ul) = ul·

puesto que k¡ = xJr. xl

(9.2.2)

9A.2 METODO DE MINIMOS CUADRADOS PONDERADOS


Para ilustrar este método, utilicemos el modelo de dos variables Y¡ = Pl + pz
X¡ + U¡. El método de mínimos c.uadrados no ponderados m.inimiza

(1)

para obtener los estimativos, mientras que el método de los mínimos cuadra-
dos minimiza la suma ponderada de los residuos al cuadrado:

(2)

donde PT y P~ son los estimadores de mínimos cuadrados ponderados y en


donde las ponderaciones Wi son tales que

W¡=2 (3)

lo cual implica que las ponderaciones son inversamente proporcionales a la


varianza de U¡ o Y¡ condicional al Xi dado, entendiendo que var (u¡ IX J =
var (Y¡ I Xi) = ul.
Al diferenciar (2) con respecto a PT y P~, obtenemos
286 VIOLACION DE LOS SUPUESTOS DEL MODELO CLASICO

o-¿w¡e;
apt = 2" (
L... w¡ Y¡ -
p.1 - IJ2
n. X ¡X- 1)

aLap!w¡e¡ -_ 2 ~~ w¡( 1'; - R*


1-'1 -
R* X
1-'2
X-
¡
X)
¡

Igualando las anteriores expresiones a cero, obtenemos las siguientes dos


ecuaciones normales:
L w¡ 1'; = Pt L W¡ + P! L W¡ X¡ (4)
L w¡X¡ 1'; = Pt L w¡X¡ + P! L w¡X¡ (5)
Obsérvese la similitud entre estas ecuaciones normales y las ecuaciones nor-
~ales de los mínimos cuadrados no ponderados.
Al solucionar estas ecuaciones simultáneamente, obtenemos
Pt = y* - P!X* (6)
y
R* _ (L w¡X¿ w¡x¡ Y¡) - (¿ w¡X¡X¿ W¡ Y¡)
(7) = (9.3.8)
1-'2 - ~ ~ 2 ~
(~ w¡X~ w¡X¡) - (~ w¡X¡) 2

La varianza de P! que aparece en (9.3.9) se puede derivar de la manera en que


se obtuvo la varianza de $2 que aparece en el Apéndice 3A, Sección 3.A.3.
Nota: Y* = L W¡ YJL W¡ y X* = L w¡XJL w¡. Como se puede verificar
fácilmente, estos promedios ponderados coinciden con los promedios no
ponderados tradicionales Y y X cuando w¡ = w, constante para todos los i.
CAPITULO 10
AUTO CORRELAC ION

Un supuesto importante del modelo lineal clásico presentado en la Parte 1 es


que no existe autocorrelación o relación serial entre las perturbaciones Uf que
entran en la función de regresión poblacional.· En este capítulo examinare-
mos cuidadosamente este supuesto, cón el fin de dar respuesta a las siguientes
preguntas:

1. ¿Cuál es la naturaleza de la autocorrelación?


2. ¿Cuáles son las consecuencias teóricas y prácticas de la autocorrelación?
3. Puesto que el supuesto de no autocorrelación se relaciona con las pertur-
baciones Uf no observables, ¿cómo se sabe que existe autocorrelación en
una situación determinada?
4. ¿Cómo se soluciona el problema de la autocorrelación?

El lector encontrará que este capítulo es similar en muchos aspectos al


capítulo anterior sobre heterocedasticida~, puesto que en presencia de auto-
correlación y de heterocedasticidad los estimadores tradicionales de MeO, a
pesar de ser insesgados, dejan de tener la varianza mínima entre todos los
estimadores- lineales ~sesgados. ,En resumen, dejan de ser MELI.

10.1 NATURALEZA DEL PROBLEMA


El término autoco"elaci6n se puede definir como la "correlación e:1dstente
entre los miembros de una serie de observaciones ordenadas en el tiempo
287
288 VIOLACION DE LOS SUPUESTOS DEL MODELO CLASICO

(como las cifras de series de tiempo) o en el espacio (como las cifras de corte
transversal)"1 . En el contexto de la regresión, el modelo de regresión lineal
clásico supone que tal autocorrelación no existe en las perturbaciones u,.
Sim bólicamente,
i:;:j (3.2.2)
Expresado en forma sencilla, el modelo clásico supone que el término de
perturbación asociado a alguna observación no está influenciado por el tér-
mino de perturbación asociado a cualquier otra observación. Por ejemplo, si
estamos manejando datos trimestrales de series de tiempo que involucren la
regresión de la variable productividad en las variables mano de obra e insu-
mos de capital, y si, digamos, se presenta una huelga que afecta la producción
de un trimestre, no existe razón alguna para creer que esta interrupción afec-
tará la producción del siguiente trimestre. Lo anterior implica que si la pro-
ducción de este