mco
normalidad
heteroestacidad
metodologa
Supuesto de normalidad
El modelo clsico de regresin lineal normal supone que cada ui est normalmente distribuida con
ui N(0, 2) (4.2.4)
Donde el smbolo sgnifica distribuido y N signica distribucin normal, y donde los trminos
entre parntesis representan los dos parmetros de la distribucin normal: la media y la varianza.
Como se seala en el apndice A, para dos variables normalmente distribuidas, una covarianza o
correlacin cero signi ca independencia entre las dos variables. Por consiguiente, con el supuesto
de normalidad, la ecuacin (4.2.4) signica que ui y uj no slo no estn correlacionadas, sino que
tambin estn independientemente distribuidas. Por tanto, (4.2.4) se escribe como
ui NID(0, 2) (4.2.5)
2. Una variante del teorema del lmite central establece que, aunque el nmero de variables no sea
muy grande, o si estas variables no son estrictamente independientes, su suma puede estar an
normalmente distribuida.
3. Con el supuesto de normalidad, se derivan con facilidad las distribuciones de probabilidad de los
estimadores de MCO, pues, como se explica en el apndice A, una propiedad de la distribucin
normal es que cualquier funcin lineal de variables normalmente distribuidas estar tambin
normalmente distribuida. Como ya analizamos, los estimadores de MCO 1 y 2 son funciones
lineales de ui. Por consiguiente, si ui est normalmente distribuida, tambin lo estn 1 y 2 , lo cual
hace que la tarea de probar hiptesis sea muy fcil.
5. Si trabajamos con una muestra nita o pequea, con datos de 100 o menos observaciones, la
suposicin de normalidad desempea un papel relevante. No slo contribuye a derivar las
distribuciones de probabilidad exactas de los estimadores de MCO, sino tambin permite utilizar las
pruebas estadsticas t, F y 2 para los modelos de regresin. Las propiedades estadsticas de las
distribuciones estadsticas t, F y 2 se estudian en el apndice A. Como veremos en seguida, si el
tamao de la muestra es razonablemente grande, se puede exibilizar el supuesto de normalidad.
6. Por ltimo, en muestras grandes, los estadsticos t y F tienen aproximadamente las distribuciones
de probabilidad de t y F, por lo que las pruebas t y F que se basan en el supuesto de que el trmino
de error est distribuido normalmente pueden seguir aplicndose con validez. En la actualidad hay
muchos datos transversales y de series de tiempo con una cantidad relativamente grande de
observaciones. Por tanto, el supuesto de normalidad puede no ser tan crucial en conjuntos grandes
de datos. Advertencia: Como se est imponiendo el supuesto de normalidad, es menester
encontrar aplicaciones prcticas que requieran tamaos pequeos de muestras en las que el
supuesto de normalidad resulte apropiado. Ms adelante se realizarn algunas pruebas para hacer
precisamente eso; asimismo, se presentarn situaciones en las que tal vez sea inadecuado el
supuesto de normalidad. No obstante, hasta ese momento, consideraremos vlido el supuesto de
normalidad por las razones expuestas.
(pag 99 - 100)
Tambin se sabe que el teorema de Gauss-Markov, que dice que MCO da el mejor estimador lineal
de insesgamiento, depende de manera crucial del supuesto de homocedasticidad. Si Var(u x) no es
constante, MCO ya no es MELI. Adems, MCO ya no es asintticamente eficiente en la clase de los
estimadores. En presencia de heterocedasticidad es posible hallar estimadores que sean ms
eficientes que MCO (aunque es necesario conocer la forma de la heterocedasticidad). Con tamaos
de muestra relativamente grandes, puede no ser tan importante obtener un estimador eficiente. En
la siguiente seccin se muestra cmo pueden modificarse los estadsticos de prueba usuales de MCO
de manera que sean vlidos, por lo menos asintticamente.