Clase 28/10/04
x
i =1
Estimacin de una varianza: se utiliza la cuasivarianza muestral para estimar la varianza poblacional: 2 = s2 =
(x
i =1
x)
n 1
Estimacin de parmetros, pg 1
En ocasiones observaremos el parmetro p como la media de una distribucin binaria: puesto que la variable aleatoria solo puede tomar los valores 1 (acierto) y 0 (fallo), el nmero de aciertos es tambin la suma de todos los valores de la variable observados en la muestra, y al dividir la suma de todas las observaciones entre el nmero de ellas, tendremos la media muestral. El parmetro de una Poisson es su media, por lo que para estimarlo tambin podremos considerarlo como una media.
a.1) Variable aleatoria X es una Normal ( ; 2). Extraida una muestra de tamao n, con las observaciones x 1, x 2 ,...xn . Al considerar todas las posibles muestras, cada observacin toma los valores de la variable aleatoria X y su misma densidad, la suma de n variables aleatorias Normales, todas ellas con la misma media y varianza es una variable aleatoria Normal, cuya media es n y cuya varianza es n2, portanto , aplicando las propiedades de la esperanza matemtica, podemos comprobar que la media X sigue una distribucin de media y varianza 2/n. . Adems, al ser Normal la poblacin de la que se extrae la muestra, la media muestral sigue tambi n una distribucin Normal: Si X N(;2) X N(;2/n) Al tipificar la media muestral: Z = X 2 n
N(0;1)
Estimacin de parmetros, pg 2
Con frecuencia no se conoce la varianza poblacional, entonces se estima con la cuasivarianza poblacional, pero al tipificar, lo que se obtiene no es lo mismo que antes: t = t(n 1) s2 n Cuando los datos proceden de una variable Normal , la media de todas las medias muestrales sigue una distribucin Normal, si se tipifica con la desviacin tpica poblacional, la media tipificada sigue una Normal (0;1). Per o si se tipifica con la cuasidesviacin tpica, sigue una distribucin t de Student con n-1 grados de libertad . a.2) La variable aleatoria X No es una Normal: Entonces la distribucin de la media muestral depende de la distribucin de la variable original. No obstante, para muestras grandes : n>30 (Teorema Central del Lmite), se puede asegurar que la distribucin de la media muestral es muy aproximadamente una Normal de media la de X y de varianza la de X dividido por el tamao muestral. Si la varianza muestral es desconocida NO SE PUEDE UTILIZAR LA DISTRIBUCIN t, pues falla el supuesto de Normalidad, por ello se comete menos error utilizando la distribucin Normal y tomando MUESTRAS DE TAMAO SUPERIOR A 60. X
Si X es una variable aleatoria N(;2) y desconocemos la media y la varianza poblacional, podemos estimar sta con la cuasivarianza poblacional:
n 1 n 2 x x (n 1)s2 sigue una distribucin Chi( xi x ) , se puede demostrar que el estadstico i = n 1 i= 1 2 i =1 cuadrado con n-1 grados de libertad. Esto significa que al tipificar r especto de la varianza poblacional, cada sumando es el cuadrado de una N(0;1) , y la suma de todos ellos una Chi-cuadrado, pero todos los sumandos no son independientes, ya que la suma de todas las observaciones ha de ser tal que se obtenga la media x observada. Si fijamos este valor de la media muestral y dejamos que varen libremente las observaciones, solo hemos de calcular n-1, pues la ltima viene obligada. Por lo tanto, el nmero de grados de libertad de la distribucin Chi-cuadrado es n-1 (el mismo nmero que se utiliza como denominador del clculo del estimador de la varianza).
s2 =
d) Distribucin del cociente de las los estimadores de las varianzas de dos distribuciones Normales independientes:
(n 1)s 2 sigue una 2 distribucin Chi cuadrado con n-1 g.l., calculado cada uno de ellos en su respectiva muestra, el estadstico: En ocasiones hay que comparar las varianzas de dos distribuciones Normales, como el estadstico
Estimacin de parmetros, pg 3
X 2 n
N(0;1)
Se puede encontrar dos valores: a y b tales que la probabilidad de que Z tome valores comprendidos entre ellos sea un valor dado 1-, P(a<Zb) = 1- . En realidad hay infinidad de posibles valores a y b y por eso se suelen tomar tales que la probabilidad de que Z sea menor que a sea igual a la probabilidad de que Z sea mayor que b , y ambas probabilidades igual a /2 Como al distribucin Normal es simtrica respecto de su media, en el caso de una N(0;1), dos abcisas a y b que delimiten colas de igual probabilidad verifican que |a| =| b|, por lo que solo hay que buscar el cuantil z /2 de la Normal(0;1)
Estimacin de parmetros, pg 4
/2
/2
Entonces: P( z / <
x 2 n
2 2 P z / 2 < x z / 2 = 1 , restando x : n n 2 2 P x z / 2 < x + z / 2 = 1 , cambiando el signo y el sentido de la desigualdad dentro del n n parntesis: 2 2 P x z / 2 < x + z / 2 =1 n n Supongamos una variable aleatoria de la que sabemos que sigue una distribucin Normal, de media desconocida y varianza conocida =4. Para estimar la media poblacional tomamos una muestra de tamao 10 y calculamos la media muestral , que resulta ser 30. La estimacin por punto ser x =30. 2 2 Por lo tanto, el intervalo buscado es: x z / 2 < x + z / 2 n n Para este ejemplo, si se desea que 1- =0.90, el cuantil buscado es el que deja a su derecha un rea de 0.05, para que su simtrico deje un rea a su izquierda de 0.05. En las tablas de la Normal(0;1), podemos encontrar que el cuantil buscado es 1.64, por lo que : 2 2 4 4 I1 = x z /2 < x + z / 2 = 30 1.64 ; 30 +1.64 = ( 28.963;31.037 ) n n 10 10 Podemos afirmar que la media poblacional es un valor comprendido entre 28.963 y 31.037 con un grado de confianza del 90%.
Estimacin de parmetros, pg 5
Ntese que se habla de confianza en lugar de probabilidad: una vez tomada la muestra, todos los datos requeridos para construir el intervalo son conocidos y podemos construirlo. Este intervalo ya ha sido fijado y contendr o no a la media poblacional. Solo podemos afirmar que de repetir el proceso muchas veces, tendramos que, en promedio, 90 de cada 100 de los intervalos que as se constuyan contendrn a la media poblacional, y "confiamos" en que este sea uno de esos 90. Si la varianza poblacional fuese desconocida, todo sera semejante, cambiando varianza poblacional por cuasivarianza muestral y la distribucin Normal por una t de Student con n-1 grados de libertad. Para el ejemplo actual, si 4 es la cuasidesviacin tpica: s2 s2 4 4 I1 = x t ( n < x + t (n 1) / 2 = 30 1.833 ; 30 +1.833 = ( 28.841;31.159) 1 ) , / 2 n n 10 10 Lgicamente, cuando valor de la varianza estimada coincide con la varianza poblacional (desconocida), al desconocer la varianza poblacional se obtiene un intervalo ms amplio para tener la misma confianza de recubrir la media, pues el grado de desconocimiento es mayor.
b) Estimacin por intervalo de la media de una variable que no sabemos si sigue una ley Normal.
En este caso solo podemos tomar muestras grandes y aplicar el T.C.L.. Si la varianza poblacional es conocida, el tamao muestral solo debe ser superior a 30, mientras que si la varianza poblacional es desconocida, el tamao ha de ser superior a 60. En ambos casos se debe usar la distribucin Normal y no la t , ya que por no cumplirse el supuesto de normalidad, el error cometido al utilizar la t de Student es superior al que se comente manteniendo la Normal. Los resultados son solo aproximados, tanto ms cuanto mayor sea la muestra: 2 2 I1 x z / 2 < x + z / 2 n n I1 x z / 2 s2 s2 < x + z / 2 n n con n >30
con n >60
Estimacin de parmetros, pg 6
pq n Esta frmula solo es aplicable si el tamao muestral es tal que tanto el nmero de "aciertos" como el de "fallos" sean mayor que 20. Adems habra que incluir una correccin por continuidad debida al hecho de aproximar una distribucin discreta (con valores para probabilidades puntuales) por una contnua, en la que la probabilidad asociada a un solo punto es nula. En el caso de que no se alcance este tamao de muestra, se puede calcular el intervalo a partir de la frmula inicial: z / 2 p =p p(1 p) n En la que se ha sustituido q por 1 p , como el resto de cantidades son conocidas, tenemos una ecuaci n irracional en p, que se resuelve aislando el trmino irracional, elevando al cuadrado: z / 2 p =p pq = z / 2 n y resolviendo la ecuacin de segundo grado que se obtiene. Las raices de dicha ecuaci n son los extremos del intervalo pedido. Existen otras expresiones para la estimacin por intervalo de proporciones, que no se vern aqu, (ver Martn Andrs, 1994).
2 ) (p p 2
Estimacin de parmetros, pg 7