USFQ.
ESTADSTICA
Estimacin e Intervalos de confianza
ESTIMACIN
ESTIMADOR PUNTUAL:
Estadstico que se calcula a partir de la informacin de la muestra y se utiliza para estimar el parmetro de la poblacin.
Intervalos de confianza I
INTERVALO DE CONFIANZA: Rango de valores creado a partir de los datos de la muestra, de modo que el parmetro poblacional es probable que ocurra dentro de ese rango en una probabilidad especfica. Esta ltima se llama nivel de confianza.
La informacin que se tiene acerca de la forma de la distribucin de la media muestral permite localizar un intervalo que tenga una determinada probabilidad de contener a la media poblacional . Si se tienen muestras razonablemente grandes, el teorema del lmite central permite establecer lo siguiente:
95% (99%) de las medias muestrales obtenidas de una poblacin se encuentran a no ms de 1.96 (2.58) desviaciones estndar de la media poblacional .
MAT 200 - USFQ
Intervalos de confianza II
A los intervalos calculados de esa manera se les llama intervalos de confianza. Cmo se calcula?
En la mayor parte de las situaciones, la desviacin estndar de la poblacin no est disponible as que no podemos calcular
s sX n
MAT 200 - USFQ
La desviacin estndar. Si sta es grande, el error estndar tambin lo ser. El tamao de la muestra. Conforme aumenta el tamao de la muestra, el error estndar disminuye, indicando que hay menos variabilidad en la distribucin de las medias muestrales. Un estimado que se hace con una muestra grande debe ser ms preciso que aquel que se hace a partir de una muestra pequea.
X z
s n
Ejemplos
Intervalo de confianza del 95%
s X 1.96 n
Intervalo de confianza del 99%
s X 2.58 n
MAT 200 - USFQ
Introduccin
En la seccin anterior se us la distribucin normal estndar para expresar el nivel de confianza. Se consider que:
La poblacin sigue una distribucin normal y se conoce la desviacin estndar de la muestra; No se conoce la forma de la distribucin de la poblacin pero el nmero de observaciones de la muestra es de por lo menos 30. Qu se hace si la muestra es inferior a 30 y se desconoce ?
Distribucin t de Student I
Cuando la muestra es menor de 30 y no se conoce la desviacin estndar de la poblacin a menudo se puede razonar que la poblacin es normal o aproximada a una distribucin normal. En estas condiciones el procedimiento estadstico correcto consiste en reemplazar la distribucin normal estndar con la distribucin t. La distribucin t es una distribucin continua que presenta muchas similitudes con la distribucin normal estndar.
Distribucin t de Student II
X t s n
Donde s es un estimador de . Al comparar la distribucin t con la distribucin normal estndar, se nota que:
al igual que la distribucin normal, es una distribucin continua. al igual que la distribucin normal, es simtrica y tiene forma de campana la distribucin t es ms plana, y ms extendida que la distribucin normal estndar; esto se debe a que la desviacin estndar de la distribucin t es mayor que la distribucin normal estndar. Debido a que la distribucin t tiene mayor extensin que la distribucin normal, el valor para t en un nivel de confianza determinado es mayor que los valores de z correspondientes.
MAT 200 - USFQ
Clculo del Intervalo de Confianza para la media poblacional con n<30 y se desconoce .
X t
s n
n es 30 o ms?
NO SI NO
Utilice la distribucin t
Si p representa la proporcin de la muestra, X el nmero de xitos y n el nmero de elementos en la muestra, se puede determinar la proporcin de la muestra as:
PROPORCIN DE LA MUESTRA p=X/n
MAT 200 - USFQ
PROPORCIN
La proporcin de la poblacin se identifica con . Por tanto, se refiere al porcentaje de xitos en la poblacin. A fin de desarrollar un intervalo de confianza para una proporcin, se necesitan cumplir con las siguientes suposiciones.
Se debe satisfacer
La informacin de la muestra es el resultado de conteos. Slo hay dos resultados posibles. (xito y fracaso) La probabilidad de un xito sigue siendo la misma de un intento a otro. Los ensayos son independientes. El resultado de un ensayo no afecta el resultado de otro. Los valores n y n(1- ) deben ser mayores o iguales a 5.
MAT 200 - USFQ
p z p
El trmino p es el error estndar de la proporcin. Mide la variabilidad en la distribucin de muestreo de la proporcin de la muestra.
p = p(1 p) / n
MAT 200 - USFQ
As se puede construir el intervalo de confianza para la proporcin de una poblacin a partir de la siguiente frmula:
Para una poblacin finita, donde el nmero total de objetos es N y el tamao de la muestra es n, se realiza el ajuste siguiente a los errores estndar de las medias y proporciones de la muestra.
ERROR ESTNDAR DE LA MEDIA DE LAS MUESTRAS, UTILIZANDO EL FACTOR DE CORRECCIN PARA POBLACIONES FINITAS X = ( / n) (N n) / (N 1)
ERROR ESTNDAR DE LAS PROPORCIONES DE LAS MUESTRAS, UTILIZANDO EL FACTOR DE CORRECCIN PARA POBLACIONES FINITAS
Si la muestra es demasiado grande, se gasta mucho dinero en recopilar la informacin. Si la muestra es demasiado pequea las conclusiones resultantes sern inciertas. El tamao apropiado de la muestra depende de tres factores.
El nivel de confianza deseado. El margen de error que el investigador va a tolerar. La variabilidad en la poblacin que se estudia.
MAT 200 - USFQ
Nivel de Confianza
El primer factor es el nivel de confianza, los niveles de confianza del 95% y 99% son los ms comunes, pero cualquier otro valor entre 0% y 100% es posible. El nivel de confianza del 99% corresponde a un valor z de 2.58, cuanto ms grande sea el nivel de confianza seleccionado, mayor ser el tamao de la muestra correspondiente.
Error Admisible
El segundo factor es el error admisible. El error mximo admisible. Designado como E, es la cantidad que se suma y resta de la medida de la muestra (o la proporcin de la muestra) para determinar los puntos extremos del intervalo de confianza. Es la cantidad de error que las personas que realizan el estudio estn dispuestas a tolerar. Tiene la mitad del ancho del intervalo de confianza correspondiente. Un error admisible alto permite una muestra ms pequea.
El tercer factor al determinar el tamao de una muestra es la desviacin estndar de la poblacin. Si la poblacin est muy dispersa, se requiere de una muestra grande. Si la poblacin est concentrada (es homognea), el tamao de la muestra requerido ser menor. Tal vez ser necesario usar un estimador (ver los tres mtodos ms adelante) para la desviacin estndar de la poblacin.
MAT 200 - USFQ
Estudio Comparativo
Utilice un estudio comparativo, emplee esta estrategia cuando haya disponible, un estimador de la dispersin de otro estudio. Si la desviacin estndar observada en un estudio previo se considera confiable, se puede utilizar en el estudio actual para tener un tamao aproximado de la muestra.
Emplee una estrategia basada en rango, para esto necesitamos saber o tener un estimador de los valores ms alto y ms bajo en la poblacin. Se sabe que todas las observaciones estn a ms o menos 3 desviaciones estndar de la media, suponiendo que la distribucin sea aproximadamente normal, por tanto la distancia entre los valores ms alto y ms bajo es 6 desviaciones estndar, se puede calcular la desviacin estndar como una sexta parte del rango.
Estudio Piloto
Realice un estudio piloto, este es el mtodo ms comn, se usa una muestra pequea y a partir de esta se calcula la desviacin estndar y el uso de este valor para determinar el tamao apropiado de la muestra.
TAMAO DE LA MUESTRA
En la siguiente frmula se puede expresar la interaccin entre los tres factores y el tamao de la muestra.
E = z ( s / n )
TAMAO DE LA MUESTRA
TAMAO DE LA MUESTRA PARA ESTIMAR LA MEDIA DE LA POBLACIN n = (zs / E)^2
Donde n es el tamao de la muestra. z es el valor normal estndar correspondiente al nivel de confianza deseado. s es un estimado de la desviacin estndar de la poblacin. E es el error mximo admisible.
MAT 200 - USFQ
TAMAO DE LA MUESTRA
Para determinar el tamao de la muestra para una proporcin es necesario especificar tres elementos. El nivel de confianza deseado. El margen de error en la proporcin de la poblacin. Un estimado de la proporcin de la poblacin.
MAT 200 - USFQ
TAMAO DE LA MUESTRA
Si est disponible un estimador de de un estudio piloto o de alguna otra fuente, se puede utilizar, de lo contrario se usa 0.50 porque el trmino p(1 p) nunca puede ser mayor de 0.50