Anda di halaman 1dari 33

Estadstica

USFQ.

MAT 200 - USFQ

ESTADSTICA
Estimacin e Intervalos de confianza

MAT 200 - USFQ

ESTIMACIN
ESTIMADOR PUNTUAL:

Estadstico que se calcula a partir de la informacin de la muestra y se utiliza para estimar el parmetro de la poblacin.

MAT 200 - USFQ

Intervalos de confianza I
INTERVALO DE CONFIANZA: Rango de valores creado a partir de los datos de la muestra, de modo que el parmetro poblacional es probable que ocurra dentro de ese rango en una probabilidad especfica. Esta ltima se llama nivel de confianza.

La informacin que se tiene acerca de la forma de la distribucin de la media muestral permite localizar un intervalo que tenga una determinada probabilidad de contener a la media poblacional . Si se tienen muestras razonablemente grandes, el teorema del lmite central permite establecer lo siguiente:

95% (99%) de las medias muestrales obtenidas de una poblacin se encuentran a no ms de 1.96 (2.58) desviaciones estndar de la media poblacional .
MAT 200 - USFQ

Intervalos de confianza II

A los intervalos calculados de esa manera se les llama intervalos de confianza. Cmo se calcula?

MAT 200 - USFQ

Qu pasa si no contamos con el error estndar de la media muestral?

En la mayor parte de las situaciones, la desviacin estndar de la poblacin no est disponible as que no podemos calcular

En su lugar usamos la desviacin estndar muestral y calculamos.

s sX n
MAT 200 - USFQ

Afectaciones al error estndar

El tamao del error estndar se ve afectado por dos valores:

La desviacin estndar. Si sta es grande, el error estndar tambin lo ser. El tamao de la muestra. Conforme aumenta el tamao de la muestra, el error estndar disminuye, indicando que hay menos variabilidad en la distribucin de las medias muestrales. Un estimado que se hace con una muestra grande debe ser ms preciso que aquel que se hace a partir de una muestra pequea.

MAT 200 - USFQ

Clculo del Intervalo de Confianza para la media poblacional con n>=30.


En general, cuando el nmero de observaciones es 30 o ms un intervalo de confianza para la media de la poblacin se calcula as:

X z

s n

donde z depende del nivel de confianza.

MAT 200 - USFQ

Ejemplos
Intervalo de confianza del 95%

s X 1.96 n
Intervalo de confianza del 99%

s X 2.58 n
MAT 200 - USFQ

Qu pasa si es desconocida y tenemos una muestra pequea?

MAT 200 - USFQ

Introduccin

En la seccin anterior se us la distribucin normal estndar para expresar el nivel de confianza. Se consider que:
La poblacin sigue una distribucin normal y se conoce la desviacin estndar de la muestra; No se conoce la forma de la distribucin de la poblacin pero el nmero de observaciones de la muestra es de por lo menos 30. Qu se hace si la muestra es inferior a 30 y se desconoce ?

MAT 200 - USFQ

Distribucin t de Student I

Cuando la muestra es menor de 30 y no se conoce la desviacin estndar de la poblacin a menudo se puede razonar que la poblacin es normal o aproximada a una distribucin normal. En estas condiciones el procedimiento estadstico correcto consiste en reemplazar la distribucin normal estndar con la distribucin t. La distribucin t es una distribucin continua que presenta muchas similitudes con la distribucin normal estndar.

MAT 200 - USFQ

Distribucin t de Student II
X t s n

Donde s es un estimador de . Al comparar la distribucin t con la distribucin normal estndar, se nota que:

al igual que la distribucin normal, es una distribucin continua. al igual que la distribucin normal, es simtrica y tiene forma de campana la distribucin t es ms plana, y ms extendida que la distribucin normal estndar; esto se debe a que la desviacin estndar de la distribucin t es mayor que la distribucin normal estndar. Debido a que la distribucin t tiene mayor extensin que la distribucin normal, el valor para t en un nivel de confianza determinado es mayor que los valores de z correspondientes.
MAT 200 - USFQ

Clculo del Intervalo de Confianza para la media poblacional con n<30 y se desconoce .

X t

s n

MAT 200 - USFQ

rbol de Toma de decisiones.


La poblacin es normal?
NO SI

n es 30 o ms?
NO SI NO

Se conoce la desviacin estndar de la poblacin?


SI

Utilice una prueba no paramtrica

Utilice la distribucin normal estndar

Utilice la distribucin t

Utilice la distribucin normal estndar

MAT 200 - USFQ

Intervalos de Confianza para una proporcin

MAT 200 - USFQ

INTERVALOS DE CONFIANZA PARA UNA PROPORCIN


PROPORCIN: Fraccin, razn o porcentaje que indica la parte de la muestra o la poblacin que tiene un rasgo de inters en particular.

Si p representa la proporcin de la muestra, X el nmero de xitos y n el nmero de elementos en la muestra, se puede determinar la proporcin de la muestra as:
PROPORCIN DE LA MUESTRA p=X/n
MAT 200 - USFQ

PROPORCIN

La proporcin de la poblacin se identifica con . Por tanto, se refiere al porcentaje de xitos en la poblacin. A fin de desarrollar un intervalo de confianza para una proporcin, se necesitan cumplir con las siguientes suposiciones.

MAT 200 - USFQ

Se debe satisfacer

La informacin de la muestra es el resultado de conteos. Slo hay dos resultados posibles. (xito y fracaso) La probabilidad de un xito sigue siendo la misma de un intento a otro. Los ensayos son independientes. El resultado de un ensayo no afecta el resultado de otro. Los valores n y n(1- ) deben ser mayores o iguales a 5.
MAT 200 - USFQ

Intervalo de confianza para una proporcin poblacional I


INTERVALO DE CONFIANZA PARA LA PROPORCIN DE UNA POBLACIN

p z p

El trmino p es el error estndar de la proporcin. Mide la variabilidad en la distribucin de muestreo de la proporcin de la muestra.

ERROR ESTNDAR DE LA PROPORCIN DE UNA MUESTRA

p = p(1 p) / n
MAT 200 - USFQ

Intervalo de confianza para una proporcin poblacional II

As se puede construir el intervalo de confianza para la proporcin de una poblacin a partir de la siguiente frmula:

INTERVALO DE CONFIANZA PARA LA PROPORCIN DE UNA POBLACIN


p z p (1 p) / n

MAT 200 - USFQ

FACTOR DE CORRECCIN PARA UNA POBLACIN FINITA

Para una poblacin finita, donde el nmero total de objetos es N y el tamao de la muestra es n, se realiza el ajuste siguiente a los errores estndar de las medias y proporciones de la muestra.

ERROR ESTNDAR DE LA MEDIA DE LAS MUESTRAS, UTILIZANDO EL FACTOR DE CORRECCIN PARA POBLACIONES FINITAS X = ( / n) (N n) / (N 1)
ERROR ESTNDAR DE LAS PROPORCIONES DE LAS MUESTRAS, UTILIZANDO EL FACTOR DE CORRECCIN PARA POBLACIONES FINITAS

p = (p(1 - p) / n ) ((N n) / (N 1))


MAT 200 - USFQ

ELECCIN DEL TAMAO APROPIADO DE LA MUESTRA

Si la muestra es demasiado grande, se gasta mucho dinero en recopilar la informacin. Si la muestra es demasiado pequea las conclusiones resultantes sern inciertas. El tamao apropiado de la muestra depende de tres factores.

El nivel de confianza deseado. El margen de error que el investigador va a tolerar. La variabilidad en la poblacin que se estudia.
MAT 200 - USFQ

Nivel de Confianza

El primer factor es el nivel de confianza, los niveles de confianza del 95% y 99% son los ms comunes, pero cualquier otro valor entre 0% y 100% es posible. El nivel de confianza del 99% corresponde a un valor z de 2.58, cuanto ms grande sea el nivel de confianza seleccionado, mayor ser el tamao de la muestra correspondiente.

MAT 200 - USFQ

Error Admisible

El segundo factor es el error admisible. El error mximo admisible. Designado como E, es la cantidad que se suma y resta de la medida de la muestra (o la proporcin de la muestra) para determinar los puntos extremos del intervalo de confianza. Es la cantidad de error que las personas que realizan el estudio estn dispuestas a tolerar. Tiene la mitad del ancho del intervalo de confianza correspondiente. Un error admisible alto permite una muestra ms pequea.

MAT 200 - USFQ

Desviacin estndar poblacional

El tercer factor al determinar el tamao de una muestra es la desviacin estndar de la poblacin. Si la poblacin est muy dispersa, se requiere de una muestra grande. Si la poblacin est concentrada (es homognea), el tamao de la muestra requerido ser menor. Tal vez ser necesario usar un estimador (ver los tres mtodos ms adelante) para la desviacin estndar de la poblacin.
MAT 200 - USFQ

Estudio Comparativo

Utilice un estudio comparativo, emplee esta estrategia cuando haya disponible, un estimador de la dispersin de otro estudio. Si la desviacin estndar observada en un estudio previo se considera confiable, se puede utilizar en el estudio actual para tener un tamao aproximado de la muestra.

MAT 200 - USFQ

Estudio basado en rango o intervalo

Emplee una estrategia basada en rango, para esto necesitamos saber o tener un estimador de los valores ms alto y ms bajo en la poblacin. Se sabe que todas las observaciones estn a ms o menos 3 desviaciones estndar de la media, suponiendo que la distribucin sea aproximadamente normal, por tanto la distancia entre los valores ms alto y ms bajo es 6 desviaciones estndar, se puede calcular la desviacin estndar como una sexta parte del rango.

MAT 200 - USFQ

Estudio Piloto

Realice un estudio piloto, este es el mtodo ms comn, se usa una muestra pequea y a partir de esta se calcula la desviacin estndar y el uso de este valor para determinar el tamao apropiado de la muestra.

MAT 200 - USFQ

TAMAO DE LA MUESTRA

En la siguiente frmula se puede expresar la interaccin entre los tres factores y el tamao de la muestra.

E = z ( s / n )

MAT 200 - USFQ

TAMAO DE LA MUESTRA
TAMAO DE LA MUESTRA PARA ESTIMAR LA MEDIA DE LA POBLACIN n = (zs / E)^2

Donde n es el tamao de la muestra. z es el valor normal estndar correspondiente al nivel de confianza deseado. s es un estimado de la desviacin estndar de la poblacin. E es el error mximo admisible.
MAT 200 - USFQ

TAMAO DE LA MUESTRA

Para determinar el tamao de la muestra para una proporcin es necesario especificar tres elementos. El nivel de confianza deseado. El margen de error en la proporcin de la poblacin. Un estimado de la proporcin de la poblacin.
MAT 200 - USFQ

TAMAO DE LA MUESTRA

La frmula para determinar el tamao de la muestra de una proporcin es:


TAMAO DE LA MUESTRA PARA LA PROPORCIN DE LA POBLACIN n = p(1 p) (z / E)^2

Si est disponible un estimador de de un estudio piloto o de alguna otra fuente, se puede utilizar, de lo contrario se usa 0.50 porque el trmino p(1 p) nunca puede ser mayor de 0.50

MAT 200 - USFQ

Anda mungkin juga menyukai