Anda di halaman 1dari 11

TEMA 2: ESTIMACIN PUNTUAL. ESTIMACIN POR INTERVALOS DE CONFIANZA.

1. INTRODUCCIN A LA INFERENCIA ESTADSTICA

El objetivo bsico de la inferencia estadstica es hacer inferencias o sacar conclusiones sobre la poblacin a partir de la informacin contenida en una muestra aleatoria de la poblacin. Ms especficamente, podemos decir que la inferencia estadstica consiste en el proceso de seleccin y utilizacin de un estadstico muestral, mediante el cual, utilizando la informacin que nos proporciona una muestra aleatoria, nos permite sacar conclusiones sobre caractersticas poblacionales. Cualquier inferencia o conclusin obtenida de la poblacin, necesariamente, estar basada en un estadstico muestral, es decir, en la informacin proporcionada por la muestra (formalmente definimos un estadstico como una funcin de las observaciones muestrales). La eleccin del estadstico apropiado depender de cul sea el parmetro poblacional que nos interese. El valor verdadero del parmetro ser desconocido y un objetivo sera estimar su valor, por lo que tal estadstico se denomina estimador. Las inferencias sobre el valor de un parmetro poblacional se pueden obtener bsicamente de dos maneras: a partir de estimacin o bien a partir del contraste de hiptesis. En la estimacin, basta seleccionar un estadstico muestral cuyo valor se utilizar como estimador del valor del parmetro poblacional. En el contraste de hiptesis, se hace una hiptesis sobre el valor del parmetro y se utiliza la informacin proporcionada por la muestra para decidir si la hiptesis se acepta o no. Ambos mtodos de inferencia estadstica utilizan las mismas relaciones tericas entre resultados muestrales y valores poblacionales. As pues, una muestra es sacada de la poblacin y un estadstico muestral es utilizado para hacer inferencias sobre el parmetro poblacional. En estimacin, la informacin muestral es utilizada para estimar el valor del parmetro . En el contraste de hiptesis, primero se formula la hiptesis sobre el valor de y la informacin muestral se utiliza para decidir si la hiptesis formulada debera ser o no rechazada. Pero cuando se utiliza la inferencia para estimar un parmetro poblacional debemos decir cmo de buena es esa inferencia, o sea debemos dar una medida de su bondad. Para ello ser necesario conocer la diferencia existente entre la estimacin del parmetro poblacional, calculada a partir de una muestra especfica de tamao n, y el valor verdadero del parmetro poblacional.
2. EL PROBLEMA DE LA ESTIMACIN: ESTIMACIN PUNTUAL

La estimacin estadstica se divide en dos grandes grupos: la estimacin puntual y la estimacin por intervalos. La estimacin puntual consiste en obtener un nico nmero calculado a partir de las observaciones muestrales, y que es utilizado como estimacin del valor del parmetro . Se le llama estimacin 1

puntual porque a ese nmero, que se utiliza como estimacin del parmetro , se le puede asignar un punto sobre la recta real. En la estimacin por intervalos se obtienen dos puntos ( un extremo inferior y un extremo superior) que definen un intervalo sobre la recta real, el cual contendr con cierta seguridad el valor del parmetro . El estimador del parmetro poblacional es una funcin de las variables aleatorias u observaciones muestrales y se representa por $ =g ( X 1 , X 2 ,..., X n ) Para una realizacin particular de la muestra ( x1 , x2 ,..., xn ) se obtiene un valor especfico del estimador que recibe el nombre de estimacin del parmetro poblacional y lo notaremos por $ = g ( x1 , x2 ,..., xn ) Vemos pues que existe diferencia entre estimador y estimacin. El estimador es un estadstico y, por tanto, una variable aleatoria y el valor de esta variable para una muestra concreta ( x1 , x2 ,..., xn ) ser la estimacin puntual. El estimador tendr su distribucin muestral. En la tabla 2.1 expresamos diferentes parmetros poblacionales, sus estimadores y sus estimaciones. Parmetro poblacion Estimador al Media Varianza 2 Proporci n p

Estimacin

n 1 n 2 = S2 = ( X i X )2 n 1 i =1
= p X nmeroxitos = n nmeropruebas

=X=

Xi
i =1

n 1 n s2 = xi x n 1 i =1

x=

x
i =1

= p

x n

TABLA 2.1 Parmetros poblacionales, estimadores y estimaciones. Para la eleccin de estos estimadores puntuales nos hemos basado, principalmente en la intuicin y en la posible analoga de los parmetros 2

poblacionales con sus correspondientes valores muestrales, pero ste no ser el mtodo ms adecuado para la obtencin de estimadores puntuales, aunque en este caso se obtienen estimadores satisfactorios para los parmetros poblacionales. En general, el problema de obtener estimadores puntuales no ser tan sencillo, por ello tenemos que dar propiedades que seran deseables que se cumplieran por los diferentes estimadores puntuales obtenidos, aunque no existe un mecanismo o mtodo nico que nos permita obtener el mejor estimador puntual en todas las circunstancias. Nuestro objetivo ahora ser dar algunas propiedades deseables de los estimadores puntuales, con el fin de poder conocer la bondad de los mismos, pues cuantas ms propiedades verifiquen los estimadores puntuales mejores sern.

* PROPIEDADES DESEABLES DE LOS ESTIMADORES PUNTUALES a) Estimador insesgado Si tenemos un gran nmero de muestras de tamao n y obtenemos el valor del estimador en cada una de ellas, sera deseable que la media de todas estas estimaciones coincidiera con el valor de . Se dice que un estimador es insesgado si su esperanza matemtica coincide con el valor del parmetro a estimar. b) Estimador eficiente Se dice que los estimadores son eficientes cuando generan una distribucin muestral con el mnimo error estndar ,es decir, entre dos estimadores insesgados de un parmetro dado es ms eficiente el de menor varianza. c) Estimador consistente Un estimador se dice consistente cuando su valor tiende hacia el verdadero valor del parmetro a medida que aumenta el tamao de la muestra . Es decir, la probabilidad de que la estimacin sea el verdadero valor del parmetro tiende a 1. d) Estimador suficiente Se dice de un estimador que es suficiente cuando es capaz de extraer de los datos toda la informacin importante sobre el parmetro.

3. ESTIMACIN POR INTERVALOS La estimacin puntual es poco til, pues solo obtenemos un valor como aproximacin al que tratamos de estimar. Es mucho ms interesante obtener un intervalo dentro del cual se tiene una cierta confianza de que se encuentre el parmetro que tratamos de estimar. El objetivo que se pretende con los intervalos de confianza es obtener un intervalo de poca amplitud y con una alta probabilidad de que el parmetro se encuentre en su interior. As pues, elegiremos probabilidades cercanas a la unidad, que se representan por 1- y cuyos valores ms frecuentes suelen ser 0'90, 0'95 y 0'99. Luego si deseamos obtener una estimacin por intervalo del parmetro poblacional desconocido, tendremos que obtener dos estadsticos ( X 1 , X 2 ,..., X n ) y ( X 1 , X 2 ,..., X n ) que nos darn los valores extremos del intervalo, tales que P ( X 1 , X 2 ,..., X n ) ( X 1 , X 2 ,..., X n ) = 1 Al valor 1- se le llama coeficiente de confianza, y Al valor 100(1-) % se le llama nivel de confianza. a) Intervalo de confianza para la proporcin poblacional . Si p representa la proporcin de xitos en una muestra aleatoria de tamao n suficientemente grande y q=1-p, entonces un intervalo de confianza aproximado para la proporcin poblacional p al nivel de confianza del 100(1-) % viene dado por: q q p p z + z ,p p n n 2 2 en donde z / 2 es tal que

2 y la variable aleatoria Z sigue una distribucin N(0,1).


P[Z> z / 2 ]=

b) Intervalo de confianza para la media de una poblacin normal, siendo conocida Supongamos que tenemos una muestra aleatoria de n observaciones de una distribucin N(, ). Si es conocida, y la media muestral observada es x , entonces el intervalo de confianza para la media poblacional , al nivel de confianza del 100(1-)% viene dado por: 4

, x + z / 2 x z / 2 n n
donde z / 2 es tal que P ( Z > z / 2 ) = y la variable aleatoria ZN(0,1). c) Intervalo de confianza para la media de una poblacin normal, siendo desconocida y n<30. Supongamos que tenemos una muestra aleatoria de n<30 observaciones de una distribucin N(,). Si es desconocida, y la media y la desviacin tpica muestral observadas son x y s, respectivamente, entonces el intervalo de confianza para la media poblacional , al nivel de confianza del 100(1-)% viene dado por: $ $ s s x t , x + t /2 /2 n n t donde / 2 es tal que P [ tn 1 > t / 2 ] = 2 y la variable tn 1 sigue una distribucin t-Student con n-1 grados de libertad. d) Intervalo de confianza para la varianza de una poblacin normal . Supongamos una muestra aleatoria de n observaciones de una distribucin 2 $ N(,). Si es desconocida y la varianza muestral observada es s entonces el 2 intervalo de confianza para la varianza poblacional al nivel de confianza del 100(1-)% viene dado por:
( n 1) s ( n 1) s , 2 2 n 1, / 2 n 1,1 / 2
2 donde n 1,1 / 2 es tal que: 2 2 P n 1 n 1,1 / 2 = 2 y n 1, / 2 es tal que: 2 2 P n 1 n 1, / 2 = 1

2 2
de Pearson con n-1

y la variable aleatoria grados de libertad.

2 n 1

sigue una distribucin 2

e) Intervalo de confianza para la diferencia de medias en poblaciones normales independientes Supongamos dos muestras independientes de tamao nx y n y procedentes de poblaciones normales. N ( x , x ) N ( y , y ) , respectivamente. Si las medias para las muestras y observadas son y , entonces un intervalo de confianza, al nivel de x e confianza del 100(1-)%, para las diferencias de medias poblacionales x y viene dado por:
2 2 x2 y x2 y ( x y ) z / 2 + , ( x y ) + z / 2 + nx n y nx n y

en donde z / 2 es el nmero tal que: P [ Z > z / 2 ] = una N(0, 1). 4. ESTIMACIN DEL TAMAO MUESTRAL

y la variable aleatoria Z sigue 2

Sabemos que si tomamos una muestra aleatoria simple de tamao n procedente de una poblacin N(,), siendo conocida, el intervalo de confianza al nivel del 100(1-)% para la media poblacional vena dado por: I = x z / 2 , x + z / 2 n n Siendo la amplitud del intervalo L = ( x + z / 2 ) ( x z / 2 ) = 2 z / 2 n n n

(*)

Si, previamente, se fija la longitud del intervalo L y deseamos conocer el tamao de la muestra para obtener ese intervalo al nivel de confianza del 100(1-)%, bastar despejar n de la expresin (*), pues L, z / 2 y son conocidos, y tendremos que el tamao de la muestra ser:
2 n = 4 z /2

2 L2

el cual nos permitir construir un intervalo al nivel de confianza del 100(1-)% y de amplitud L para la media de una poblacin normal con conocida.

Tambin podramos hacer el siguiente razonamiento cuando sea conocido, si la media fuera el valor central del intervalo, entonces x estimara puntualmente a sin error alguno, x |---------------------------|----------------|---------------------------| error x z / 2 n

x + z / 2

Pero generalmente x no ser exactamente igual a y entonces se comete un error, E=| x -|, que como mximo ser: E= z / 2 n entonces si queremos determinar el tamao de muestra necesario para obtener un intervalo de confianza para la media poblacional , admitiendo un error E, tendremos que despejando de la expresin anterior:
2 n = z /2

2 E2

2 2 z q z p / 2 pq Igualmente se tendra para una proporcin : n=4 = / 22 2 L E

EJERCICIOS TEMA 17 1. En un hospital psiquitrico se ha estudiado una muestra de 150 pacientes y se ha observado que 38 de ellos tienen una cierta tendencia al suicidio. Hallar un intervalo de confianza al nivel de 95% para el parmetro proporcin de individuos con tendencia al suicidio de la poblacin. 2. Se desea hacer un estudio de mercado sobre el nivel de aceptacin de un tipo de detergente. Para ello, se ha tomado una muestra aleatoria formada por 60 personas, de las cuales 45 son asiduas usuarias del citado detergente. Hallar un intervalo de confianza al nivel de 99% para la poblacin de usuarios del citado detergente en una comarca muy poblada. 3. Un psiclogo escolar ha estudiado que el tiempo de reaccin de 1 de Primaria se distribuye normalmente. Con una muestra de 100 alumnos, la media de tiempo de reaccin fue de 45 segundos y la desviacin tpica de 0,04 segundos. Hallar un intervalo de confianza para la media de tiempos de reaccin al nivel de confianza de: a) b) c) d) 90% 95% 99% Interpretar los resultados obtenidos.

4. El nivel de desarrollo cognitivo de nios de 5 aos se distribuye segn una normal con una varianza poblacional igual a 11,56. Se ha elegido una muestra aleatoria formada por 60 nios de 5 aos y se ha determinado que la media del nivel de desarrollo cognitivo es igual a 13 puntos. Hallar un intervalo de confianza para la media poblacional al nivel de 95%. Cuntos nios se debera haber tomado en la muestra para estar seguro, al nivel del 95%, de que el error mximo es 0,1? 5. Se sospecha que el nmero de unidades que contiene cada dosis de un medicamento no llega a las 10.000 que se indican en el envase pero el laboratorio que lo fabrica afirma que el contenido medio de la dosis es de 10.000 unidades. Para comprobarlo, tomamos al azar 100 dosis y determinamos el

nmero de unidades de cada una, obteniendo de media 9940 unidades y de desviacin tpica 120 unidades. Si suponemos que la distribucin del nmero de unidades en la poblacin es normal, qu podemos decir acerca de la afirmacin del laboratorio para un nivel de confianza del 99%? 6. Se afirma que la estatura media de las personas adultas de una determinada regin es de 1,80m. Queremos tener una confianza del 99% en saber si la afirmacin anterior es correcta o errnea. Para ello, tomamos una muestra al azar de 100 personas adultas, a las que medimos sus alturas, obteniendo de media 1,78 m. y de desviacin tpica 0,10 m. Suponemos que la variable objeto de estudio es normal. 7. Las edades en que se produce la muerte, para una muestra aleatoria de 39 individuos fallecidos de tuberculosis, dan una media de 50 aos y una desviacin tpica muestral de 6 aos. Suponiendo normal la distribucin, se pide: a) Estimaciones por puntos no sesgados de la media y la varianza. b) Hallar un intervalo de confianza para la media al nivel del 99%. 8. Los tiempos de reaccin ante la palabra = divorcio ? se distribuyen normalmente tanto entre los hombres como entre las mujeres. La desviacin tpica poblacional de dichos tiempos en el caso de los hombres es 6 segundos y en las mujeres es 7 segundos. Con el fin de estimar la diferencia de medias poblacionales, se escoge una muestra formada por 40 hombres y 38 mujeres, obtenindose tiempos medios de reaccin 15 segundos y 14 segundos, respectivamente. Hallar un intervalo de confianza para la diferencia de medias poblacionales al nivel del 90%. 9. En un estudio sobre hbitos de alimentacin en murcilagos, se sabe que la distancia que recorren volando en una pasada en busca de alimento sigue una distribucin normal tanto en los machos como en las hembras. Las desviaciones tpicas poblacionales son 80 y 75 metros, respectivamente. Con el fin de estimar la diferencia de medias de distancias recorridas, se toma una muestra formada por 40 machos y 35 hembras y se determinan las medias muestrales, que son, respectivamente, 230 y 140 metros. Hallar un intervalo de confianza para la diferencia de medias recorridas poblacionales al nivel del 95%. 10. De una poblacin de personas comparables con exceso de peso se seleccionan dos grupos A y B de 100 y 50 individuos, respectivamente. A los individuos del grupo A se les suministra una nueva dieta D1 con la que sufren una prdida media de peso al cabo de un mes de 7,9 Kg. con una desviacin tpica de 0,2 Kg. A los individuos del grupo B se le suministra una dieta D2 con la que sufren una prdida media de peso al cabo de un mes de 6,8 Kg., con una desviacin tpica de 0,3 Kg. Hallar los lmites de confianza del 95% para la diferencia del nmero medio de Kg. perdidos producido por el suministro de las dos dietas D1 y D2 .

11. En un Instituto de Investigaciones Dermatolgicas se est investigando una afeccin cutnea de tipo cancergeno. Se eligen 40 ratas de una misma raza aleatoriamente y se les provoca el cncer citado; a continuacin se las frota con un medicamento. Se elige como variable de respuesta el nmero de horas que tarda el cncer en desaparecer. Se obtuvieron los siguientes resultados: x =10 horas y s=101 horas. Se admite que la variable de respuesta sigue una distribucin normal. Se pide: a) Calcular el intervalo de confianza para la media de la variable de respuesta, al nivel del 90%. b) Si =99 horas, calcular el intervalo de confianza al 99% para la media de la variable de respuesta elegida. c) Que tamao de muestra se necesita para que al nivel de confianza del 95%, la longitud del intervalo sea de 5 horas, supuesto = 99 horas? 12. Con el fin estimar la proporcin de votantes favorables a un candidato, se ha elegido un muestra al azar formada por 100 personas y se ha detectado que 47 de ellas son favorables al candidato. Si el error mximo que se comete es de 0,1 determinar el tamao de la muestra, en cada caso, para que la confianza en que el candidato salga elegido sea del a) 90% b) 95% c) 99%. 13. Una muestra aleatoria formada por 130 datos extrados de poblacin normal de varianza igual a 80 presenta una media muestral de 120. Se pide: a) Hallar el intervalo de confianza para la media poblacional a los niveles de confianza del 95% y del 90%. b) Comparar los intervalos desde el punto de vista de la informacin que generan. c) Se quiere tener una confianza del 95% de que la estimacin no se separa en ms de 1,2 de la verdadera media. Cuantas observaciones adicionales debern tomarse? 14. Un director de una compaa de autobuses est interesado en la puntualidad de su servicio. Toma una muestra aleatoria s, de tamao 20 y encuentra una media de demora en minutos de 6,8 y una s muestral de 120. a) Construir un intervalo de confianza para al 99%. b) Cul debera ser el tamao n muestral para que el largo total del intervalo sea de 10 minutos? 15. Un fabricante de una determinada marca de vehculos de lujo sabe que el consumo de gasolina de sus vehculos se distribuye normalmente. Se selecciona una muestra aleatoria de 6 coches y se observa el consumo cada 100 km., obteniendo las siguientes observaciones 192, 194, 184, 186, 205, 208 Obtener un intervalo de confianza para el consumo medio de gasolina de todos los vehculos de esa marca al nivel del 90%.

10

16. El precio de un determinado artculo perecedero en los comercios de alimentacin de una ciudad sigue una distribucin normal. Se toma una muestra aleatoria de 8 comercios y se observa el precio de ese artculo, obteniendo las siguientes observaciones: 132, 125, 130, 139, 126, 138, 124, 140 Obtener el nivel de confianza del 95% a) Un intervalo de confianza para la media poblacional b) Un intervalo de confianza para la varianza poblacional 17. Se sabe que los estudiantes de una provincia duermen un nmero de horas diarias que se distribuye segn una ley Normal de media horas y desviacin tpica =2 horas. a) A partir de una muestra de 64 alumnos se ha obtenido el siguiente intervalo de confianza (7,26 - 8,14) para la media de la poblacin. Determinar el nivel de confianza con que se ha construido dicho intervalo. b) Determinar el tamao muestral mnimo necesario para que el error que se cometa al estimar la media de la poblacin por un intervalo de confianza sea, como mximo, de 0,75 h. con un nivel de confianza del 98%. 18. En una poblacin una variable aleatoria sigue una ley Normal de media desconocida y desviacin tpica 2. a) Observada una muestra de tamao 400, tomada al azar, se ha obtenido una media muestral igual a 50. Calcule un intervalo, con el 97% de confianza, para la media de la poblacin. b) Con el mismo nivel de confianza, qu tamao mnimo debe obtener la muestra para que la amplitud del intervalo que se obtenga sea, como mximo, 1? 19. Se ha medido la talla de 100 personas elegidas al azar, mediante muestra aleatoria s, de entre los estudiantes varones de bachillerato de una gran ciudad, obtenindose una talla media de 175 m. Se sabe que la desviacin tpica de la poblacin es 0,2 m. Con qu nivel de confianza se ha construido el intervalo (173 , 177) para la media poblacional? 20. La longitud de la ballena azul se distribuye segn una ley Normal con desviacin tpica 7,5 m. En un estudio estadstico realizado a 25 ejemplares se ha obtenido el intervalo de confianza (2106, 2694) para la longitud media. a) Calcule la longitud media de los 25 ejemplares de la muestra. b) Calcule el nivel de confianza con el que se ha construido dicho intervalo.

11

Anda mungkin juga menyukai