Anda di halaman 1dari 20

Captulo 8

ESTIMACION PUNTUAL Y POR


INTERVALO

8.1. INTRODUCCION
El corazon de la estadstica inferencial esta constituida por la estimacion de parametros y la prueba de hipotesis.
Entenderemos, como inferencia estadstica a un conjunto de metodos matematicos que permiten al investigador sacar
conclusiones de una poblacion a partir de las observaciones obtenidas de una muestra extrada de ella. Pero estas
conclusiones o inferencias, a diferencias de las deducciones logicas de las matematicas que son absolutas, estas son
apenas probables. Sin embargo, por la forma como se adquirir estas conclusiones o inferencias es posible que se puede
llegar a un conocimiento erroneo de la poblacion.

Es claro, que a las poblaciones se les describe mediante medidas descriptivas numericas llamadas parametro. Por
lo tanto, en la mayoras de las veces el proposito de muchas investigaciones estadsticas es estimar el valor de uno
o mas parametros de una poblacion. Por consiguiente, en este captulo trataremos el concepto de la estimacion de
un parametro, concepto fundamental de la estadstica inferencial. Estudiaremos dos tipos de problemas; el problema
de estimacion puntual, el cual consiste en dar un solo valor aproximado de un parametro de una poblacion a partir
de los datos obtenidos de una muestra, y el problema de estimacion por intervalo, que consiste en la obtencion de
un intervalo dentro del cual se encuentra el verdadero valor del parametro estimado con una cierta probabilidad o
nivel de confianza. Los parametros que mas se investigan son: la media, la proporcion, la varianza y otras que son
combinaciones de las anteriores.
A continuacion en las siguientes tablas se daran los estimadores puntuales y por intervalos de algunos parametros
y los supuestos poblacionales asociados a las estimaciones.

167
8.1. INTRODUCCION Universidad Popular del Cesar

Resumen de construccion de intervalos de confianza


para un promedio y diferencias de promedios
Parametros Supuestos Estimador Varianza Intervalo de
poblacionales puntual del estimador confianza
 Varianza Media
2
= media conocida muestral V (X ) = n x z/2 ee(X )
X N ( , 2 ) x
 Tamano de Media
s2
= media muestra muestral V (X ) = n x z/2 ee(X )
n 30 x
 Varianza descono- Media
s2
= media cida y n < 30 muestral V (X ) = n x t/2 ee(X )
 X N ( , 2 ) x y n < 30
Diferencias  Varianzas Diferencia
de conocidas de medias
X2 X2
medias  Muestras muestrales V (D) = n1
1
+ n2
2
D z/2 ee(D)
X1 X2 independientes D = x1 x2
 Xi N ( i , i2 ), i = 1, 2
Diferencias  Muestras Diferencia
de independientes de medias
s2X s2X
medias  Tamanos muestrales V (D) = n1
1
+ n2
2
D z/2 ee(D)
X1 X2 de muestras D = x1 x2
n1 30 y n2 30
Diferencias  Varianzas desco- Diferencia
de nocidas e iguales de medias
 
1
medias  Muestras muestrales V (D) = s2p n1 + n12 D t/2 ee(D)
X1 X2 independientes D = x1 x2
 Xi N ( i , 2 ), i = 1, 2

Donde

n es el tamano de la muestra

x es la media muestral

s2 es la varianza muestral

z/2 es el valor correspondiente al area bajo la curva normal P(z/2 < Z < z/2 ) = 1

168 Humberto Barrios. mail: hbarrios@unicesar.edu.co


8.1. INTRODUCCION Universidad Popular del Cesar

t(/2,n1) es el valor correspondiente al area bajo la curva t de students con n 1 grados de libertad para una
muestra, P(t/2,n1 < T < z/2,n1 ) = 1 .

t(/2,n1 +n2 2) es el valor correspondiente al area bajo la curva t de students con n1 + n2 2 grados de libertad
para dos muestras independientes, P(t/2,n1 +n2 2 < T < z/2,n1 +n2 2 ) = 1 .

La varianza muestrales combinadas


(n1 1)s21 + (n2 1)s22
s2p =
n1 + n2 2

El error de estimacion del parametro es:


q
ee( ) = V ( ).

Resumen de construccion de intervalos de confianza


para una proporcion y diferencias de proporciones
Parametros Supuestos Estimador Varianza Intervalo de
poblacionales puntual del estimador confianza
Proporcion Tamano Proporcion
p(1p)
muestra muestral V (P) = n p z/2 ee(P)
grande p
Diferencias  Muestras Diferencia
de grandes de proporciones
p1 (1p1 ) p2 (1p2 )
Proporciones  Muestras muestrales V (D) = n1 + n2 D z/2 ee(D)
1 2 independientes D = p1 p2

Donde

n es el tamano de la muestra

x es el numero de exitos en la muestra

p es la proporcion muestral y
x
p=
n

z/2 es el valor correspondiente al area bajo la curva normal P(z/2 < Z < z/2 ) = 1

El error de estimacion del parametro es:


q
ee( ) = V ( ).

169 Humberto Barrios. mail: hbarrios@unicesar.edu.co


8.1. INTRODUCCION Universidad Popular del Cesar

Estimacion del tamano de muestra


1. Para estimar un promedio X : El tamano necesario para estimar un promedio poblacional con una con-
fianza 100(1 ) y un error de estimacion alrededor de la media poblacional y con una muestra aleatoria
simple con reemplazo es:
z 2
/2
n=

Donde

a) Nivel de confianza. Los niveles de confianza es: z/2 es el valor cuantil correspondiente al area bajo la
curva normal P(z/2 < Z < z/2 ) = 1 y los mas utilizados y sus correspondientes valores z se
muestran en la tabla siguiente:

Confianza mas usadas


100(1 /2) % 80 % 90 % 95 % 98 %
Z 1.28 1.64 1.96 2.58

b) Estimacion de la varianza. Algunas de las maneras de estimar las varianzas de la poblacion para calcular
el tamano de la muestra:

a. Por los resultados de una encuesta piloto.

b. Utilizando estudios anteriores altamente correlacionado con el estudio que estamos haciendo.
c. Conjeturar sobre la estructura de la poblacion y ayudarse con algunos resultados matematicos. Por
ejemplo, si usted cree que la poblacion se distribuye en forma normal entonces rango/4.

c) Estimacion del margen error o precision. La precision deseada se puede establecer, al definir la cantidad
de margen de error tolerable en las estimaciones muestrales. Esta cantidad se determina mejor a la luz de
los usos a los cuales se van utilizar los resultados de la muestra.

2. Para estimar una proporcion P: Para estimar el tamano de muestra para una proporcion poblacion, con
un muestreo aleatorio simple con reemplazo, se utiliza la siguiente expresion:

z/2 p(1 p)
n=
2

Donde

a) Nivel de confianza. El nivel de confianza es: z/2 es el valor cuantil correspondiente al area bajo la curva
normal P(z/2 < Z < z/2 ) = 1 .

b) Notese que n es una funcion de p. Dado que p no se conoce, se puede utilizar uno de estudios anteriores
que se encuentre correlacionado con el estudio de investigacion o puede utilizarse el valor mas conservador
de p que es 0.5, puesto que maximiza a la funcion p(1 p).

170 Humberto Barrios. mail: hbarrios@unicesar.edu.co


8.1. INTRODUCCION Universidad Popular del Cesar

c) Estimacion del margen error o precision. El error de estimacion siempre se da en las mismas unida-
des del parametro que se quiere estimar, de manera tal que, con una probabilidad 100(1 /2) %, la
proporcion muestral p se encuentre en un intervalo a alrededor de la proporcion poblacional .

Resumen de construccion de intervalos de confianza


para la varianza y el cociente de dos varianzas
Parametros Supuestos Estimador Intervalo de
poblacionales puntual confianza
Varianza Varianza
(n1)s2 (n1)s2
 
2 X N ( , 2 ) muestral (1/2,n1) ,
(/2,n1)

s2
Cociente  X y Y Cociente
de dos desconocidas de varianzas
 
as2X bs2X
1 1
varianzas Muestras muestrales s2X
, s2X
2 2

X21 /X22 independientes s2X1 /s2X2

n es el tamano de la muestra

s2 es la varianza muestral

2
1/2,n1 es el valor correspondiente al area bajo la curva 2 con n1 grados de libertad con una muestra de
tamano n, P( 2 < 1/2,n1
2 ) = 1 /2.

2
/2,n1 es el valor correspondiente al area bajo la curva 2 con n1 grados de libertad con una muestra de
tamano n, P( 2 < /2,n1
2 ) = /2.

1
a= f1/2,n 1,n 1 es el cuantil inferior de una distribucion F.
2 1

b = f1/2,n1 1,n2 1 es el cuantil superior de una distribucion F.

171 Humberto Barrios. mail: hbarrios@unicesar.edu.co


8.1. INTRODUCCION Universidad Popular del Cesar

EJERCICIOS RESUELTOS
Ejemplo 8.1. Los datos que a continuacion se dan son los volumenes en centmetros cubicos del contenido de 25
bolsas de leche que se seleccionaron de un proceso de llenado con el proposito de verificar el volumen promedio: 898,
905, 900, 900, 900, 895, 908, 901, 904, 897, 902, 898, 898, 903, 894, 899, 897, 904, 901, 910, 907, 905, 903, 899,
911. Si el volumen de cada bolsa es una variable aleatoria aproximadamente normal con una varianza de 2 = 36.
Obtener:

a. Un estimacion puntual para el promedio poblacional

b. Los intervalos de confianza estimados del 90 %, 95 % y 99 %.

c. De una conclusion con respecto a los niveles de confianza dados en el punto anterior.

d. Cual debe ser el tamano de muestra necesario para estimar el volumen promedio de las bolsas de leche con una
confianza del 95 %, un error de estimacion 2 cc y una varianza 2 = 36?

Solucion 33.

1. Con base en los datos muestrales, el valor de la media muestral es: x = 901.56. Por lo tanto, una estimacion
puntual para el volumen promedio de las bolsas de leche es de 901.56 cc.

2. Un intervalo de confianza para un promedio poblacional para una poblacion que se distribuye aproximadamente
normal con una varianza conocida y un nivel de confianza 100(1 ) % es

 

x z/2 , x + z/2
n n

As, un intervalo de confianza del 90 % para la media del proceso de llenado es

 
6
901.56 1.64 = (901.56 1.97) = (899.59, 903.53)
5

Por lo tanto, podemos concluir con una confianza del 90 % que en el procedo de llenado de las bolsas de leche
salen con promedio entre 899.59 y 903.53 cc.

Los otros intervalos de confianza se obtienen llevando a cabo el mismo procedimiento. Los resultados se resu-
men en el siguiente cuadro, ver 8.1

Cuadro 8.1: Intervalos de confianza


Confianza z/2 Limite inferior Limite superior
90 % 1.64 899.59 903.53
95 % 1.96 899.21 903.91
99 % 2.58 898.46 904.66

172 Humberto Barrios. mail: hbarrios@unicesar.edu.co


8.1. INTRODUCCION Universidad Popular del Cesar

3. Observando el cuadro 8.1 se ve que para una desviacion y un tamano de muestra dados, para confianzas mas
grandes se obtienen intervalos de confianza mas anchos.

4. Para un muestreo aleatorio simple con reemplazo la formula para hallar tamano de muestra con una confianza
del 100(1 /2) %, con un error y una varianza conocida es

z 2
/2
n=

De acuerdo a lo anterior, con una confianza 95 %, un error = 2 cc y una varianza 2 = 36. Reemplazando en
la formula obtenemos  2
1.96(6)
n= = 36.
2

Por lo tanto, para estimar el contenido promedio de las bolsas de leche, en el proceso de llenado, es necesario
tomar una muestra de tamano n = 36, y esto lo hacemos con una confianza del 95 %.

Ejemplo 8.2. Se encontro en una muestra aleatoria sistematica que la concentracion promedio de zinc en las aguas
del ro Guatapur en 36 sitios diferentes fue de 2.6 gramos por mililitro y una desviacion estandar de 0.3 gramos.
Encuentre un intervalo de confianza del 95 % para la concentracion promedio de zinc en las aguas del Ro Guatapur.

Solucion 34.

Se tiene una situacion donde no se supone que tipo de distribucion tiene las mediciones de las concentraciones de
zinc en las aguas del ro Guatapur, pero se tiene un tamano de muestra superior a 30. Por lo tanto, un intervalo de
confianza para esta situacion esta dado por

 
s s
x z/2 , x + z/2
n n
Donde

x = 2.6gr es la media muestral, la cual es una estimacion puntual de la media poblacional

s = 0.3gr es la desviacion estandar obtenida de la muestra

n = 36 tamano de muestra superior a 30

z/2 = 1.96 es el valor cuantil correspondiente al area bajo la curva normal P(z/2 < Z < z/2 ) = 0.95.

Por consiguiente, reemplazando estos valores en el anterior intervalo obtenemos

    
0.3 0.3
2.6 1.96 , 2.6 + 1.96 = (2.50, 2.70)
36 36

De esta manera, podemos concluir con una confianza del 95 % que la concentracion promedio de zinc en las aguas
del ro Guatapur esta entre 2.50 y 2.70 gramos por mililitro.

173 Humberto Barrios. mail: hbarrios@unicesar.edu.co


8.1. INTRODUCCION Universidad Popular del Cesar

Ejemplo 8.3. Un fabricante de vehculos sabe que el consumo de gasolina de sus vehculos se distribuye normal-
mente. Se selecciona una muestra aleatoria simple de coches y se observa el consumo en litros cada cien kilometros
obteniendo las siguientes observaciones: 6.4, 5.9, 6.4, 6.4, 6.1, 5.9, 5.6, 6.2, 6.8, 6.9, 6.1, 6.5. Obtenga el intervalo de
confianza para el consumo medio de gasolina de todos los vehculos de este fabricante, al nivel de confianza del 99 %.

Solucion 35.

De la muestra se tiene el tamano de la muestra n = 12, la media de la muestra x = 6.27 litros por cada cien
kilometros y la desviacion estandar de la muestra s = 0.38. Es claro, que una estimacion puntual del consumo promedio
de gasolina por cada cien kilometros es x = 6.27 litros. Por otra parte, tenemos que un intervalo de confianza para el
promedio de una poblacion que se distribuye normalmente, con una varianza desconocida 2 y un tamano de muestra
n menor que 30 es

 
s s
x t/2,n1 , x + t/2,n1
n n
Donde

x = 6.27 litros por cien kilometros es la media muestral, la cual es una estimacion puntual de la media pobla-
cional

s = 0.38 es la desviacion estandar obtenida de la muestra

n = 12 tamano de muestra superior a 30

t/2,11 = 3.11 es el valor cuantil correspondiente al area bajo la curva t-student P(t/2,11 < T < t/2,11 ) =
0.99.

Por consiguiente, reemplazando estos valores en el anterior intervalo obtenemos

    
0.38 0.38
6.27 3.11 , 6.27 + 3.11 = (5.93, 6.61)
12 12

Podemos concluir, con una confianza del 99 %, que el consumo promedio de gasolina para este tipo de vehculo
esta entre 5.93 y 6.61 litros por cada cien kilometros.

Ejemplo 8.4. Una muestra aleatoria de tamano n1 = 25 que se tomo de una poblacion distribuida normalmente con
una varianza de 12 = 25 tiene una media x1 = 80. Una segunda muestra aleatoria de tamano n2 = 36, que se tomo
de una poblacion distribuida normalmente con una varianza de 22 = 9, tiene una media de x2 = 75. Encuentre un
intervalo de confianza del 95 % para 1 2 .

Solucion 36.

174 Humberto Barrios. mail: hbarrios@unicesar.edu.co


8.1. INTRODUCCION Universidad Popular del Cesar

Cuadro 8.2:
Poblacion n x s2
I 25 80 25
II 36 75 9

Los datos de las muestras se pueden resumir en el siguiente cuadro 8.2

Es claro que una estimacion puntual para la diferencia de los promedios poblacionales es: x1 x2 = 80 75 =
5. Por otra parte, puesto que las poblaciones estan distribuidas normalmente con varianzas conocidas, entonces un
intervalo de confianza para la diferencias de medias esta dado por la siguiente expresion:

 r r 
1 2 1 2
x1 x2 z/2 + , x1 2 + z/2 +
n1 n2 n1 n2

Para una confianza del 95 % se tiene que z/2 = 1.96. As, reemplazando los valores del cuadro 8.2 en el intervalo
anterior, se tiene:

r r !
25 9 25 9
80 75 1.96 + , 80 75 + 1.96 +
25 36 25 36

Por lo tanto (2.81, 7.19). As, podemos afirmar con una confianza del 95 % que la verdadera diferencia de los
promedios de las dos poblaciones esta entre 2.81 y 7.19.

Ejemplo 8.5. Se comparan las resistencias de dos clases de hilo. Cincuenta piezas de cada clase de hilo se prueban
bajo condiciones similares. La marca A tiene una resistencia a la traccion promedio de 78.3 kilogramos con una
desviacion estandar de 5.6 kg., mientras que la marca B tiene una resistencia a la traccion promedio de 87.2 kg.
con una desviacion estandar de 6.3 kg. construya un intervalo de confianza de 95 % para la diferencia de las medias
poblacionales.

Solucion 37.

Los datos de las muestras se pueden resumir en el siguiente cuadro 8.3

Cuadro 8.3:
Clases de hilo n x s
A 50 78.3 5.6
B 50 87.2 6.3

Una estimacion puntual para la diferencia de las resistencias de las dos clases de hilo es: x1 x2 = 87.3 78.3 = 9,
a favor del hilo de tipo B. Por otra parte, puesto que los tamanos de muestras son superiores a 30, entonces un intervalo
de confianza para la diferencias de medias esta dado por la siguiente expresion:

175 Humberto Barrios. mail: hbarrios@unicesar.edu.co


8.1. INTRODUCCION Universidad Popular del Cesar

s s
s21 s2 s21 s22
x1 x2 z/2 + 2 , x1 2 + z/2 +
n1 n2 n1 n2

Para un nivel de confianza del 95 % se tiene que z/2 = 1.96. As, reemplazando los valores del cuadro 8.3 en el
intervalo anterior, se tiene:

r r !
39.69 31.36 39.69 31.36
87.2 78.3 1.96 + , 80 75 + 1.96 +
50 50 50 50

Por lo tanto (6.56, 11.24). As, podemos afirmar con una confianza del 95 % que la verdadera diferencia de los
promedios de las resistencias de las dos clases de hilo esta entre 6.56 y 11.24.

Ejemplo 8.6. En un proceso qumico por lotes, se comparan los efectos de dos catalizadores sobre la potencia de la
reaccion del proceso. Se preparo una muestra de 12 lotes con el uso del catalizador 1 y se obtuvo una muestra de 10
lotes con el catalizador 2. Los 12 lotes para los que se utilizo el catalizador 1 dan un rendimiento promedio de 85 con
una desviacion estandar muestral de 4, y para la segunda muestra el promedio es 81 con una desviacion estandar de
5. Encuentre un intervalo de confianza de 90 % para la diferencia entre las dos medias poblacionales: Suponga que
las poblaciones se distribuyen normalmente con varianzas iguales.

Solucion 38.

Los datos de las muestras obtenidos de los efectos de dos catalizadores se pueden resumir en el siguiente cuadro
8.4

Cuadro 8.4:
Catalizadores n x s
1 12 85 4
2 10 81 5

Una estimacion puntual para la diferencia de los efectos de los dos catalizadores: x1 x2 = 85 81 = 4, a favor del
catalizador 1. Por otra parte, puesto que los tamanos de muestras son superiores menores a 30, las poblaciones estan
distribuidas aproximadamente normal y con varianzas iguales pero desconocidas, entonces un intervalo de confianza
para la diferencias de medias esta dado por la siguiente expresion:

r r !
1 1 1
x1 x2 t(/2,n1 +n2 2) s p + , x1 x2 + t(/2,n1 +n2 2) s p +
n1 n2 n1 n2

Donde s2p es la varianza muestral combinada es

(n1 1)s21 + (n2 1)s22


s2p =
n1 + n2 2

176 Humberto Barrios. mail: hbarrios@unicesar.edu.co


8.1. INTRODUCCION Universidad Popular del Cesar

As,
(12 1)42 + (10 1)52
s2p = = 20.05 s p = 4.48
12 + 10 2

Para un nivel de confianza del 95 % se tiene que t0.95,20 = 1.72. As, reemplazando los valores del cuadro 8.4 en el
intervalo anterior, se tiene:

r r !
1 1 1 1
85 81 1.72(4.48) + , 85 81 1.72(4.48) +
12 10 12 10

Por lo tanto (0.70, 7.30). As, podemos afirmar con una confianza del 90 % que la verdadera diferencia de los
promedios de los efectos de los dos catalizadores esta entre 0.70 y 7.30.

Ejemplo 8.7. Una encuesta realizada por Gallup revelo que si las elecciones fueran el proximo domingo, 17 de
noviembre 2013. La intencion de voto de los 1.200 encuestados, el 27 % lo hara por el presidente Juan Manuel
Santos, el 14.9 % elegira a Oscar Ivan Zuluaga, en el tercer puesto se mantiene Antonio Navarro Wolff con 12 %, en
el cuarto lugar figura Clara Lopez con 7.2 % y por ultimo Marta Luca Ramrez, con 5 % de electores. Por otra parte,
la encuesta revelo que el 30.9 % votara en blanco y un 3.2 % no sabra o no respondieron. Responda las siguientes
preguntas, bajo el supuesto que la encuesta se realizo con un muestreo aleatorio simple con reemplazo.

1. Construir un intervalo de confianza del 95 % de la verdadera proporcion de intencion de voto de los colombiano,
para cada uno de los candidatos que aspiran a la presidencia de la republica, para el proximo periodo.

2. Construir un intervalo de confianza para la diferencia entre las proporciones del voto en blanco y la intencion
de voto para el presidente Juan Manuel Santos. De una conclusion.

3. Con una confianza del 95 % y un error del 3 % cual debe ser el tamano de muestra para estimar la verdadera
proporcion de la intencion de voto que favorece al presidente Santos?

Solucion 39.

En el siguiente cuadro se muestran los estimadores puntuales de las proporciones de la intencion de vota corres-
pondiente a cada candidato incluyendo al del voto en blanco, ver 8.5.

a. Un intervalo de confianza aproximado de 100(1 ) % para la verdadera proporcion poblacional es

r r !
p(1 p) p(1 p)
p z/2 , p + z/2
n n

Donde z/2 es el valor cuantil correspondiente al area bajo la curva normal P(z/2 < Z < z/2 ) = 1 .

Como para una confianza del 95 % z/2 = 1.96, un intervalo de confianza para la proporcion de votantes que
apoyaran a Santos bajo el supuesto que el proximo domingo fueran las elecciones, sera:

177 Humberto Barrios. mail: hbarrios@unicesar.edu.co


8.1. INTRODUCCION Universidad Popular del Cesar

Cuadro 8.5:
Intencion
Pre-candidatos de voto
Juan M. Santos 27.0 %
Oscar I. Zuluaga 14.9 %
Antonio Navarro 12.0 %
Clara Lopez 7.2 %
Marta L. Ramrez 5.0 %
Voto en blanco 30.6 %
Otros 3.2 %

> #INTERVALO DE CONFIANZA PARA UNA PROPORCION CON R


> n=1200 #tama~
no de muestra
> p=0.27 #proporcion en la muestra
> con=0.95 #confianza
> #INTERVALO DE CONFIANZA
> round(p+c(-1,1)*qnorm(con+(1-con)/2)*sqrt(p*(1-p)/n),3)
[1] 0.245 0.295

r r !
0.27(0.73) 0.27(0.73)
0.27 1.96 , 0.27 + 1.96 = (0.245, 0.295)
1200 1200

Por lo tanto, estimamos con una confianza del 95 % que la proporcion de votantes que apoyaran a Santos bajo el
supuesto que el proximo domingo fueran las elecciones estara entre 24.5 % y 29.5 %.

Los demas intervalos de confianzas, para los otros candidatos, se obtienen de manera similar.

b. Un intervalo de confianza del 100(1 ) % para la diferencia de dos proporciones, con tamanos de muestras
grandes, poblaciones independientes y utilizando el Teorema del Limite Central es

s s
|p1 p2 | z/2 p1 (1 p1 ) p2 (1 p2 ) p1 (1 p1 ) p2 (1 p2 )
+ , |p1 p2 | + z/2 +
n1 n2 n1 n2

Realizando los calculos en R, con p1 = 0.306, p2 = 0.27, n1 = n2 = 1200 y con una confianza del 95 %, obtenemos

#INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE DOS PROPORCIONES CON R


> n1=1200 #tama~
no de muestra para la poblacion 1
> n2=1200 #tama~
no de muestra para la poblacion 2
> p1=0.306 #proporcion en la muestra 1

178 Humberto Barrios. mail: hbarrios@unicesar.edu.co


8.1. INTRODUCCION Universidad Popular del Cesar

> p2=0.27 #proporcion en la muestra 2


> con=0.95 #confianza
> #INTERVALO DE CONFIANZA
> round(abs(p1-p2)+c(-1,1)*qnorm(con+(1-con)/2)*sqrt(p1*(1-p1)/n1+p2*(1-p2)/n2),3)
[1] 0.000 0.072

Por lo tanto, podemos afirmar con una confianza del 95 % que no hay evidencias para afirmar que existe diferencias
significativa entre el voto en blanco y el de Santos, es decir, hay un empate tecnico.

c. Para estimar el tamano de muestra para una proporcion poblacion, con un muestreo aleatorio simple con reemplazo,
se utiliza la siguiente expresion:
z/2 p(1 p)
n=
2

Donde el error de estimacion sera la diferencia absoluta entre p de una muestra y la verdadera proporcion que
podemos aceptar y y p se puede tomar de estudios anterior o simplemente p = 0.5 el cual es un maximo para el
tamano de la muestra, como se puede ver a continuacion: sea p = 0.20, 0.30, 0.40, 0.50, 0.40, 0.30, 0.20. Haciendo
los calculos en R, obtenemos

> p=c(0.20, 0.30, 0.40, 0.50, 0.40, 0.30, 0.20)# proporciones


> con=0.95 #nivel de confianza
> ee=0.03 #error de estimacion
> n=round(qnorm(con+(1-con)/2)^2*p*(1-p)/(ee^2),0)
> #TAMA~
NOS DE MUESTRAS
p;n
[1] 0.2 0.3 0.4 0.5 0.4 0.3 0.2
[1] 683 896 1024 1067 1024 896 683

Observemos que para diferentes valores de p con una confianza y un error fijo obtenemos diferentes tamanos de
muestras, pero para p = 0.50 se obtiene el maximo. Esto solo ocurre en el caso de una proporcion.

Ejemplo 8.8. Se espera tener una cierta variacion aleatoria nominal en el espesor de las laminas de plastico que
una maquina produce. Para determinar cuando la variacion en el espesor se encuentra dentro de ciertos limites, cada
da se selecciona en forma aleatoria 12 laminas de plastico y se mide en milmetros su espesor. Los datos que se
obtuvieron son los siguientes: 10.7, 10.5, 11.4, 11.7, 16.1, 12.5, 11.0, 12.3, 12.2, 14.2, 13.1, 12.4. Si se supone que el
espesor es una variable aleatoria distribuida normal. Obtener los intervalos de confianza del 90 %, 95 % y 99 % para
la varianza desconocida del espesor.

Solucion 40.

179 Humberto Barrios. mail: hbarrios@unicesar.edu.co


8.1. INTRODUCCION Universidad Popular del Cesar

Para hallar un intervalo de confianza del 90 % para la varianza del espesor, se aplica la siguiente formula:
!
( n 1 ) s2 (n 1)s2
,
(1/2,n1) (/2,n1)

n es el tamano de la muestra

s2 es la varianza muestral

2
1/2,n1 es el valor correspondiente al area bajo la curva 2 con n1 grados de libertad con una muestra de
tamano n, P( 2 < 1/2,n1
2 ) = 1 /2.

2
/2,n1 es el valor correspondiente al area bajo la curva 2 con n1 grados de libertad con una muestra de
tamano n, P( 2 < /2,n1
2 ) = /2.

Realizando los calculo en R

> #INTERVALO DE CONFIANZA DE LA VARIANZA CON R


> x=c(10.7, 10.5, 11.4, 11.7, 16.1, 12.5, 11.0, 12.3, 12.2, 14.2, 13.1, 12.4)#datos
> n=length(x)#numero de datos
> lg=n-1#grados de libertad
> ss=var(x)#varianza de la muestra
> con=0.90#confianza
> chi1=qchisq(con+(1-con)/2,11)#cuantil superior
> chi2=qchisq((1-con)/2,11)#cuantil inferior
> #INTERVALO DE CONFIANZA
> round(c((n-1)*ss/chi1,(n-1)*ss/chi2),2)
[1] 1.39 5.99

Por lo tanto, un intervalo de confianza del 99 % para la varianza poblacional, 2 , esta entre 1.39 y 5.99.

Ejemplo 8.9. Una empresa fabrica propulsores. A los ingenieros les gustara saber cual de dos procesos tiene la
menor rugosidad en las superficies. Para ello se toman muestras aleatorias de cada proceso. Datos.

Proceso 1 n1 = 16, s1 = 4.7

Proceso 2 n2 = 12, s2 = 5.1

Solucion 41.

Supongase que se tienen dos poblaciones normales e independientes con varianzas desconocidas 12 y 22 , res-
pectivamente. De este par de poblaciones, se tienen disponibles dos muestras aleatorias de tamanos n1 y n2 , respec-
tivamente, sean s21 y s22 las dos varianzas muestrales. Si se desea, por ejemplo, conocer un intervalo de confianza del
12
1000(1 ) % por ciento para el cociente de las dos varianzas 22
se tiene

180 Humberto Barrios. mail: hbarrios@unicesar.edu.co


8.2. EJERCICIOS Universidad Popular del Cesar

!
as2X1 bs2X1
,
s2X2 s2X2

n1 es el tamano de la muestra de la poblacion 1

n2 es el tamano de la muestra de la poblacion 2

s21 es la varianza muestral de la poblacion 1

s22 es la varianza muestral de la poblacion 2

1
a= f1/2,n 1,n 1 es el cuantil inferior de una distribucion F.
2 1

b = f1/2,n1 1,n2 1 es el cuantil superior de una distribucion F.

Los resultados se derivan de R, se muestran a continuacion:

> #INTERVALO DE CONFIANZA PARA EL COCIENTE DE DOS VARIANZAS


> con=0.90
> n1=16#tama~
no de muestra de la primera poblacion 1
> n2=12#tama~
no de muestra de la primera poblacion 2
> s1=4.7#desviacion e la primera poblacion 1
> s2=5.1#desviacion e la primera poblacion 1
> a=1/qf(con+(1-con)/2,n1-1,n2-1)#cuantil inferior de F
> b=qf(con+(1-con)/2,n2-1,n1-1)#cuantil superior de F
> #INTERVALO DE CONFIANZA
> round(c(a*s1^2/(s2^2),b*s1^2/(s2^2)),2)
[1] 0.31 2.13

Como el intervalo de confianza (0.31, 2.13) incluye al uno, no se puede concluir que exista alguna diferencia entre
la variabilidad de los dos procesos. Es decir, el intervalo de confianza incluye la posibilidad de que las dos desviaciones
estandar sean iguales, puesto que el cociente puede ser igual a uno.

8.2. EJERCICIOS
1. Se sabe que el peso de los ladrillos producidos por una determinada fabrica sigue una distribucion normal con
una desviacion tpica de 0.12 kilos. En el da de hoy se extrae una muestra aleatoria de 60 ladrillos cuyo peso
medio es de 4.07 kilos.

a. Calcular un intervalo de confianza del 99 % para el peso medio de los ladrillos producidos hoy.

b. Sin realizar los calculos, determinar si un intervalo de confianza del 95 % para la media poblacional tendra
mayor, menor o la misma longitud que el calculado en el apartado a.

181 Humberto Barrios. mail: hbarrios@unicesar.edu.co


8.2. EJERCICIOS Universidad Popular del Cesar

c. Se decide que manana se tomara una muestra de 20 ladrillos. Sin realizar los calculos, determinar si un
intervalo de confianza del 99 % para el peso medio de los ladrillos producidos manana tendra mayor, menor
o la misma longitud que el calculado en el apartado a.

d. Se sabe que la desviacion tpica poblacional para la produccion de hoy es de 0.15 kilos. Sin realizar los
calculos, determinar si un intervalo de confianza del 99 % para el peso medio de los ladrillos producidos hoy
tendra mayor, menor o la misma longitud que el calculado en el apartado a.

e. Hallar el tamano muestral necesario para calcular un intervalo de confianza del 90 % para el peso medio
poblacional de los ladrillos, cuya amplitud a cada lado de la media muestral sea igual a 0.01 kilos.

2. Un supervisor de control de calidad en una enlatadora sabe que la cantidad exacta en cada lata vara, pues
hay ciertos factores imposibles de controlar que afectan a la cantidad de llenado. El llenado medio por lata es
importante, pero igualmente importante es la variacion s2 de la cantidad de llenado. Si s2 es grande, algunas
latas contendran muy poco, y otras, demasiado. A fin de estimar la variacion del llenado en la enlatadora, el
supervisor escoge al azar 10 latas y pesa el contenido de cada una, obteniendo el siguiente pesaje (en onzas):
7.96, 7.90, 7.98, 8.01, 7.97, 8.03, 8.02, 8.04, 8.02 Establezca un intervalo de confianza de 90 % para la verdadera
variacion del llenado de latas en la enlatadora.

3. Es comun utilizar el acero inoxidable en las plantas qumicas para manejar fluidos corrosivos. Sin embargo, este
acero tienen especial susceptibilidad al agrietamiento por corrosion causada por esfuerzos en ciertos entornos.
En una muestra de 295 fallas de aleaciones de acero que ocurrieron en refineras de petroleo y plantas petro-
qumicas en Venezuela durante los ultimos 10 anos, 118 se debieron a agrietamiento por corrosion causada por
esfuerzos y a fatiga de corrosion. Establezca un intervalo de confianza de 95 % para la verdadera proporcion de
fallas de aleaciones causadas por agrietamiento por corrosion debido a esfuerzos.

4. Supongamos que el tiempo en horas dedicado por los estudiantes de una determinada asignatura a preparar el
examen final tiene una distribucion normal. Se toma una muestra aleatoria de 6 estudiantes cuyos resultados son
los siguientes: 12.2, 18.4, 23.1, 11.7, 8.2, 24

a. Calcular un intervalo de confianza del 99 % para la media poblacional.

b. Calcular un intervalo de confianza del 99 % para la varianza poblacional.

c. Sin realizar los calculos, determinar si un intervalo de confianza del 90 % tendra una amplitud mayor o
menor que el hallado en el apartado b.

5. Para comparar la estatura media de los habitantes de dos regiones de Colombia se toman dos muestras aleatorias
de tamanos 150 y 250. Los resultados obtenidos fueron:

Supuesta la distribucion de la altura como una normal, se pide calcular al nivel de confianza del 98 %:

a. Intervalo de confianza de la media poblacional de la region 1.

182 Humberto Barrios. mail: hbarrios@unicesar.edu.co


8.2. EJERCICIOS Universidad Popular del Cesar

Region x s n
Andina 1.73 0.10 150
Costa 1.70 0.12 250

b. Intervalo de confianza de la media poblacional de la region 2.

c. Intervalo de confianza de la diferencia de medias poblacionales.

6. Un gabinete de investigacion quiere estimar la proporcion de consumidores que adquiriran antes un producto
de fabricacion nacional que uno elaborado por un competidor extranjero. Su intencion es construir un intervalo
de confianza para la proporcion poblacional con una amplitud maxima a cada lado de la proporcion muestral de
0.04. Cuantas observaciones se necesitan, incluir en la muestra, para alcanzar este objetivo?

7. Se encuentra que la concentracion promedio de zinc que se saca del agua a partir de una muestra de mediciones
de zinc en 36 sitios diferentes del rio Guatapur es de 2.6 gramos por mililitros. Encuentre un intervalo de
confianza de 95 % y 99 % para la concentracion media de zinc en el ro. Suponga que la desviacion estandar de
la poblacion es 0.3.

8. Una empresa electrica fabrica bombillas y su tiempo de duracion se distribuyen aproximadamente normal, con
una varianza de 1296. Se ensaya una muestra de 35 bombillas y arroja una duracion promedia de 800 horas.

a. Hallar una estimacion puntual para la media poblacional. De una interprete.

b. Con un nivel de confianza del 95 % estime la media poblacion de todos las bombillas que produce la empresa.
Interprete los resultados.

c. Cuantas bombillas se deben probar para un nivel de confianza 95 %, si se desea que nuestra estimacion
puntual este dentro de las 10 horas de la media real? Interprete el resultado obtenido.

d. Con relacion al punto anterior. Que le ocurre al tamano de la muestra s: S aumente el nivel de confianza?
Si se disminuye la varianza? Si se disminuye el error de estimacion?. Haga una conclusion de lo observado.

9. Las estaturas de una muestra aleatoria de 50 estudiantes de la Universidad Popular del Cesar (UPC) da una
media de 175 centmetros y una desviacion estandar de 7 centmetros.

a. Hallar una estimacion puntual para la media poblacional. Interprete los resultados.

b. Hallar una estimacion para la varianza del promedio muestral? Interprete los resultados.

c. Hallar un error de estimacion para la media muestral? Interprete los resultados.

d. Estime el promedio poblacional de las estaturas de los estudiantes de la UPC, con una confianza del 95 %.
Interprete los resultados.

10. Una maquina produce piezas metalicas de forma cilndrica. Se toma una muestra de nueve piezas y las medidas
de los diametros son: 1.01, 0.97, 1.03, 1.04, 0.99, 0.98, 0.99, 1.01 y 1.03 centmetros. Se conoce que el diametro
de las piezas producidas por la maquina se distribuyen aproximadamente normal.

183 Humberto Barrios. mail: hbarrios@unicesar.edu.co


8.2. EJERCICIOS Universidad Popular del Cesar

a. Hallar una estimacion puntual para la media poblacional. Interprete los resultados.

b. Hallar una estimacion para la varianza del promedio muestral? Interprete los resultados.

c. Hallar un error de estimacion para la media muestral? Interprete los resultados.

d. Estime un intervalo de confianza para el promedio poblacional del diametro de los cilindros producidos por
la maquina, con una confianza del 99 %. Interprete los resultados.

e. Realice una nueva estimacion con un nivel de confianza menor, compare con los resultados anteriores y
concluya con su juicio crtico.

11. Se sabe que el peso de los ladrillos producidos por una determinada fabrica sigue una distribucion normal con
una desviacion tpica de 0.12 kilos. En el da de hoy se extrae una muestra aleatoria de 60 ladrillos cuyo peso
medio es de 4.07 kilos.

a. Calcular un intervalo de confianza del 99 % para el peso medio de los ladrillos producidos hoy.

b. Sin realizar los calculos, determinar si un intervalo de confianza del 95 % para la media poblacional tendra
mayor, menor o la misma longitud que el calculado en el apartado a.

c. Se decide que manana se tomara una muestra de 20 ladrillos. Sin realizar los calculos, determinar si un
intervalo de confianza del 99 % para el peso medio de los ladrillos producidos manana tendra mayor, menor
o la misma longitud que el calculado en el apartado a.

d. Se sabe que la desviacion tpica poblacional para la produccion de hoy es de 0.15 kilos. Sin realizar los
calculos, determinar si un intervalo de confianza del 99 % para el peso medio de los ladrillos producidos hoy
tendra mayor, menor o la misma longitud que el calculado en el apartado a.

e. Hallar el tamano muestral necesario para calcular un intervalo de confianza del 90 % para el peso medio
poblacional de los ladrillos, cuya amplitud a cada lado de la media muestral sea igual a 0.01 kilos.

12. Un supervisor de control de calidad en una enlatadora sabe que la cantidad exacta en cada lata vara, pues
hay ciertos factores imposibles de controlar que afectan a la cantidad de llenado. El llenado medio por lata es
importante, pero igualmente importante es la variacion s2 de la cantidad de llenado. Si s2 es grande, algunas
latas contendran muy poco, y otras, demasiado. A fin de estimar la variacion del llenado en la enlatadora, el
supervisor escoge al azar 10 latas y pesa el contenido de cada una, obteniendo el siguiente pesaje (en onzas):
7.96, 7.90, 7.98, 8.01, 7.97, 8.03, 8.02, 8.04, 8.02. Establezca un intervalo de confianza de 90 % para la verdadera
variacion del llenado de latas en la enlatadora.

13. Es comun utilizar el acero inoxidable en las plantas qumicas para manejar fluidos corrosivos. Sin embargo, este
acero tienen especial susceptibilidad al agrietamiento por corrosion causada por esfuerzos en ciertos entornos.
En una muestra de 295 fallas de aleaciones de acero que ocurrieron en refineras de petroleo y plantas petro-
qumicas en Venezuela durante los ultimos 10 anos, 118 se debieron a agrietamiento por corrosion causada por
esfuerzos y a fatiga de corrosion. Establezca un intervalo de confianza de 95 % para la verdadera proporcion de
fallas de aleaciones causadas por agrietamiento por corrosion debido a esfuerzos.

184 Humberto Barrios. mail: hbarrios@unicesar.edu.co


8.2. EJERCICIOS Universidad Popular del Cesar

14. Supongamos que el tiempo en horas dedicado por los estudiantes de una determinada asignatura a preparar el
examen final tiene una distribucion normal. Se toma una muestra aleatoria de 6 estudiantes cuyos resultados son
los siguientes: 12.2, 18.4, 23.1, 11.7, 8.2, 24.

a. Calcular un intervalo de confianza del 99 % para la media poblacional.

b. Calcular un intervalo de confianza del 99 % para la varianza poblacional.

c. Sin realizar los calculos, determinar si un intervalo de confianza del 90 % tendra una amplitud mayor o
menor que el hallado en el apartado b.

15. Para comparar la estatura media de los habitantes de dos regiones de Colombia se toman al azar dos muestras
aleatorias de tamanos 150 y 250. Los resultados obtenidos fueron:

Region x s n
Andina 1.73 0.10 150
Costa 1.70 0.12 250

Supuesta la distribucion de la altura como una normal, se pide calcular al nivel de confianza del 98 %:

a. Intervalo de confianza de la media poblacional de la region 1.

b. Intervalo de confianza de la media poblacional de la region 2.

c. Intervalo de confianza de la diferencia de medias poblacionales.

16. Un gabinete de investigacion quiere estimar la proporcion de consumidores que adquiriran antes un producto
de fabricacion nacional que uno elaborado por un competidor extranjero. Su intencion es construir un intervalo
de confianza para la proporcion poblacional con una amplitud maxima a cada lado de la proporcion muestral de
0.04. Cuantas observaciones se necesitan, incluir en la muestra, para alcanzar este objetivo?

17. Se encuentra que la concentracion promedio de zinc que se saca del agua a partir de una muestra de mediciones
de zinc en 36 sitios diferentes del rio Guatapur es de 2.6 gramos por mililitros. Encuentre un intervalo de
confianza de 95 % y 99 % para la concentracion media de zinc en el ro. Suponga que la desviacion estandar de
la poblacion es 0.3.

18. De 1000 casos de cancer pulmonar seleccionados aleatoriamente, 823 son de pacientes que fallecieron.

a. Construya un intervalo de confianza del 95 % para la tasa de cancer pulmonar.

b. Que grande debe ser el tamano de la muestra para tener una confianza del 95 % de que el error al estimar la
tasa de mortalidad del cancer pulmonar no sea superior a 0.03 %?

19. Se tomo una muestra aleatoria de 50 cascos utilizados por los corredores de motocicletas y los conductores de
automoviles de carrera, y se someten a una prueba de impacto. En 18 de los cascos se observa cierto dano.

185 Humberto Barrios. mail: hbarrios@unicesar.edu.co


8.2. EJERCICIOS Universidad Popular del Cesar

a. Encuentre un intervalo de confianza del 95 % para la verdadera proporcion de cascos de este tipo que mos-
traran dano como resultado de la prueba?

b. Al utilizar la estimacion puntual de p obtenida a partir de la muestra preliminar de 50 cascos. Cuantos


cascos debe probarse para tener una confianza del 95 % de que el error al estimar el verdadero valor de p sea
menor que 0.02?

c. De que tamano debe ser la muestra si se desea tener una confianza del 95 % de que el error al estimar p sea
menor que 0.02, sin importar el valor verdadero de p?

20. Un fabricante de calculadoras electronicas esta interesado en estimar la fraccion de unidades defectuosas pro-
ducidas.Toma una muestra aleatoria de 50 calculadoras y resultaron 5 defectuosas. Calcule un intervalo de
confianza del 99 % para la fraccion de calculadoras defectuosas?

21. Se lleva a cabo un estudio para determinar la efectividad de una nueva vacuna contra la gripe. Se administra la
vacuna a una muestra aleatoria de 3000 sujetos, y de este grupo 13 contraen gripe. Como grupo de control se
seleccionaron de manera aleatoria 2500 sujetos, a los cuales no se les administro la vacuna, y de este grupo 170
contraen gripe. construya un intervalo de confianza del 95 % para la diferencia entre las dos proporciones.

22. Se analiza la fraccion de productos defectuosos por dos lneas de produccion. Una muestra de 100 unidades
provenientes de la lnea 1 contiene 10 que son defectuosas, mientras una muestra aleatoria de 120 unidades de
la lnea 2 tiene 25 que son defectuosas. Encuentre un intervalo de confianza del 99 % para la diferencia en
fracciones de productos defectuosos producidos por las dos lneas?

186 Humberto Barrios. mail: hbarrios@unicesar.edu.co