Anda di halaman 1dari 42

ESTADISTICA APLICADA

Enzo Aldo Bravo Burgos


Intervalos de confianza
PARA UNA Y DOS POBLACIONES
Introducción
Es la estimación de un parámetro dentro de un intervalo de
extremos cerrados a , b
Se establece un nivel de confianza (1 – a)%
Interpretación: Si se seleccionan muchas muestras
muestras de tamaño n, y para cada muestra se obtiene el
intervalo de confianza correspondiente, entonces
aproximadamente el (1 – a)% de estos intervalos
contendrá el verdadero valor del parámetro.
Intervalo de confianza para
UNA población N
Intervalo de confianza para
la media poblacional
Propiedades básicas de los intervalos de confianza
Los conceptos y propiedades básicas de los intervalos de confianza son más fáciles de
introducir si primero se presta atención a un problema simple, aunque un tanto irreal.
Supóngase que el parámetro de interés es una media poblacional µ y que:

1. La distribución de la población es normal.


2. El valor de la desviación estándar de la población es conocido.

Con frecuencia la normalidad de la distribución de la población es una suposición


razonable. Sin embargo, si el valor de σ2 es desconocido, no es factible que el valor de
estaría disponible (el conocimiento del centro de una población en general precede a la
información con respecto a la dispersión). En secciones posteriores, se desarrollarán
métodos basados en suposiciones menos restrictivas.
Intervalo de confianza para
la media poblacional

Caso 1: s 2 conocida:

s s
x  z1a 2    x  z1a 2
n n
EJEMPLO
Ejemplo: Una empresa fabrica focos que tienen un
tiempo de duración aproximadamente normal con
desviación estándar de 40 horas. Si una muestra de 30
focos tiene una duración promedio de 780 horas,
calcule e interprete un intervalo de confianza del 96%
para la duración promedio de todos los focos que
produce esta empresa.
Intervalo de confianza para
la media poblacional
Caso 2: s 2 desconocida:
La población de interés es normal, de modo que
X1, . . . , Xn constituyen una muestra aleatoria tomada
de una distribución normal con µ y σ2 desconocidas.

s s
x  t1a 2, n 1    x  t1a 2, n 1
n n
EJEMPLO
Los contenidos de una muestra aleatoria de 5 latas de café
instantáneo de un productor han dado los siguientes pesos netos en
gramos:
280, 290, 285, 275, 284.
a) Encuentre un intervalo de confianza del 95% para la medía de
los contenidos de todas las latas de café del productor.
b) ¿Con que grado de confianza se estima que el contenido
promedio de café tenga los límites de confianza 277. 432 y
288.168?.
Suponga una distribución normal.

Solución:
Ejemplo: Suponga que se decide hacer algunos cambios
en una empresa de modo que el tiempo medio de
producción por articulo disminuya. Hechos los
cambios, se toma una muestra aleatoria de 30 artículos,
con los cuales se obtiene un tiempo promedio muestral
de 9.45 minutos y una desviación estándar muestral de
1.41 minutos. Estime mediante un intervalo de
confianza del 95% el tiempo medio de producción por
artículo.
Intervalo de confianza para la proporción
poblacional p
Sea X1,X2,...,Xn una muestra aleatoria de tamaño n escogida de una población
de Bernoullí B(1,p). cuyo parámetro p es la proporción de éxitos en la
población. En la muestra cada Xi= 1, si hay éxito con probabilidad p, y cada
Xi = 0, si no hay éxito con probabilidad 1 - p.

p 1  p ) p 1  p )
p  z1a 2  p  p  z1a 2
n n
Ejemplo:
En una muestra aleatoria de n = 500 familias que tienen televisores en la
ciudad de Hamilton, Canadá, se encuentra que x = 340 están suscritas a
HBO. Calcule un intervalo de confianza del 95% para la proporción real
de familias que tienen televisores en esta ciudad y están suscritas a HBO.
Solución:
Ejemplo:
El encargado del control de calidad desea estimar la proporción de
artículos defectuosos. Se selecciona una muestra aleatoria simple
de 200 artículos, encontrándose 10 artículos defectuosos. Halle
una estimación por intervalo del 95% para la proporción
verdadera de artículos defectuosos en dicha producción.
Intervalo de confianza para la
varianza poblacional s 2

Intervalo de confianza para s 2 :

 n  1) s 2

s  2
2 n  1) s 2

 2
1a 2, n 1 a 2, n1

Intervalo de confianza para s :

 )
n  1 s 2

s 
 )
n  1 s 2

 2
1a 2, n 1 a2 2, n1
EJEMPLO
Una máquina produce piezas metálicas en forma
cilíndrica. Para estimar la variabilidad de los diámetros, se
toma una muestra aleatoria de 10 piezas producidas por
la máquina encontrando los siguientes diámetros en
centímetros:
10.1, 9.7, 10.3. 10.4. 9.9, 9.8, 9.9. 10.1, 10.3, 9.9.
Encuentre un intervalo de confianza del 95% para la
varianza de los diámetros de todas las piezas producidos
por la máquina. Suponga que los diámetros de las piezas
se distribuyen según la normal.

Solucion:
Ejemplo: Para estudiar el tiempo que lleva ensamblar
cierto componente de una computadora, el supervisor
de una empresa electrónica tomó el tiempo que 20
técnicos tardaban en ejecutar esta tarea, obteniéndose
una media de 12.73 minutos y una desviación estándar
de 2.06 minutos. Construya e interprete un intervalo de
confianza de 95% para la desviación estándar del
tiempo que lleva ensamblar el componente de la
computadora.
Intervalo de confianza para
dos poblaciones
Diferencia de medias poblacionales

1. Poblaciones normales con varianzas s21 y s22 conocidas

( x1  x 2 )  ( 1   2 )
z
s 12 s 22

n1 n2

s 2
s 2
( 1   2 )  ( x1  x2 )  Za / 2 1
 2
n1 n2
¿Cuándo consideramos a las medias
poblacionales iguales?

si 1  2  1  2  0
El “0” debe estar en el intervalo de confianza

Por ejemplo  2,35 , 0,58

0 I.C
Ejemplo: La media y la desviación estándar del peso máximo soportado
por 100 fierros de ½ pulgada producidos por SIDERPERU son 20 y 1.1
toneladas respectivamente. Mientras que la media y la desviación
estándar de 100 fierros de ½ pulgada IMPORTADOS de Chile son 18.8 y
0.8 toneladas respectivamente. Determinar un intervalo de confianza
del 95% para la diferencia de pesos máximos medios.
Solución: Reemplazando en la fórmula de acuerdo al
caso, tenemos:
1-α = 0.95, entonces Z1-α/2 = 1.96

X 1  20, s 1  1.1 , n1  100

X 2  18.8, s 2  0.8 , n2  100
 (1.1) 2 (0.8) 2 (1.1) 2 (0.8) 2 
20  18.8)  1.96   1   2  20  18.8)  1.96  
 100 100 100 100 
1.2  0.27  1   2  1.2  0.27
0.93  1   2  1.47

Interpretación: El peso máximo promedio soportado por los fierros de


SIDERPERU superan al IMPORTADO de Chile entre 0.93 y 1.47 Toneladas
Métricas, con una confianza del 95%
2. Poblaciones normales con varianzas
s21 y s22 desconocidas.
CASO : n1 y n2 ≥ 30

( x1  x 2 )  ( 1   2 )
z
s12 s22

n1 n2

2 2
s s
( 1   2 )  ( x1  x2 )  Za / 2 1
 2
n1 n2
3. Poblaciones normales con varianzas
s21 y s22 desconocidas pero iguales s21 = s22

tn1  n2  2 ) 
x1  x 2 )  1  2 )
n1  1)s12  n2  1)s22 . 1 1
n1  n2  2  n  n 
 1 2 

(1  2 )  ( x1  x2 )  t( n1  n2 2),a / 2
n1  1)s12  n2  1)s22 . 1  1

n1  n2  2 n
 1 n2 
 Ejemplo:
Se realizó un estudio de muestreo en el Banco
Prosperidad. Muestras aleatorias independientes de
saldos en los estados de cuenta de cheques para
clientes de dos sucursales dieron los siguientes
resultados:

Número de Promedio de la Desviación Estd.


Sucursal cuentas de cheques muestra de saldos de Muestra
Norte 12 X 1  $1000 S1  $150

X 2  $920 S2  $120
Sur 10

Determinar un intervalo de confianza del 90% para la


diferencia de las medias de los saldos en las dos
sucursales
Solución
*Tenemos dos muestras de tamaño
n1=12 n2=10
*Se obtiene los siguientes medidas estadísticas:


x1  1000 x 2  920
S1  150 S2  120
 Con una confianza del 90%

t( n  n a t  t( 20,0.95)  1.725
2  2 ,1 2 )
0.10
1 (1210 2, 1 )
2
Reemplazando en la fórmula, tenemos:

 2 9*(120 ) 2 1 1 2 9*(120 ) 2 1 1 
11*(150 ) 11*(150 )
P 100  920 )  1.725 *       100  920 )  1.725 *    0.90
 12  10  2 12 10 1 2 12  10  2 12 10 
 

P 21 . 41      181 . 41  0.90


 1 2 

Interpretación:
La diferencia entre las medias de los saldos en las dos sucursales es
de -21.41 y 181.41 dólares con 90% de confianza.
Por lo tanto no existe suficiente evidencia para afirmar que las
medias de los saldos en las dos sucursales son diferentes.
3. Poblaciones normales con varianzas
s21 y s22 desconocidas y diferentes s21 ≠ s22
2
s 2
s  2

  
1 2

t v ) 
 x 1  x 2 )   1   2 )
v  n 1 n2 
2 2
s  s 
2 2 2 2
s s
1
 2
 
1
  2
n1 n 2  n1    n2 
n1  1 n2  1

2 2
s s
( 1   2 )  ( x1  x2 )  t v ,a / 2 1
 2

n1 n2
Ejemplo
 Se determinan los valores de colesterol en niños de padres que han
fallecido por fallo cardiaco (Grupo 1) y en niños de padres sin historial
de problemas cardiovasculares (Grupo 2). Los resultados son:

n1  100 X 1  207.3 s1  35.6


n2  74 X 2  193.4 s 2  17.3

 Estima la diferencia de la concentración media de colesterol en ambos


grupos e interpreta el resultado.
Ejemplo

 Con estos valores:


n1  100 X 1  207.3 s1  35.6
n 2  74 X 2  193.4 s 2  17.3

 Calculamos:
(35.6 2 / 100  17.32 / 74) 2
v  151.4
(35.6 / 100) /(100  1)  (17.3 / 74) /( 74  1)
2 2 2 2

v  151
t151, 0.975  1.98
 El intervalo buscado es: 35.6 2 17.3 2
(207.3  193.4)  1.98  
100 74
13.9  8.09  5.80, 21.99 )
Intervalo de confianza para la razón de dos varianzas s 2
2
poblacionales s12

s s
2
s s
2 2 2
Fn1 1,n2 1)  1
 1
x 2 1
s s
2
2 s s
2
2
2
1
2
2

2 2
s1 s
1
2
F( n2 1,n1 1),a / 2 , F( n2 1,n1 1),1a / 2
2
s2 s
2
Los valores de F se tomarán para a y 1-a

Diferentes!! Fa F1a F(n1, n2)


¿Cuándo consideramos a las varianzas poblacionales
iguales?
s 2
si s s 
2
1
2 2
2
s 1 2
1
Cuando el “1” esté en el intervalo de confianza

Por ejemplo 0,47 : 3,58


1 I.C
EJEMPLO:
Se quiere comparar la variabilidad de todas las ventas mensuales
de una compañía A con la variabilidad de su competidor a la
compañía B. Se sabe que todas las ventas de A y de B se
distribuyen normalmente. Se han tomado dos muestras aleatorias
de ventas; una de 8 meses de A y otra de 6 meses de B
obteniéndose las siguientes ventas:
Muestra de A: 17, 23, 21, 18, 22, 20, 21, 19.
Muestra de B: 13, 16, 14, 12, 15, 14.
Mediante un intervalo de confianza del 95% para σ21 / σ22 . ¿Se
puede concluir que son iguales las varianzas de todas las ventas de
las compañías A y B?.
Intervalo de confianza para la diferencia de
dos proporciones poblacionales p1 – p2

( p1  p2 )  (p 1  p 2 )
z
p 1 (1  p 1 ) p 2 (1  p 2 )

n1 n2

p1q1 p 2 q2
(p 1  p 2 )  ( p1  p2 )  Z a / 2 
n1 n2
Ejemplo: Se ha encontrado que 25 de 250 videos de cine producidos
por el proceso A son defectuosas y que 14 de 180 producidos por el
proceso B son defectuosos. Suponiendo que el muestreo es aleatorio,
determinar el intervalo del 99% de confianza para la diferencia
verdadera en la proporción de videos defectuosos de los procesos A y B.
Solución:

1-a = 0.99 Entonces Za/2 = 2.58


p1 = 25 / 250 = 0.10 q1 = 1 - 0.10 = 0.90 n1 = 250
p2 = 14 / 180 = 0.08 q2 = 1 - 0.08 = 0.92 n2 = 180

 (0.10)0.90 (0.08)0.92 (0.10)0.90 (0.08)0.92 


( 0.10  0.08)  2.58 250  180  (p 1  p 2 )  ( 0.10  0.08)  2.58 250  180 
 
0.02  2.58 * 0.028  (p 1  p 2 )  0.02  2.58 * 0.028 
 0.0522  (p 1  p 2 )  0.0922 
Interpretación: La verdadera diferencia de proporción de videos
producidos por los procesos A y B están entre -5.22% y 9.22%. Es decir
no hay suficiente evidencia para decir que existe una diferencia
significativa entre los dos procesos de producción de videos.

Anda mungkin juga menyukai