Anda di halaman 1dari 20

INFERENCIA ESTADISTICA

PROBLEMAS RESUELTOS.

rv>

1) Se quieren hacer inferencias sobre una poblacin mediante un muestreo


aleatorio simple, con reemplazamiento se conocen los siguientes datos:

Poblacin normal

Tamao muestral:25 = n

2
Cuasivarianza muestral: 225= ( n 1)

a) Obtenga un intervalo de confianza del 95% para la media poblacional.


b) Obtenga un intervalo de confianza del 90% para la desviacin tpica de la
poblacin
c) Si se quiere obtener una confianza del 99% de que la estimacin
realizada de la media se encuentre a una distancia de menos de 3
unidades de la verdadera media de la poblacin.Cuantas observaciones
deberan tomarse?
d) Con la muestra inicial, realice un contraste unilateral con un nivel de
significacin del 5% para ver si se puede aceptar o no que la media de la
poblacin es menor o igual a 194.
e)

Con la muestra inicial, realice un contraste bilateral para decidir aceptar


o no que la varianza de la poblacin sea 150, de manera que sea solo del
5% la probabilidad de que si esta varianza fuera 150, el contraste nos
dijera que no.

rv>

a) Estimacin de la media de una poblacin normal con varianza desconocida y


n=25 menor a 30.
I [ X t n 1;

s
2

I 197 2.064

] ; 5%

2,5% t 24; 0.025 2.064

225

197 6.192 190.808 ; 203.192

25

b) El estimador de la varianza poblacional es:


chi.cuadrado.
2

(n 1) s 2
2

que tiene distribucin

2
(n 1) s
(n 1) s 2


; P 24 ;1
2 24 ;
2
2
2
2

0.95

2
1

0.95
2 24;1 (n 1) s 2 2 24;
2
2

(n 1) s 2
(n 1) s 2
2

P
2
0.95
2 24;

24; 1 / 2
2

Entonces el Intervalo de la var ianza :


P

24 225 24 225
I 2
;

13.848
36.415

I 12.18 ;19.75

24 . 225 24 . 225
;

36.415 13.848

rv>

c) Del Inc a) sabemos que para n= 25 y una confianza del 95%, el error de
estimacin es inferior a 6.192 unidades. Si queremos un error menor y mayor
confianza, entonces seguro necesitaremos una muestra de mayor tamao.
(n>30) ( esto nos permite trabajar con z)

s
s
I X Z
;
donde
ERROR

Z
3

2
2
n
n

Z s
2.5757 225
2
n
n
n 166
ERROR
3
SE DEBERIAN TOMAR 166 25 141 OBSERVACIO NESMAS .

d) Se trata de un contraste unilateral sobre la media de una poblacin normal


con varianza desconocida y muestra menor a 30.
H 0 : 194 ;

H 1 : 194

ESTADISTIC O DE CONTRASTE : t

X 197 194

1
s
15
5
n

REGINDE ACEPTACIN : t t n 1; t 24 ; 0.05 1.711


COMO t 1 1.711 t 24 ; 0.005, A ESTE NIVEL DE SIGNIFICACIN
NO HAY MOTIVO PARA RECHAZAR LA HIPOTESIS rv>
NULA.

e) Error tipo I:0.05, como contraste es bilateral: alfa/2=0.025.


H 0 : 2 150 ;

H 1 : 2 150

( N 1) S 2
ESTADISTIC O DE CONTRASTE :
36
2
REGION DE ACEPTACIN : 2 n 1; 1 2 ; 2 n 1;

2
12.401 ; 39.364
COMO EL VALOR DEL ESTADISTIC O DE CONTRASTE ESTA
CONTENIDO EN LA REGION DE ACEPTACION , NO HAY
MOTIVOS PARA RECHAZAR LA HIPOTESIS NULA A ESE NIVEL
2

DE SIGNIFICACIN .

rv>

2) Una empresa del sector informtico, pretende lanzar al


mercado un nuevo producto para ingenieros. Para ello realiza
un estudio de viabilidad en el mercado, efectuando una
consulta, mediante muestreo aleatorio simple a 1750
ingenieros; entre los que se ha detectado que un 44.3% tiene
intencin de realizar compra durante los prximos (3) tres
aos.
a) A partir de estos datos, la empresa realiza una
presentacin interna de los resultados , dando un
intervalo de confianza para la proporcin de intencin de
compra en tres aos de entre 0.424 y 0.462 sin informar,
sin embargo sobre el contenido probabilstico de dicho
intervalo. Calcule ese dato que falta.
b) Obtenga un intervalo de confianza del 95% para el
porcentaje de ingenieros que tienen intencin de compra
en los prximos tres aos.
rv>

a) Nuestro problema consiste en calcular el nivel de riesgo alfa, con el


cual se determino el intervalo de confianza:
n 1750 ; p 0.443 ; n p q 1750

0.443 0.557 9

se puede aproximar la distribucin binomial por la normal :

(1 )
p q
I p Z
2
2
n
n
AL INTERVALO DADO LO PODEMOS EXPRESAR : 0.443 0.019

I p Z

O SEA QUE Z

p q
0.019 Z 0.019
2
n

n
1.6000854
p q

Z 1.6

0.0558 0.1096
2
NIVELDE CONFIANZA : (1 )100 89.04%
2

b)

I 0.443 1.96

p q
0.443 0.02327 0.4197 ; 0.4663
n

rv>

PROBLEMAS SOBRE TEST DE HIPOTESIS, CON SOLUCION DETALLADA.


3) La empresa de transporte urgentes El Rpido asegura en su
publicidad que entrega el 80% de sus envos antes de las 12 de la maana.
Para contrastar la calidad de este servicio, la asociacin de consumidores
selecciona aleatoriamente 100 envos en diversos das.
a) Establecer la hiptesis nula y la hiptesis alternativa.
b) Describir, en este caso, en qu consistiran los errores tipo I y tipo II.
Cmo se llama la probabilidad de confundirnos de modo que la
asociacin acuse injustamente a la empresa de no cumplir sus
compromisos publicitarios?
c) A partir de los datos de la muestra, el informe elaborado por la
asociacin afirma que el valor obtenido es significativo. Cmo debe ser
interpretado este resultado?
Solucin:
Apartado a:
Hiptesis nula (H0) : p 0.8 al menos el 80% de los envos se entregan
antes de las 12 h. de la maana
Hiptesis alternativa (H1) : p < 0.8 menos del 80% de los envos se
entregan antes de las 12 h. de la maana
Las hiptesis as definidas, suponen plantear una prueba de contraste de
rv>
8
hiptesis unilateral.

Apartado b:
errores tipo I: rechazar la hiptesis nula, siendo sta verdadera.
errores tipo II: aceptar la hiptesis nula, siendo sta falsa.
La probabilidad de confundirnos al acusar injustamente a la empresa
sera, precisamente, el nivel de significacin de la prueba.
Estaramos cometiendo un error de tipo I.
H0 falsa
H0 verdadera
Aceptar H0

Decisin Correcta
p = 1

Error tipo II
p=

Rechazar H0:

Error tipo I
p=

Decisin Correcta
p = 1

Apartado c:
Si el valor obtenido en la prueba es significativo, entenderemos que la diferencia
encontrada no es debida al azar. Optaremos por rechazar la hiptesis nula. Es
decir, se pone en duda la afirmacin de la empresa acerca de que el 80% de los
envos se entregan antes de las 12 h. de la maana.

rv>

4) Con el objetivo de controlar la calidad de sus productos, la fbrica de


conservas PEZ ha decidido seleccionar parte de su produccin para un
anlisis detallado.
a) Comentar brevemente cmo podran seleccionarse muestras aleatorias
de esa produccin. Debera efectuarse un muestreo con o sin
reposicin? Por qu?
b) La produccin diaria es de 6.000 latas de las que el 80% son de
tamao normal y el 20% restante corresponde a la lata familiar.
Sabiendo que el tamao muestral es n = 30, justificar cuntas latas de
cada tipo deberan estudiarse.
Solucin:
Apartado a:
Una posible manera de seleccionar la muestra es partir de nmeros aleatorios
obtenidos de tablas, calculadora u ordenador.
Todas las frmulas que hemos estudiado de teora del muestreo y de inferencia
estadstica presuponen que las poblaciones son infinitas o que, si no lo son, el
muestreo aleatorio se realiza con reposicin.
Sin embargo, si la poblacin es suficientemente grande, y la muestra cumple las
condiciones de aplicacin de las pruebas o tests: es preferible seleccionar la
muestra sin reposicin, para evitar la posibilidad de que algn elemento se tenga
que tener en cuenta ms de una vez
Conviene efectuar un muestreo aleatorio estratificado; si fuera sistemtico, cabra
la posibilidad de obtener una muestra sesgada (fallos
rv>sistemticos de envasado...).
10

Apartado b:
Para efectuar un muestreo aleatorio estratificado, ser necesario que la muestra
refleje fielmente los estratos existentes en la poblacin; deben considerarse los
estratos formados por: latas de tamao Normal y latas de tamao Familiar.
El tamao muestral de cada estrato deber ser proporcional a la presencia del
mismo en la poblacin original:

TOTAL : 6000

POBLACION NORMAL :80%


FAMILIAR : 20%

TOTAL : 30

MUESTRA : NORMAL : 80% de 30 24


FAMILIAR : 20 % de 30 6

Luego, la muestra debe estar formada por 24 latas de tamao Normal y 6 latas de
tamao Familiar.

rv>

11

5) En los ltimos tiempos, las ventas medias en un comercio, rondaban


las 120.000 pesos diarias. Sin embargo, hace unos meses se abri a
poca distancia, otro comercio del mismo ramo. El establecimiento
defiende que las ventas medias se mantienen o incluso han aumentado,
pero que no han disminuido.
Para contrastar estadsticamente este supuesto se ha seleccionado una
muestra de las ventas diarias realizadas despus de la apertura de la
superficie comercial.
a) Establecer las hiptesis nula y alternativa.
b) Qu nombre recibe la probabilidad de que el establecimiento
concluya errneamente que las ventas medias han disminuido? Explica
cmo se denomina y en qu consiste el otro error posible.
c) El establecimiento ha encargado el estudio a un especialista, y en su
informe afirma textualmente que el valor obtenido al realizar el
contraste es significativo, pero el establecimiento no entiende el
significado de la frase. Significa que el establecimiento debe concluir
que sus ventas disminuyeron, o es lo contrario?

rv>

12

Solucin:
Apartado a:
Hiptesis nula (H0) : 120000 las ventas medias diarias se mantienen o incluso
han aumentado
Hiptesis alternativa (H1) : < 120000 las ventas medias diarias han disminuido.
Apartado b:
errores tipo I: rechazar la hiptesis nula, siendo sta verdadera.
errores tipo II: aceptar la hiptesis nula, siendo sta falsa.
La probabilidad de que el establecimiento concluya errneamente que las ventas
han disminuido sera, precisamente, el nivel de significacin de la prueba.
Estaramos cometiendo un error de tipo I.
H0 falsa
H0 verdadera

Aceptar H0

Decisin Correcta
p = 1

Error tipo II
p=

Rechazar H0:

Error tipo I
p=

Decisin Correcta
p = 1

Apartado c:
Si el valor obtenido al realizar el contraste es significativo, entendemos que la
diferencia encontrada no es debida al azar. Optaremos por rechazar la hiptesis nula.
Deberamos concluir que las ventas s han disminuido, aunque sera necesario
rv>
13
especificar cul es el nivel de significacin de la prueba.

6) La Secretara de la Juventud de una municipalidad, maneja el


dato de que la edad a la que los hijos se independizan de sus
padres es una variable Normal con media 29 aos y desviacin
tpica 3 aos. Aunque la desviacin tpica no plantea dudas, s se
sospecha que la media ha descendido, sobre todo por la poltica
de ayuda al empleo que ha llevado a cabo el Municipio. As, de un
estudio reciente sobre 100 jvenes que se acaban de independizar,
se ha obtenido una media de 28.1 aos de edad.
a) Con un nivel de significacin del 1%, puede defenderse que la
edad media no ha disminuido, frente a que s lo ha hecho como
parecen indicar los datos? Plantear el contraste o test de hiptesis
y resolverlo.
b) Explicar, en el contexto del problema, en qu consisten cada
uno de los errores de tipo I y II.
Nota: Algunos valores de la funcin de distribucin de la Normal de
media 0 y desviacin tpica 1: F (100) = 1; F (3) = 0.999; F (2.33) = 0.99;
F (0.01) = 0.504
rv>

14

Solucin:
Apartado a:
1. Formulamos las hiptesis nula y alternativa:
H0 : 29 la edad media no ha disminuido
H1 : < 29 la edad media ha disminuido
2. Aceptamos el nivel de significacin impuesto y que se trata de una
prueba unilateral:
= 0.01 Z = 2.33
3. Determinamos el Intervalo de Confianza para una media:
IC = x Z
n = 28.1 2.33 3 100 = (27.401, 28.799)
4. Elegimos entre H0 y H1:

Como que la media a contrastar (29) se encuentra fuera del


Intervalo de Confianza calculado, rechazamos la hiptesis nula H0;
es decir, no podemos afirmar, con un nivel de significacin del 1%,
que la edad media de emancipacin en la poblacin sea mayor o
igual a 29 aos; concluimos, por tanto, que ha disminuido.

rv>

15

Apartado b:
errores tipo I: rechazar la hiptesis nula, siendo sta verdadera.
errores tipo II: aceptar la hiptesis nula, siendo sta falsa.
En este caso:
Error tipo I: Aceptar que la edad media ha disminuido cuando en
realidad no lo ha hecho.
Error tipo II: Aceptar que la edad media no ha disminuido cuando
en realidad s lo ha hecho.

H0 verdadera

H0 falsa

Aceptar H0

Decisin Correcta
p = 1

Error tipo II
p=

Rechazar H0:

Error tipo I
p=

Decisin Correcta
p = 1

rv>

16

7) El 42% de los escolares de cierto pas suelen perder al menos


un da de clase a causa de gripes y catarros. Sin embargo, un
estudio sobre 1.000 escolares revela que en el ltimo curso hubo
450 en tales circunstancias.
Las autoridades defienden que el porcentaje del 42% para toda la
poblacin de escolares se ha mantenido.
a) Contrastar con un nivel de significacin del 5% la hiptesis
defendida por las autoridades sanitarias , frente a que el
porcentaje ha aumentado, como parecen indicar los datos,
explicando claramente a qu conclusin se llega.
b) Cmo se llama la probabilidad de concluir errneamente que el
% se ha mantenido?
Nota: Algunos valores de la funcin de distribucin Normal de
media 0
y desviacin tpica 1: F (1000) = 1; F (1.645) = 0.95; F (1.92) =
0.9726; F (0.05) = 0.5199

rv>

17

Solucin:
Apartado a:
1. Formulamos las hiptesis nula y alternativa:
H0 : p 0.42 el 42% se ha mantenido (no ha aumentado)
H1 : p > 0.42 el 42% ha aumentado
2. El nivel de significacin impuesto es del 5% y se trata de una prueba unilateral, por
tanto Z = 1.645:
3. Calculamos el Intervalo de Confianza para una proporcin: La proporcin observada
en la muestra es:

IC 0.45 1.645

450
0.45
1000

0.45 x 0.65
1000

IC p z

p (1 p )
n

, entonces IC= ( 0.424, 0.475)

4. Elegimos entre H0 y H1:


Como que la proporcin a contrastar (0.42) se encuentra fuera del Intervalo de Confianza
calculado, rechazamos la hiptesis nula H0 ; es decir, no podemos afirmar, con un nivel de
significacin del 5% que el porcentaje del 42% se ha mantenido en la poblacin.
Apartado b:
errores tipo I: rechazar la hiptesis nula, siendo sta verdadera.
errores tipo II: aceptar la hiptesis nula, siendo sta falsa.
La probabilidad de concluir errneamente que el % se ha mantenido, sera la probabilidad
de aceptar la hiptesis nula siendo sta falsa. Esta probabilidad de denomina y
determina la potencia de la prueba que es (1 ). Estaramos cometiendo un error de tipo
II.

rv>

18

8) A partir de la informacin que recoge las pautas de consumo


diario de cigarrillos de la poblacin femenina, las autoridades
sanitarias desean adoptar las medidas oportunas con objeto de
reducir dicho consumo.
0-5

5-10

10-15

15-25

25-35

10

15

Consumo
cigarrillos
Pob. femenina 2
(miles)

a) Determine el consumo ms frecuente.


b) Calcule el consumo medio y su desviacin tpica.
c) La media y desviacin tpica del consumo masculino ha sido de
15 y 4, respectivamente. Un consumo de 17 cigarrillos, en que
poblacin destaca ms? por qu?

rv>

19

Solucin:
Apartado a:
El consumo ms frecuente se corresponde con la moda de esta distribucin, que es
el intervalo Mo = (10 15) cigarrillos, o si se prefiere, con la marca de clase de
dicho intervalo: Mo = 12.5 cigarrillos.
Apartado b:
Para calcular la media y la desviacin tpica:

fi

xi f i

s 2 E ( xi ) ( E ( xi )) 2

12.986

xi f i

40.218

s 40.218 6.341
Apartado c:
Podemos presuponer una distribucin normal en el consumo de cigarrillos
tanto de los hombres como de las mujeres, y tipificar en cada caso el valor de
17 cigarrillos, mediante el cambio de variable :

Z HOMBRE

17 15
0.5 ;
4

z MUJER

17 12.986
0.633
6.341

De esta manera, comprobamos que el consumo de 17 cigarrillos destaca ms


entre las mujeres, dado que ese valor supera a la media en 0.633 veces la
desviacin tpica.

rv>

20