Anda di halaman 1dari 4

INTERROGACIÓN 3 – EYP1010

Elija responder la pregunta 1 o 2, solo se corregirá una.

1. Explique cuál es el principal objetivo e interés de desarrollar algún procedimiento de inferencia en estadı́stica.
Solución: El principal objetivo e interes de desarrollar algún procedimiento estadı́stico es poder conocer
acerca de la población. En la mayorı́a de los casos solo se tiene acceso a una muestra y mediante la inferencia
podremos concluir con los datos muestrales cosas interesantes de la población.

2. Tal como se 
reviso en clases, el Teorema del Lı́mite Central nos indica que bajo ciertas condiciones se cumple
2
˙ N µ, σn . Sin embargo, al momento de encontrar la distribución muestral de p̂ usamos el mismo
que X̄ ∼
 
Teorema y se obtiene que p̂ ∼ ˙ N p, p(1−p)
n . Indique porque p̂ puede considerarse como un promedio.
Solución: El Teorema del Lı́mite Central indica que si tengo una colección
  de variables aleatorias i.i.d. con
2 σ2
esperanza común µ y varianza común 0 < σ < ∞. Entonces X̄ ∼ ˙ N µ, n .
De forma particular, podemos elegir nuestra colección de variables aleatorias con distribución
 bernoulli
 de
p(1−p)
parámetro p. Luego la esperanza común sera p y su varianza p(1 − p). Por ende, p̂ ∼
˙ N p, n
Respondiendo la pregunta, las variables Bernoulli corresponde a valores 0 o 1, dado que también se puede
pensar como una binomial(n = 1, p), de este modo 0 representa el “no éxito” y 1 el “éxito”. Por ejemplo:
Puedo definir que 1 será “sale cara al lanzar la moneda” y 0 “no sale cara al lanzar la moneda”. Luego podrı́a
tener 10 realizaciones de la v.a. estas son: 0, 1, 1, 1, 0, 0, 0, 1,1,0.
La proporción de caras que se obtuvieron (p̂) puede ser calculada sumando la cantidad de caras obtenidas
5
(equivalente a sumar los 1’s) y dividirlos por el total de realizaciones, esto es 10 = 0,5.
Por otra parte, se podrı́a calcular el promedio de estos valores, ası́:

0+1+1+1+0+0+0+1+1+0
X̄ = = 0,5
10

Por tanto p̂ puede verse como un promedio de v.a. bernoulli.


En adelante, debe responder todas las preguntas.

3. Se tienen 80 variables aleatorias independientes con distribución Poisson de parámetro λ = 8, llamémoslas


Q1 , Q2 , . . . , Q80 .

(a) Encuentre P (Q75 > 1)


80
1 X 
(b) Sea Q̄ = Qi , calcule P Q̄ > 8,5 .
80 i=1

1
Solución: Sabemos que Qi ∼ P oi(λ = 8) donde E(Qi ) = 8 y V (Qi ) = 8; con i = 1, . . . 80. Ası́ por el Teorema
del Limite Central, ya que corresponden a variables i.i.d, se tiene que Q̄ ∼
˙ N (8, 0,1)

(a) P (Q75 > 1) = 1 − P (Q75 ≤ 1) = 1 − P (Q75 = 0) − P (Q75 = 1) = 1 − e−8 − 8 × e−8 = 0,99698.


 
(b) P Q̄ > 8,5 = 1 − P Q̄ ≤ 8,5 = 1 − P Z ≤ (8,5−8)
 

0,1
= 1 − P (Z ≤ 1,58) = 0,0571.

4. Una industria dedicada a la fabricación de harina, para llenar los paquetes usa una máquina. Se considera
que el contenido de harina (kilos) en los paquetes tiene una distribución normal.
Para estudiar el contenido de estos paquetes, se toma una muestra aleatoria de los paquetes envasados por la
máquina obteniendo los siguientes resultados:

1.03 1.05 1.08 0.90 1.10 1.20 1.09 1.13 1.04 1.08
0.90 1.00 1.06 1.08 1.15 0.92 1.07 1.21 0.85 1.11
0.70 0.99 0.40 0.60 1.50 2.30 0.80 0.90 1.21 0.77

Se considera que un paquete no cumple con las normas, si su contenido es inferior a un kilo.

(a) En base a la muestra y usando un nivel de significancia del 10 %, estime un intervalo de confianza para la
proporción de paquetes que cumplan con la norma.
(b) ¿Qué sucede con el tamaño del intervalo anterior si el nivel de significancia es del 5 %?
(c) Indique la proporción de intervalos que contienen al verdadero valor del parámetro.

Solución: Sea p la proporción de paquetes que cumplen con la norma.


19
Tenemos que p̂ = = 0,63 y el tamaño muestral es n = 30.
30
(a) Sabemos que un IC para p viene dado por:
" r r #
p̂(1 − p̂) p̂(1 − p̂)
p̂ − Z1− α2 × ; p̂ + Z1− α2 ×
n n

Previo a aplicar el procedimiento, debemos verificar si se cumplen las condiciones necesarias para proseguir,
esto es:
n × p̂ ≥ 10 y n × (1 − p̂) ≥ 10

lo cual es correcto porque n × p̂ = 19 y n × (1 − p̂) = 11


Por tanto reeemplazando y considerando α = 0,10 tenemos:
" r r #
0,63(1 − 0,63) 0,63(1 − 0,63)
0,63 − Z1− 0,10 × ; 0,63 + Z1− 0,10 × = [0,4850 ; 0,7750]
2 30 2 30

(b) En el caso anterior con α = 0,10 calculamos Z0,95 = 1,644854. Si α cambia a 0.05 entonces se debe calcular
Z0,975 que equivale a 1.96 por tanto como Z0,975 es mayor al Z0,95 entonces el IC será más amplio.
(c) La proporción de intervalos que contienen al verdadero valor del parámetro varı́a en la letra (a) y (b), esto
dado que tiene directamente relación con la interpretación de la confianza de un intervalo de confianza.
Por tanto en (a) es un 90 % y en (b) es un 95 %.

5. ¿Cuánta grasa suelen tener las galletas light? Suponga que se toma una muestra aleatoria de 51 galletas
reducidas en grasa y se testean en un laboratorio, encontrando que la media de la grasa contenida es de 4,2

2
gramos. Se calcula un intervalo de confianza al 95 % de confianza y se encuentra que el margen de error es
±0,8.
Solución: Dado que todos los intervalos de confianza vistos en clases se construyen como

Estimador ± margen de error

, y cumpliendose que tenemos más de 30 observaciones. El nivel de grasa promedio (µ) tendrá por intervalo
de confianza
[4,2 − 0,8 , 4,2 + 0,8] = [3,4 , 5,0]

. Luego con alta probabilidad las galletas ligth tendrán entre un 3.4 y 5.0 gramos de grasa.

6. Para los siguientes casos, identifique el parámetro y estadı́stico asociado. Justifique su elección.

(a) En una ciudad A, se toma una muestra aleatoria simple de 98 cabezas de familia de las cuales 48 han sido
contagiadas por un extraño virus. En otra ciudad B, se selecciona otra muestra aleatoria simple de 127
cabezas de familia de las cuales 21 han sido contagiadas por el mismo virus. Se desea estudiar si existe
diferencia entre proporciones de cabezas de familia que no han sido contagiadas por este extraño virus.
(b) Se sabe que, de las mujeres a quienes se les diagnóstica cáncer de mama inicial, una tercera parte de
ellas muere de la enfermedad. Es por ello que cientı́ficos han trabajado en un nuevo tratamiento para
incrementar la tasa de supervivencia de personas con cáncer de mama. Para probar la efectividad del
nuevo tratamiento, se seleccionó una muestra aleatoria de 200 mujeres con la enfermedad que fueron
sometidas a este tratamiento. De ellas, 164 mujeres sobreviven.
(c) Un investigador desea probar si existe diferencia de sueldos en parejas heterosexuales donde ambas per-
sonas trabajan.
(d) Un invetigador está interesado en determinar si una reducción del consumo de lactosa, altera la absorción
de energı́a. Un grupo de 8 recién nacidos se alimento con leche materna y, otro grupo de 10 recibió
una fórmula que contenı́a solo la mitad de la lactosa presente en la leche materna. Las distribuciones de
absorción de energı́a en carbohidratos de las 2 poblaciones son aproximadamente normales. En el primer
grupo la absorción de energı́a media fue de 87 % y una desviación estándar de 4.5 %. En el segundo grupo,
la media fue de 90 % y una desviación estándar de 4.5 %.
(e) Un técnico deportivo preocupado por la efectividad que puede tener su entrenamiento en los alumnos, el
primer y último dı́a de clases, programa que los estudiantes corran 2 kilometros para registrar su tiempo.
El objetivo es determinar si mejoraron su resistencia cardiorespiratoria.

Solución:

(a) Parámetro: p1 − p2 , Estadı́stico: pˆ1 − pˆ2 . Justificación: explicitamente nos indican que se desea saber si
exiten diferencia de proporciones de cabezas de familia no contagiadas en cada una de las ciudades.
(b) Parámetro: p , Estadı́stico: p̂. Justificación: nos indican que 164 mujeres cumplen la caracterı́stica de
sobrevivir y nos indican el total de la muestra, la única opción es propoción.
¯ Justificación: Es de interes estudiar la diferencia de sueldos en las parejas
(c) Parámetro: µd , Estadı́stico: d.
por tanto mi objeto de estudio es la pareja y hago dos mediciones, sueldo de la mujer, sueldo del hombre,
por tanto es diferencia de medias en datos pareados.
(d) Parámetro: µ1 − µ2 , Estadı́stico: X̄1 − X̄2 . Justificación: Se tiene una variable continua que determina la
absorción de energı́a y se tienen dos grupos, y el objetivo es determinar si reducir el consumo de lactosa
depende de en que grupo me encuentre, la única opción es diferencia de medias en datos independientes.

3
¯ Justificación: tenemos que a cada alumno se le realizan dos mediciones, y
(e) Parámetro: µd , Estadı́stico: d.
se desea ver si mejoró su resistencia cardio respiratoria, la única forma de hacerlo es mediante diferencia
de medias en datos pareados.

Anda mungkin juga menyukai