Anda di halaman 1dari 10

Universidad del Valle

Facultad de Ingeniería
Escuela de Estadística
Muestreo Estadístico
Profesor: Rafael Klinger
Taller N° 3

1) Una población está formada por dos estratos en los cuales se han medido las variables 𝑋 e 𝑌 con los
siguientes resultados:

Estrato I Estrato II
Unidad 𝑥1𝑖 𝑦1𝑖 𝑥2𝑖 𝑦2𝑖
1 4 3 5 6
2 6 3 6 10
3 7 4 7 9
4 4 4

Tomando muestras de tamaño 2 en el estrato I y de tamaño 3 en el estrato II ( 𝑛1 = 2 , 𝑛2 =3).

a) ¿Cuántas muestras resultan por estrato? Y ¿Cuántas para la población?


b) Escriba todas las muestras
c) Usando estimadores de Razón encuentre 𝐸(𝑌̅̂𝑅𝑆 ); 𝑉(𝑌̅̂𝑅𝑆 ) y 𝐸𝐶𝑀(𝑌̅̂𝑅𝑆 )

2) En un censo agrícola para la región ABC se encontró que para 486 granjas, el promedio de acres de tierra
cultivable fue de 𝜇𝑥 = 52 acres. En la actualidad se desea investigar el promedio de acres 𝜇𝑦 dedicado al
cultivo de sorgo.

a) ¿Qué tamaño de muestra se debe tomar para estimar 𝜇𝑦 usando el método de regresión, sabiendo que
una muestra piloto de 𝑛∗ dio los siguientes resultados: 𝑠𝑦∗ = 14.056, 𝑦̅∗ = 65 𝑎𝑐𝑟𝑒𝑠, 𝜌𝑥𝑦∗ = 0.90 y se
desea un coeficiente de variación 𝐶𝑉 = 0.022?.
𝑆 2 𝑆 2
Ayuda: Aquí 𝐶𝑥𝑥 = ( 𝑋̅𝑋 ) ; 𝐶𝑦𝑥 = ( 𝑌̅𝑌 ) .
b) ¿Qué tamaño de muestra sería necesario si se quiere usar estimadores de razón y la muestra piloto
permite deducir que 𝐶𝑥𝑥 = 0.1286?
c) Finalmente se tomó una muestra de 𝑛 = 20 granjas con los siguientes resultados:
∑ 𝑥𝑖2 = 23634; ∑ 𝑥𝑖 = 460; ∑ 𝑥𝑖 𝑦𝑖 = 36854; ∑ 𝑦𝑖2 = 59816; ∑ 𝑦𝑖 = 760

Encuentre el intervalo de confianza para 𝜇𝑦 al 95% usando estimadores de regresión.

3) Usando la información del ejercicio 1):


a) Obtenga 𝐵ℎ para cada estrato.

Nh
S yxh ( xhi  X h )( yhi  Yh )
Bh   i 1


Nh
( yhi  Yh )2
2
S yh
i 1

b) Encuentre las varianzas de Xˆ RES y Xˆ REC en donde:


L Wh (1  f h )
  L Wh (1  f h )
 
2 2
ˆ
V ( X RES ) MIN  h 1 2 2 2 ˆ
S Xh  Bh SYh ; V ( X REC ) MIN  h 1 2
S Xh  BC2 SYh2
nh nh

1
(1  f h )

Nh
h 1
Wh2 S yxh
nh
BC 
N (1  f )
h h1 n h SYh2
h
c) Verifique que:

L W (1  f h )
 
2
1 L
V ( Xˆ RES ) MIN  V ( Xˆ REC ) MIN  h 1 h SYh2 ( BC  Bh )2 ; BC  h 1 Bh
nh L

4) Mediante un muestreo estratificado se determina 𝑛ℎ para c/u de los estratos usando Neyman mediante
estimadores de razón. Esta asignación permite encontrar el menor error de muestreo con una muestra de
tamaño 𝑛. Otro investigador desea utilizar el mismo tamaño de muestra 𝑛 pero involucrando los costos 𝐶ℎ
de medir en cada estrato cuando se dispone de un costo total 𝐶. ¿Cuáles deben ser los tamaños de muestra
para cada estrato con el menor error posible por parte del segundo investigador?

5) Al utilizar estimadores de razón en una población dividida en dos estratos se pretende asumir como función
de costos la siguiente:
C  2.5 n1  3.25 n2
Determine los valores de 𝑛1 y 𝑛2 que hacen mínima la varianza 𝑉(𝑌̅̂𝑅 ) para la variable 𝑌 que está
correlacionada con la variable 𝑋. Se desea utilizar una muestra de 1500 unidades. Un estudio piloto da como
resultados la siguiente información:

Estrato 2
𝑆𝑦ℎ 2
𝑆𝑥ℎ (𝑆𝑥𝑦 )2
1 23.4 10.45 12.5
2 18.45 9.28 8.63

𝑁
Así mismo se sabe que la relación entre los tamaños de cada estrato es 𝑁1 = 0.91, y la razón de los totales
2
𝑌
entre las dos variables es igual a 𝑋 = 𝑅 = 0.48 para los dos estratos.
Ayuda: Encuentre para cada estrato 𝑆𝑦ℎ 2 2
+ 𝑅 2 𝑆𝑥ℎ − 2𝑅𝑆𝑥𝑦ℎ , escriba la expresión de la varianza 𝑉(𝑌̅̂𝑅 ) solo
en función de 𝑁1 , 𝑁2 , 𝑛1 y 𝑛2 . Defina la función de Lagrange ∅ = 𝑉(𝑌̅̂) + 𝜆(2.5 √𝑛1 + 3.25√𝑛2 − 𝐶).

6) Par una muestra de tamaño 𝑛 = 2000 y una función de costos dada por: 𝐶 = 2√𝑛1 + 3√𝑛2 . Determine 𝑛1 y
𝑛2 de tal manera que se minimice la varianza del estimador de la media mediante regresión. Un estudio
piloto permite conocer los siguientes estimadores adelantados.
Estrato 𝑊ℎ 𝑆̂𝑦ℎ
2 𝜌̅̂𝑥𝑦ℎ
1 23.4 10.45 12.5
2 18.45 9.28 8.63

2
𝑊 ((1−𝑓 )
Ayuda: Asuma 𝑉(𝑌̅̂𝑙𝑟 ) = ∑ ℎ 𝑛 ℎ (1 − 𝜌̂𝑥𝑦ℎ
2 2
)𝑆𝑦ℎ

Use la función de Lagrange: ∅ = 𝑉(𝑌̅̂𝑙𝑟 ) + 𝜆(2. √𝑛1 + 3. √𝑛2 − 𝐶).

7) Al realizar una encuesta a 10 estudiantes del programa de Estadística se obtuvo la siguiente información:

2
𝑋 𝑌1 𝑌2 𝑌3
Alumno N° de personas que N° de cuartos para N° de personas que N° de mascotas que
encuestado habitan la vivienda del dormir en la vivienda del trabajan y habitan la mantienen en la casa
alumno estudiante vivienda del alumno que habita el alumno
1 5 3 3 0
2 4 2 2 1
3 3 2 1 1
4 2 3 1 2
5 6 4 4 3
6 5 4 3 2
7 3 2 2 2
8 2 2 1 0
9 4 3 2 1
10 3 1 3 0

Si se utiliza la variable 𝑋: Número de personas que habitan la vivienda del alumno como variable auxiliar y
suponiendo que se conoce el total poblacional de ella, ¿Qué recomendaría Usted para estimar el total en
cada caso si se usa estimador de razón o no?

a) Estimación del promedio de cuartos por vivienda en las casas donde viven los alumnos del Programa de
Estadística.
b) Estimación del promedio de personas que trabajan en las viviendas de los alumnos del Programa de
Estadística
c) Estimación del promedio de mascotas que mantienen en las casas de los alumnos del Programa de
Estadística.

8) Demuestre que bajo la asignación proporcional en el MAE se tiene que la varianza del estimador de la media
puede expresarse por:
(1  f h ). S yh
2
(1  f ) L
V (YˆMAE )  h 1Wh2 
L
 W S2
h 1 h yh
nh n
1
9) De una población se sabe que: 𝑊1 = 𝑊2 y al tomar una muestra de tamaño 𝑛 = 200 se obtuvo que:
2
𝑋̅̂1 ≅ 2𝑋̂2 y 𝑆̂12 ≅ 𝑆̂2̅ 2
Encuentre el tamaño de muestra que se requiere usando el MAS si se supone que 𝑉(𝑌̂ ) = 𝑉0 = 0.04. Asuma
población grande.

10) Determine el tamaño de muestra 𝑛 que con afijación de Neyman (reparto) produzca la misma precisión que
una muestra simple no estratificada de tamaño 𝑛∗, para la estimación de la proporción 𝑃 poblacional.
Suponga en ambos casos muestreo con reposición y aplique el resultado a los siguientes datos en donde
𝑛∗ = 1000.

Estratos
I II III
𝑊ℎ 0.2 0.3 0.5
𝑃ℎ 0.5 0.6 0.4

𝑃.(1−𝑃) 𝑃 (1−𝑃 )
En el MAS con reposición: 𝑉(𝑃̂) = 𝑛∗ y en el MAE con reposición: 𝑉(𝑃̂) = ∑ℎ 𝑊ℎ2 ℎ 𝑛 ℎ .

11) En una población con tres estratos se tiene: 𝑊ℎ : (0.5; 0.3; 0.2) y de una muestra piloto se tiene:

3
𝑃̂ℎ = (0.52; 0.40; 0.60)

𝑁ℎ Es suficientemente grande con relación a 𝑛ℎ para prescindir de 𝑓ℎ . Se pide: Determinar el tamaño de una
muestra estratificada, con afijación proporcional, que dé la misma precisión para estimar 𝑃 con una muestra
𝑛∗ = 600 sin estratificar.

12) La ciudad de Cali tiene 36932 lados de manzana distribuidos en los estratos socioeconómicos 01-02-03-04-
05-06 distribuidos en las 22 comunas de dicha ciudad. La siguiente tabla muestra la distribución porcentual
de los lados de manzana clasificados en los estratos 01-02-03 para las comunas 06-07 y 08 de Santiago de
Cali.

Estrato 01 02 03
Comuna Bajo-Bajo Bajo Medio -Bajo
06 0,002897217 0,05011914 0,00703997
07 0,003005524 0,01732915 0,02101159
08 8,12304E-05 0,01519008 0,04497455

La secretaría de Salud Pública Municipal de Cali desea realizar un estudio en la Zona integrada por estas tres
comunas para determinar la proporción de lados de manzana con presencia de niños menores de 7 años. Un
estudio piloto sobre 40 lados de manzana distribuidos en la zona de estudio arrojó los siguientes estimadores
adelantados:

Estrato
01 02 03
*
n h 10 15 15
Pˆh* 0.61 0.33 0.22

a) Asumiendo asignación de Neyman, determine el tamaño de muestra usando MAE con un error de 0.05
y un nivel de confianza del 95%.
b) Finalmente se asumió una muestra de n  401 lados de manzana repartidos de la siguiente manera:
n1  17 , n2  216 y n3  168 obteniendo las siguientes relaciones entre las proporciones muestrales:
 p1  p2  p3  1.55

 p1  p2  1.17
 p  p  1.2
 1 3
Determine la proporción de lados de manzana que tienen la característica estudiada y su varianza.

13) Demuestre que si en el MAE se hace con asignación de Neyman entonces:

V (Yˆ ) 
 L
Wh Sh 
2
1 L
h 1
n N

 W S2
h 1 h h

Wh Sh / Ch
14) Si en la asignación óptima viene dada por: nh  n ; encuentre el tamaño de muestra
h 1 (Wh Sh / Ch )
L


L
requerido para satisfacer la función de costos dada por: C  C0  h 1
Ch nh

4
15) Hace 10 años se estimó el número medio de familias por manzana en las 400 manzanas de la comuna ABC
de una ciudad. Se pensó que este número dependía del nivel socioeconómico de cada una de ellas y, así, las
manzanas fueron estratificadas en dos estratos de tamaños 60 y 340 respectivamente. Se tomó una muestra
aleatoria de manzanas en cada estrato y se obtuvo como resultado:
y1  25, y2  55 ; s12  50 , s22  170
Ahora en la actualidad, se desea repetir la encuesta usando el mismo marco muestral, es decir, las mismas
manzanas en los estratos previamente definidas. Pero ahora se desea que las estimaciones en el estrato I,
tenga un error no mayor a 3 familias por manzana, y en el II no mayor a 2 familias por manzana, en ambos
casos a una confianza del 95%.

a) ¿Qué tamaño de muestra por estrato se hace necesario?. Suponga que las medias actuales son 10%
mayores que las de hace 10 años, y que las cuasivarianzas aumentaron en un 20%.
b) ¿Qué tamaño de muestra se requiere si no se desea estratificar suponiendo un error promedio
ponderado para el número de familias por manzana y un nivel de confianza del 95%. Asuma los ajustes
supuestos en el literal a). Asuma que la vez pasada se tomó una muestra de 100 manzanas que fueron
repartidas proporcionalmente al tamaño de los estratos

16) Se supone que la variable 𝑋 tiene un comportamiento aproximado por estrato de acuerdo con la figura:

1
Se sabe que: W2  W1 , ¿Qué tamaño de muestra se requerirá para estimar X con un error de 0.25 y un
3
nivel de confianza del 95%? Use asignación proporcional.

17) Para la siguiente función de densidad de la variable 𝑋 dada por:

 1
 x  3k si 0 x
2

k si
1
x
5
f ( x)   2 2
 5
 x  9k si  x3
 2
0 otro lugar

5
a) Halle el valor de 𝑘
b) Dibuje la función de densidad (polígono de frecuencias)
c) Encuentre el tamaño de muestra requerido para estimar 𝑋̅̂ con un 𝐶𝑉 = 𝐶𝑉0. ¿Qué debe suponerse?

18) El efecto de diseño muestral se define como en cociente de varianzas:


V (ˆ)*
EFD  Deff 
V (ˆ) MAS
En donde el numerador será la varianza del estimador de un parámetro mediante un método de muestreo
diferente del MAS y el denominador será la varianza obtenida para la estimación del mismo parámetro
mediante el uso de un MAS.

a) De acuerdo con la definición anterior probar que si las 𝑁ℎ son suficientemente grandes para que los
cocientes 1⁄𝑁 puedan ser despreciables, entonces demuestre que:

V (Yˆ ) MAE ( Prop)
Deff  1
V (Yˆ ) MAS

Donde 𝑉(𝑌̅̂)𝑀𝐴𝐸(𝑝𝑟𝑜𝑝) es la varianza obtenida en la estimación de 𝑌̅̂ usando asignación proporcional.

b) Se realiza un muestreo en tres estratos de una población obteniendo la siguiente información mediante
asignación proporcional.

Estrato 𝑛𝑖 ∑ 𝑦𝑖 ∑ 𝑦𝑖2
1 10 70239 501272491
2 13 108796 914594852
3 7 67654 656917264
Total 30 246689 2072784607

V (Yˆ ) MAE ( Prop)


Encuentre Deff  e interprete.
V (Yˆ ) MAS

c) Si sé asume una varianza 𝑉(𝑌̅̂) = 𝑉0 ; deduzca el tamaño de muestra que se requiere


𝑀𝐴𝐸−𝑃𝑅𝑂𝑃
utilizando un MAS considerando que el efecto de diseño entre los dos modelos es igual a 𝐷𝑒𝑓𝑓.

19) Suponga la siguiente situación (asignación que requiere más del 100% en algún estrato):

POBLACIÓN MUESTRA
Sˆ yh Yˆh
2 2
Estrato Nh Wh S yh Yh nh
1
2
3 N3 n3 S y23 Y3
Total N 1 n

6
¿Qué pasa si alguna asignación como por ejemplo la del estrato 3 es mayor al tamaño del estrato es decir
𝑛3 > 𝑁3 ?
a) ¿Qué debe hacerse?
b) ¿Cómo quedarían los estimadores?

20) Considere una población divida en dos estratos de tamaños 𝑁1 = 7 y 𝑁2 = 5 en donde los pesos reales de
7 5
los estratos son: 𝑊1 = 12 y 𝑊2 = 12.

a) Genere todas las posibles muestras de tamaños 𝑛1 = 5 y 𝑛2 = 3


b) Encuentre las estimaciones 𝑋̅̂∗ considerando que 𝑊1∗ = 0.7 y 𝑊2∗ = 0.3.
c) Verifique el sesgo del estimador 𝑋̅̂∗ será 𝐸(𝑋̅̂∗ ) = ∑(𝑊ℎ∗ − 𝑊ℎ )𝑋̅ℎ
d) Verifique que la varianza del estimador 𝑋̅̂ ; que será:

V ( X * )  h 1 Wh   
2
ˆ 2 * 2 Sh
(1  f h ) 
2
(Wh*  Wh ) X h
2

h 1
nh

21) Suponga que se conocen los pesos reales (𝑊ℎ ) pero no se escogen las unidades muestrales al interior de
cada estrato si no que se realiza un MAS considerando toda la población para luego ubicar a cada unidad
muestral en su respectivo estrato. Este procedimiento se llama POSTESTRATIFICACIÓN.
Considere la siguiente población:

Estrato I Estrato II
2 7
3 8
Valores de X
4 9
5

Genere todas las posibles muestras de tamaño 𝑛 = 5 es decir (un total de 𝑘 = 21).

a) Clasifique las unidades de la muestra seleccionada de acuerdo con los dos estratos y encuentre el
estimador:
Xˆ POST  h 1Wh xh
L

b) Verifique que la varianza del estimador Pos-estratificado de 𝑋̅ tiene por varianza aproximada:

N n L 1  N  n  L  N  Nh  2
V ( Xˆ POST )   .h 1Wh Sh  2 
2
  .Sh
 N .n  n  N  1  h 1  N 

22) Para realizar un estudio económico en una zona cultivada de encina (árbol) se necesita estimar la
producción media (kilos) de bellota (fruto) por árbol y para ello se diseñan dos tipos de muestreo.

a) MAS usando regresión.


Se eligen al azar 30 árboles de la zona y se registra para cada árbol las bellotas producidas (Variable Y
en Kilos) y el diámetro de la copa del árbol (Variable X en metros). Además, usando una fotografía aérea
a escala 1: 5000, se mide el diámetro de la copa de 1000 árboles, resultando que la media del diámetro

7
de copa es 3.05 m; este valor se considera un buen estimador de la media poblacional. Los resultados
del muestreo fueron:

y i  3122; y 2
i  490184;  x  79.5;  x
i
2
i  377.7; x y
i i  12334.7; n  30

b) MAE
Se divide la zona en tres estratos de acuerdo con la edad del árbol de encina y se registra como variable
el peso en kilos de bellotas (Y). La muestra de 30 se toma con asignación proporcional, encontrando:

Estrato
 
nh nh
Nh nh i 1
yhi i 1
yhi2
I 1200 10 450 28350
II 1350 12 1232 180324
II 105 9 1440 281600

Estime los kilos de bellota por encina y su error estándar de estimación en cada caso.
¿Cuál de los dos tipos de muestreo resulta más eficiente?
Si se define para un muestreo MAE la función de costos: ; donde 𝑎ℎ : el tiempo de acceso al monte y 𝑡ℎ :
factor de dificultad en la obtención de los frutos (bellotas) para un árbol del estrato h, ¿Cuál será la
asignación (FÓRMULA) de la muestra en cada estrato para hacer mínima la varianza total? ( V (Yˆ ) .

8
23) Ll
24) S
25) S
26) S
27)

9
f ( x)
k

3 4 X

Estrato I Estrato II

10

Anda mungkin juga menyukai