Anda di halaman 1dari 6

El gobierno de estados unidos realiza un censo de agricultura cada cinco años;

para ello, reúne datos de todas las granjas (definidas como un lugar donde se
producen y venden $1000 o más productos agrícolas) de los 50 estados que
conforman la Unión Americana. El censo de agricultura proporciona los datos
sobre el número de granjas, los acres dedicados a las granjas, su tamaño, los
resultados de carias cosechas y una amplia variedad de otras medidas en
agricultura, para cada uno de los N=3078 condados o equivalentes en Estados
Unidos. El archivo agpop.txt contiene la información de 1982,1987 y 1992 sobre
el número de granjas, superficies dedicadas a la agricultura, número de
granjas con menos de 9 acres y numero de granjas con más de 1000 acres para
esta población.

Para extraer una muestra aleatoria simple de tamaño de 300 de esta población, el autor de est
reemplazo. Si la población es grande con respecto a la muestra, es probable
que cada unidad de la muestra aparezca, solo una vez en la lista. Sin embargo,
en este caso, 13 de los 300 números están repetidos. Descartamos los
duplicados y los reemplazamos con nuevos números generados en forma
aleatoria de 1 a 3078, hasta que los 300 números sean distintos.

En un principio, podría parecer que los condados elegidos para estar en la


muestra no son muy aleatorios.

(a) Obtenga la Figura 2.3.

Observemos la variable acres92, el número de acres dedicado a la agricultura.


Un pequeño número de condados en la población de omite esa información.
Primero verificamos el efecto que tiene la ausencia de datos sobre nuestra
muestra.
1.- Nuestro histograma muestra los acres dedicados a la agricultura en cada
uno de los 300 condados.

Histograma: número de acres dedicados a la agricultura en 1992, para nuestra muestra


aleatoria simple de 300 condados. Observe la asimetría de los datos. La mayor parte de los
condados tiene menos de 500,000 acres en granjas; sin embargo, algunos condados tienen
más de 1.5 millones de acres en granjas.

(B) Obtenga los valores del ejemplo 2.5 (página 34 y 35).

Tenemos:

N=3078 n=300

300
Fracción de muestreo:
3078

Las estadísticas de la muestra son:


𝑦̅ = 297,897
𝑠 = 344551.9
𝑡̂ = 𝑁𝑦̅ = 916,927,110
Los errores estándar son:

s2 300
EE[y̅] = √ (1 − ) = 18,898.434428
n 3078

EE[𝑡̅] = (3078)(18,898.434428) = 58,169,381

El coeficiente de variación es
̂ [𝑡̅] = 𝐶𝑉
𝐶𝑉 ̂ [𝑦̅]

EE[y̅]
=
𝑦̅
18,898.434428
=
297,897
= 0.06344
Como los datos son muy asimétricos, también debemos informar de la mediana
del número de acres necesarios para desarrollar la actividad agrícola en un
condado, que es 196,117.

c) Obtenga los valores del ejemplo 2.6 de la página 35.

Para la muestra descrita, la proporción estimada de condados con menos de


200000 acres dedicados a la agricultura es:
153
𝑝̂ = = 0.51
300

300 (0.51)(0.49)
EE[𝑝̂ ] = √(1 − III )
Tarea3078 = 0.0275
299
Omar Filio Filio
Matrícula: 2123043427
3. Obtenga una muestra de tamaño 300 de la población en agpop.txt.
Usando su muestra, obtenga el intervalo con 95% de confianza para
a) la media,
b) el total de la población de la variable ACRES92 y
c) para la proporción de condados con menos de 200,000 acres. Compare
con lo obtenido por Lohr en su muestra en agsrs.txt.

300
Fracción de muestreo: = 0.09746589
3078

Las estadísticas de la muestra son:


̅ = 𝟑𝟑𝟎𝟗𝟗𝟗. 𝟕
𝒚
𝑠 = 440611.2
𝑡̂ = 𝑁𝑦̅ = 1,018,817,025
Los errores estándar son:

s2 300
]
EE[y̅ = √ (1 − ) = 24,167.22
n 3078

EE[𝑡̅] = (3078)(24167.22) = 74,386,711

a) El intervalo de 95% de confianza para la media es:


I = [330999.7 - (1.96)( 24167.22),33099.7-(1.96)( 24167.22)]
= [ 283631.9, 378367.4]

b) Así el intervalo de 95% de confianza para un total de población t es :


I = [1,018,817,025-(1.96)( 74386711), 1,018,817,025-(1.96)( 74386711)]
= [ 873019071, 1164614979]
c) Así el intervalo de 95% de confianza para la proporción de condados
con menos de 200,000 acres:
I = [0.4766667 - (1.96)( 0.02744055), 0.4766667-(1.96)( 0.02744055)]
= [ 0.4228832, 0.5304501]
Finalmente haremos la comparación respectiva de los intervalos de confianza,
dadas las muestras resultantes y la que presenta Lohr.

INTERVALO MUESTRA RESULTANTE MUESTRA DE LOHR

Para la media [ 283631.9, 378367.4] [260 856, 334 938]

Para la población total [ 873019071, 1164614979] [802 915 123, 1 030 939 097]

Para la proporción con


[ 0.4228832, 0.5304501] [0.456,0.564]
menos de 200000 acres

Observemos que al tener esta comparación se puede dar uno cuenta que la
muestra resultante es mayor que la que presenta Lohr con su muestra
agsrs.text

Código en R de la tarea II.


Código en R de la tarea III.

Anda mungkin juga menyukai