Anda di halaman 1dari 32

Estadística I

INGESIS-Contadores

Contiene: Capítulo 6
“Muestreo y distribución muestral”

Autor : Newbold, P., W. L. Carlson y B. Thorne (2008):


Estadística para administración y economía. 6ta
edición.
Cátedra : Estadística I
Profesor Responsable : Mauricio Oyarzo Aguilar.

“Este documento es para uso exclusivo de alumnos de pregrado Universidad


Católica del Norte - sede Antofagasta, para fines de docencia e investigación”
MUESTREO Y DlSTRlBUClONES
MUESTRALES

6.1 MUESTREO DE UNA POBLACI~N

En lo que resta de este volumen, dedicaremos gran parte de nuestra atenci6n a analizar problemas
que tienen por objeto averiguar algo acerca de las propiedades de un grupo grande de observaciones,
a partir de la informaci6n proporcionada por un subconjunto del mismo relativamente pequefio. Lla-
maremos poblaci6n a1 grupo grande del que deseamos obtener informaci6n y muestra a1 subcon-
junto de individuos de la poblaci6n cuyas caractensticas han sido observadas.
Citamos a continuaci6n algunos ejemplos de poblaciones que podn'an resultar de inter&:
1. La renta de todas las familias que viven en la ciudad de Chicago.
2. Los dividendos anuales de cada uno de 10s valores negociados en la bolsa de Nueva York.
3. El coste de todas las reclamaciones que recibe una compaiiia de seguros por accidentes de coche.
4. El coste anual de reparaci6n de todos 10s coches de un deterrninado modelo.
5. Los erryes que aparecen en una lista de facturas cobradas.
En particular, podriamos estar interesados en averiguar algo acerca de alguna caracteristica
particular, o atributo, de estas poblaciones. Por ejemplo, podriamos tener interCs en realizar in-
ferencias acerca de la media o la varianza de la distribuci6n poblacional de las rentas familiares
en Chicago, o sobre la proporcion de familias de esta ciudad que tienen una renta anual inferior
a 15.000 d6lares.
La principal raz6n para observar una muCstra en lugar de la poblaci6n completa es el hecho de que
la recogida de toda la informaci6n ser8, en la mayonla de las ocasiones, exageradamente cara. Incluso
en 10s casos en que se dispone de recursos suficientes para analizar la poblaci6n completa, puede re-
sultar preferible dedicar esos recursos a un subconjunto pequefio de la poblaci6n, con la esperanza de
que tal concentraci6n de esfuerzo produzca medidas m8s precisas. Asi, por ejemplo, es sabido que en
el censo de poblacidn por decenios de Estados Unidos, algunos grupos aparecen representados en
una proporci6n mucho menor de la que les corresponderia'.
El objetivo de extraer una mueitra de una poblaci6n serh, en general, poder hacer afirmaciones que ten-
gan cierta validez sobre la poblaci6n completa. Por tanto, es importante que la muestra sea representativa de
la poblaci6n. Supongamos, por ejemplo, que el director de una agencia de publicidad quiere analizar la res-
puesta de 10s consurnidores ante un nuevo prducto alimenticio. Resultaria poco aconsejable que se limi-
tase a consultar a su circulo de amigos o a sus vecinos m L pr6ximos. Es muy poco probable que tales gru-
pos reflejen adecuadarnente el espechu de opiniones de la poblaci6n completa, y puede ocunir incluso que
se encuentren en uno de 10s extremos de tal espectro. Para evitar este t i p de problemas, y lograr mferencias
vilidas acerca la poblaci6n, es importante que el proceso de selecci6n de la muestra est6 basado en el prin-
cipio de aleatorizaci6n. La forma m k sencilla para conseguir esto es diseiiar un mecanismo de selecdi6n en
el cud todas las muestras de un tamaiio dado tengan la misma probabilidad de ser elegidas.

Muestreo aleatoriosimple
Supongamos que se ha de seleccionar una muestra de n objetos de una poblaci6n de N objetos. Un
procedimiento de muestreo aleatorio simple es aquel en el que todas las posibles muestras de n obje-
tos tienen la misma probabilidad de ser escogidas. Este mCtodo se usa con tanta frecuencia que, en
muchos casos, el adjetivo simple se elimina, y a las muestras obtenidas por procedimientos de este
tip0 se las denomina muestras aleatorias.

Puede pensarse en el proceso de muestreo aleatorio simple de la forma siguiente: supongamos que 10s N
miembros de la poblaci6n se introducen en un enorme sombrero y se mezclan concienzudamente. Una
muestra aleatoria se obtiene extrayendo n de ellos. En la prhctica, no es necesario hacerlo de este m d o ;
pueden usarse tablas de numeros aleatorios, como las que aparecen en la Tabla 4 del A@ndice, para con-
seguir el mismo resultado. Si etiquetamos a 10s N miembros de la poblaci6n con ndmeros desde 1 hash N,
podemos comenzar desde un n h e r o arbitrario de la tabla y seleccionar 10s individuos cuyas etiquetas co-
rresponden a 10s nlimeros que siguen hasta que se haya completado una muestra de n miembros. Las ta-
blas e s t h construidas de forma que este proceso tiene las mismas propiedades que el muesmo aleatorio
simple. Una de las posibles formas de construir una tabla de niuneros aleatorios consistiria en meter en
una urna 10 bolas numeradas de 0 a 9. DespuCs de haberlas mezclado bien, se extrae una de las bolas y se
anota su nbmero. A continuaci6n, se devuelve esta bola a la urna y se repite el proceso. Puede repethe el
procedimiento para obtener niuneros con tantas cifras como se precisen. Este proceso tiene la propiedad
de que cada uno de 10s posibles niuneros tiene la misma probabilidad de ser elegido, y las elecciones suce-
sivas son independientes unas de otras; el problema es que resulta extremadamente tedioso. En la prictica,
pueden generarse niuneros aleatorios de manera mucho m k dpida con la ayuda de un ordenador, ya que
existen mecanismos que imitan de forma efectiva el procedimiento que acabamos de describir.
En este capitulo y en 10s que siguen, nos centraremos en mktodos para analizar 10s resultados mues-
trales con el fin de obtener informaci6n acerca de la poblaci6n. Por el momento nos limitaremos a
muestras que hayan sido seleccionadas mediante esquemas de muestreo aleatorio simple. Sin embargo,
debemos aclarar que este no es el h i c o procedimiento que existe para elegir individuos de la poblacibn,
y que, en determinadas circunstancias, pueden resultar preferibles esquemas de muestreo altemativos.
Posponemos la discusi6n acerca de 10s mCtodos de selecci6n de muestras hasta el Capitulo 18, en el que
ademhs describiremos de forma mis completa el uso de las tablas de ndmeros aleatorios.
El principio de aleatorizacidn en la selecci6n de 10s miembros de la muestra proporciona cierta
protecci6n contra la presencia en la muestra de individuos no representativos de la poblacibn, en el

Ver, por ejemplo, H.Hogan, "The 1990 post-enumeration survey: An overview, "American Statistician, 46
(1992),261-269
sentido de que, en media, si se extraen repetidas muestras de la poblaci6n seg6n este mecanismo,
ning6n subgrupo particular deberia estar mBs representado en la muestra. AdemBs, el concepto de
distribucidn muestral nos permite determinar la probabilidad de que la muestra particular que se ha
obtenido no sea representativa en un determinado grado.
Sobre la base de la informaci6n muestral, nuestro objetivo serB hacer inferencias acerca de la po-
blaci6n de la que procede la muestra. La distribucidn de todos 10s valores de inter& de esta poblaci6n
puede ser representada a travCs de una variable aleatoria. Seria demasiado ambicioso pretender descri-
bir completarnente la distribuci6n poblacional bashdonos en una pequeiia muestra aleatoria de obser-
vaciones. Sin embargo, si seremos capaces de hacer inferencias bastante firmes sobre algunas de las
caracteristicas m b importantes de la distribuci6n poblacional. Por ejemplo, podemos estar interesados
en hacer afirmaciones acerca de su media y su varianza. Asi, por ejemplo, dada una muestra aleatoria
de consumo de combustible de 20 coches de un determinado modelo, se puede hacer inferencia sobre
la media y la varianza del consumo de combustible de todos 10s coches de ese modelo. Tal inferencia
estarh basada en la informaci6n muestral, y serB natural planteamos cuestiones del tipo: "Si el con-
sumo de combustible de todos 10s coches de un determinado modelo, medido en kil6metros por litro,
tiene una media de 10 y una desviaci6n tipica de 2, ~cuAIes la probabilidad de que para una muestra
aleatoria de 18 coches de este tipo, el consumo medio de combustible sea menor de 8 kil6metros por
litro?'. Al planteamos la pregunta de este modo, estamos asumiendo implicitamente que las inferen-
cias sobre la media poblacional estarh basadas en la media o promedio muestral.
Es importante distinguir entre las caracteristicas poblacionales y sus correspondientes cantidades
muestrales. En el ejemplo del p h a f o anterior, el consumo de combustible de todos 10s autom6viles de
ese modelo tendrii una distribuci6n con una determinada media. Esta media, que es un atributo de la po-
blaci6n, es un n6mero fijo pero desconocido. Para hacer inferencia sobre tal atributo, se extrae una
muestra de la poblaci6n y se calcula su media muestral. Puesto que para cada muestra que se extraiga se
obtendri un valor diferente de la media muestral, podemos pensar en esta cantidad como en una varia-
ble aleatoria con una cierta distribuci6n de probabilidad. La distribuci6n de probabilidades de 10s posi-
bles resultados muestrales proporciona una base para realizar inferencias sobre la poblaci6n. Nuestro
objetivo en este capitulo serB examinar las propiedades de distribuciones muestrales de este tipo.

Estadisticos y distribuciones muestrales


Supongamos que se ha extraido una muestra aleatoria de una poblaci6n y que se desea hacer infe-
rencia sobre ciertas caracteristicas de la distribuci6n de la poblaci6n. Esta inferencia estarB basada en
alg6n estadistico, es decir, en alguna funci6n particular de la informaci6n muestral. La distribucion
muestral, o distribucidn en el muestreo, de este estadistico es la distribuci6n de probabilidades de
10s valores que puede tomar el estadistico a lo largo de todas las posibles muestras con el mismo n6-
mero de observaciones que pueden ser extraidas de la poblaci6n.

Para ilustrar la importancia del concepto de distribuci6n muestral, consideremos el caso de un su-
(
pervisor con seis empleados, cuyas experiencias (medidas en aiios de trabajo) son

Se eligen a1 azar cuatro de estos empleados y se les asigna una nueva tarea. El n6mero medio de
aiios de experiencia para 10s seis empleados es

Estamos interesados en el n6mero medio de aiios de experiencia para 10s cuatro empleados con-
cretos a 10s que les ha sido asignado el cambio de tarea. Podemos pensar en este ejemplo como en
una muestra aleatoria simple de cuatro valores extraidos de una poblaci6n de seis. El numero de
muestras diferentes que pueden ser seleccionadas es quince. En la Tabla 6.1 aparece cada una de las
posibles muestras con su correspondientemedia muestral. Las muestras como (2,4,6,7) aparecen dos
veces porque hay dos empleados en la poblaci6n con seis aiios de experiencia de trabajo.

TABLA 6.1 Posibles muestras de cuatro observaciones con sus correspondientes medias muestrales,
para la poblaci6n 2,4,6,6,7,8

MUESTRA MEDIA MUESTRAL MUESTRA MEDIA MUESTRAL

Puesto que todas las posibles muestras tienen la misma probabilidad de ser seleccionadas, la proba-
bilidad que tiene cada una de las muestras de ser elegida es 1/15. Usando esta informaci6n, podemos de-
terminar la probabilidad de cada uno de 10s valores de la media muestral. Por ejemplo, en la Tabla 6.1
vemos que tres de las posibles muestras tienen media 5,75. Por tanto, la probabilidad de que 10s cuatro
empleados seleccionados para la nueva tarea tengan una experiencia media de 5,75 aiios es de 3/15. De
la misma forma podemos encontrar la probabilidad de cada una de las posibles medias muestrales. La
colecci6n de todas estas probabilidades constituye la distribucibn en el muestreo de la media muestral.
La forma m8s simple de describir esta distribucibn muestril es, posiblemente, a travCs de su
funci6n de probabilidad. Si representamos la media muestral por X, tenemos

El gr8fico de esta funci6n de probabilidad aparece en la Figura 6.1. N6tese que, mientras que el
nlimero de aiios de trabajo de 10s seis trabajadores se mueve entre dos y ocho, 10s valores posibles de
la media muestral tienen un rango mucho m8s restringido: de 4,5 a 6,75. Ademis, la mayor parte de
la masa de probabilidad se sitlia en la zona central de este rango.
En la siguiente seccibn, analizaremos la distribuci6n en el muestreo de la media muestral para
poblaciones m8s generales.
DISTRIBUCI~N
EN EL MUESTREO DE LA MEDIA MUESTRAL 193

6.2 DISTRIBUCI~NEN EL MUESTREO DE LA MEDIA MUESTRAL


Supongamos que se ha extraido una muestra de n observaciones de una poblacidn con media px
y varianza axZ, y representemos 10s elementos de la muestra por XI, X2, ...X.. Antes de que la
muestra haya sido observada, habri incertidumbre sobre 10s resultados. Esta incertidumbre es
consecuencia del hecho de que cada uno de 10s miembros de la muestra es una variable aleatoria
con media p, y varianza a:. Asumamos por el momento que nuestro principal interis es hacer
inferencias sobre la media poblacional p,. Un punto de partida obvio es el promedio de 10s valo-
res muestrales.

Definici6n:
Sea XI,Xz, ...X. una muestra aleatoria de una poblaci6n. El valor medio de tales observaciones
1 "
X = -cxj
n i=l
se denomina media muestral.

Queremos analizar la distribuci6n muestkal de la variable aleatoria xZ.En primer lugar, determi-
naremos la media de esta distribuci6n. En las secciones 4.4 y 5.4, se vio que, para variables aleatorias
discretas y continuas, la esperanza de una suma es la suma de las esperanzas y, por tanto,

FIGURA 6.1 Funci6n de probabilidad de la distribuci6n muestral de la media de muestras de cuatro


observaciones extraidas de la poblaci6n 2,4,6,6,7,8

A1 igual que en 10s Capitulos 4 y 5, distinguiremos entre una variable aleatoria y 10s valores especificos que
.
puede tomar. Asf, cuando la muestra ha sido extraida, podremos observar 10s valores espegficos x,, x2, ... x.. con
media T = X1., xJn. En este contexto, F es una realizaci6n concreta de la variable aleatoria X.

-
Puesto que cada variable aleatoria Xi tiene media px, podemos escribir

La media muestral es la suma de 10s valores de la muestra multiplicada por l/n, y, por tanto, su va-
lor esperado sera

En consecuencia, la media de la distribucidn en el muestreo de la media muestral es la media po-


blacional. Esto nos asegura que, si se extraen repetidas muestras independientes de n observaciones
de una poblacidn, entonces, cuando el n ~ m e r ode muestras se hace muy grande, el promedio de las
medias muestrales se hace muy pr6ximo a la verdadera media poblacional. Este resultado es G a im-
portante consecuencia del muestreo aleatorio, y refleja la proteccidn que este tip0 de muestreo pro-
porciona contra observaciones muestrales no representativas de la poblacidn. Por supuesto, la media
obtenida para una muestra particular puede ser mucho mayor o mucho menor que la media pobla-
cional. Sin embargo, en la media, no hay razones para esperar un valor que sea mayor o menor que el
valor poblacional.

EJEMPLO Vamos a confirmar este resultado para el ejemplo de la Tabla 6.1, en el que considerhbamos una
6.1 poblacidn de aiios de experiencia para seis empleados:

La media de esta poblacidn es simplemente la media de estos seis valores, es decir, px= 5 3 .
Habiamos encontrado que la distribuci6n de probabilidad de la media muestral para muestras de cua-
tro observaciones de esta poblaci6n puede ser representada por la siguiente funci6n de probabilidad:

Por tanto, el valor esperado de la media muestral es

que es la media poblacional, px.


De esta forma hemos probado que la distribucidn de la media muestral esth centrada en la media
poblacional. Nos interesarh determinar tambiCn lo cerca que puede estar la media muestral de la me-
dia poblacional. Supongamos, por ejemplo, que para una muestra aleatoria de 20 coches de un deter-
minado modelo, se obtuvo un consumo medio de combustible de un litro en 10 kil6metros. iQuC di-
ferencia habri entre este valor y la media del consumo de todos 10s coches de este modelo? Las
cuestiones de este tip0 van a depender de la varianza de la distribuci6n muestral de 2.
Si el tamaiio de la poblacidn es muy grande con respecto al tamaiio muestral, entonces, una conse-
cuencia del muestreo aleatorio simple es que la distribuci6n de cada uno de 10s valores de la muesua
DISTRIBUCI~N
EN EL MUESTREO DE LA MEDIA MUESTRAL 195

es independiente de la de 10s otros. Recordemos de las Secciones 4.4 y 5.4 que, en tal caso, la va-
rianza de la suma es la suma de las varianzas y, por tanto, tendremos

Puesto que cada Xi tiene varianza,:a se sigue que

Var E X i
( i ~ l ) = nux2

Llegamos asi a que la varianza de la media muestral es

Esto implica que la varianza de la distribuci6n muestral de X decrece a medida que aumenta el ta-
maiio muestral n. Lo que esto nos indica es que, cuantas mhs observaciones tenga la muestra, mhs
concentrada estarh la distribuci6n muestral de la media muestral alrededor de la media poblacional.
En otras palabras, cuanto mayor sea la muestra, mhs segura sera nuestra inferencia acerca de la media
poblacional. Y esto es lo que esperibamos: cuanto mayor sea la cantidad de informaci6n que se ha
extraido de una poblacibn, mis probable seri que acertemos cosas sobre caractensticas (tales como
la media) de dicha poblaci6n. Representaremos por:a la varianza de la media muestral; la corres-
pondiente desviaci6n tipica, que recibe el nombre de error esthndar de X,vendrfi dada por

Si el n~meron de miembros de la muestra no es una fracci6n muy pequeiia del n ~ m e r oN de miem-


bros de la poblaci6n. no podremos asumir que 10s valores individuales de la muestra se distribuyen in-
dependientemente unos de otros. Por ejemplo,.puesto que un individuo de la poblaci6n no puede ser
incluido en la muestra m b de una vez, la probabilidad de que cualquier miembro concreto de la po-
blaci6n sea el segundo de 10s elegidos en la muestra dependerh de cud fue el primero de 10s miembros
escogidos. El argument0 usado en el p k a f o anterior para encontrar la varianza de la media muestral
no es vhlido en este caso. De hecho, puede probarse que la expresi6n adecuada en este caso' es

A1 t6rmino (N - n)l(N - 1) se le suele dar el nombre de factor de correccibn por poblucibnfmita.


Hasta a h ~ r ahemos encontrado expresiones para la media y la varianza de la distribuci6n muestral
de X.Afortunadamente, para la mayoria de las aplicaciones, esto bastarh para caracterizar completa-
mente su distribuci6n. Se puede probar que, si la poblaci6n de la que se extrajo la muestra es normal,
la media muestral sigue tambiCn una distribuci6n normal. Si el tamaiio muestral es una proporci6n
pequefia del tamaiio poblacional, entonces, restando la media y dividiendo por el error esthndar, se
obtiene una variable aleatoria

Ya habtarnos encontrado este fen6meno en el Capttulo 4. La varianza de la distribuci6n hipergeomitrica es (N-n)/(N-1)


vexes la varianza de la distribuci6n binomial.
que sigue una distribuci6n normal esthdar. Ademas, el teorema central del limite nos asegura que,
incluso cuando la distribucibn de la poblacibn no es normal, si el tamaiio muestral n es suficiente-
mente grande, la distribuci6n de X sera tambiCn muy prdxima a la normal y, por tanto, la Ecua-
ci6n (6.2.1) seguirh una distribuci6n muy pr6xima a la normal esthdar.
Los resultados de esta seccidn se resumen en el cuadro que aparece a continuaci6n.

Distribuci6n muestral de 5
Sea f la media de una muestra aleatoria de n observaciones extraidas de una poblaci6n con media
px y varianza ax2.Entonces,
(i) La distribucidn muestral de f tiene media px ,es decir,
E(X) = Px
(ii) La distribuci6n muestral de ,f tiene desviaci6n tipica
ax
aa = 3
Esta cantidad recibe el nombre de error estirndar de f.
(iii) Si el tamaiio muegral n no es una fracci6n pequeiia del tamaiio poblacional N,entonces, el
error esthdar de X es

u.= 3 JE
(iv) Si la distribucidn de la poblacidn es normal, entonces, la variable aleatoria

z = X - px \
m
sigue una distribuci6n normal estfindar.
(v) Si la distribuci6n de la poblaci6n no es normal per0 el tamaiio muestral n es suficientemente
grande, entonces, del teorema central del limite se sigue que, el resultado del apartado (iv) es
aproximadamente viilido.

En la Figura 6.2, aparece la distribuci6n muestral de la media muestral para muestras de tamaiios
n = 25 y n = 100, extraidas de una poblaci6n normal. Puede observarse que ambas distribuciones es-
thn centradas en la media poblacional, per0 que, cuando el tamaiio muestral se hace mayor, la distri-
bucidn se concentra miis alrededor de la media, reflejando el hecho de que el error esthdar de la
media muestral es una funci6n decreciente del nlimero de observaciones de la muestra. Asi, tal
como cabria esperar, la probabilidad de que la media muestral difiera de la media poblacional en
una cantidad fija decrece a medida que aurnenta el tamaiio muestral.
A continuaci6n, ilustraremos las ideas de esta secci6n con algunos ejemplos concretos que se re-
fieren a muestreo en poblaciones con distribuci6n normal.

EJEMPLO Supongamos que el increment0 porcentual de 10s salarios de 10s funcionarios de todas las
6.2 . corporaciones medianas se distribuye siguiendo una normal con media 12,2% y desviaci6n ti-
pica 3,6%. Se toma una muestra aleatoria de nueve observaciones de esta poblaci6n de incre-
mentos porcentuales de salario. iCut4l es la probabilidad de que la media muestral .sea menor
del lo%?
DISTRIBUCI~N
EN EL MUESTREO DE LA MEDIA MUESTRAL 197

FIGURA 6.2 Funci6n de densidad de probabilidad para las medias muestrales de muestras de 25 y de 100
observaciones de una dishibuci6n normal con media 100 y desviaci6n tipica 5

Tenemos
)(LX= 122 UX= 3,6 n =9

Representemos por 2 la media muestral. Debemos calcular

donde el error esthdar de la dishibuci6n muestral de la media muestral es

Por consiguiente, la probabilidad requerida es

donde la variable aleatoria Z sigue una dishibuci6n normal esthdar. Por tanto, usando la Tabla 3 del
Aptndice, tenemos

Concluimos, entonces, que la probabilidad de que la media muestral sea menor que un 10% es
s610 0,0336.

EJEMPLO Un fabricante declara que la duraci6n de, las bujias que 61 fabrica sigue una distribuci6n normal
6.3 con una media de 36.000 kildmetros y una desviacidn esthdar de 4.000 kil6metros. Para una mues-
tra aleatoria de diecistis bujias, se obtuvo una duraci6n media de 34.500 kil6metros. Si la afirmaci6n
del fabricante es corrects, jcual es la probabilidad de obtener una media muestral tan pequeiia como
Csta o menor?
Si X representa la media muestral, entonces, la probabilidad que queremos calcular es

donde se asume que la media muestral es px = 36.000. y

Por tanto.

siendo Z una distribuci6n normal esthdar.


La Figura 6.3(a) muestra la funci6n de densidad de probabilidad de X; la zona sombreada es la
probabilidad de que la media muestral sea menor o igual que 34.500. En la Figura 6.3(b) se ha som-
breado la misma probabilidad per0 en este caso sobre el grfifico de la funci6n de densidad de la dis-
tribuci6n normal esthdar. La probabilidad es

como puede verse en la Tabla 3 del ~ ~ C n d i c e .

FIGURA 6.3 (a) Probabilidad de que la media muestral sea menor que 34.500 en muestras de 16
observaciones de una distribuci6n normal con media 36.000 y desviaci6n tipica 4.000;
la media muestral seguirh una ditribuci6n normal con media 36.000 y desviaci6n tipica 1.000
FIGURA 6.3 (b.) Probabilidad de que una variable aleatoria con distribuci6n normal esthdar sea
menor que -1,5

El resultado nos indicaque, en el caso de que la afirmaci6n del fabricante fuese corrects, la probabi-
lidad de obtener un valor tan bajo de la media muestral sena bastante pequefia. Esto introduce ciertas
dudas sobre la veracidad de la afirmaci6n.En el Capitulo 9 discutiremos un mCtodo general para con-
trastar tales afirmaciones o hip6tesis sobre la base de la evidencia muestral.

6.3 DISTRIBUCI~NEN EL MUESTREO DE UNA PROPORCI~N


MUESTRAL
Como ya se dijo en la Secci6n 4.5, si se repite n veces un experiment0 que tiene probabilidad de Cxito
p, entonces, la variable aleatoria X, que recoge el ndmero total de Cxitos en las n repeticiones, sigue
una distribuci6n binomial. Un problema bastante comdn consiste en que el parhetro p sea descono-
cido. Por ejemplo, podemos estar interesados en determinar cual es la proporci6n del electorado que
tiene intenci6n de votar a un determinado candidato, o la proporci6n de lectores de revistas que po-
drian estar en el mercado de un product0 especifico. En situaciones de este tipo, sera natural basar
nuestra inferencia en la proporci6n de Cxitos en una muestra tomada de la poblaci6n que nos interese.

Definici6n:
Sea Xel ndmero de Cxitos en una muestra binomial de n observaciones, donde la probabilidad de Cxito es p.
(En la mayoria de las aplicaciones, el parhetrop sera la proporci6n de individuos de una gran pobla-
ci6n que posean la caractenstica de inter&.) Entonces, la proporci6n de Cxitos en la muestra

I recibe el nombre de proporei6n rnuestra14.

La media y la varianza de la distribucidn muestral de la proporci6n muestral pueden deducirse fii-


cilmente a partir de la media y la varianza del ndmero de Cxitos que, como vimos en la Secci6n 4.5,
vienen dadas por
E(X) = np Var(X) = np(1 - p)

De nuevo, distinguiremos entre una variable aleatoria y sus posibles realizaciones concretas. Por ejemplo, en una
muestra concreta podemos observar x Bxitos, en cuyo caso la proporci6n muestral serAFx = x h . Entonces,bx es una
realizaci6n particular de la variable aleatoria Fx.
200 MUESTREO
Y DISTRIBUCIONES MUESTRALES

De aqui se deduce que

Es decir, la media de la proporci6n muestral es la proporci6np de Cxitos en la poblaci6n. Su varianza es

De riuevo, la desviaci6n tipica de la proporci6n muestral, que es la raiz cuadrada de su varianza,


recibe el nombre de errbk estandar.
Si el ndmero N de individuos en la poblaci6n no es demasiado grande cornparado con el ndmero
de individuos de la muestra, en la expresi6n de la varianza de la proporci6n muestral serh necesaria
una correcci6n por poblaci6n finita. La varianza serh entonces

Ya se dijo el la Secci6n 5.7 que, como una consecuencia del teorema central del limite, la distribuci6n
del ndmero de Cxitos es aproximadamente normal para tamaiios muestrales grandes. Esto mismo es tam-
bikn cierto para la proporci6n de Cxitos. Por tanto, si restamos a la proporci6n muestral su media p y la
dividimos por su error estbdar, obtendremos una variable aleatoria con distribuci6n normal esthdar.

Distribucibn en el muestreo de una proporci6n muestral


sea Bx la proporci6n de txitos en una muestra aleatoria de n observaciones. Entonces
(i) La distribuci6n muestral de fix fiene mediap, es decir,
E(Dx) = P
ix
(ii) La distribucidn rnuestral de tiene desviaci6n tipica

.=/T p(1 -PI

La cantidad ub recibe el nombre de error esthdar de fix.

(iii) Si el niunero n de individuos de la muestra no es una proporci6n pequefia del n6mero N de in-
dividuos de la poblaci6n, entonces, el error esthdar de fix es

q=,lT/zl p(1-P) N-n

(iv) Si el tamaiio muestral es grande ', entonces, la variable aleatoria

z= i k l !
se distribuye aproximadamentecomo una normal estindar.

'En general, la aproximaci6n es satisfactoria para muestras de 50 observaciones o mhs. La-calidad de la


aproxirnacidn dependerh tambiCn de p; lo ideal es que se verifique np (1 -p) > 9.
DISTRIBUCI~N
EN EL MUESTREO DE UNA PROPORCI6N MUESTRAL 20 1

N6tese que para p fijo, el error esthndar de la proporci6n muestral disminuye a medida que crece el
tamaiio muestral. Esto implica que, a1 aumentar el tamaiio muestral, la distribuci6n de jx se concen-
tra rnhs alrededor de su media, como puede observarse en la Figura 6.4.Esto a su vez supone que,
para cualquier proporcidn poblacional particular, la probabilidad de que a1 proporci6n muestral y la
poblacional difieran en rnhs de una cantidad fija diminuye a medida que crece el tamaiio muestral. En
otras palabras, si tomamos una muestra mayor de la poblacibn, nuestra inferencia acerca de la pro-
porci6n de individuos que poseen alguna caracteristica particular se harh rnhs firme.
Cuando el tamaiio muestral es grande, la aproxirnaci6n normal de la distribuci6n binomial propor-
ciona un procedimiento muy adecuado para calcular la probabilidad de que la proporci6n muestral
estC dentro de un determinado rango. Vamos a ilustrar esto con 10s ejemplos siguientes.

EJEMPLO Se toma una muestra de 250 casas de una poblaci6n de edificios antiguos para estimar la propor-
6.4 ci6n de casas de este tipo cuya instalaci6n elCctrica resulta insegura. Supongamos que, de hecho, el
30% de todas 10s edificios de esta poblaci6n tienen una instalaci6n insegura. Hallar la probabilidad
de que la proporci6n de edificios de la muestra con instalacidn insegura estC entre 0,25y 0,35.
Tenemos
p = 0,30 n 7 250

Representemos por & la proporci6n de casas de la muestra que tienen una inst@aci6n insegura. Se tiene

donde el error esthndar de la distribuci6n rnueskal de-la proporci6n muestral es

FIGURA 6.4 Funci6n de densidad de probabilidad de las proporciones muestrales en muestras de 100 y 400
observaciones cuando la proporci6n poblacional es 0,8
La probabilidad requerida seri entonces

siendo Z una variable aleatoria con distribuci6n normal esthndar, lo cual nos proporciona una buena
aproximaci6n. Usando la Tabla 3 del ApCndice,

Por tanto, la proporci6n de casas con instalaci6n insegura estai6 dentro de este rango para, aproxi-
madamente, el 91,5% de las muestras de 250 observaciones de esta poblaci6n.

EJEMPLO Se ha estimado que el 43% de 10s licenciados en economia consideran que es muy importante que se
6.5 imparta un curso de Ctica en economia para inculcar valores morales a 10s estudiantes '. Hallar la proba-
bilidad de que m k de la mitad de 10s 80 licenciados en economia de una muestra opinen de este modo.
Nos indican que
n = 80 p = 0,43
Si representamos porOx la proporci6n muestral, la probabilidad que se nos pide es

El error esthndar de la distribuci6n muestral de la proporci6n muestral es

FIGURA 6.5 La probabilidad de que una variable aleatoria normal esthndar sea mayor que 1,27. ~ s t es
a
la probabilidad de que la proporci6n muestral sea mayor que 0,50 para una muestra
de 80 observaciones cuando la proporci6n poblacional es 0,43

6F.R .David, L. M. Anderson y K. W. Lawrimore, "Perspectives on business ethics in management education",


S.A.M. Advanced Management Journal, 55, no.4 (1990), 26-32.
DISTRIBUCI~N
EN EL MUESTREO DE UNA PROPORC16N MUESTRAL 203

Por tanto,

La variable aleatoria Z sigue aproximadamente una distribucidn normal esthndar. Usando la Tabla
3 del Aptndice, obtenemos que

Por tanto, la probabilidad de que mhs de la mitad de 10s individuos de la muestra tengan esta opi-
nidn es aproximadarnente 0,l. Esta probabilidad se corresponde con el Area sombreada en el grhfico
de la curva de densidad d e la normal estandar que aparece en la Figura 6.5.

EJERCICIOS -
-
1. Cuando un cierto proceso de producci6n estA fun- a) Hallar la probabilidad de que la media muestral
cionando correctamente, la resistencia en ohmios de del consumo de combustible sea menor que diez
10s componentes producidos sigue una distribuci6n kildmetros por litro si
normal con media 92 y desviaci6n tipica 3,6. Se (i) se ha tomado una muestra de una observa-
toma una muestra aleatoria de cuatro componentes. ci6n.
a) Hallar la media de la distribuci6n muestral de la . (ii) se ha tomado una muestra de cuatro obser-
media muestral de la resistencia. vaciones.
b) Hallar la varianza de la media muestral. (iii) se ha tomado una muestra de diecistis ob-
C) Hallar el error estindar de la media muestral. servaciones.
d) iCu6l es la probabilidad de que la media mues- b) Explicar por quC las tres respuestas de (a) difie-
tral resulte ser mayor que 93 ohmios? ren de este modo. Hacer un grifico para ilustrar
2. La duraci6n de las bombillas producidas por un el razonamiento.
cierto fabricante tiene una media de mil doscientas 4. El precio medio de venta de casas nuevas durante el
, horas y una desviaci6n tipica de cuatrocientas horas. liltimo aiio en cierta ciudad americana fue de
La poblaci6n sigue una distribuci6n normal. Supon- 115.000 d6lares. La desviaci6n tipica de la pobla-
gamos que t6 has comprado nueve-bombillas, que ci6n fue de 25.000 d6lares. Se toma una muestra
pueden ser consideradas como una muestra aleatoria aleatoria de 100 casas nuevas de esta ciudad.
de la producci6n del fabricante. a) iCuAl es la probabilidad de que la media mues-
a) iCuAl es la media de la media muestral de la du- tral de 10s precios de venta sea menor que
raci6n de estas bombillas? 110.000 d6lares?
b) iCuAl es la varianza de la media muestral? b) ~ C u 6esl la probabilidad de que la media mues-
C) iCuAl ees el error esthdar de la media muestral? tral de 10s precios de venta estC entre 113.000
d) CuAl es la probabilidad de que el tiempo medio d6lares y 117.000 d6lares?
de duraci6n de tus bombillas sea de menos de C) iCuhl es la probabilidad de que la media mues-
mil cincuenta horas? tral de 10s precios de venta estC entre 114.000 y
3. El consumo de combustible, en kil6metros por litro, 116.000 d6lares?
de todos 10s coches de cierto modelo tiene media d) Sin hacer 10s cAlculos, razonar en cuAl de 10s si-
diez y desviaci6n tipica dos. Puede asumirse que la guientes rangos resulta mAs probable que se en-
distribuci6n poblacional es normal. Se toma una cuentre la media muestral de 10s precios de
muestra aleatoria de estos coches. venta:
cereales es de doscientos gramos y su desviaci6n ti-
pica de seis gramos. La distribucidn de 10s pesos en
la poblaci6n es normal. Se eligen cuatro cajas, que
pueden ser-consideradas como una muestra aleato-
ria del total de la producci6n.
e) Supongamos que, despu6s de haber realizado 10s a) ~Cuiiles el error estindar de la media muestral
ciilculos anteriores, un amigo tuyo afirma que la del peso de estas cuatro cajas?
distribuci6n poblacional de 10s precios de venta de
las casas nuevas de esta ciudad es casi con toda se- b) ~Cuiiles la probabilidad de que, como media, el
guridad no normal. tQu6 podrias contestarle? peso de estas cuatro cajas sea menor que 197
gramos?
5. Los candidatos a empleados del departamento de
bomberos de cierta ciudad han de realizar un exa- c) t ~ u es d la probabilidad de que, como media, el
men de actitudes. Las puntuaciones en dicho exa- peso de estas cuatro cajas sea mayor que 206
men siguen una distribuci6n normal con media 280 gramos?
y desviaci6n ttpica 60. Se toma una muestra aleato- d) ~Cuiiles la probabilidad de que, como media, el
ria de nueve puntuaciones de estos e x h e n e s . peso de estas cuatro cajas est6 entre 195 y 205
a) ~ C u isera
l el error estindar de la media muestral gramos?
de las puntuaciones? e) Se eligen al azar dos de estas cuatro cajas. iCuil es
b) iCu6l es la probabilidad de que la media mues- la probabilidad de que, como media, el contenido
tral de las puntuaciones sea menor que 270? de estas dos cajas pese entre 195 y 205 gramos?
c) ~ C u ies l la probabilidad de que la media mues- 8. Supongamos que la desviaci6n tipica de la cuota
tral de las puntuaciones sea mayor que 250? pagada mensualmente por 10s estudiantes de cierta
ciudad americana es de 40 d6lares. Se toma una
d) Supongamos que la desviaci6n tipica poblacio-
muestra de 100 estudiantes con el fin de estimar la
nal fuese 40 en lugar de 60. Sin repetir 10s cilcu-
renta media pagada mensualmente por el total de la
los, establecer c6mo cambim'an las respuestas a poblaci6n de estudiantes.
10s apartados (a), (b) y (c). llustrar las conclu-
siones con 10s graficos adecuados. a) ~ C u i sera
l error estindar de la media muestral
de la cuota mensual?
6. Se ha tomado una muestra de 16 directores de ofici-
nas de corporaciones de una gran ciudad, con el fin b) ~Cuiiles la probabilidad de que la media mues-
de estimar el tiempo medio diario que emplean en tral exceda a la media poblacional en m h de cin-
desplazarse para ir hasta su trabajo. Supongamos co dblares?
que la distribuci6n de dichos tiempos en la pobla- c) ~ C u a es
l la probabilidad de que la media mues-
ci6n sigue una normal con media de 87 minutos y tral est6 mas de cuatro d6lares por debajo de la
desviaci6n tipica de 22 minutos. media poblacional?
a) iCuAl es el error esthndar de la media muestral d) ~ C u k es
l la probabilidad de que la media mues-
de 10s tiempos de desplazamiento? tral difiera de la media poblacional en rnis de
b) ~ C u kes l la probabilidad de que la media mues- tres d6lares?
tral sea menor que 100 minutos? 9. El tiempo que dedican a estudiar 10s estudiantes de
c) iCuil es la probabilidad de que la media mues- cierta universidad en la semana anterior a 10s ex&
tral sea mayor que 80 minutos? menes finales sigue una distribuci6n normal con
d) ~ C u ies l la probabilidad de que la media mues- una desviaci6n tipica de ocho horas. Se toma una
tral tome un valor que est6 entre 85 y 95 minu- muestra aleatoria de cuatro estudiantes con el fin de
tos? estimar el tiempo medio de estudio para esta pobla-
ci6n de estudiantes.
e) Supongamos que se toma una segunda muestra
de quince directores, independiente de la ante- a) ~ C u iesl la probabilidad de que la media muestral
rior. Sin hacer 10s cilculos, razonar si las proba- exceda a la media poblacional en m h de dos horas?
bilidades calculadas en 10s apartados (b), (c) y b) iCuAl es la probabilidad de que la media mues-
(d) serin mayores, menores o iguales para esta tral estC rnis de tres horas por debajo de la me-
segunda muestra. Utilizar grificos para ilustrar dia poblacional?
las respuestas. c) ~ C u a es
l la probabilidad de que la media mues-
7. Una compaiiia produce cereales para el desayuno. tral difiera de la media poblacional en rnis de
La media del peso que contienen las cajas de estos cuatro horas?
DISTRIBUCI~N
EN EL MUESTREO DE UNA P R O P O R C I ~ NMUESTRAL 205

d) Supongamos que se toma una segunda muestra b) Sin realizar 10s ctllculos, razonar si se requerirri un
de diez estudiantes, independiente de la anterior. tamaiio muestral mayor o menor que el del apar-
Sin hacer 10s chlculos, razonar si las probabili- tado (a) para poder garantizar que la probabilidad
dades calculadas en 10s apartados (a), (b) y (c) de que la media muestral difiera de la media pobla-
serhn mayores, menores o iguales para esta se- cional en m k de dos horas sea menor que 0,lO?
gunda muestra. C) Sin realizar 10s chlculos, razonar si se requerirh
10. Un proceso industrial produce lotes de un cierto pro- un tamaiio muestral mayor o menor que el del
ducto quimico cuyos niveles de irnpureza siguen una apartado (a) para poder garantizar que la proba-
distribuci6n normal con una desviaci6n tipica de 1,6 bilidad de que la media muestral difiera de la
grarnos por cada 100 gramos del product0 quimico. media poblacional en mhs de 1,5 horas sea me-
Se selecciona una muestra de 100 lotes a fin de esti- nor que 0,05.
mar la media poblacional del nivel de irnpurezas. 13. En la Tabla 6.1 y en el Ejemplo 6.1, consideriba-
a) 0,05 es la probabilidad de que la media muestral mos muestras de n=4 observaciones de una pobla-
del nivel de impurezas exceda a la media pobla- ci6n de N=6 valores de aiios de experiencia de
cional, ten qu6 cantidad? trabajo en una compaiiia. La media poblacional es
px= 5,5 aiios.
b) 0.1 es la probabilidad de que la media muestral
del nivel de irnpurezas est6.por debajo de la me- a) Confirmar, a partir de 10s seis valores de la po-
dia poblacional, ten qu6 cantidad? blaci6n, que la varianza muestral es
C) 0,15 es la probabilidad de que la media muestral
del nivel de irnpurezas difiera de la media pobla-
cional, ten qu6 cantidad? b) Confirmar, siguiendo la aproximacidn del Ejem-
11. Las tasas de rentabilidad de cierto tipo de acciones plo 6.1, que la varianza de la distribucidn mues-
siguen una distribucidn con una desviacidn tipica tral de la media muestral es
de 3,8. Se extrae una muestra de tales acciones con
el fin de estimar el precio medio.
a) tQu6 tamaiio ha de tener la muestra para asegu-
rarnos de que la probabilidad de que la media c) Verificar para este ejemplo que
muestral difiera de la media poblacional en una
cantidad superior a 1 sea menor que 0,1?
b) Sin realizar 10s chlculos, razonar si serh preciso
un tamaiio muestral mayor o menor que el re- 14. Si se toma una muestra de n observaciones de una
querido en el apartado (a) para garantizar que la poblacidn con N individuos, la varianza de la distri-
probabilidad de que la media muestral difiera de bucidn muestral de la media muestral es
la media poblacional en m h de 1 sea menor que
0,05.
c). Sin realizar 10s chlculos, razonar si serh preciso
La cantidad
un tamaiio muestral mayor o menor que el re-
querido en el apartado (a) para garantizar que la
probabilidad de que la media muestral difiera de
la media poblacional en m h de 1,5 sea menor
que 0,l. recibe el nombre de "factor de correccidn por po-
12. El tiempo que dedican a estudiar 10s estudiantes de blacidn finita".
cierto campus en la semana anterior a 10s exhmenes a) Para tener una idea de las posibles magnitudes
finales sigue una distribucidn normal con una des- del factor de correccidn por poblaci6n finita, cal-
viacidn tipica de 8,4 horas. Se toma una muestra cular dicho factor para muestras de n=20 obser-
aleatoria de estos estudiantes con el fin de estimar vaciones de poblaciones de N=20, 40, 100,
el tiempo medio de estudio para esta poblacidn de 1.000 y 10.000 individuos.
estudiantes. b) Explicar por quC el resultado obtenido para
a) tQu6 tamaiio ha de tener la muestra para poder N=20 en el apartado (a) coincide 'kxactamente
asegurar que la probabilidad de que la media con lo que se esperana intuitivamente.
muestral difiera de la media poblacional en m h c) A partir de 10s resultados obtenidos en el apar-
de dos horas sea menor que 0,05? tad0 (a), discutir el efecto que tendri en la prhc-
206 MUESTREO
Y DlSTRlBUClONES MUESTRALES

tica el factor de correcci6n por poblaci6n finita para de Quebec, el 42,4% de la gente que vot6 lo hizo en
muestras de 20 observaciones extraidas de pobla- favor de la nueva Constituci6n. Se tom6 una mues-
ciones de diferentes tamaiios. tra de 100 votantes de dicha provincia.
15. En cierta ciudad americana hay 400 agentes que se a) /,Cull sera la media de la proporci6n muestral
dedican a1 negocio de venta de propiedades. El va- que esti en favor de la nueva Constituci6n?
lor medio de las propiedades vendidas por estos b) /,Cuhl es la varianza de la proporci6n muestral?
agentes en un aiio es de 800.000 d6lares, y su des-
viaci6n tipica es de 300.000 d6lares. Se selecciona C) iCuBl es el error esthndar de la proporci6n
una muestra de 100 agentes y se anota el valor de muestral?
las propiedades que han vendido en un aiio. d) iCuhl es la probabilidad de que la proporci6n
a) iCuhl es el error esthdar de la media muestral? muestral sea mayor que 0,5?
b) iCuhl es la probabilidad de que la media mues- 19. De acuerdo con 10s datos del Ministerio de Econo-
mia y Hacienda, el 15% de las declaraciones del
tral sea mayor que 825.000 dblares?
IRPF del dltimo aiio pasado darin lugar a una de-
C) iCuBl es la probabilidad de que la media mues- voluci6n. Se toma una muestra aleatoria de 100 de-
tral sea mayor que 780.000 d6lares? claraciones.
d) /,Cuhl es la probabilidad de que la media mues- a) ~ C u hes
l la media de la distribuci6n en el mues-
tral est6 entre 790.000 y 820.000 dblares? treo de proporci6n muestral de declaraciones
16. En un curso de econom'a hay 250 estudiantes. Cada que d a r h lugar a una devoluci6n?
uno de 10s integrates de una muestra aleatoria de 50 b) iCu81 es la varianza de la proporci6n muestral?
estudiantes es interrogado con el fin de estirnar la can-
C) iCuBl es el error esthndar de la proporci6n
tidad de tiempo que gasta semanalmente en resolver
muestral?
10s problemas de estadistica. Supongamos que la des-
viaci6n tipica de la poblaci6n es de treinta minutos. d) /,Cuhl es la probabilidad de que la proporci6n
muestral sea mayor que 0,8?
a) iCuhl es la probabilidad de que la media mues-
tral exceda a la media poblacional en mhs de 2,5 20. El dueiio de una tienda de discos ha comprobado
minu tos? que el 20% de 10s clientes que entran en su tienda
realizan alguna compra. Cierta maiiana, entraron en
b) iCu8l es la probabilidad de que la media mues- esta tienda 180 personas, que pueden ser considera-
tral est6 m h de cinco minutos por debajo de la das como una muestra aleatoria de todos sus clien-
media poblacional? tes.
C) ~ C u hesl la probabilidad de que la media mues- a) /,Cuhl serh la media de la proporci6n muestral de
tral difiera de la media poblacional en mhs de clientes que realizaron alguna compra?
diez minutos?
b) ~ C u hes
l la varianza de la proporci6n muestral?
17. Para una audiencia de 600 personas que han acu-
dido ha escuchar un concierto, el tiempo medio em- C) /,Cuhl-es el error estlndar de la proporci6n
pleado en desplazarse hasta el lugar del concierto muestral?
fue de treinta y dos minutos, con una desviaci6n ti- d) ~ C u h es
l la probabilidad de que la proporci6n
pica de diez minutos. Se toma una muestra de 150 muestral sea menor que 0,15?
personas de dicha audiencia. 21. El adrninistrador de una gran cadena de hospitales
a) iCull es la probabilidad de que la media mues- opina que, de entre todos sus pacientes, un 30% ge-
tral del tiempo de desplazamiento sea superior a nerarh facturas que se pagarh con m L de dos me-
treinta y un minutos? ses de retraso. Se toma una muestra aleatoria de
b) /,Cuhl es la probabilidad de que la media mues- 200 pacientes.
tral del tiempo de desplazamiento sea inferior a a) /,Cull es el error esthndar de la proporci6n
treinta y tres minutos? muestral de pacientes con facturas cuyo pago se
C) Dibujar un grhfico que explique por qu6 la res- retrasarh m8s de dos meses?
puesta en (a) y en (b) es la misma. b) ~ C u hesl la probabilidad de que esta proporci6n
d) ~ C u hes l la probabilidad de que la media mues- muestral sea inferior a 0,25?
tral del tiempo de desplazamiento est6 entre C) iCuhl es la probabilidad de que esta proporci6n
treinta y uno y treinta y tres minutos? muestral sea superior a 0,33?
18. En 1992 10s canadienses votaron en un referindurn d) /,Cuhl es la probabilidad de que esta proporci6n
acerca de una nueva Constituci6n. En la provincia muestral est6 entre 0,27 y 0,33?
DISTRIBUCI~N
EN EL MUESTREO DE UNA PROPORCI6N MUESTRAL 207

22. Una corporaci6n ha recibido 120 solicitudes de tra- b) jcuiil es la probabilidad de que esta proporci6n
bajo de estudiantes que acaban de terminar su licen- muestral sea superior a 0,25?
ciatura en economia. Suponiendo que estas solicitu- c) jcuiil es la probabilidad de que esta proporcion
des pueden ser consideradas como una muestra muestral sea inferior a 0,32?
aleatoria de todos 10s licenciados, jcual es la proba-
bilidad de que entre un 35% y un 45% de las solici- d) Sin realizar 10s cdculos, mzonar en cud de 10s si-
tudes correspondan a mujeres si se sabe que el 40% guientes intewalos es mhs probable que se encuen-
de 10s licenciados en economia que acaban de ter- tre la proporci6n muestral : 0,29-0,3 1; 0.30-0,32;
minx su carrera son mujeres? 0,3 1 4 3 3 ; 0,32434.
23. Una asociaci6n benCfica ha comprobado que el 26. Se toma una muestra aleatoria de 100 votantes con
42% de las personas que hicieron alguna donaci6n el fin de estimar la proporci6n de votantes de un
el aiio anterior donarh de nuevo este aiio. Se toma cierto estado que estii a favor de un aumento en 10s
una muestra de 300 donantes del aiio anterior. impuestos sobre la gasolina para contar asi con un
ingreso adicional para reparaciones de las autopis-
a) cud es el error esthdar de la proporci6n mues- tas. jCuiil es el mayor valor que puede tomar el
tral de donantes que donartin de nuevo este aiio? error esthdar de la proporcion muestral de esta me-
b) jCuiil es la probabilidad de que miis de la mitad dida?
de 10s individuos de esta muestra vuelvan a ser
27. Supongamos que, en el context0 del Ejercicio 26,
donantes este aiio? se decide que una muestra de 100 votantes es dema-
c) jCud es la probabilidad de que esta proporci6n siado pequeiia para obtener un estimador de la pro-
muestral estC entre 0,40 y 0,45? porci6n poblacional que resulte suficientemente
d) Sin realizar 10s ciilculos, decidir en cuiil de 10s creible. Se decide exigu que la probabilidad de que
siguientes intewalos es miis probable que se en- la proporci6n muestral difiera de la proporci6n po-
cuentre la proporci6n muestral: 0,39-0,41; blacional (cualquiera que sea su valor) en m6s de
0,41-0,43; 0,43-0,45; 0,45-0,47. 0,03 no debe ser superior a 0,05. jQuC tamaiio ha
24. Una corporaci6n estii considerando una nueva emi- de tener la muestra para poder garantizar que se
si6n de bonos convertibles. Sus directores piensan cumple este requerimiento?
que la oferta resultarii atractiva para el 20% de 10s 28. Una compaiiia quiere estimar la proporcidn de per-
accionistas actuales. Supongamos que su creencia sonas que son posibles compradores de afeitadoras
es acertada. Se toma una muestra aleatoria de 130 elCctricas que ven las retransmisiones de 10s parti-
accionistas. dos de flitbol de la liga nacional. Se toma una
a) jCuiil es el error estiindar de la proporci6n muestra de 120 individuos aue se identificaron
muestral de accionistas que encontrarh atrac- como posibles compradores de afeitadoras elCctri-
tiva la oferta? cas. Supongamos que la proporci6n de posibles
compradores de afeitadoras elCctricas en la pobla-
b) jCud es la probabilidad de que esta proporci6n ci6n que ven estas retransmisiones es 0,25.
muestral sea superior a 0,15?
a) 0,10 es la probabilidad de que la proporci6n
c) jcuiil es la probabilidad de que esta proporci6n muestral exceda a la proporci6n poblacional jen
muestral estC entre 0,18 y 0,22? auk valor?
d) Supongamos que se toma ahora una muestra de b) 0,05 es la probabilidad de que la proporci6n
500 accionistas. Sin realizar 10s cdculos, razo- muestral estC por debajo de la proporci6n pobla-
nar si las probabilidades correspondientes a 10s cional jen quC cantidad?
apartados (b) y (c) resultarh en este caso mayo-
res, menores o iguales que las calculadas para la c) 0,30 es la probabilidad de que la proporcion
muestra anterior. muestral difiera de la proporci6n poblacional
Len quC cantidad?
25. Unos almacenes han comprobado que el 30% de 10s
clientes que compran una cortadora de cCsped, ad- 29. Supongamos que el 50% de 10s espaiioles adultos
quieren tambiCn un contrato de servicios. En un opinan que es necesaria una revisi6n del sistema
mes fueron vendidas 280 cortadoras de cCsped a un nacional pliblico de hospitales. iCu6l es la probabi-
grupo de clientes que puede ser considerado como lidad de que miis del 56% de 10s componentes de
una muestra aleatoria del total de compradores. una muestra aleatoria de 150 espaiioles adultos ten-
a) jCu6l es el error estiindar de la proporci6n gan esta opini6n?
muestral de clientes que adquieren u6 contrato 30. Supongamos que el 50% de 10s espaitoles adultos opi-
de servicios? nan que el nivel actual de dCficit del presupuesto nacio-
nal puede causar un daiio importante a la economfa de c) jCud es la probabilidad de que la proporci6n
la naci6n a largo plazo. j C ~ es
a la probabilidad de que muestral se encuentre entre 0,40 y 0,50?
mL del58% de 10s componentes de una muestra alea- 33. Una fhbrica tiene a 439 obreros contratados. De
toria de 250 espaiioles adultos tengan esta opini6n? ellos, 239 e s t h preocupados sobre sus futuras pen-
31. Un periodista quiere averiguar cuhtos de 10s 500 siones. Se toma una muestra de 80 obreros y se les
maestros de cierta regi6n e s t h a favor de un cam- interroga con el fin de estimar la proporci6n de la
bio en 10s planes de estudio. En el tiempo disponi- poblaci6n que esth preocupada sobre el futuro de su
ble, s610 fue posible contactar con una muestra pensi6n.
aleatoria de 81 de estos maestros. Si el 55% de to- a) jCuhl serh el error esthndar de la proporci6n
dos 10s individuos de la poblaci6n opina que un muestral de obreros preocupados?
c ~ b i resultm'a
o beneficioso, jcual es la probabili-
b) jCuhl es la probabilidad de que la proporci6n
dad de que menos de la mitad de 10s individuos de muestral sea menor que 0,5?
la muestra tengan esta opini6n?
c) jCuhl es la probabilidad de que la proporci6n
32. Una universidad cuenta con un total de 528 estu- muestral se encuentre entre 0,5 y 0,6?
diantes de primer curso. De ellos, 211 llevan su
propio ordenador a1 campus. Se toma una muestra 34. El increment0 porcentual del salario de 10s directo-
aleatoria de 120 estudiantes de primer curso. res ejecutivos de medianas corporaciones sigue una
distribuci6n normal con una media del 12,2% y una
a) j C ~ h les el error esthndar de la proporci6n desviaci6n tipica del 3,6%. Se toma una muestra
muestral de alumnos que llevan su propio orde- aleatoria de 8 1 de estos directores ejecutivos. jCu6l
nador al campus? es la probabilidad de que mhs de la mitad de 10s in-
b) jCuk1 es la probabilidad de que la proporci6n dividuos de la muestra tengan incrementos salaria-
muestral sea menor que 0,33? les menores del lo%?

6.4 DISTRIBUCI~NEN EL MUESTREO DE LA VARIANZA MCTESTRAL


En la Secci6n 6.2, consideramos el problema de hacer inferencias sobre la media de una poblaci6n
bashdonos en la informaci6n muestral. Ahora vamos a centrar nuestra atenci6n en la varianza po-
blacional.
Supongamos que se extrae una muestra de n observaciones de una poblaci6n con media descono-
cida px y varianza desconocida ax2. Representaremos las observaciones muestrales por XI,Xz,.....,
X,. La varianza poblacional es la esperanza
ux' = E[(X- px)'I
y, por tanto, una cantidad en la que evidentemente deberiamos fijamos seria en la media de 10s (Xi-pJ2
para 10s n individuos de la muestra. Sin embargo, la media poblacional px es desconocida, por lo que en
la prkctica esta cantidad no podrh ser calculada. Es natural, entonces, sustituir la desconocida px por la
X,
media muestral y considerar la media de 10s (Xi- @. De hecho, como ya se dijo en el Capitulo 2, la
varianza muestral se define como
DISTRIBUCI~N
EN EL MUESTREO DE LA VARlANZA MUESTRAL 209

Definici6n:
Sea XI, Xz, ....., X, una muestra aleatoria de una poblaci6n. La cantidad
Sx2 = -5 ( x i - x ) 2
n - 1 i=I

1 recibe el nombre de varianza muestra17.Su raiz cuadrada, SX, se denornina desviaci6n tipica muestral. 1
Obsbrvese que, en nuestra definici6n de varianza muestral, hemos usado como divisor (n-1) en lu-
gar de n, lo cual puede resultar sorprendente. La raz6n para esta formulaci6n es que puede probarse
que, si se define la varianza muestral de este modo, entonces, 1a.media de su distribuci6n muestral es
la verdadera varianza poblacional ',es decir,

La conclusi6n de que el valor esperado de la varianza muestral es la varianza poblacional, es general.


Sin embargo, para poder caracterizar completarnente su distribuci6n muestral, necesitaremos saber m k
acerca de la distribuci6n de la poblaci6n. En muchas aplicaciones prkticas, el supuesto de que la distri-
buci6n de la poblaci6n es normal resulta razonable. En tal caso, puede probarse que la variable aleatoria

sigue una distribuci6n conocida con el nombre de distribuci6n X 2 (distribuci6n chi-cuadrado) con
( n -1) grados de libertad 9.
La familia de distribuciones chi-cuadrado se-usa con mucha frecuencia en el analisis estadistico.
Estas distribuciones s610 esthn definidas para valores positivos de la variable aleatoria, lo cual resulta
adecuado en este contexto, ya que la varianza muestral no puede ser negativa. Su funci6n de densi-
dad, que aparece representada en la Figura 6.6, es asimbhica. Un miembro concreto de la farnilia chi-
cuadrado viene caracterizado por un dnico parhetro, a1 que llarnaremos grados de libertad, para el
que habitualmente se usa el simbolo v. Si una variable aleatoria sigue una distribuci6n 2 con v gra-
dos de libertad, se representar&por 2v. La media y la varianza de esta dishibuci6n son, respectiva-
mente, el ndmero de grados de libertad y el doble del ndmero de grados de libertad, es decir,
E(x;) = v Y var(xP) = 2v
En nuestro contexto, la variable aleatoria (n - l)s,2/d sigue una distribuci6n y, por tanto, su
media es

' ~ n avez mas, distinguimos entre la variable aleatoria SX' y el valor especifico que toma. Asi, si la muestra concreta
que se ha obsewado es x,, xl. ....J",entonces, la realizacidn de s? sera

"Esteresultado se demuestra en el Apc5ndice A6.1 que aparece al final de este capitulo. N6tese que esto s610 es cierto
cuando el tamaiio muestral es una proporci6n pequeiia del tamafio de la poblaci6n.
9La distribuci6n chi-cuadrado con v grados de libertad es la distribuci6n de la suma de 10s cuadrados de variables
aleatorias normales esthdar independientes.
FIGURA 6.6 Funci6n de densidad de probabilidad de la distribuci6n chi-cuadrado con v = 4,6 y 8 grados
de libertad

Por tanto, tenemos


'n -
~ ( s : )= ( n - 1 )
ax'
de donde
E(sXZ)= ax2
como antes. Para hallar la varianza de :s ,usamos que

Por consiguiente,

( n - 1)'
var(sX2)= 2(n - 1)
ax"

y, en consecuencia,

Las propiedades de la distribuci6n XZ pueden usarse tambiCn para calcular la varianza de la distri-
buci6n muestral de la varianza muestral lo.
El parhetro v de la distribuci6n ,$ recibe el nombre de grados de libertad. Para entender esta
terminologfa, observemos que'la varianza muestral involucra en su definici6n a la suma de 10s cua-
drados de las cantidades
(XI -a,(X2 - m,.. . ,(X" - m
Esto supone que estas n piezas de informaci6n intervienen en el cAlculo de la varianza muestral.
Sin embargo, no son piezas de informaci6n independientes, puesto que su suma ha de ser 0, seg6n se
deduce de la definici6n de X . Por tanto, si conocemos ( n - 1 ) cualesquiera de 10s (Xi - X), podemos
calcular el otro a partir de 10s (n-1) primeros. Por ejemplo, dado que

10~ecutrdese
que este resultado s610 es vflido cuando la poblaci6n de la que se extrajo la muestra es normal.
DISTRIBUCI~N
EN EL MUESTREO DE LA VARlANZA MUESTRAL 2 11

sejiene que

Las n cantidades (Xi-z) son equivalentes a un conjunto de (n - 1) piezas independientes de infor-


maci6n. Podemos pensar en esta situaci6n de la forma siguiente: queremos hacer inferencia sobre la
desconocida 0x2. Si la media poblacional px fuese conocida, nuestra inferencia podria estar basada en
la suma de cuadrados de

Estas cantidades son independientes unas de otras, y podriamos decir que tenemos n grados de li-
bertad para la estimaci6n de 0x2. Sin embargo, dado que en la prictica la media poblacional es desco-
nocida, y tendremos que sustituirla por su estimador X,uno de estos grados de libertad se pierde, y
nos quedamos con (n - 1) observaciones independientes para hacer inferencia sobre la varianza po-
blacional. Se dice por ello que 10s grados de libertad disponibles son (n - l).
Con frecuencia, necesitaremos encontrar valores de la funci6n de distribuci6n acumulada de una
variable aleatoria 2.En muchos casos, estos problemas e s t h planteados en tCrminos de la determi-
naci6n de puntos de corte correspondientes a una probabilidad concreta. Por ejemplo, para una varia-
ble aleatoria que sigue una distribuci6n XloZ, se nos puede pedir que hallemos el nlimero K para el
cual se verifica
P(,y,: < K ) = 0,90
o, equivalentemente,
P(,yl; > K ) = 0,lO
Las funciones de distribuci6n de las variables aleatorias con distribuci6n chi-cuadrado aparecen ta-
buladas en la Tabla 5 del Aptndice de tal forma que se pueden leer directamente 10s puntos de corte.
Puede verse en la Tabla 5 que, para una variable aleatoria con distribuci6n x,:,si P(,yl: > K)= 0,10,
entonces, K = 15,99. Esta probabilidad corresponde a1 Area sombreada debajo de la funci6n de densi-
dad en la Figura 6.7.

Distribucion muestral de la varianza muestral


Seas? la varianza muestral de una muestra aleatoria de n observaciones extraidas de una poblacidn
con varianza ax2. Entonces,
(i) La distribuci6n muestral de sx2 tiene media a?, es decir,
E(s2) = 0-2
(ii) La varianza de la distribuci6n muestral de sx2 depende de la distribuci6n de la poblaci6n. Si
dicha distribuci6n es normal, entonces,
2~x4
var(sxZ)= -
n-1

(n - l)sx2
(iii) Si la distribuci6n poblacional es normal, entonces, se distribuye como una 2(,-1,.
ax2

Supongamos que hemos tomado una muestra aleatoriir de una poblaci6n y queremos hacer alguna
inferencia sobre la varianza poblacional. Si se asume la normalidad de la poblacibn, se podri usar la
distribuci6n chi-cuadrado, como haremos en 10s ejemplos que aparecen a continuaci6n.
2 12 MUFSTREO
Y DISTRlBUClONES MUFSTRALES

EJEMPLO Cuando un proceso de producci6n esta funcionando correctamente, la resistencia en ohmios de 10s
6.6 componentes que produce sigue una distribucibn normal con desviaci6n tipica 3,6. Se toma una
muestra aleatoria de cuatro componentes. iCuA es la probabilidad de que la varianza muestral sea
superior a 30?
Tenemos que
n =4 ax= 3,6 u? = (3,6)' = 12,96
La probabilidad que se nos pide es

En la Tabla 5 del ApCndice, encontramos que

Puesto que 6,94 esti entre 6,25 y 7,81, la probabilidad que buscamos debe estar entre 0,05 y 0,10,
esto es
0,05 < p(sX2> 30) < 0,lO
La tabla no nos permite encontrar la probabilidad exacta, aunque existen muchos programas de or-
denador que si pueden calcularla. N6tese tambiCn que la varianza muestral ser6 mayor que 30 si y
s610 si la desviaci6n tipica muestral es mayor que fi= 5.48. Por tanto, las probabilidades de es-
tos dos sucesos son iguales. En consecuencia, se tiene que

FIGURA 6.7 Probabilidad (0,9) de que una variable aleatoria chi-cuadrado con 10 grados de libertad sea
menor que 15,99

$ ,
DISTRIBUCI~NEN EL MUESTREO DE LA VARIANZA MUESTRAL 2 13

EJEMPLO Un fabricante de latas de guisantes estd interesado en que el peso medio de su product0 estk pr6-
6.7 ximo a1 peso anunciado. Ademds, desea que no haya mucha variabilidad en 10s pesos de las latas de
guisantes, ya que de lo contrario, una gran proporci6n de latas diferiria sensiblemente del peso anun-
ciado. Asumamos que la distribuci6n poblacional de 10s pesos es normal. Se toma una muestra alea-
toria de veinte latas. Hallar 10s ndmeros K, y K2que verifican

Tenemos que

donde n = 20 es el tamafio muestral y x?(..~,


es una variable aleatoria que se distribuye como una chi-
cuadrado con (n- 1 ) = 19 grados de libertad. Entonces,
0,05 = P(X,; < 19Kl) o 0,95 = P(x,: > 19K1)
En la Tabla 5 del ApCndice, encontramos que
19K1 = 10,12
y, por tanto,
Kl = 0,533
La conclusi6n es que la probabilidad de que la varianza muestral sea menor que un 53% de la va-
rianza poblacional es 0,05.
Tenemos que hallar tambiCn el ndmero Kz.que verifica

De forma equivalente podemos escribir

Asi pues, dado que n = 20

luego, buscando en la Tabla 5, encontramos que


19Kz = 30,14
y, por tanto,
Kz = 1,586
Esto supone que la probabilidad de que la varianza muestral sea mds de un 58,6% mayor que la va-
rianza poblacional es 0,05.
Estas probabilidades aparecen representadas en la Figura 6.8 como ireas debajo de la funci6n de
densidad de la distribuci6n x:,.
Hay que hacer hincapik en el hecho de que la tCcnica empleada en estos ejemplos no es tan univer-
salmente aplicable en la prictica como la que usibamos en las primeras secciones de este capitulo.
En este contexto, el supuesto de que la distribuci6n de la poblaci6n de la que se ha extraido la
2 14 MUESTREO
Y DISTRIBUCIONES MUESTRALES

FIGURA 6.8 0,05 es la probabilidad de que una variable aleatoria chi-cuadrado con 19 grados de libertad sea
menor que 10,12 y tambitn la de que dicha variable aleatoria sea mayor que 30,14

muestra es normal, es fundamental. Hemos visto cdmo pueden encontrase probabilidades relativas
tanto a la media muestral como a la varianza muestral cuando se muestrea de una poblacidn normal.
Sin embargo, esta liltima se verfi mfis afectada por desviaciones del supuesto de normalidad de la dis-
tribuci6n poblacional. Cuando se quieren calcular probabilidades relativas a la media muestral, el te-
orema central del limite asegura que, para muestras moderadarnente grandes, desviaciones pequefias
de la hipdtesis de normalidad de la poblaci6n de la que se extrae la muestra tienen un efecto pequefio
en la validez de las probabilidades calculadas. Por esta raz6n, se dice que las inferencias basadas en
la media muestral son robustas frente a desviaciones del supuesto de normalidad de la poblacidn,
rnientras que las inferencias basadas en la varianza poblacional no lo son.
Sin embargo, es frecuente en la prfictica que la varianza poblacional tenga un interts direct0
para el investigador. Debe recordarse que, si s610 se dispone de una cantidad pequeiia de obsema-
ciones muestrales, desviaciones importantes del supuesto de normalidad de la poblacidn pueden
invalidar las conclusiones del anfilisis realizado seglin la tCcnica que hemos descrito en esta sec-
ci6n. Por tanto, un analista precavido deberfi ser cuidadoso a la hora de hacer inferencias en tales
circunstancias.

EJERCICIOS

35. Un proceso produce lotes de un product0 quimico a) Hallar la probabilidad de que la desviaci6n ti-
cuyos niveles de concentraci6n de irnpurezas siguen pica muestral sea menor que 2,5.
una distribuci6n normal con varianza i ,75. Se extrae
una muestra aleatoria de 20 lotes. Hallar la probabili- b) Hallar la probabilidad de que la desviaci6n ti-
dad de clue la varianza muestral sea suverior a 3.10. pica muestral sea mayor que 1.
36. Las reniabilidades mensuales de cieio tipo de ac- 37. Los salarios de 10s contables durante sus primeros
ciones son independientes unas de otras, y siguen aiios de trabajo siguen una distribuci6n normal con
una distribuci6n normal con desviaci6n tipica 1,7. desviaci6n tipica de'250.000 pesetas. Se' extrae una
Se toma una muestra de doce meses. muestra aleatoria de 16 observaciones.
DISTRIBUCI~N
EN EL MUESTREO DE LA VARIANZA MUESTRAL 2 15

a) Hallar la probabilidad de que la desviaci6n ti- 42. En una empresa se fabrican componentes electr6ni-
pica muestral sea mayor que 300.000 pesetas. cos que emiten seiiales cuya duraci6n sigue una dis-
b) Hallar la probabilidad de que la desviaci6n ti- tribuci6n normal. Se extrae una muestra aleatoria
pica muestral sea menor que 150.000 pesetas de seis componentes, y se mide la duraci6n de las
seiiales que emiten.
38. Se quiere someter a todos 10s empleados de una
gran universidad a un test de 100 preguntas de a) 0,05 es la probabilidad de que la varianza mues-
elecci6n m6ltiple. Inicialmente, en un estudio tral sea mayor que ~ q u Cporcentaje de la va-
piloto, se somete a este test a una muestra alea- rianza poblacional?
toria de 20 trabajadores. Supongamos que, para b) 0,10 es la probabilidad de que la varianza mues-
la poblaci6n completa de todos 10s trabajadores tral sea menor que ~ q u Cporcentaje de la va-
de la Universidad, la distribuci6n del n6mero de rianza poblacional?
respuestas correctas sigue una normal con va- 43. Se toma una muestra aleatoria de diez acciones de em-
rianza 250. presas aseguradoras. Supongarnos que la distribuci6n
a) cull es la probabilidad de que la varianza de las tasas de rentabilidad de las acciones en la pobla-
muestral sea menor que loo? ci6n de todas las empresas aseguradoras es normal.
b) ~ C u i l les la probabilidad de que la varianza a) 0,10 es la probabilidad de que la varianza mues-
muestral sea mayor que 500? tral sea mayor que ~ q u porcentaje
t de la va-
39. Se ha comprobado que, en cierta ciudad espaiiola, rianza poblacional?
las facturas de electricidad durante el periodo de b);Encontrar dos niimeros, a y b, que hagan co-
verano siguen una distribuci6n normal con una des- rrecta la frase siguiente: 0,95 es la probabilidad
viaci6n tipica de 10.000 pesetas. Se toma una de que la varianza muestral est6 entre el a% y el
muestra aleatoria de 25 facturas. b% de la varianza poblacional.
a) Hallar la probabilidad de que la desviaci6n ti- c) Supongamos que se extrae una muestra de 20
pica muestral sea menor que 7.500 pesetas. acciones. Sin realizar 10s cillculos, indicar cdmo
b) Hallar la probabilidad de que la desviaci6n ti- cambiaria esto la respuesta a1 apartado (b).
pica muestral sea mayor que 15.000 pesetas. 44. Se extrae una muestra aleatoria de 15 economistas
40. El ndmero de horas que dedican a ver televisi6n 10s y se les pregunta sobre su predicci6n acerca de la
estudiantes en la semana anterior a sus exhnenes fi- tasa de inflaci6n para el pr6ximo aiio. Supongamos
nales sigue una distribuci6n normal con una desvia- que las predicciones para la poblaci6n completa de
ci6n tipica de 4,s horas. Se toma una muestra alea- economistas sigue una distribuci6n normal con una
toria de 30 estudiantes. desviaci6n tipica de 1,8%.
a) 0,01 es la probabilidad de que la desviaci6n ti-
a) La probabilidad de que la desviaci6n tipica mues- pica muestral sea mayor que ~ q u Cn6mero?
tral sea mayor que 3,s horas, Les mayor que
0,95? b) 0,025 es la probabilidad de que la desviaci6n ti-
pica muestral sea menor que ~ q u Bndmero?
b) La probabilidad de la desviaci6n tipica muestral
sea menor que seis horas, Les mayor que 0,95? C) Encontrar un par de n6meros tales que la proba-
bilidad de que la desviaci6n tipica muestral se
41. En la Tabla 6.1, consider6bamos las quince posi- encuentre entre estos dos ndmeros sea 0,9.
bles muestras de cuatro obsewaciones de una po-
blaci6n de N=6 valores de aiios de experiencia de 45. Para comprobar la precisidn de cierto instrumento,
trabajo. La varianza poblacional para estos seis se hacen 12 lecturas de la misma cantidad. La dis-
valores es tribuci6n poblacional de las lecturas que hace este
instrumento es normal.
a) 0,95 es la probabilidad de que la varianza mues-
tral sea mayor que ~ q u Cporcentaje de la va-
rianza poblacional?
Calcular la varianza muestral para cada una de la 15
posibles muestras. Hallar la media de estas 15 varian- b) 0,9 es la probabilidad de que la varianza mues-
zas muestrales, y comprobar que el valor esperado de tral sea mayor que ~ q u Cporcentaje de la va-
la varianza muestral no es igual a la varianza poblacio- rianza poblacional?
nal cuando el nirmero de individuos en la muestra no es c) Encontrar un par de n6meros, a y b, que hagan
una proporci6n pequeiia del n6mero de individuos en correcta la frase siguiente: 0,95 es la probabili-
la poblacidn. [De hecho, puedes comprobar para este dad de que la varianza muestral estC entre el a%
ejemplo que ~(s;) = NuxZ/(N- I)]. y el b% de la varianza poblacional.
2 16 MUESTREO
Y DISTRIBUCIONES MUESTRALES

46. Una compaiiia farmaceutica elabora pfldoras que de impurezas con una varianza de 15,4 (medida
contienen un ingrediente activo. La compaiiia se en kilos cuadrados). Un competidor de este pro-
preocupa sobre la media del peso de este ingre- veedor asegura a1 fabricante que puede propor-
diente por pfldora, per0 tambiCn pretende que la va- cionarle envios de la misma materia prima con el
rianza (medida enmiligramos cuadrados) no sea mismo nivel medio de impurezas per0 con menor
mayor que 1,5. Se extrae una muestra aleatoria de varianza. Para una muestra de 25 envios del se-
20 pildoras y su varianza muestral resulta ser de gundo proveedor, la varianza del 10s niveles de
2,05. jCukl es la probabilidad de que la varianza impureza result6 ser de 12,2. jCukl es la probabi-
muestral sea tan alta como la observada o mayor si lidad de obtener un valor de la varianza muestral
la varianza poblacional es realmente 1,5? Asumir tan bajo como el observado o menor si, de hecho,
que la distribuci6n poblacional es normal. la verdadera varianza poblacional es de 15,4?
47. Un fabricante ha estado comprando materias pri- Asumir que la distribuci6n de la poblaci6n es
mas a un proveedor cuyos envios tienen niveles normal.

UERClClOS DE REPASO

48. ~ Q u 6quiere decir que la media muestral tiene una a) Hallar la probabilidad de que la media muestral
distribuci6n en el muestreo? de las puntuaciones sea mayor que 450.
49. Un agente estk considerando seis fondos de inver- b) Hallar la probabilidad de que la media muestral
si6n diferentes. El ndmero medio de dias que tardan . de las puntuaciones tome un valor que estC entre
en vencer estos fondos es 400 y 450.
41 39 35 35 33 38 c) 0,10 es la probabilidad de que la media muestral
Se eligen a1 azar dos de estos fondos. de las puntuaciones sea mayor que jquC ndmero?
a) jCu6l es el ndmero de posibles muestras de dos d) 0,10 es la probabilidad de que la media muestra
fondos? de las puntuaciones sea menor que jquC nhmero?
b) Hacer una lista de todas las posibles muestras. e) 0,05 es la probabilidad de que la desviaci6n ti-
C) Hallar la funci6n de probabilidad. de la distribu- pica muestral de las puntuaciones sea mayor que
ci6n en el muestreo de la media muestral. ~ q u Cndmero?
d) Comprobar directamente que la media de la dis- f) 0,05 es la probabilidad de que la desviaci6n ti-
tribuci6n en el muestreo de la media muestral es pica muestral de las puntuaciones sea menor que
igual a la media poblacional. jquC nhmero?
50. jQuC importancia tiene el teorema central del Ifmite g) Si se toma una muestra de 50 e x h e n e s , la pro-
en la distribuci6n muestral de la media muestral. babilidad de que la media muestral de las pun-
tuaciones sea mayor que 450 jseri mayor, me-
51. Nos situamos en el context0 del Ejercicio 49. Ha- nor o la misma que la obtenida en el apartado
llar la funci6n de probabilidad de la distribuci6n en (a)? No es necesario detallar 10s ciilculos. Reali-
el muestreo de la proporci6n muestral de fondos zar un grkfico para ilustrar el razonamiento
con un vencimiento medio superior a treinta y seis
dias para muestras de dos observaciones. Compro- 53. Una compaiiia repara aparatos de aire acondicio-
bar directamente que la media de la distribuci6n en nado. Se ha comprobado que el tiempo que duran
el muestreo de la proporci6n muestral es igual a la 10s servicios de reparaci6n sigue una distribuci6n
proporci6n poblacional. normal con una media de sesenta minutos y una
desviaci6n tipica de diez minutos. Se extrae una
52. Las puntuaciones obtenidas en su examen de in- muestra aleatoria de cuatro reparaciones.
greso por todos 10s candidatos a entrar en cierta fa-
cultad de derecho sigue una distribuci6n normal a) jCuiil es la probabilidad de que el tiempo medio de
con una media de 420 y una desviaci6n tipica de reparaci6n sea mayor que sesenta y cinco minutos?
100. Se extrae una muestra aleatoria de 25 puntua- b) 0,10 es la probabilidad de que el tieihpo medio
ciones. de reparaci6n sea menor que jcuhtos minutos?
c) 0,10 e s la probabilidad de que la desviaci6n ti- damente el argument0 empleado en la demostra-
pica muestral del tiempo de servicio sea mayor ci6n del Aptndice A6.1 ,probar que
que jcuhtos minutos?
d) 0,10 es la probabilidad de que la desviaci6n ti-
pica muestral del tiempo de servicio servicio sea N6tese lo intuitivo que resulta este resultado
menor que jcuhtos minutos? cuando n=N.
e) jCud es la probabilidad de que m h de dos de estos 57. Se ha comprobado que el tiempo que tarda la
servicios duren m h de sesenta y cinco rninutos? gente en completar sus formularios de la declara-
54. En un determinado aiio, las tasas de rentabilidad de ci6n de la renta, sigue una distribuci6n normal con
las acciones de las compaiiias eltctricas siguieron una media de cien minutos y una desviaci6n tipica
una distribuci6n normal con media 14,8 y desvia- de treinta minutos. Se toma una muestra aleatoria
ci6n tipica 6,3. Se extrae una muestra aleatorid de de nueve personas que han completado su declara-
nueve de estas acciones. ci6n de la renta.
a) jCull es la probabilidad de que la media mues- a) jCull es .la probabilidad de que la media mues-
tral de la tasa de rentabilidad sea mayor que 19? tral del tiempo empleado en completar 10s im-
b) jCuhl es la probabilidad de que la media mues- presos sea mayor que dos horas?
tral de la tasa de rentabilidad estt entre 10,6 y b) 0,20 es la probabilidad de que la media muestral
19? del tiempo empleado sea menor que jcuhntos
c) 0,25 es la probabilidad de que la media muestrd minutos?
de la tasa de rentabilidad sea menor que jqut c) 0,05 es la probabilidad de que la desviaci6n ti-
n~mero? pica muestral del tiempo empleado sea mayor
d) Supongamos ahora que se selecciona una mues- que jcuhtos minutos?
tra de 20 acciones. Razonar si la probabilidad de d) 0,05 es la probabilidad de que la desviaci6n ti-
que la media muestral de la tasa de rentabilidad pica muestral del tiempo empleado sea menor
sea mayor que 19 resultarl en este caso mayor, que jculntos minutos?
menor o igual que la calculada en el apartado 58. Se ha comprobado que, en cierta universidad, el
(a). Realizar un grifico para ilustrar el razona- 80% de 10s estudiantes de 6ltimo aiio acepta una
miento. oferta de trabajo antes de su graduaci6n. Para quie-
55. Se sabe que 10s tiempos de duraci6n de cierto tip0 nes aceptan una oferta, la distribuci6n de 10s sala-
de componentes electr6nicos siguen una distribu- nos es normal con una media de 29.000 d6lares y
ci6n normal con una media de mil seiscientas horas una desviaci6n tipica de 29.000 d6lares.
y una desviaci6n tipica de cuatrocientas horas. a) Para una muestra aleatoria de sesenta alumnos
a) Para una muestra aleatoria de diecistis compo- de 6ltimo curso, jcuhl es la probabilidad de que
nentes, hallar la probabilidad de que la media menos del 70% hayan aceptado una oferta de
muestral sea mayor que mil quinientas horas. trabajo?.
b) Para una muestra aleatoria de diecistis compo- b) Para una muestra aleatoria de seis alumnos,
nentes, 0,15 es la probabilidad de que la media jcuhl es la probabilidad de que menos del 70%
muestral del tiempo de duraci6n sea mayor que hayan aceptado una oferta de trabajo?
jcuhtas horas? c) Para una muestra aleatoria de seis alumnos que
c) Para una muestra aleatoria de diecistis compo- han aceptado una oferta de trabajo, ~ c u h es
l la
nentes, 0,10 es la probabilidad de que la desvia- probabilidad de que la media muestral de su sa-
ci6n tipica muestral del tiempo de duraci6n sea lario sea mayor que 30.000 d6lares?
mayor que jcuhtas horas? d) Se elige un estudiante de ultimo aiio a1 azar.
d) Para una muestra aleatoria de 121 componentes, jCuhl es la probabilidad de que haya aceptado
hallar la probabilidad de que menos de la mitad una oferta de trabajo con salario superior a 10s
de 10s componentes muestrales tengan un tiempo 30.000 d6lares?
de duraci6n mayor que mil quinientas horas. 59. Las bolsas de pllstico empleadas para empaquetar
56. Analicese el Aptndice A6.1 con el objeto de calcu- productos se fabrican de forma que la resistencia a
lar la media de la distribuci6n en el muestreo de la rotura de las bolsas sigue una distribuci6n normal
varianza muestral para una muestra de n individuos con una desviaci6n tipica de cinco kilos por centi-
extraida de una poblaci6n con N individuos cuando metro cuadrado. Se extrae una muestra aleatoria de
la varianza poblacional es a:. Modificando adecua- 16 bolsas.
a) 0,01 es la probabilidad de que la desviaci6n ti- 64. Cierto aiio, el 40% de las ventas a domicilio fueron
pica muestral de la resistencia a rotura sea ma- parcialmente financiadas por el vendedor. Se exa-
yor que jqu6 nlimero? mina una muestra aleatoria de 250 ventas.
b) 0,15 es la probabilidad de que la media muestral a) 0,8 es la probabilidad de que la proporci6n
supere a la media poblacional en jqud cantidad? muestral sea mayor que iquB cantidad?
c) 0.05 es la probabilidad de que la media muestral b) 0,9 es la probabilidad de que la proporci6n
difiera de la media poblacional en iquC cantidad? muestral sea menor que j q ~ 6cantidad?
60. Un director de control de calidad est6 preocupado c) 0,7 es la probabilidad de que la proporci6n
sobre la variabilidad de la cantidad de ingredientes muestral difiera de la proporci6n poblacional
activos en las pfldoras producidas por un cierto pro- jen qu6 cantidad?
ceso. Se toma una muestra aleatoria de 21 pildoras. 65. Un candidato a la alcaldia de cierta ciudad quiere
jCud es la probabilidad de que la varianza mues- presentarse a las elecciones s610 si la proporci6n
tral de la cantidad de ingrediente activo sea mayor del electorado que esti inicialmente dispuesto a vo-
que dos veces la varianza poblacianal? tarle es superior al30%. Se toma una muestra alea-
61. Se toma una muestra de 100 estudiantes para deter- toria de 300 votantes, y se decide que se presentarh
minar cual de entre dos marcas de cerveza se pre- a las elecciones si la proporci6n muestral de votan-
fiere. Se les da a probar ambas marcas con 10s ojos tes a favor del candidato es mayor que 0,28.
tapados. supong&os que, para la poblaci6n com- a) ~ C u h es
l la probabilidad de que el candidato
pleta de estudiantes, el 50% prefiere la marca A. tome la decisi6n de participar en las elecciones
a) iCud es la probabilidad de que mfis del60% de si la verdadera proporci6n de candidatos que es-
10s individuos de la muestra prefieran la marca A? tin inicialmente a su favor es del20%?
b) iCu5l es la probabilidad de que la proporci6n b) jCuhl es la probabilidad de que el candidato
muestral de individuos que prefieren la marca A tome la decisi6n de no participar si la verdadera
est6 entre un 45% y un 55%? proporci6n de votantes que e s t h inicialmente a
c) Supongamos que s610 se dispone de una muestra su favor es del40%?
de diez estudiantes. Indicar c6mo diferiria el 66. Se sabe que la renta de 10s lectores que se han sus-
mdtodo de cdculo de probabilidades comparado crito a cierta revista americana sigue una distribu-
con las respuestas a 10s apartados (a) y (b). ci6n normal con una desviaci6n tipica de 6.600 d6-
lares. Se toma una muestra aleatoria de veinticinco
62. Las puntuaciones de cierto examen realizado por
lectores suscritos a dicha publicaci6n.
un grupo grande estudiantes sigue una distribu-
ci6n normal con una desviaci6n tipica de 40 pun- a) cud es la probabilidad de que la desviaci6n ti-
tos. Se toma una muestra aleatoria de diecis6is pica muestral de sus rentas sea mayor que 4.000
puntuaciones para estimar la puntuaci6n media d6lares?
en la poblaci6n. Sea X la media muestral. cCu5l b) jCud es la probabilidad de que la desviaci6n ti-
es la probabilidad de que el interval0 que va de pica muestral de las rentas sea menor que 8.000
(x - 10) a (x + 10) contenga a la verdadera me- d6lares?
dia poblacional? 67. Un proceso d i producci6n fabrica lotes de cierto
63. Un fabricante de detergente liquido afirma que el product0 quimico. Se seleccionan muestras de 20
peso medio de detergente en 10s envases que vende lotes para realizar un examen. Si la desviacidn ti-
es al menos de 500 gramos. Se sabe que la distribu- pica del porcentaje de concentraci6n de impureza
ci6n poblacional de 10s pesos es normal con una contenido en 10s lotes muestreados supera el
desviaci6n tipica de 17 gramos. Con el fin de com- 2,5%, el proceso de producci6n tendri que ser
probar la afirmaci6n del fabricante, se toma una cuidadosamente revisado. Asumamos que la dis-
muestra aleatoria de 16 envases de detergente. La tribuci6n poblacional del porcentaje de concen-
afirmaci6n ser6 cuestionada si la media muestral de traci6n de impureza es normal. jCu5l es la proba-
10s pesos es menor que 440 gramos. ~ C u 5 es l la bilidad de que el proceso de producci6n tenga
probabilidad de que la afirmaci6n sea cuestionada que ser revisado si la desviaci6n tipica poblacio-
en el caso de que la media poblacional de 10s pesos nal del porcentaje de concentraci6n de impureza
sea realmente de 500 gramos? es del2%?
En este apkndice, demostraremos que la media de la distribuci6n en el muestreo de la varianza mues-
tral es la varianza poblacional. Comenzaremos por hallar la esperanza de la suma de cuadrados de la
diferencia entre cada miembro de la muestra y la media muestral, es decir, la esperanza de

Tomando esperanzas tenemos

E f ( x i - X)' ] = E Z (Xi - px)'] - nE[(X - PXYI

N6tese que la esperanza de cada (Xi -,uA2 es la varianza poblacional a',


y la esperanza de (x,- px)2
es la esperanza de la media muestral, es decir, d n . Por tanto, tenemos

Por liltimo, el valor esperado de la varianza muestral sera

Y este es el resultado que querlarnos probar.

Anda mungkin juga menyukai