DISTRIBUCIONES
MUESTRALES
CONTENIDO
APNDICE..................................................................................................... 139
DISTRIBUCIONES MUESTRALES 127
6 DISTRIBUCIONES MUESTRALES
6.1 INTRODUCCIN
Muchas de las tcnicas utilizadas en inferencia exigen, tambin, que la distribucin de los datos
tenga determinadas caractersticas. El anlisis de datos es de gran ayuda en este aspecto,
para descubrir observaciones atpicas y otras desviaciones que puedan perturbar una correcta
inferencia. Por lo tanto, en la prctica podemos observar cmo el anlisis exploratorio de los
datos y la inferencia estadstica se complementan.
Sintetizando:
Cuando el inters reside en generalizar las conclusiones de los resultados observados a la
poblacin en estudio o queremos tomar una decisin sobre la poblacin en base a una
muestra, estamos frente a un problema de inferencia estadstica.
Para que este proceso sea adecuado, debemos tener en cuenta:
G.Carnevali-E.Franchelli-G.Gervasoni-M.Grasso
DISTRIBUCIONES MUESTRALES 128
1
As, por ej., si se quiere analizar cierta caracterstica de los alumnos que cursaron en la Fac. Reg. Rosario de la
UTN en los aos 2005 y 2006 y la muestra se elige seleccionando alumnos al azar solamente de los que cursaron
durante esos aos en ISI, las conclusiones que se extraigan a partir de esta muestra sern vlidas slo para la
poblacin de los alumnos de ISI, pero no para todos los alumnos de la Fac. Reg. Rosario.
2
Ya hemos dicho que en el curso slo se trabajar con muestras aleatorias simples.
3
En el caso de poblaciones finitas, el muestreo debe ser con reposicin para que la ocurrencia de una observacin
no aumente o disminuya la probabilidad de ocurrencia de otra (ver ej. 1 y 2, pag. 58, Cap. III)
G.Carnevali-E.Franchelli-G.Gervasoni-M.Grasso
DISTRIBUCIONES MUESTRALES 129
Distribucin de Probabilidad de X
Tabla 1
x P(X=x) 0,30
2 0,25 0,25
Probabilidad
0,20
4 0,25
0,15
6 0,25
0,10
8 0,25
0,05
1 0,00
2 4 6 8
Varianza 2x = 5
V Tomamos muestras de tamao 2, con reposicin. Cada muestra es de la forma (x1 ; x2),
donde:
Tabla 2
Xi es el i-simo elemento de la muestra. Muestra, n=2
x1 x2 Promedio
Simbolizaremos con x al promedio muestral y con S al desvo estndar 2 2 2
de la muestra.
2 4 3
2 6 4
En la tabla 2 estn todas las posibles muestras con sus
2 8 5
correspondientes promedios.
4 2 3
4 4 4
Observamos que tanto el primer elemento de la muestra como el 4 6 5
segundo son variables aleatorias, ya que, antes de realizar el muestreo, 4 8 6
no sabemos qu valores tomarn. Si consideramos la distribucin de 6 2 4
probabilidad de cada una de ellas, resultan idnticas a la distribucin de
6 4 5
probabilidad de la poblacin de la cual fueron extradas las muestras,
6 6 6
siendo por lo tanto, iguales los parmetros estadsticos:
6 8 7
xi = 5 y 2xi = 5 8 2 5
8 4 6
En la tabla 2, tambin se visualiza que el promedio muestral es una 8 6 7
variable aleatoria. 8 8 8
G.Carnevali-E.Franchelli-G.Gervasoni-M.Grasso
DISTRIBUCIONES MUESTRALES 130
2 0,0625 0,25
Probabilidad
3 0,1250 0,20
4 0,1875 0,15
5 0,2500 0,10
0,05
6 0,1875
0,00
7 0,1250
2 3 4 5 6 7 8
8 0,0625
1,0000 Prom edio de la m uestra de tam ao 2
Observemos que la distribucin del promedio adopta una forma completamente distinta de
la distribucin uniforme de los datos de origen.
G.Carnevali-E.Franchelli-G.Gervasoni-M.Grasso
DISTRIBUCIONES MUESTRALES 131
0,30
Distribucin del promedio muestral, n=2
0,25
Probabilidad
0,20
0,15
0,10
0,05
0,00
2 3 4 5 6 7 8
Prom edio de la m uestra de tam ao 2
0,15
Probabilidad
0,10
0,05
0,00
2,00 2,67 3,33 4,00 4,67 5,33 6,00 6,67 7,33 8,00
Prom edio de la m ue stra de tam ao 3
0,15
Probabilidad
0,10
0,05
0,00
2 2,5 3 3,5 4 4,5 5 5,5 6 6,5 7 7,5 8
Prom e dio de la m ue stra de tam ao 4
0,20
Distribucin del promedio muestral, n=5
0,15
Probabilidad
0,10
0,05
0,00
2 2,4 2,8 3,2 3,6 4 4,4 4,8 5,2 5,6 6 6,4 6,8 7,2 7,6 8
Promedio de la m uestra de tam ao 5
G.Carnevali-E.Franchelli-G.Gervasoni-M.Grasso
DISTRIBUCIONES MUESTRALES 132
En las grficas anteriores podemos comprobar una aplicacin del Teorema Central del Lmite:
a medida que aumenta el tamao de la muestra la distribucin de probabilidad del promedio
muestral se hace cada vez ms acampanada, concentrndose alrededor del promedio de la
poblacin original.
Tabla 4
La Tabla 4 permite comparar los parmetros esperanza
matemtica y varianza de la poblacin original, con la Poblacin x =5 x2 = 5
esperanza matemtica y varianza de las poblaciones de Tamao de
los promedios muestrales antes descriptas. muestra x x2
2 5 2,5
Vemos que las medias poblacionales se mantienen
3 5 1,667
iguales a 5 (la esperanza matemtica de las edades de
los 4 hermanos), mientras que las varianzas 4 5 1,25
poblacionales disminuyen su valor a medida que 5 5 1
aumenta el tamao de la muestra.
Al considerar la distribucin de los valores tomados por el estadstico X en todas las muestras
de un mismo tamao n de la misma poblacin, obtenemos la distribucin muestral de X .
G.Carnevali-E.Franchelli-G.Gervasoni-M.Grasso
DISTRIBUCIONES MUESTRALES 133
Generalizando:
Si las muestras aleatorias simples de tamao n son tomadas de una poblacin con
media poblacional y desvo estndar poblacional , la distribucin muestral de
X tiene las siguientes propiedades:
1) x = E( X ) =
2) x =
n
Cuando el tamao de la muestra aumenta, la medida de dispersin disminuye. Es
decir, a medida que el nmero de observaciones obtenidas aumenta, el promedio
de los valores observados se acerca ms y ms a (Ley de los grandes
nmeros)
3) Si la poblacin de la cual se extraen las muestras es normal,
la distribucin de X es tambin normal con media y desvo como los dados en los
puntos anteriores, para cualquier tamao muestral n.
4) Si la poblacin de la cual se extraen las muestras no es normal,
pero el tamao muestral es suficientemente grande, la distribucin de X es
aproximadamente normal con media y desvo como los dados en los puntos
anteriores. Suficientemente grande en la prctica significa un tamao de muestra n
30 (Teorema Central del Lmite).
El tamao n de la muestra, necesario para que X se aproxime a una distribucin
normal depende de la distribucin de la poblacin. En el caso de que las muestras
se extraigan de una poblacin uniforme son suficiente 6 observaciones para que la
distribucin del promedio muestral sea aproximadamente normal.
5) Si la poblacin de la cual se extraen las muestras es normal,
con media poblacional y desvo estndar poblacional , pero sta es
desconocida, se reemplaza por S (desvo estndar muestral) y la estadstica
(x )
deja de tener distribucin normal estandarizada y tiene una distribucin t
S/ n
(a)
Student con n-1 grados de libertad :
(X )
t n 1;
S/ n
(a)
La apariencia general de la distribucin t es similar a la de la distribucin normal estndar: ambas son simtricas
y unimodales y el valor mximo de la ordenada se alcanza en la media = 0. Sin embargo esta distribucin tiene
colas ms amplias que la normal. Existe una distribucin t distinta para cada tamao de muestra. Una distribucin t
viene determinada por un parmetro llamado grados de libertad. A medida que aumentan los grados de libertad, la
curva de densidad t se parece ms a la curva de la N(0,1), ya que la estimacin de por s se va haciendo ms
precisa.
G.Carnevali-E.Franchelli-G.Gervasoni-M.Grasso
DISTRIBUCIONES MUESTRALES 134
Idealmente buscamos un estimador que cumpla estas dos propiedades: que sea insesgado y
convergente4:
Parmetro Estimador
= X
p p = fr
2 2 = Sn2 -1
4
Estas condiciones permiten controlar los errores de estimacin al aumentar el tamao de la muestra, como
veremos ms adelante.
G.Carnevali-E.Franchelli-G.Gervasoni-M.Grasso
DISTRIBUCIONES MUESTRALES 135
Generalizando:
) p(1 p )
2) p) = Var(p ) =
n
Cuando el tamao de la muestra aumenta, la medida de dispersin disminuye. Es
decir, a medida que el nmero de observaciones obtenidas aumenta, el promedio
de los valores observados se acerca ms y ms a p (Ley de los grandes nmeros).
Observe que para un tamao de muestra fijo, la mxima desviacin estndar se
encuentra en p = 0,5
3) Si n es suficientemente grande (b), la distribucin de p = f r
se comporta aproximadamente como una distribucin normal con media y
desviacin estndar como las dadas en los puntos 1 y 2.
) p(1 - p)
p es aproximada mente N p;
n
5
Para poder aproximar la distribucin Binomial a la Normal, el tamao de muestra n debe ser suficientemente
grande. Como regla emprica esta aproximacin es apropiada si np > 5 (Cap. 4).
G.Carnevali-E.Franchelli-G.Gervasoni-M.Grasso
DISTRIBUCIONES MUESTRALES 136
Generalizando:
1) E ( S2 ) = 2
24
2) V(S 2 ) = S2 2 =
n -1
Cuando el tamao de la muestra aumenta, la medida de dispersin disminuye. Es
decir, a medida que el nmero de observaciones obtenidas aumenta, el promedio de
los valores observados de S2 se acerca ms y ms a 2 (Ley de los grandes
nmeros).
3) Si la poblacin de la cual se extraen las muestras es normal,
2
(n 1) S
la variable tiene una distribucin ji cuadrado ( 2 ) con n - 1 grados de
2
libertad (b):
(n 1) S 2
n2 -1
2
4) Si n es suficientemente grande, la distribucin de la variable
2
se ve como una distribucin normal con media y desviacin estndar como las
dadas en los puntos 1 y 2.
(b)
Las distribuciones ji cuadrado son una familia de distribuciones que slo toman valores positivos y que son
asimtricas hacia la derecha. Una distribucin ji cuadrado viene determinada por un parmetro llamado grados de
libertad. A medida que aumentan los grados de libertad, las curvas de densidad son menos asimtricas y por lo
tanto, los valores mayores son ms probables.
6 2
Utilizaremos la notacin S para identificar a la variable Sn2-1 (varianza muestral).
G.Carnevali-E.Franchelli-G.Gervasoni-M.Grasso
DISTRIBUCIONES MUESTRALES 137
1.- El 9 % de los individuos de una regin tiene sangre tipo B. En una muestra simple al azar de
400 personas de esa poblacin se encontr que 12,5 % tenan sangre tipo B.
a) Indique:
- valor numrico del parmetro: .
- valor numrico del estadstico: .
- identifique en trminos del problema al parmetro y al estadstico
b) Cul es la probabilidad de que una nueva muestra aleatoria de tamao 400 contenga
por lo menos un porcentaje de 12,5 % de personas con sangre tipo B?
2.- Considere la variable aleatoria X: peso de alumnos varones de UTN, FRRO.
Se conoce que esta variable tiene una distribucin normal con promedio 75 kg y una
desviacin estndar de 7 kg.
a) Grafique y compare las distribuciones muestrales de X cuando se extraen muestras
aleatorias simples de:
* 10 alumnos * 30 alumnos * 100 alumnos
b) Cul es la proporcin de muestras de tamao 30 que arrojarn un valor del promedio
alejado del promedio poblacional en a lo sumo 2 desviaciones estndares?
3.- Suponga que el 60% de todos los estudiantes de la UTN, Reg. Rosario acceden a
informacin sobre cursos por medio de Internet.
a) Grafique en forma aproximada la distribucin para la posible proporcin muestral basada
en una muestra aleatoria simple de 100 estudiantes.
b) Cul es la probabilidad de observar una proporcin muestral de 0,50 basada en una
muestra aleatoria simple de tamao 100 si la proporcin poblacional fuese de 0,60?
Explique.
4.- Sea X el nmero de accidentes por semana en una esquina dada. Suponga que la media de
X es 2,2 y el desvo estndar de X es 1,4.
a) Sea X el nmero promedio de accidentes por semana en un ao, o sea, n= 52 semanas.
cul es la distribucin aproximada de la media muestral? Bosqujela.
7
Los ejercicios 1, 3 y 4 fueron extrados y adaptados del mdulo Nmero 7: Distribuciones muestrales de la
Coleccin Mtodos Estadsticos I., redactado por docentes de la UNR y extractado del libro Interactive Statistics
de Martha Aliaga, Universidad de Michigan, 2002.
G.Carnevali-E.Franchelli-G.Gervasoni-M.Grasso
DISTRIBUCIONES MUESTRALES 138
G.Carnevali-E.Franchelli-G.Gervasoni-M.Grasso
DISTRIBUCIONES MUESTRALES 139
APNDICE
1 n 1 n
1 n
1
Luego E ( X )= E [
n 1
Xi ] = E Xi =
n 1 n
E ( Xi) =
1 n
n =
1 n 1 n
1 n 1 1
V ( X )=V [
n 1
Xi ] = 2 V Xi = 2 VXi = 2 nV Xi = 2
n 1 n 1 n n
p(1 p )
y en consecuencia E ( fA ) = p y 2 ( fA ) =
n
G.Carnevali-E.Franchelli-G.Gervasoni-M.Grasso
DISTRIBUCIONES MUESTRALES 140
En la pgina 135 se plantea, para el caso en que la variable X se distribuya normalmente, que:
E ( S2 ) = 2
24
V ( S2 ) = S2 2 =
n -1
( X ) ( X ) 2
Si X N ( , ) N (0, 1) 2
21
y en consecuencia :
n
( Xi ) 2
=1 2
2n por propiedad reproductiva de la distribucin ji cuadrado
Se demuestra que:
n
( Xi X )2 (n 1) S 2
=1 2
2n-1 o en forma equivalente:
2
2n-1
Reemplazando en (1)
(n 1) S 2
E = ( n 1) E ( S2 ) = 2
2
(n 1) S 2 (n 1) 2 V(S 2 ) 2 4
V = = 2 ( n 1) V ( S2 ) =
2 4 (n 1)
G.Carnevali-E.Franchelli-G.Gervasoni-M.Grasso
DISTRIBUCIONES MUESTRALES 141
nA
siendo f A =
n
p (1 - p)
P ( | fA p | < ) > 1 - 2 y lm P ( | f A p < ) = 1
n n
es decir, que cuando n tiende a infinito la frecuencia relativa tiende a la probabilidad ( definicin
frecuencial de probabilidad ).
Demostracin :
nA Bi ( n , p ) E ( nA ) = n p 2 ( nA ) = n p ( 1 p )
p (1 p)
y en consecuencia E ( fA ) = p 2 ( fA ) =
n
p (1 p) 1
P fA p k > 1 2 (1)
n k
p (1 p) n 2
Sea = k entonces k 2 =
n p (1 p)
p (1 - p)
P ( | fA p | < ) > 1 - 2
n
8
La ley de los grandes nmeros se puede demostrar tambin a partir del comportamiento del promedio muestral. A
medida que el nmero de observaciones obtenidas aumenta, la media de los valores observados se acerca ms y
ms a .
G.Carnevali-E.Franchelli-G.Gervasoni-M.Grasso