x
i 1
i
x (1)
n
Evaluemos el verdadero valor y alcance de la medida (1).
Si la selección hubiera recaído en otras n familias (lo que es
completamente factible, pues la selección fue hecha "al
azar"), ¿ x podría haber tomado un valor distinto?
¿Podrían haberse presentado valores muy alejados del
que obtuvimos, de manera que por "pura casualidad"
tengamos un valor excepcionalmente alto o bajo?
Para analizar todas estas cuestiones, utilizamos el hecho
básico de que la selección fue hecha al azar y utilizaremos
algunas ideas de probabilidad y variables aleatorias.
MODELO: Usemos la v.a. X para designar a la variable o
característica que se quiere investigar.
En el ejemplo:
X es el “ingreso total de una unidad familiar”
X tiene una distribución de frecuencias relativas, que muestra las
proporciones de unidades familiares que tiene cada nivel de ingreso
total.
Si x es un valor de X → x es el ingreso de una unidad familiar.
Si hay k familias con ingreso x → k/ 174.763 es la proporción
de familias con ingreso x.
LA POBLACION ES UNA VARIABLE ALEATORIA X QUE
TIENE ALGUNA DISTRIBUCION DE FRECUENCIAS
RELATIVAS (que sumen 1).
Por cada valor de X distinto, se ponen en la urna tantas bolillas
como veces ese valor aparezca en la población y tendremos una
urna con bolillas en la misma proporción que la distribución de
frecuencias relativas.
Se extrae de esa población o urna, una muestra al azar de tamaño
n= 1.
Proposición Fundamental: Si designamos por X1 el valor que
resultará seleccionado, X1 es una variable aleatoria cuya
distribución de probabilidad es la distribución de frecuencias
relativas de X.
Conclusión: FX1(x1) = FX(x1).
Por ejemplo P(X1 ≤ 10.000) = P(X ≤ 10.000)
Si X2 registra el valor que resultará seleccionado en la segunda
unidad muestral, X2 es una variable aleatoria con la misma
distribución de X y es INDEPENDIENTE de X1.
Conclusión: Si X1, X2,...,Xn son las variables aleatorias del
muestreo al azar con reposición, entonces
FX i = FX para cada i = 1, 2, …, n. Esto es P( X i ≤ a ) = P( X ≤ a )
observado x
i 1
o la suma observada
xi
, no como números
n i 1
dados sino tomados desde el punto de vista que las xi tienen como
contraparte teórica las variables aleatorias Xi. Vale decir que
n
Xi
queremos analizar como variables aleatorias a X i 1
n ,
n
Xi
i 1 , etc.
Entonces en el marco de las variables aleatorias involucradas
usamos la siguiente definición (2):
Definición: Se llama ESTADISTICO a cualquier función de las
variables aleatorias del muestreo y solo de ellas, y por lo tanto
también es una variable aleatoria-
U es un estadístico ↔ U = U (X1, X2, ..., Xn)
n
Xi − X 2
Momentos de S’2 S’2 = i=1
n
n−1
1°) E(S’ ) =
2
2
n
2 n−1 2σ 4
2°) Si X es normal, V(S′ ) =
n n
10.2 Para el Caso de Muestreo “Simple al Azar” (Sin
Reposición) de una Población Finita X
Los momentos de estadísticos presentados, corresponden
al caso en que se muestrea con reposición. Esto es
equivalente a considerar una población infinitamente grande,
en el sentido de que no se altera por la extracción de una
muestra de tamaño n, finito.
Un caso distinto ocurre cuando la población es finita, de
tamaño N, y extraemos una muestra al azar simple, esto es sin
reposición. Ya vimos que en este caso las observaciones
muestrales Xi siguen teniendo marginalmente la misma
distribución que X, pero que son dependientes. En
consecuencia cuando calculemos momentos es necesario
tener en cuenta este hecho; por ejemplo el cálculo de la
varianza de X que reproducimos más arriba, no es válido
cuando las Xi no son independientes.
1 𝑁
𝜇=𝐸 𝑋 = 𝑗 =1 𝑋𝑗
𝑁
Parámetros 1 2
2 𝑁 2
𝜎 =𝑉 𝑋 = 𝑗 =1 (𝑋𝑗 − 𝜇) = 𝐸 𝑋 − 𝐸(𝑋)
𝑁
Momentos de X
1°) E(X ) = . Demostrado en 9.1
V(X) σ2 N−n
2°) V(X ) = = .
n n N−1
N−n
El factor es efecto de la dependencia y se llama factor
N−1
de corrección por población finita (cpf)
N−n
puede omitirse cuando el tamaño de la muestra es
N−1
pequeño en comparación con el tamaño de la población.
Criterio: La mayoría de los estadísticos no utilizan el cpf a
menos que la muestra contenga más del 5% de las
observaciones de la población.
n
O sea se ignora el cpf si ≤ 0,05
N
Ejemplo: Una muestra de tamaño 100 de una población de
tamaño N= 100.000 unidades tiene la misma precisión que una
muestra de tamaño 100 de una población de tamaño N =
100.000.000
n = 100, N = 100.000
σ 2 100000 −100 99900 σ 2 σ2
V(X )= = = 0,99900999
n 100000 −1 99999 n n
n = 100, N = 100.000.000
σ 2 100000000 −100 99999900 σ 2 σ2
V(X )= = = 0,99900001
n 100000000 −1 99999999 n n
Notaciones :
Para el valor esperado de X : E(X ) o μX
Para la varianza de X : V (X) o σX2
DISTRIBUCION MUESTRAL DE ALGUNOS
ESTADISTICOS
11.- DISTRIBUCION MUESTRAL DE LA MEDIA
𝑋1 +𝑋2 + … + 𝑋𝑛
MUESTRAL 𝑋 = y/o del Total T= 𝑋1 + 𝑋2 +
𝑛
… + 𝑋𝑛
Reconsideramos los teoremas estudiados en
Combinaciones Lineales de variables aleatorias a la luz
de la teoría de Muestreo.
11.1 Muestreo de poblaciones normales (Teorema 13
de Combinaciones Lineales)
Sea X1, X2, … , Xn una muestra aleatoria de una
población X con distribución normal con media y
varianza 2, entonces con cualquier tamaño de muestra
n, 𝑋 está normalmente distribuida (con media y
varianza 2/n), al igual que el total T (con media n y
varianza n 2). Esto es
𝜎2
𝑋 ~ N 𝜇𝑋 = 𝜇 , 𝜎𝑋2 =
𝑛
T ~ N 𝜇 𝑇 = 𝑛 𝜇 , 𝜎𝑇2 = 𝑛 𝜎 2
Ejemplo 𝑋 : La duración de cierto tipo de baterías está
normalmente distribuida con media de 8 horas y desviación
estándar de 1 hora.
a) Si se escoge aleatoriamente una batería, ¿cuál es la
probabilidad de que dure por lo menos 8,5 horas?
b) Si las baterías se venden en paquetes de 4 baterías. ¿Cuál es
la probabilidad de que la duración promedio de las 4 baterías, de
un paquete seleccionado, sea por lo menos de 8,5 horas?
Ejemplo T: Un elevador de carga grande puede transportar un
máximo de 10.000 libras (5 toneladas). Suponga que una carga
que contiene 45 cajas se debe transportar mediante el elevador.
La experiencia ha demostrado que el peso X de una caja de este
tipo de carga se ajusta a una distribución de probabilidad con una
media de = 200 libras y una desviación estándar de = 55
libras. ¿Qué probabilidad hay de que las 45 cajas se puedan
cargar en el elevador de carga y transportarse simultáneamente?
de proporciones
PS representa la proporción de éxitos en la muestra
Ejemplo: Se toma una muestra de 250 casas de una
población de edificios antiguos para estimar la
proporción de casas de este tipo. Supongamos que el
30% de todos los edificios son antiguos. Hallar la
probabilidad de que la proporción de edificios antiguos
esté entre 0.25 y 0.35.
n*p y n*q ambos ≥5
E(PS)= p
𝑝∗𝑞
VAR(PS)=
𝑛
𝑛
= 𝑖 =1 (𝑋𝑖 − 𝜇)2 + 2(𝑋𝑖 − 𝜇) 𝜇 − 𝑋 + 𝜇−𝑋 2
𝑛 𝑛 𝑛
= 𝑖 =1 (𝑋𝑖 − 𝜇)2 + 2 𝜇 − 𝑋 𝑖 =1 𝑋𝑖 − 𝜇 + 𝑖 =1 𝜇−
2
𝑋
𝑛 2 2
= 𝑖 =1 (𝑋𝑖 − 𝜇) + 2 𝜇 − 𝑋 𝑛 𝑋 − 𝜇 +n 𝑋−𝜇
𝑛
= 𝑖 =1 (𝑋𝑖 − 𝜇)2 − 𝑛 𝑋 − 𝜇 2
Entonces
n
2 i=1 Xi − X 2 1 𝑛 2
𝐸 𝑆 =𝐸 = 𝐸 𝑖=1 𝑋𝑖 − 𝜇 −
n−1 𝑛−1
𝑛 𝑋−𝜇 2
1 𝑛 2 2
= 𝑖=1 𝐸 𝑋𝑖 − 𝜇 − 𝑛𝐸 𝑋−𝜇
𝑛−1
1 𝑛
= 𝑖=1 𝑉 𝑋𝑖 − 𝑛 𝑉 𝑋
𝑛−1
1 2 𝜎2
= 𝑛𝜎 − 𝑛
𝑛−1 𝑛
𝑛−1
= 𝜎2
𝑛−1
= 𝜎2
Ejemplo:
El tiempo que ocupan los estudiantes mirando televisión
en las semanas anteriores a los exámenes finales (en horas)
tiene una distribución normal con desvió estándar de 4,5
hs. Se tomó una muestra de 30 estudiantes:
Indique si la probabilidad de que el desvío estándar
muestral supere las 3,5 hs es mayor a 0,95.
14.- Distribución Muestral de la razón de 2 varianzas
muestrales 𝑺𝟐𝟏 𝑺𝟐𝟐
Un problema que surge en los experimentos
industriales es comparar la variabilidad de dos procesos
𝜎12 𝜎22
Se toma una muestra al azar con reposición de n1
artículos, usando el proceso X y se toma una muestra
aleatoria de n2 artículos, usando el proceso Y. se
comparan las varianzas muestrales para cada proceso,
o sea 𝑆12 𝑆22 . Si esta razón es cercana a la unidad, las
variabilidades se juzgan como casi equivalentes; si esta
razón es muy diferente a la unidad, las variabilidades se
juzgan como no equivalentes. Para tomar buenas
decisiones y para cuantificar la expresión de “cercana a
la unidad”, es necesario examinar la distribución de
𝑆12 𝑆22
Sea 𝑋1 , 𝑋2 , … , 𝑋𝑛 1 una muestra aleatoria de n1 v. a.
independientes de una población normal X ~ N(μ1, σ12) y
sea 𝑌1 , 𝑌2 , … , 𝑌𝑛 2 una muestra aleatoria de n2 v. a.
independientes de una población normal Y ~ N(μ2 , σ22 );
además sean todas las X’s e Y´s independientes.χ1
𝑛 1 −1 𝑆12
La distribución de 𝜒12 = es entonces chi-
𝜎1 2
cuadrado con n1 – 1 grados de libertad.
𝑛 2 −1 𝑆22
De modo similar 𝜒22 = es también chi- cuadrado
𝜎2 2
con n2 – 1 grados de libertad.
Además estas dos variables 𝜒12 y 𝜒22 son
independientes porque las X’s y las Y´s lo son.
Entonces la variable aleatoria
𝜒 12 𝑛 1 −1 𝑆 2
1 𝑆2
1
𝑛 1 −1
𝑛 1 −1 𝜎 12 𝜎 12
𝐹= 𝜒 22
= 𝑛 2 −1 𝑆 2
= 𝑆2
tiene una
2 𝑛 2 −1 2
𝑛 2 −1 𝜎2 2 𝜎 22
distribución F con n1 – 1 y n2 – 1 grados de libertad.
• BIBLIOGRAFÍA: ELEMENTOS DE LA TEORIA DEL
MUESTREO (Versión Preliminar)- Dr. Raúl
Pedro MENTZ - Instituto de Investigaciones
Estadísticas (INIE) - Universidad Nacional de
Tucumán