Anda di halaman 1dari 75

MUESTREO PROBABILISTICO

PROBLEMA: Por razones de gobierno se desea conocer el


ingreso total (o el ingreso promedio que es otra forma de
presentar la información) de los habitantes de la provincia
de Jujuy "en un momento dado", entrevistando para tal
propósito a las unidades familiares que viven en la
provincia
POBLACION (o UNIVERSO) de nuestro estudio:
¿conjunto de unidades familiares en la provincia?
La población es el conjunto de ingresos totales ($) de las
citadas unidades familiares.
Nos interesan las mediciones de la variable "ingreso" ($) y
no la entidad física "unidad familiar".
POBLACION es la totalidad de observaciones en
las que se está interesado.
Métodos alternativos para reunir la información
necesaria:
(a) CENSAR: Esto es, entrevistar a todos los
integrantes de la población.
(b) MUESTREAR: Entrevistar solamente a un
subconjunto de la población.

Una MUESTRA es un subconjunto de la población.


VENTAJAS DEL MUESTREO
1) Casos en los que siempre debe muestrearse
(debido a características de la población, naturaleza
del método de estudio, etc.):
Población infinita.
Población de tamaño desconocido.
Muestreo destructivo.
2) A menudo conviene muestrear por razones de:
Tiempo: oportunidad – cambios en la población
Costo
Calidad
DESVENTAJAS DEL MUESTREO
1) La información de una muestra no es la de la
población. Se introduce un elemento más de
aproximación.
2) Cuando se quiere desagregar mucho a los datos
(clasificaciones cruzadas por varios atributos), la cantidad
de información juega un papel preponderante. Aún los
censos pueden resultar insuficientes para que ciertas
clasificaciones cruzadas tengan relevancia estadística.

En lo sucesivo supondremos que por alguna razón


de las expuestas, o por otras, ya se ha decidido tomar
solo una muestra. Ejemplos del censo
TIPOS DE MUESTRAS
Si las inferencias de la muestra para la población han
de ser válidas, es importante obtener muestras
representativas de la población.
a) Muestra seleccionada "por expertos" De alguna
manera especial se decide la muestra que se tomará, basada
en razonamientos o consideraciones de algún tipo.
b) Muestra Probabilística : Es aquella en la que los
elementos de la muestra se seleccionan con base en
probabilidades conocidas.
b1) "Al azar o aleatorio": Las formas más sencillas de este
método consiste en poner a toda la población en una urna, y
extraer al azar, con reposición o sin ella, la muestra del
tamaño deseado. Es decir se pueden utilizar dos métodos
básicos para seleccionar la muestra al azar: con reemplazo o
sin reemplazo.
Con Reemplazamiento:
Todas las muestras tienen la misma probabilidad
de ser seleccionadas y
Todas las unidades de la población tiene la
misma probabilidad de ser seleccionadas para
formar parte de la muestra.
Coincide con el muestreo de poblaciones
infinitas.
Sin Reemplazamiento:
Cada una de las Comb(N, n) muestras, tiene la
misma probabilidad de ser escogida. N: tamaño
de la Población y n: tamaño de la muestra.
Todas las unidades de la población tienen la
misma probabilidad de ser extraídas, pero si la
población es finita, la probabilidad de que salga
un elemento dependerá de los que fueron
separados anteriormente para formar parte de
la muestra y dejaron, por lo tanto, de pertenecer
a los seleccionables.
También se llama a este método: muestreo
irrestricto aleatorio o muestreo aleatorio simple
(muestreo al azar sin reemplazamiento).
Ya sea que se realice el muestreo con
reemplazo en poblaciones finitas o sin
reemplazo en poblaciones infinitas (tal como
algunos procesos continuos de producción) las
fórmulas que se utilizan son las mismas.
El muestreo “al azar” se utiliza cuando a
priori no conocemos que elementos de la
población tendrán valores altos de ella.
Cuando dispongamos de información sobre la población,
conviene tenerla en cuenta al seleccionar la muestra.
b.2 Se denomina MUESTREO ESTRATIFICADO aquel en que
los elementos de la población se dividen en clases o
estratos, y la muestra se toma asignando un número
determinado de miembros a cada estrato y escogiendo
por muestreo al azar dentro del estrato.
Existen dos criterios básicos para dividir el tamaño
total entre los estratos:
a) A cada estrato le corresponde igual número de
elementos muéstrales.
b) Proporcionalmente al tamaño relativo del
estrato en la población. La distribución se hace de
acuerdo con el peso (tamaño) de la población en cada
estrato.
Ejemplo de muestreo Estratificado
b.3 Otro tipo de muestreo que se utiliza cuando
los elementos de la población están ordenados
en listas es el MUESTREO SISTEMATICO.
Si la población tiene tamaño N, se desea una
muestra de tamaño n.
Sea k = entero más próximo a N/n.
Se elige al azar un elemento entre los primeros k
elementos de la lista → n1 es el orden elegido.
Tomamos los elementos n1+k; n1+2k, etc., a
intervalos fijos de k hasta completar la muestra.
• Si el orden de los elementos en la lista es al
azar, este procedimiento es equivalente al
muestreo al azar o aleatorio.
• Si el orden de los elementos es tal que los
individuos próximos tienden a ser mas
semejantes que los alejados, el muestreo
sistemático tiende a ser más preciso que el
muestreo al azar, al cubrir más
homogéneamente toda la población.
El muestreo sistemático puede utilizarse
conjuntamente con el estratificado, para
seleccionar la muestra dentro de cada estrato.
Ejemplo de muestreo Sistemático
b.4
MUESTERO ALEATORIO POR CONGLOMERADOS
La unidad muestral ya no son los individuos, sino un conjunto de individuos que bajo
determinados aspectos, se considera que forman una unidad.
Busca, al contrario que el estratificado, heterogeneidad dentro de los estratos y
homogeneidad entre estratos. En pequeña escala, cada conglomerado es una
representación del universo.

MUESTREO POLIETÁPICO POR CONGLOMERADOS


Es un submuestreo del conglomerado.
Se utiliza cuando el número de conglomerados es elevado.
Selecciona los individuos por etapas, configurando sucesivamente grupos (estratos o
conglomerados) y subgrupos denominados Unidades de Muestreo primarias,
secundarias, terciarias, etc.

Para poblaciones muy heterogéneas se utiliza el MUESTREO


POLIETAPICO por Conglomerados: Por ejemplo para seleccionar una
muestra de personas de S.S. de Jujuy podemos seleccionar por muestreo
aleatorio simple barrios, después calles dentro de los barrios, luego
viviendas de la calle y finalmente, el piso dentro de la vivienda, etc.
Ejemplo de muestreo por Conglomerados
La regla general que se aplica a todos los
procedimientos de muestreo es que cualquier
información previa debe utilizarse para subdividir
la población y asegurar la mayor representatividad
de la muestra. Una vez que disponemos de
subpoblaciones homogéneas, la selección dentro
de ellas debe realizarse por muestreo al azar.

En todo lo que sigue SUPONDREMOS SIEMPRE que


la muestra proviene de un muestreo al azar.
Resumen Tipos de Muestreo
MODELO PARA MUESTREO AL AZAR CON
REPOSICION

Por algún procedimiento práctico adecuado,


se va a seleccionar al azar, con reposición a n
familias y se va a preguntar a las respectivas
familias sus ingresos totales, por ejemplo en el
último año anterior al día del relevamiento.
Familia 1 Familia 2 Familia 3
… Familia n-ésima
Ingreso x1 Ingreso x2 Ingresox3 ...
Ingreso xn
x1, x2, ... , xn será una muestra al azar con
reposición de ingresos ($)
Si nuestro interés: El ingreso promedio de las 174.763
familias de la provincia de Jujuy), podemos tomar el ingreso
promedio de las n familias entrevistadas
n

x
i 1
i
x (1)
n
Evaluemos el verdadero valor y alcance de la medida (1).
Si la selección hubiera recaído en otras n familias (lo que es
completamente factible, pues la selección fue hecha "al
azar"), ¿ x podría haber tomado un valor distinto?
¿Podrían haberse presentado valores muy alejados del
que obtuvimos, de manera que por "pura casualidad"
tengamos un valor excepcionalmente alto o bajo?
Para analizar todas estas cuestiones, utilizamos el hecho
básico de que la selección fue hecha al azar y utilizaremos
algunas ideas de probabilidad y variables aleatorias.
MODELO: Usemos la v.a. X para designar a la variable o
característica que se quiere investigar.
En el ejemplo:
X es el “ingreso total de una unidad familiar”
X tiene una distribución de frecuencias relativas, que muestra las
proporciones de unidades familiares que tiene cada nivel de ingreso
total.
Si x es un valor de X → x es el ingreso de una unidad familiar.
Si hay k familias con ingreso x → k/ 174.763 es la proporción
de familias con ingreso x.
LA POBLACION ES UNA VARIABLE ALEATORIA X QUE
TIENE ALGUNA DISTRIBUCION DE FRECUENCIAS
RELATIVAS (que sumen 1).
Por cada valor de X distinto, se ponen en la urna tantas bolillas
como veces ese valor aparezca en la población y tendremos una
urna con bolillas en la misma proporción que la distribución de
frecuencias relativas.
Se extrae de esa población o urna, una muestra al azar de tamaño
n= 1.
Proposición Fundamental: Si designamos por X1 el valor que
resultará seleccionado, X1 es una variable aleatoria cuya
distribución de probabilidad es la distribución de frecuencias
relativas de X.
Conclusión: FX1(x1) = FX(x1).
Por ejemplo P(X1 ≤ 10.000) = P(X ≤ 10.000)
Si X2 registra el valor que resultará seleccionado en la segunda
unidad muestral, X2 es una variable aleatoria con la misma
distribución de X y es INDEPENDIENTE de X1.
Conclusión: Si X1, X2,...,Xn son las variables aleatorias del
muestreo al azar con reposición, entonces
FX i = FX para cada i = 1, 2, …, n. Esto es P( X i ≤ a ) = P( X ≤ a )

Si X1, X2,...,Xn son variables aleatorias INDEPENDIENTES cada


una con la distribución de probabilidad de X, definimos X1,
X2,...,Xn como una MUESTRA ALEATORIA de variables
aleatorias de la población X.
MUESTREO AL AZAR SIN REPOSICION (SIMPLE)
Hasta X1 es lo mismo que en el modelo anterior.
Proposición: Si X1, X2,...,Xn son las variables aleatorias del
muestreo sin reposición de una población de tamaño N > n, y X es
la variable aleatoria de la población, entonces X1, X2,...,Xn tienen
marginalmente la misma distribución de X pero no son
independientes.
(Es así pues X2 es el valor que resultará seleccionado y hasta tanto
no salga seleccionado x1 la distribución de X2 será igual a la
Distribución de X).
Mientras que al censar conocemos toda la distribución de X,
con el muestreo al azar obtenemos información probabilística sobre
esa distribución pues cada Xi tiene la distribución de probabilidad
de X.
RESUMEN: En el muestreo al azar queremos distinguir entre los
números que se observan al disponer de los datos x1, x2,..., xn y las
variables aleatorias X1, X2, ... ,Xn que constituyen la
CONTRAPARTE TEORICA de las observaciones.
Con los números observados podemos hacer cálculos, gráficos
etc., pero para aclarar el valor intrínseco de las observaciones,
y para tener en cuenta que provienen de un muestreo al azar,
recurrimos al análisis de las correspondientes variables
aleatorias.

5.- NOTAS SOBRE MUESTREO AL AZAR


Con reposición: teóricamente el más fácil, pues las
observaciones X1, X2, ..., Xn son independientes en sentido
probabilístico, e idénticamente distribuidas (tienen la
distribución de la población).
Sin reposición: Es el más eficiente, pues la información que da
un elemento no aparece sino una sola vez. Si por ejemplo
tuviésemos una población muy chica, el muestreo sin
reposición rápidamente nos proporcionaría toda la
información, mientras que el muestreo con reposición seguiría
manteniendo ciertos niveles de probabilidad.
Proposición: Aún en el caso del muestreo sin
reposición, cada una de las observaciones X1, X2,
..., Xn tiene (marginalmente) la misma
distribución que la población. Sin embargo las
observaciones no son independientes en el
sentido probabilístico.
No demostraremos esta aseveración en general,
sino que daremos un ejemplo para ver por qué
se cumple.
Ejemplo: Sea una urna con 100 bolillas de las cuales 20 están
marcadas con el número uno, 30 con el dos y 50 con el tres. Analice
el experimento aleatorio consistente en extraer dos bolillas al azar,
con y sin reposición.
La distribución de probabilidad x P(X = x)
de v.a. poblacional X “la 1 0,20
puntuación de bolilla extraída”
es: 2 0,30
3 0,50
Las posibles muestras de tamaño 2 y sus respectivas
probabilidades se presentan en la tabla siguiente:
Caso A: Extracciones con reposición

P(X1 = x1, X2 = x2 ) = P(X1 = x1)*P(X2 = x2 │ X1= x1)= P(X1 = x1)*P(X2


=x2 )
Caso B: Extracciones sin reposición

P(X1 = x1, X2 = x2 ) = P(X1 = x1) P(X2 = x2 │ X1 = x1)


Como 198/990 = 0,20, 297/990 = 0,30 y 495/990 = 0,50, en este
caso resulta que marginalmente los acontecimientos “1”, “2” y “3”
tienen las misma probabilidades en ambos casos. Note sin embargo
que el cuerpo de las tablas es distinto y que en el caso sin
reposición no hay independencia.
6.- NOTA SOBRE TERMINOLOGIA
La dualidad entre los valores muestrales
observados (xi ) y su contraparte teórica, las
variables aleatorias Xi , hace que existan dos
maneras de caracterizar a la mayoría de los
elementos en juego. Presentamos ambas formas
en el cuadro siguiente.
DEFINICIONES
Concepto En Muestreo En términos de variables aleatorias
Población Conjunto de mediciones de una Variable aleatoria (X) y su distribución de
característica, para los individuos probabilidad.
de un grupo bien definido. (Nota: ver definición “alternativa” de v.a. en
A menudo también la población las notas – Claramente la variable poblacional
física (personas, ratones, etc.) X concuerda con esa definición, y es una v. a.)
Muestra Subconjunto de la población Muestra al azar
Muestreo al Selección de una muestra con Conjunto de observaciones muestrales (Xi ),
azar probabilidades conocidas cada una es una variable aleatoria.
Parámetro Cualquier característica Parámetro (o función paramétrica) de la
mensurable de la población distribución de la variable aleatoria (cuando la
v. a. tiene una distribución paramétrica).
Estadístico Característica mensurable de la Función de las variables aleatorias muestrales,
muestra y por lo tanto también una v. a.
Parte 2
7.- EL CONCEPTO DE LA DISTRIBUCIÓN MUESTRAL DE
UN ESTADÍSTICO
Ya dijimos que estamos interesados en analizar el promedio
n
xi n

observado x 
i 1
o la suma observada
 xi
, no como números
n i 1
dados sino tomados desde el punto de vista que las xi tienen como
contraparte teórica las variables aleatorias Xi. Vale decir que
n
 Xi
queremos analizar como variables aleatorias a X i 1
n ,
n
 Xi
i 1 , etc.
Entonces en el marco de las variables aleatorias involucradas
usamos la siguiente definición (2):
Definición: Se llama ESTADISTICO a cualquier función de las
variables aleatorias del muestreo y solo de ellas, y por lo tanto
también es una variable aleatoria-
U es un estadístico ↔ U = U (X1, X2, ..., Xn)

Una primera observación es que estos estadísticos son también


variables aleatorias, pues son transformaciones (simples o
complicadas) de las variables aleatorias X1, X2, ..., Xn. Como
además sabemos algo de la distribución de las Xi, podemos aspirar a
analizar a los estadísticos (tomados como variables aleatorias) con
mucho detalle.
Por ejemplo, si el muestreo fue al azar con reposición, los Xi son
independientes y tienen la distribución FX de la población X.
Si el muestreo fue al azar sin reposición (al azar simple), los Xi
tienen todavía marginalmente la misma distribución FX (de la
población X), pero no son independientes.
X 1 +X 2 + … + X n
Ejemplo: Con o sin reposición, E = E(X) , esto es
n
E(x) = E(X).
Demostración:
X 1 +X 2 + … + X n 1
E(x) = E = E X1 + X 2 + … + X n =
n n
1 1
E X1 ) + E(X2 ) + … + E( Xn = n E(X) = E(X)
n n
Notas: (1) La reposición o falta de ella no afecta este resultado, pues
la clave está en la “linealidad de la esperanza matemática”.
(1) E X1 + X2 + … + Xn = n E X , depende de n; en
consecuencia es un poco menos útil que el estadístico
media aritmética, si bien en este caso ambos pueden
sustituirse prácticamente para todos los fines.
Por ser un estadístico una variable aleatoria tiene una distribución
de probabilidad que se llama “Distribución muestral del
estadístico”.
Definición: Llamamos distribución muestral de un estadístico a su
distribución de probabilidad cuando se lo considera una variable
aleatoria.
Ejemplos:
Si x1, x2, ... , xn son los números obtenidos en el muestreo, todas las
operaciones con esos números nos permiten definir estadísticos.
x1+ x2+ … + xn= t —→ será un valor del estadístico T = X1 + X2
+ ... + Xn
x 1 +x 2 + … + x n
= x —→ será un valor del estadístico
n
X 1 +X 2 + … + X n
x=
n
Entonces, desde un punto de vista teórico T y x son variables
aleatorias cuyas distribuciones de probabilidad se llaman
“Distribución Muestral de T” y “Distribución Muestral de x”.
Problemas típicos con respecto a la distribución muestral de un
estadístico:
(1) Problema amplio: Dada una cierta distribución de
probabilidad de la población X, deducir la distribución muestral
de un estadístico.
(2) Problema reducido: Dada cierta información con
respecto a la distribución de probabilidad de la población
X, deducir algunas partes de la distribución muestral de
un estadístico, e incluso decir algo sobre toda la
distribución si fuera posible.
Típicamente estos problemas son resueltos por la estadística
matemática, los resultados se expresan en la forma siguiente:
Si la v.a. poblacional X tiene una cierta distribución (específica) FX
y U = U (X1, X2, ..., Xn) es un estadístico muestral función de las
variables aleatorias Xi , y Xi se distribuye como X para cada
subíndice i, entonces U tiene la distribución FX.
En otros casos puede decirse: Si E(X) =  , entonces x satisface E(x)
=  . Esto es lo que demostramos más arriba
8.- OTROS ESTADÍSTICOS IMPORTANTES
Si X1, X2, ..., Xn es una muestra aleatoria de v. a. (iid) son de
interés, entre otros, los siguientes estadísticos ya estudiados en
estadística descriptiva que miden donde se concentra la distribución
muestral, su variabilidad, como así también posiciones no centrales
de dicha distribución.
X 1 +X 2 + … + X n
x = Media o promedio muestral
n
x Mediana Muestral
n
2 i=1 Xi − X 2
S = Varianza muestral
n−1
S = 𝑆2 Desviación estándar muestral
K = Mín (X1, X2, ..., Xn) Mínimo de la muestra
M = Máx (X1, X2, ..., Xn) Máximo de la muestra
R=M–K Rango muestral
𝑛
Estadísticos de orden: 𝑋(𝑗 ) j-ésima observación de la muestra
ordenada (en orden creciente) j = 1, 2, …, n
𝑛 𝑛 𝑛 𝑛
𝑋(1) ≤ 𝑋(2) ≤ 𝑋(3) ≤ … ≤ 𝑋(𝑛 )
𝑛 𝑛
Obviamente 𝑋(1) =𝐾 𝑋(𝑛 ) = 𝑀
9.- EJEMPLO de la CONSTRUCCION DE LA
DISTRIBUCION MUESTRAL DE UN ESTADISTICO
(25/08)
Para ilustrar los conceptos, consideremos una
población extremadamente sencilla (la que
seguramente no daría origen a un problema de
muestreo en la vida real) que nos permite deducir
la distribución muestral de algunos estadísticos en
forma completa sin tener que resolver un problema
matemático complicado.
Las distribuciones muestrales pueden construirse
empíricamente a partir de poblaciones finitas. Para
ello se procede como sigue:
1.- De una población finita de tamaño N, se extraen
al azar todas las muestras posibles de tamaño n.
2.-Se calcula el estadístico de interés para cada
muestra.
3.-Se listan en una columna los distintos valores
observados del estadístico, y en otra columna las
frecuencias relativas correspondientes de cada
valor observado.
Problema: Sea una urna con 100 bolillas de las cuales 20 están
marcadas con el número uno, 30 con el dos y 50 con el tres. Se
extraen dos bolillas al azar con reposición. Determine:
a) Distribución de probabilidad, esperanza y varianza de la
población.
b) Distribución de probabilidad de la muestra.
a) Distribución de probabilidad, esperanza y varianza de la
media muestral y de la varianza muestral.
Solución: a) Denominando X a la puntuación de la bolilla
extraída, la distribución de probabilidad de X es
x pX(x)
1 0,2
2 0,3
3 0,5
Calculamos su esperanza y varianza. E(X) =  = 2,3 V(X) = 2
= 0,61
a) Las posibles muestras seleccionadas al azar, con reposición y sus
respectivas probabilidades fueron calculadas en el ejemplo del
punto 4) Tabla A (Probabilidades Conjuntas de X1, X2)

b) Veamos a continuación el valor de la media y la varianza para


cada posible muestra:
Muestra P(X1= x1,
x s2
(x1, x2) X2= x2)
(1,1) 1 0 0,04
(1,2) 1,5 0,5 0,06
(1,3) 2 2 0,10
(2,1) 1,5 0,5 0,06
(2,2) 2 0 0,09
(2,3) 2,5 0,5 0,15
(3,1) 2 2 0,10
(3,2) 2,5 0,5 0,15
(3,3) 3 0 0,25
Por lo tanto las distribuciones de probabilidad de la media
muestral y de la varianza muestral son:
x P( X = x)
1 P{(1,1)} = 0,04
1,5 P{(1,2), (2,1)}= 0,06 + 0,06
= 0,12
2 P{(1,3), (2,2), (3,1)}= 0,10
+ 0,09 + 0,10 = 0,29
2,5 P{(2,3), (3,2)}= 0,15 + 0,15
=0,30
3 P{(3,3)} = 0,25

E(X) = 1∙ 0,04 + 1,5 ∙ 0,12 + 2∙ 0,29 +2,5 ∙ 0,30 + 3 ∙ 0,25 = 2,3


= E(X)
E(X2 ) = 12∙ 0,04 + 1,52 ∙ 0,12 + 22∙ 0,29 +2,52 ∙ 0,30 + 32 ∙ 0,25 =
5,59
σ2 0,61
V(X) = 5,59 – 2,3 = 0,305 =
2
=
n 2
s2 P(S2 = s2)
P{(1,1), (2,2), (3,3)}=
0 0,04+0,09+0,25 = 0,38
P{(1,2), (2,1), (2,3), (3,2)}= 0,06 +
0,5 0,06 + 0,15 + 0,15 = 0,42
2 P{(1,3), (3,1)}= 0,10 + 0,10 = 0,20

E(S2) = 0∙ 0,38 + 0,5 ∙ 0,42 + 2∙ 0,20 = 0,61 = V(X)


E(S2 ) = 02∙ 0,38 + 0,52 ∙ 0,42 + 22∙ 0,20 = 0,905
V(S 2 ) = 0,905 – 0,612 = 0,5329

El problema central de la estadística inferencial consiste en utilizar


la información disponible sobre distribuciones como las de X y S2
del ejemplo, para emitir juicios respecto a (la distribución) de la
población.
Nótese que la distribución muestral de un estadístico depende de la
distribución de la población, por supuesto de la fórmula definitoria
del estadístico y del proceso de muestreo incluso el tamaño muestral.
Si el muestreo hubiera sido sin reposición, las distribuciones podrían
haber sido diferentes, por ejemplo. Estas consideraciones son válidas
para la mayoría de las distribuciones muestrales.
El alumno debe tener en cuenta que en la realidad la población
nunca es conocida en forma completa, no es razonable suponer que
sea tan elemental como en el ejemplo. Además debe reconocer que
en la mayoría de los casos útiles no es posible deducir la distribución
muestral enumerando los casos, como hicimos en el ejemplo.
10. MOMENTOS DE ALGUNAS DISTRIBUCIONES
MUESTRALES
Normalmente, para una distribución muestral, se tiene interés
en conocer tres cosas: media, varianza y forma funcional.
Es bien conocida la dificultad que existe para elaborar una
distribución muestral de acuerdo al procedimiento anterior
cuando la población es muy grande. También constituye un
problema cuando la población es infinita. En este caso lo mejor
que se puede hacer es aproximar la distribución del muestreo
para el estadístico.
Ambos problemas pueden evitarse por medio de la
matemática
El problema que tratamos es el siguiente: Sea X1, X2, … , Xn
una muestra al azar de una variable aleatoria (población) X
con distribución acumulada FX. Sea U = U (X1, X2, … , Xn) un
estadístico, función solo de las observaciones muestrales (no
depende de parámetros poblacionales, por ejemplo).
Queremos encontrar momentos de U, esto es, momentos de
la distribución muestral de U. Por ejemplo queremos saber que
son
E(U), E[U – E(U)]2 = Var(U), etc.
Consideramos algunos casos particulares:
10.1 Para el Caso de Muestreo al Azar Con Reposición de
una población X con E(X)= , Var(X) = 2
Momentos de X
1°) E(X ) = E(X) = 
Demostración:
𝑋1 +𝑋2 + … + 𝑋𝑛 1
E(𝑋) = 𝐸 = 𝐸 𝑋1 + 𝑋2 + … + 𝑋𝑛 =
𝑛 𝑛
1 1
𝐸 𝑋1 ) + 𝐸(𝑋2 ) + … + 𝐸( 𝑋𝑛 = 𝑛 = 𝐸(𝑋)
𝑛 𝑛
Notas: (1) La reposición o falta de ella no afecta este
resultado, pues la clave está en la “linealidad de la esperanza
matemática”.
V(X) σ2
2°) V(X) = = pues las variables son X1, X2, … , Xn
n n
son independientes por ser el muestreo con reposición.
Demostración:
𝑛 2
𝑖=1 𝑋 𝑖
V(𝑋) = E [𝑋 - E(𝑋)]2 = E [𝑋 –  ]2 = E − 𝜇 =E
𝑛
𝑛 2 𝑛 𝑛 2
𝑖=1 𝑋 𝑖 𝑛𝜇 𝑖=1 𝑋 𝑖 𝑖=1 𝜇
− = E −
𝑛 𝑛 𝑛 𝑛
1 𝑛 2
=
𝑛2
E 𝑖=1(𝑋𝑖 − 𝜇)
1 𝑛 𝑛
= E 𝑖=1 (𝑋𝑖 − 𝜇) 𝑗 =1(𝑋𝑗 − 𝜇)
𝑛2
1 𝑛 𝑛
=
𝑛2
E 𝑖=1 𝑗 =1(𝑋𝑖 − 𝜇) (𝑋𝑗 − 𝜇)
1 𝑛 𝑛
=
𝑛2 𝑖=1 𝑗 =1 𝐸 𝑋𝑖 − 𝜇 𝑋𝑗 − 𝜇
1 𝑛 𝑛 𝑛
= 𝑖=1 (𝑋𝑖 −𝜇)2 + 𝑖=1 𝑗 =1 𝐸 𝑋𝑖 − 𝜇 𝑋𝑗 − 𝜇
𝑛2
iǂj
1 𝑛 𝑛 𝑛
=
𝑛2 𝑖=1 𝑉 𝑋𝑖 + 𝑖=1 𝑗 =1 𝐶𝑜𝑣 (𝑋𝑖 , 𝑋𝑗 )
𝐶𝑜𝑣 𝑋𝑖 , 𝑋𝑗 = 0 por ser las Xi independientes
iǂj
1 2 𝜎2
= 𝑛𝜎 =
𝑛2 𝑛
Momentos de S2
n
i=1 Xi − X 2
S2 =
n−1
1°) E(S2 ) = 2
2σ 4
2°) Si X es normal, V(S2 ) =
n−1

n
Xi − X 2
Momentos de S’2 S’2 = i=1
n
n−1
1°) E(S’ ) =
2
2
n
2 n−1 2σ 4
2°) Si X es normal, V(S′ ) =
n n
10.2 Para el Caso de Muestreo “Simple al Azar” (Sin
Reposición) de una Población Finita X
Los momentos de estadísticos presentados, corresponden
al caso en que se muestrea con reposición. Esto es
equivalente a considerar una población infinitamente grande,
en el sentido de que no se altera por la extracción de una
muestra de tamaño n, finito.
Un caso distinto ocurre cuando la población es finita, de
tamaño N, y extraemos una muestra al azar simple, esto es sin
reposición. Ya vimos que en este caso las observaciones
muestrales Xi siguen teniendo marginalmente la misma
distribución que X, pero que son dependientes. En
consecuencia cuando calculemos momentos es necesario
tener en cuenta este hecho; por ejemplo el cálculo de la
varianza de X que reproducimos más arriba, no es válido
cuando las Xi no son independientes.
1 𝑁
𝜇=𝐸 𝑋 = 𝑗 =1 𝑋𝑗
𝑁
Parámetros 1 2
2 𝑁 2
𝜎 =𝑉 𝑋 = 𝑗 =1 (𝑋𝑗 − 𝜇) = 𝐸 𝑋 − 𝐸(𝑋)
𝑁
Momentos de X
1°) E(X ) =  . Demostrado en 9.1
V(X) σ2 N−n
2°) V(X ) = = .
n n N−1
N−n
El factor es efecto de la dependencia y se llama factor
N−1
de corrección por población finita (cpf)
N−n
puede omitirse cuando el tamaño de la muestra es
N−1
pequeño en comparación con el tamaño de la población.
Criterio: La mayoría de los estadísticos no utilizan el cpf a
menos que la muestra contenga más del 5% de las
observaciones de la población.
n
O sea se ignora el cpf si ≤ 0,05
N
Ejemplo: Una muestra de tamaño 100 de una población de
tamaño N= 100.000 unidades tiene la misma precisión que una
muestra de tamaño 100 de una población de tamaño N =
100.000.000
n = 100, N = 100.000
σ 2 100000 −100 99900 σ 2 σ2
V(X )= = = 0,99900999
n 100000 −1 99999 n n

n = 100, N = 100.000.000
σ 2 100000000 −100 99999900 σ 2 σ2
V(X )= = = 0,99900001
n 100000000 −1 99999999 n n
Notaciones :
Para el valor esperado de X : E(X ) o μX
Para la varianza de X : V (X) o σX2
DISTRIBUCION MUESTRAL DE ALGUNOS
ESTADISTICOS
11.- DISTRIBUCION MUESTRAL DE LA MEDIA
𝑋1 +𝑋2 + … + 𝑋𝑛
MUESTRAL 𝑋 = y/o del Total T= 𝑋1 + 𝑋2 +
𝑛
… + 𝑋𝑛
Reconsideramos los teoremas estudiados en
Combinaciones Lineales de variables aleatorias a la luz
de la teoría de Muestreo.
11.1 Muestreo de poblaciones normales (Teorema 13
de Combinaciones Lineales)
Sea X1, X2, … , Xn una muestra aleatoria de una
población X con distribución normal con media  y
varianza 2, entonces con cualquier tamaño de muestra
n, 𝑋 está normalmente distribuida (con media  y
varianza 2/n), al igual que el total T (con media n  y
varianza n 2). Esto es
𝜎2
𝑋 ~ N 𝜇𝑋 = 𝜇 , 𝜎𝑋2 =
𝑛
T ~ N 𝜇 𝑇 = 𝑛 𝜇 , 𝜎𝑇2 = 𝑛 𝜎 2
Ejemplo 𝑋 : La duración de cierto tipo de baterías está
normalmente distribuida con media de 8 horas y desviación
estándar de 1 hora.
a) Si se escoge aleatoriamente una batería, ¿cuál es la
probabilidad de que dure por lo menos 8,5 horas?
b) Si las baterías se venden en paquetes de 4 baterías. ¿Cuál es
la probabilidad de que la duración promedio de las 4 baterías, de
un paquete seleccionado, sea por lo menos de 8,5 horas?
Ejemplo T: Un elevador de carga grande puede transportar un
máximo de 10.000 libras (5 toneladas). Suponga que una carga
que contiene 45 cajas se debe transportar mediante el elevador.
La experiencia ha demostrado que el peso X de una caja de este
tipo de carga se ajusta a una distribución de probabilidad con una
media de  = 200 libras y una desviación estándar de  = 55
libras. ¿Qué probabilidad hay de que las 45 cajas se puedan
cargar en el elevador de carga y transportarse simultáneamente?

11.2 Muestreo de una población Bernoullí (Teoremas


10 y 11 de Combinaciones Lineales)
Sea X1, X2, … , Xn una muestra aleatoria de una
población X con distribución Bernoullí entonces
Distribución muestral del total de éxitos de la muestra
T= 𝑋1 + 𝑋2 + … + 𝑋𝑛 ; T tiene distribución binomial con
parámetros n y p,
T representa el número de éxitos en la muestra de tamaño
n

Distribución Muestral de la Proporción Muestral PS


𝑇 𝑋1 +𝑋2 + … + 𝑋𝑛
𝑋=
𝑛
=
𝑛
(=P S) tiene distribución binomial

de proporciones
PS representa la proporción de éxitos en la muestra
Ejemplo: Se toma una muestra de 250 casas de una
población de edificios antiguos para estimar la
proporción de casas de este tipo. Supongamos que el
30% de todos los edificios son antiguos. Hallar la
probabilidad de que la proporción de edificios antiguos
esté entre 0.25 y 0.35.
n*p y n*q ambos ≥5
E(PS)= p
𝑝∗𝑞
VAR(PS)=
𝑛

Factor de corrección por continuidad


1 1
𝑃(𝑎 − ≤𝑃≤𝑏+ )
2∗𝑛 2∗𝑛
11.3 Muestreo de una población X de cualquier
forma funcional (Teorema Central del Límite)
Dada una población X de cualquier forma funcional con
una media  y varianza 2 finita y sea X1, X2, … , Xn
una muestra aleatoria de esa población. Si n es
suficientemente grande 𝑋 tiene aproximadamente
distribución Normal. Esto es
𝜎2
Si n es grande, 𝑋 ~ N 𝜇𝑋 = 𝜇 , 𝜎𝑋2 =
𝑛
¿Qué tan grande debe ser la muestra para que el TCL
sea aplicable?
Regla empírica: En la mayoría de las aplicaciones
prácticas una muestra de tamaño 30 es suficiente.
En general, la aproximación a la normalidad de 𝑋 mejora
a medida que crece el tamaño de la muestra.
12.- Distribución Muestral de la diferencia entre dos
medias muestrales 𝑿 − 𝒀
Si se extraen al azar muestras independientes de
tamaños n1 y n2 de dos poblaciones, discretas o
continuas, con medias μ1 y μ2 y varianzas σ12 y σ22,
respectivamente, entonces la distribución muestral de
las diferencias de las medias muestrales 𝐗 − 𝐘, tendrá
las siguientes propiedades:
1°) 𝜇𝑋 −𝑌 = E(𝑋 − 𝑌)= E(𝑋) − 𝐸(𝑌)= μ1 —μ2
2 2
𝜎 1 𝜎2
𝜎𝑋2−𝑌 = 𝑉 𝑋 − 𝑌 = 𝑉 𝑋) + 𝑉(𝑌 = +
𝑛1 𝑛2
2°) Si ambas poblaciones son normales,
X ~ N(μ1, σ12) e Y ~ N(μ2 , σ22 )
𝜎12 𝜎22
Entonces 𝑋 ~ N 𝜇1 , e 𝑌 ~ N 𝜇2 ,
𝑛1 𝑛2
𝜎12 𝜎22
Luego 𝑋 − 𝑌 ~ N 𝜇1 — 𝜇2 , +
𝑛1 𝑛2
Entonces la diferencia tiene una distribución normal exacta
sin importar los tamaños de las muestras n1 y n2.
3°) Si las poblaciones no son normales, entonces si n1 y n2
son suficientemente grandes
𝜎12 𝜎22
𝑋 − 𝑌 ~ aproximadamente N 𝜇1 — 𝜇2 , + si n1 ≥
𝑛1 𝑛2
30 y n2 ≥ 30
Teorema : Si se extraen al azar muestras independientes de
tamaños n1 y n2 de dos poblaciones, discretas o continuas,
con medias μ1 y μ2 y varianzas σ12 y σ22, respectivamente,
entonces la distribución muestral de las diferencias de las
medias muestrales , está distribuida aproximadamente de
forma normal con media y varianzas dadas por
𝜎12 𝜎22
E(𝑋 − 𝑌)= μ1 —μ2 ; 𝑉 𝑋−𝑌 = +
𝑛1 𝑛2
𝑋 −𝑌 −(𝜇 1 —𝜇 2 )
De aquí 𝑍= es aproximadamente una
𝜎12 𝑛 1 +𝜎22 𝑛 2

variable normal estándar.


•Si n1 y n2 son mayores o iguales a 30, la aproximación
normal para la diferencia de 𝑋 − 𝑌 es muy buena sin
importar las formas de las dos poblaciones. Sin embargo,
aun cuando n1 y n2 sean menores que 30, la
aproximación normal es razonablemente buena excepto
cuando las dos poblaciones no son definitivamente
normales.
•Por supuesto, si ambas poblaciones son normales,
entonces la diferencia 𝑋 − 𝑌 tiene una distribución
normal exacta sin importar los tamaños de las muestras
n1 y n2.
Ejemplo: En una población de bovinos de la sierra
central, la producción de leche promedio es de 12 litros
con una desviación estándar de 4 litros.
En otra población de bovinos de la sierra sur la
producción promedio es de 10 litros con una desviación
estándar de 3 litros. Si se obtiene una muestra aleatoria
simple de 24 bovinos de la sierra central y otra de 30 de
la sierra sur ¿cuál es la probabilidad de que la media
muestral para la muestra aleatoria de la sierra central
exceda a la de la sierra sur en más de 2 litros.
13.- Distribución Muestral de la Varianza muestral S2
Sea X1, X2, … , Xn una muestra aleatoria de una
población X con distribución normal con media  y
varianza 2 y sea S2 la varianza muestral
n 2
2 i =1 Xi − X
S =
n −1
Entonces se tiene lo siguiente
a) E(S2 ) = 2
2 𝑛 −1 𝑆 2
b) Si 𝑋 ~ 𝑁(𝜇, 𝜎 ), entonces tiene una
𝜎2
distribución chi- cuadrado con n – 1 grados de libertad y
2𝜎 4
V(S2) =
𝑛 −1
Demostración
𝑛 2 𝑛 2
a) 𝑖 =1 𝑋𝑖 − 𝑋 = 𝑖 =1 𝑋𝑖 − 𝜇 + 𝜇 − 𝑋 =
𝑛 2
𝑖 =1 [ 𝑋𝑖 − 𝜇 + 𝜇 − 𝑋 ]

𝑛
= 𝑖 =1 (𝑋𝑖 − 𝜇)2 + 2(𝑋𝑖 − 𝜇) 𝜇 − 𝑋 + 𝜇−𝑋 2

𝑛 𝑛 𝑛
= 𝑖 =1 (𝑋𝑖 − 𝜇)2 + 2 𝜇 − 𝑋 𝑖 =1 𝑋𝑖 − 𝜇 + 𝑖 =1 𝜇−
2
𝑋
𝑛 2 2
= 𝑖 =1 (𝑋𝑖 − 𝜇) + 2 𝜇 − 𝑋 𝑛 𝑋 − 𝜇 +n 𝑋−𝜇
𝑛
= 𝑖 =1 (𝑋𝑖 − 𝜇)2 − 𝑛 𝑋 − 𝜇 2
Entonces
n
2 i=1 Xi − X 2 1 𝑛 2
𝐸 𝑆 =𝐸 = 𝐸 𝑖=1 𝑋𝑖 − 𝜇 −
n−1 𝑛−1
𝑛 𝑋−𝜇 2
1 𝑛 2 2
= 𝑖=1 𝐸 𝑋𝑖 − 𝜇 − 𝑛𝐸 𝑋−𝜇
𝑛−1
1 𝑛
= 𝑖=1 𝑉 𝑋𝑖 − 𝑛 𝑉 𝑋
𝑛−1
1 2 𝜎2
= 𝑛𝜎 − 𝑛
𝑛−1 𝑛
𝑛−1
= 𝜎2
𝑛−1

= 𝜎2
Ejemplo:
El tiempo que ocupan los estudiantes mirando televisión
en las semanas anteriores a los exámenes finales (en horas)
tiene una distribución normal con desvió estándar de 4,5
hs. Se tomó una muestra de 30 estudiantes:
Indique si la probabilidad de que el desvío estándar
muestral supere las 3,5 hs es mayor a 0,95.
14.- Distribución Muestral de la razón de 2 varianzas
muestrales 𝑺𝟐𝟏 𝑺𝟐𝟐
Un problema que surge en los experimentos
industriales es comparar la variabilidad de dos procesos
𝜎12 𝜎22
Se toma una muestra al azar con reposición de n1
artículos, usando el proceso X y se toma una muestra
aleatoria de n2 artículos, usando el proceso Y. se
comparan las varianzas muestrales para cada proceso,
o sea 𝑆12 𝑆22 . Si esta razón es cercana a la unidad, las
variabilidades se juzgan como casi equivalentes; si esta
razón es muy diferente a la unidad, las variabilidades se
juzgan como no equivalentes. Para tomar buenas
decisiones y para cuantificar la expresión de “cercana a
la unidad”, es necesario examinar la distribución de
𝑆12 𝑆22
Sea 𝑋1 , 𝑋2 , … , 𝑋𝑛 1 una muestra aleatoria de n1 v. a.
independientes de una población normal X ~ N(μ1, σ12) y
sea 𝑌1 , 𝑌2 , … , 𝑌𝑛 2 una muestra aleatoria de n2 v. a.
independientes de una población normal Y ~ N(μ2 , σ22 );
además sean todas las X’s e Y´s independientes.χ1

𝑛 1 −1 𝑆12
La distribución de 𝜒12 = es entonces chi-
𝜎1 2
cuadrado con n1 – 1 grados de libertad.
𝑛 2 −1 𝑆22
De modo similar 𝜒22 = es también chi- cuadrado
𝜎2 2
con n2 – 1 grados de libertad.
Además estas dos variables 𝜒12 y 𝜒22 son
independientes porque las X’s y las Y´s lo son.
Entonces la variable aleatoria
𝜒 12 𝑛 1 −1 𝑆 2
1 𝑆2
1
𝑛 1 −1
𝑛 1 −1 𝜎 12 𝜎 12
𝐹= 𝜒 22
= 𝑛 2 −1 𝑆 2
= 𝑆2
tiene una
2 𝑛 2 −1 2
𝑛 2 −1 𝜎2 2 𝜎 22
distribución F con n1 – 1 y n2 – 1 grados de libertad.
• BIBLIOGRAFÍA: ELEMENTOS DE LA TEORIA DEL
MUESTREO (Versión Preliminar)- Dr. Raúl
Pedro MENTZ - Instituto de Investigaciones
Estadísticas (INIE) - Universidad Nacional de
Tucumán

Anda mungkin juga menyukai