Anda di halaman 1dari 11

MUESTREO ESTRATIFICADO

Esta tcnica, perteneciente a la familia de muestreos


probabilsticos, consiste en dividir toda la poblacin objeto de
estudio en diferentes subgrupos o estratos disjuntos, de manera
que un individuo slo puede pertenecer a un estrato. Una vez
definidos los estratos, para crear la muestra se seleccionan
individuos empleando una tcnica de muestreo cualquiera a
cada uno de los estratos por separado. Si por ejemplo
empleamos muestreo aleatorio simple en cada estrato,
hablaremos de muestreo aleatorio estratificado (M.A.E. en
adelante). Del mismo modo, podramos usar otras tcnicas de
muestreo en cada estrato (muestreo sistemtico, aleatorio con
reposicin, etc.).
Los estratos suelen ser grupos homogneos de individuos, que a
su vez son heterogneos entre diferentes grupos. Por ejemplo, si
en un estudio esperamos encontrar un comportamiento muy
diferente entre hombres y mujeres, puede ser conveniente
definir dos estratos, uno por cada sexo. Si la seleccin de estos
estratos es correcta (1) los hombres deberan comportarse de
forma parecida entre ellos, (2) las mujeres deberan comportarse
de forma muy similar entre ellas y (3) hombres y mujeres
deberan mostrar comportamientos dispares entre s.
Si la anterior condicin se cumple (estratos homogneos
internamente, heterogneos entre s) el uso del muestreo
aleatorio estratificado reduce el error muestral, mejorando la
precisin de nuestros resultados al realizar un estudio sobre la
muestra.
Es relativamente habitual definir estratos de acuerdo a algunas
variables caractersticas de la poblacin como son la edad, sexo,
clase social o regin geogrfica. Estas variables permiten dividir
fcilmente la muestra en grupos mutuamente excluyentes y con
bastante frecuencia, permiten discriminar comportamientos
diferentes dentro de la poblacin.
Tipos de muestreo estratificado

Dependiendo del tamao que asignamos a los estratos,


hablaremos de diferentes tipos de muestreo estratificado.
Tambin se acostumbra a hablar de diferentes formas de
afijacin de la muestra en estratos.
(1) Muestreo estratificado proporcionado
Cuando seleccionamos una caracterstica de los individuos para
definir los estratos, suele ocurrir que el tamao de las
subpoblaciones resultantes en el universo son diferentes. Por
ejemplo, queremos estudiar el % de la poblacin que fuma en
Mxico y pensamos que la edad puede ser un buen criterio para
estratificar (es decir, pensamos que existen diferencias
importantes en el hbito de fumar dependiendo de la edad).
Definimos 3 estratos: menores de 20 aos, de 20 a 44 aos y
mayores de 44 aos. Es de esperar que al dividir toda la
poblacin mexicana en estos 3 estratos no resulten grupos de
igual tamao. Efectivamente, si miramos datos oficiales,
obtenemos:
* Estrato 1 Poblacin Mexicana menor de 19 aos: 42,4
millones (41,0%)
* Estrato 2 Poblacin Mexicana de 20 a 44 aos: 37,6 millones
(36,3%)
* Estrato 3 Poblacin Mexicana mayor de 44 aos: 23,5
millones (22,7%)
Si usamos muestreo estratificado proporcionado, la
muestra deber tener estratos que guarden las mismas
proporciones observadas en la poblacin. Si en este ejemplo
queremos crear una muestra de 1.000 individuos, los estratos
tendrn que tener un tamao como sigue:
Estrato
1
2
3

Poblacin
42,4M
37,6M
23,5M

Proporcin
41,0%
36,3%
22,7%

Muestra
410
363
227

(2) Muestreo estratificado uniforme


Hablaremos de una afijacin uniforme cuando asignamos el
mismo tamao de muestra a todos los estratos definidos, sin
importar el peso que tienen esos estratos en la poblacin.
Siguiendo con el ejemplo anterior, un muestreo estratificado
uniforme definira la siguiente muestra por estrato:
Estrato
1
2
3

Poblacin
42,4M
37,6M
23,5M

Proporcin
41,0%
36,3%
22,7%

Muestra
334
333
333

Esta tcnica favorece los estratos que tienen menos peso en la


poblacin, equiparndolos en importancia a los estratos ms
relevantes. Globalmente, reduce la eficiencia de nuestra
muestra (menor precisin en los resultados), pero como
contrapartida permite estudiar caractersticas particulares de
cada estrato con mayor precisin. En nuestro ejemplo, si
queremos emitir alguna afirmacin especfica sobre la poblacin
del estrato 3 (mayores de 44 aos), podremos hacerlo con
menor nivel de error muestral si empleamos una muestra de
333 unidades que si lo hacemos con una muestra de 227 (como
ocurra en el muestreo estratificado proporcional).
(3) Muestreo estratificado ptimo
desviacin estndar)

(respecto

la

En este caso, el tamao de los estratos en la muestra no


guardar proporcionalidad con la poblacin. Por el contrario, se
define el tamao de los estratos proporcionalmente a la
desviacin estndar de las variables objeto de estudio. Es decir,
se toman estratos de mayor tamao en los estratos con mayor
variabilidad interna para representar mejor en el total de la
muestra los grupos poblacionales ms difciles de estudiar.

Eficiencia de los diferentes muestreos


estratificados

Las preguntas inevitables son: cuando conviene emplear la


estratificacin?, qu tipo de estratificacin es ms
conveniente?
El muestreo estratificado proporcional produce
siempre menor o igual error muestral que el
muestreo aleatorio simple, es decir, es ms preciso.
La igualdad se produce cuando las medias o las
proporciones que estamos analizando son iguales en
todos los estratos. Por lo tanto, la estratificacin produce
ms beneficio cuanto ms diferentes sean los estratos
entre s.
El muestreo estratificado ptimo es siempre igual
o ms preciso que el muestreo estratificado
proporcional. Ambos mtodos son igual de precisos
cuando las desviaciones tpicas dentro de cada estrato
son iguales, en cuyo caso ambos mtodos son
totalmente equivalentes. Por lo tanto, la estratificacin
ptima produce ms beneficio cuanto ms diferencias
existan entre las desviaciones dentro de cada grupo,
situacin en la que podremos reducir el tamao muestral
de los grupos ms homogneos en beneficio de los ms
heterogneos. Como contrapartida, es un mtodo ms
complejo y que requiere tener mucha informacin a
priori de la muestra que estudiamos, algo que
normalmente no tenemos.
Tamaos de muestra requeridos por cada tcnica
Vemos que la estratificacin puede proporcionar beneficios.
Si estas tcnicas pueden emplearse para estimar de forma
ms precisa ya sean medias (p.e. media de cigarrillos
consumidos por los fumadores de Mxico) o proporciones
(p.e. proporcin de la poblacin de Mxico que fuma),
tambin pueden permitirnos reducir el tamao de muestra
requerido para lograr una estimacin con un nivel de error
determinado.

La siguiente tabla resume el tamao de muestra requerido al


emplear cada tcnica, en funcin del error mximo que estamos
dispuestos a aceptar y de las caractersticas del propio universo,
que consideraremos de tamao infinito (si fuese finito, debe
aplicarse un factor de correccin).

Para interpretar el cuadro anterior es necesario tener en cuenta


lo siguiente:
L es el nmero de estratos en que particionamos la
muestra y h es un ndice que se refiere a un estrato
concreto. Por lo tanto, h puede variar entre 1 y L
estratos.
p es la proporcin que buscamos en el total de la
poblacin (p.e. % de fumadores). Por lo tanto, (1-p) es la
proporcin de la muestra complementaria, la que no
cumple el criterio buscado (no fumadores). Del mismo
modo, ph es dicha proporcin dentro de cada uno de los
estratos.
2 es la varianza que el dato buscado (en el caso de
estimar medias) tiene en el total de la poblacin.
Asimismo, h2 es la varianza dentro de cada estrato.

e es el margen de error aceptado.


Wh es el peso que el estrato tiene en la muestra
(tamao del estrato respecto al total de la muestra). Si
hablamos de estratificacin proporcional, cada Wh es
igual a la proporcin que ese estrato representa en la
poblacin. Si hablamos de estratificacin ptima, cada
Wh se calcula en funcin de la dispersin dentro de cada
estrato.
Es posible demostrar a partir de las frmulas anteriores que los
diferentes mtodos de estratificacin slo reducen el tamao de
la muestra si los valores de p y vara entre estratos. De lo
contrario, todas las expresiones son equivalentes. Veamos un
ejemplo: si tomamos la expresin de tamao de muestra
requerido para estimar una media mediante un muestreo
estratificado ptimo

y consideramos que todas las varianzas de los estratos son


iguales (h=) y que el tamao de los estratos es idntico
(Wh=1/L), el resultado que obtenemos es

MUESTREO POR CONGLOMERADOS

El muestreo por conglomerados es una tcnica que aprovecha la


existencia de grupos o conglomerados en la poblacin que
representan correctamente el total de la poblacin en relacin a
la caracterstica que queremos medir. Dicho de otro modo, estos
grupos contienen toda la variabilidad de la poblacin. Si esto
sucede, podemos seleccionar nicamente algunos de estos
conglomerados para realizar el estudio.
Podemos ver esta tcnica desde otro punto de vista. Mientras
que en todas las tcnicas vistas hasta ahora las unidades de
muestreo coinciden con las unidades a estudiar (individuos), en
el muestreo por conglomerados las unidades de muestreo son
grupos de unidades de estudio, algo que puede resultar muy
beneficioso en relacin al coste del propio muestreo. A cambio,
es habitual obtener una menor precisin al usar esta tcnica,
causada por falta de heterogeneidad dentro de los
conglomerados.
El proceso de muestreo
El primer paso para aplicar esta tcnica es definir los
conglomerados. Se trata de identificar una caracterstica que
permita dividir la poblacin en grupos disjuntos (sin
solapamiento) y exhaustiva (todos los individuos deben estar en
un grupo), de tal manera que los grupos no difieran entre s en
relacin a aquello que queremos medir. Una vez hemos definido
estos conglomerados, seleccionaremos al azar algunos de ellos
para estudiarlos.
Un criterio habitual para definir conglomerados es el geogrfico.
Por ejemplo, si queremos estudiar qu proporcin de la
poblacin argentina fuma, podemos dividir el total de la
poblacin en provincias y seleccionar algunas de ellas para ser
estudiadas. Si no tenemos razones para pensar que l % de
fumadores va a cambiar de una provincia a otra, esta solucin
nos permitir concentrar el esfuerzo de muestreo en un nico
entorno geogrfico. Si el estudio se va a hacer mediante
entrevistas personales, esto representa un importante ahorro de
costes de desplazamientos.

Una vez definimos los conglomerados, el siguiente paso es


seleccionar los conglomerados a estudiar, ya sea mediante un
muestreo aleatorio simple o sistemtico.
Por ltimo, una vez hemos seleccionado los conglomerados a
estudiar, podemos investigar a todos los sujetos que forman
parte de los mismos, o bien aplicar un nuevo proceso de
muestreo dentro del conglomerado, por ejemplo obteniendo una
muestra mediante muestreo aleatorio simple o sistemtico. Si
optamos por esta posibilidad, estaremos hablando de un
muestreo en dos etapas o bietpico: la primera etapa es la
seleccin del conglomerado, la segunda la de individuos dentro
del conglomerado. Si por el contrario estudiamos todos los
individuos del conglomerado, hablaremos de muestreo por
conglomerados unietpico.

Ventajas y desventajas del muestreo por conglomerados


La principal ventaja de esta tcnica es de tipo operativa:
seleccionar un conglomerado a estudiar suele ser ms
fcil y econmico que hacer una muestra aleatoria o
sistemtica. Hemos visto por ejemplo que usar
conglomerados geogrficos puede representar un
importante ahorro en desplazamientos de personas.
Curiosamente, es habitual hacer estudios a travs de
Internet en los que se sigue pensando en trminos de
estudiar slo unas zonas geogrficas, cuando en realidad
a travs de Internet no obtenemos ningn beneficio
operativo; al contrario, incurrimos en mayor riesgo de
tener menor precisin por diferencias entre las regiones
estudiadas y el resto de la poblacin. Esta prctica es
una herencia injustificada de tcnicas que eran buenas
en entrevistas personales, pero que no lo son al usar
otras metodologas.
Como principal inconveniente, al usar muestreo por
conglomerados corremos un riesgo importante: que los
conglomerados no sean realmente homogneos entre
ellos. En el ejemplo anterior sobre fumadores en

Argentina, podra suceder que en una de las provincias


exista ms propensin a fumar, por ser una regin ms
urbana, por razones culturales, etc.
Eficiencia del muestreo por conglomerados
Cmo podemos comparar esta tcnica con otras? Lo bien o mal
que va a funcionar esta tcnica va a depender, de forma similar
a como ocurra en el muestreo estratificado, de la relacin entre
varianza dentro y fuera de los conglomerados.
Esta relacin se suele expresar con un coeficiente de
correlacin intraconglomerados (), que se define como el
coeficiente de correlacin lineal entre todos los pares de valores
de la variable en estudio medidos sobre las unidades de los
conglomerados y extendido a todos los conglomerados. En
definitiva, este coeficiente es una medida de la homogeneidad
en el interior de los conglomerados.
Cuanto
menor
sea
el coeficiente
de
homogeneidad
intraconglomerados , mayor eficiencia arrojar el muestreo por
conglomerados. Recordemos que lo ideal es que los
conglomerados sean tan heterogeneos como el total de la
muestra, con el fin de que la seleccin de un conglomerado
concreto nos de la misma informacin que la seleccin de
individuos al azar del total de la poblacin.
Si comparamos el muestreo aleatorio simple con el muestreo
por conglomerados, es posible demostrar que si =0 ambos
mtodos son equivalentes. Esta condicin implica que los
conglomerados son exactamente tan heterogeneos como el
total de la poblacin. El peor caso sera =+1 , mientras que el
ms favorable sera el de=-1/(M-1), donde M es el tamao del
conglomerado. Sin embargo, normalmente va a ser siempre
mayor que 0, ya que lo normal es que las unidades de un
conglomerado tengan cierto parecido entre s.
Otra forma de ver el impacto de este problema es calcular el
tamao de muestra necesario al emplear muestreo por

conglomerados para lograr la misma precisin de un muestreo


aleatorio simple. Esta expresin es la que sigue
nc = na (1 + (M-1) )
donde nc es el tamao de muestra en muestreo por
conglomerados y naes el tamao de muestra que necesitaramos
en muestreo aleatorio simple. Por lo tanto, el factor (1+(M-1)
es la variacin del tamao de muestra que necesitamos
debido al uso de conglomerados. Normalmente ser un
incremento. Este factor se conoce como efecto de diseo.
Esperamos que este post haya sido de ayuda para entender
mejor esta tcnica de muestreo probabilstico. A continuacin,
podrs encontrar los enlaces al resto de artculos que conforman
la serie:

MUESTREO ESTRATIFICADO Y MUESTREO POR


CONGLOMERADOS
La idea del muestreo por conglomerados recuerda a la
del muestreo estratificado. En ambos casos dividimos la
poblacin en grupos. Sin embargo, los principios detrs de
ambas tcnicas son en cierto modo opuestos.
El muestreo estratificado es especialmente adecuado cuando los
grupos (estratos) son muy homogneos internamente y muy
diferentes entre s. En ese caso, conviene asegurar que tenemos
representantes en nuestra muestra que provienen de todos los
estratos. Por el contrario, el muestreo por conglomerados es
muy adecuado cuando los grupos en que dividimos la poblacin
son muy similares entre s, por lo que no hay gran diferencia
entre estudiar individuos de un grupo o de otro.
Es por ello que pese a que ambas tcnicas dividen la poblacin
(en estratos o conglomerados) el proceso de seleccin de
individuos es radicalmente diferente.

BIBLIOGRAFIA

http://www.netquest.com/blog/es/muestreoprobabilistico-muestreo-estratificado/
http://www.netquest.com/blog/es/muestreoprobabilistico-muestreo-conglomerados/