Anda di halaman 1dari 14

TEMA 8

EL MUESTREO

1. POBLACIN Y MUESTREO

Cuando no es posible realizar una investigacin sobre la totalidad de la poblacin


objeto de estudio se hace necesario seleccionar un subconjunto de la misma sobre el
cual realizarlo: la muestra. Sin embargo, para que la muestra sea representativa del
conjunto de la poblacin no puede ser elegida de cualquier modo (haphazard
sample), sino siguiendo unos criterios muy precisos (probability sample). Un ejemplo de
ello fue el estudio de la revista Literary Digest sobre las elecciones presidenciales de
1936 en EEUU; envi 10 millones de solicitudes a direcciones de las guas telefnicas y
de las listas de propietarios de coches, y obtuvo 2 millones de encuestas. A pesar de
una muestra tan colosal, erraron su diagnstico y no gan Alf Landon, sino F. D.
Roosevelt, algo que s predijeron empresas de sondeos como Gallup, Roper y Crossley
empleando muestras mucho ms pequeas pero extradas aleatoriamente sobre la
poblacin total. La Literary Digest realiz su estudio sobre una muestra no
probabilstica, cometiendo los errores de cobertura (listas incompletas) y de no-
respuesta (autoseleccin de la muestra).

En base a lo anterior, se denomina muestreo al procedimiento a travs del cual se


extrae, del conjunto de la poblacin objeto de estudio, una muestra elegida con
criterios tales que permitan la generalizacin a toda la poblacin de los resultados
obtenidos al estudiar la muestra. Su importancia es tal, que ha dado lugar a una rama
especfica de la estadstica conocida como la teora de las muestras. Con los
precedentes de Anders Kiaer (1895) y A. L. Bowley (1926), fue Jerzy Neyman (aos 30)
quien realiz la sistematizacin terica definitiva del campo, y estableci la distincin
entre muestreo subjetivo y muestreo probabilstico.

Entre las ventajas de la encuesta de muestreo se encuentran: (a) ahorro en los costes
de la investigacin, (b) ahorro de tiempo en la recogida y elaboracin de los datos,
(c) ventajas organizativas por el menor nmero de encuestadores, y (d) ventajas de
profundizacin, pues el ahorro de recursos econmicos y organizativos permite
incrementar la calidad de la encuesta.

2. ERROR DE MUESTREO

Se denomina poblacin al conjunto N de unidades de anlisis que constituyen el


objeto de estudio: personas, objetos, empresas, territorios, acontecimientos De
dichas unidades lo que se desea conocer son sus variables (propiedades), a fin de
describir su distribucin total en la poblacin o las relaciones entre ellas, en base a
diferentes parmetros: media, proporcin o correlacin. As, si la unidad es el individuo
y la variable es la renta, el parmetro de la poblacin que deseamos conocer es una
media: la renta per capita.

Se denomina diseo de muestreo al procedimiento terico y predeterminado que se


debe seguir para elegir las n unidades de muestro entre el total de las N unidades de la
poblacin con el objetivo de representarla, muestreo a la ejecucin prctica de
dicho diseo y muestra al conjunto n de unidades seleccionadas.

Una investigacin total proporciona el valor exacto del parmetro que se desea
conocer (La renta media de la poblacin X es de 950 ); sin embargo, una
investigacin por muestreo slo proporciona una estimacin (La renta media de la
poblacin X es de 950 25 , con un 95 % de probabilidades). As, una estimacin
comporta dos datos: un grado de confianza y un intervalo de confianza; el grado de
confianza indica las probabilidades (95 %) de que cualquier persona de la poblacin
elegida al azar contar con una renta que se encontrar dentro del intervalo de
confianza (950 25 ). Puesto que la estimacin proporcionada por la muestra (v) slo
es una aproximacin sobre el valor real de la poblacin (V), el error de muestreo (e) se
define como la diferencia entre ambos:

V ve

Si la muestra ha sido elegida segn un proceso rigurosamente probabilstico, la teora

s p*q
e z * ( X ) z * * 1 f e z* * 1 f
n n 1
estadstica permite calcular el error de muestreo:

Si el parmetro es una media Si el parmetro es una proporcin

z Grado de confianza de la estimacin (si 95 %, z = 1,96; si 99 %, z = 2,58)


(X) Error tpico de la media muestral

s Desviacin tpica muestral de la variable s p*q

n Tamao de la muestra
1f Factor de correccin para poblaciones finitas

f Fraccin de muestreo f n/ N

p Proporcin en la muestra de la categora a examen q p 1

Examinando las frmulas se observa que el error de muestreo es mayor:

a) Cuanto mayor sea el grado de confianza (z) que se desea.


b) Cuanto mayor sea la variabilidad o desviacin () de la variable estudiada.
c) Cuanto menor sea el tamao de la muestra (n) respecto al de la poblacin (N).

Examinando las frmulas tambin se observa que en el error de muestreo influye ms el


tamao de la muestra (n) que la fraccin de muestreo (f = n/N). Ello se debe a que si N
es infinita, o mucho mayor que n (n < 5 % de N), el factor de correccin (1f ) se
acerca tanto a 1 que se puede neutralizar, y en ese caso N deja de intervenir en el
valor de e.

3. TAMAO DE LA MUESTRA

Determinar el tamao de la muestra (n) constituye uno de los criterios bsicos para
definir la entidad de la investigacin y la previsin de sus costes. Para ello podemos
emplear las frmulas del error de muestreo (e), dando a e el error que estamos
dispuestos a aceptar y resolviendo la ecuacin para n.
z 2 * s2 z2 * p * q
n
e2 e2

Como se observa, es el investigador el que decide z y e, de tal modo que el tamao


de la muestra (n) es directamente proporcional a la precisin deseada (z, e). En
cualquier caso, los valores de s, p y q no son conocidos, por lo que debe recurrirse a
valores aproximados en funcin de estudios anteriores o de estudios piloto.

Como en el caso del error de muestreo, es interesante observar que N apenas


interviene para determinar el valor de n, salvo en el caso de que n > 5 % de N (si n/m >
0,05). En ese caso, la introduccin del factor de correccin conduce a frmulas
bastante complejas. Para simplificar el proceso, se aconseja averiguar n en dos pasos:
(1) averiguar n0 con la frmula normal; si n0 < 5 % de N, entonces n = n0; si n0 > 5 % de N,
entonces (2) se averigua el valor de n mediante la segunda frmula.

n0
z 2 * s2 z2 * p * q n
n0 n
1 0
e2 e2 N

En el caso de que la investigacin precise determinar n para estimar parmetros de


varias variables, debe averiguar el tamao de la muestra necesario para cada
variable y adoptar el ms elevado. En el caso de que se trate de estimar slo
proporciones, el investigador puede simplificar el clculo de n situndose en la
situacin mas desfavorable, es decir, asumiendo que p = q = 0,5.

Es importante advertir que, aplicando las frmulas del tamao de la muestra, 2.500
casos son suficientes para obtener estimaciones con una notable precisin del 2 %
para cualquier tamao de poblacin (una ciudad, una comunidad, un pas, todo el
planeta!), y slo 400 para una precisin del 5 %. Sin embargo, todo ello es vlido
siempre que nos encontremos con una rigurosa muestra aleatoria simple, lo que en
muchos casos es irrealizable (problema de la practicabilidad del muestreo).

Tambin es importante advertir que la lgica estadstica es una lgica monovariada,


pues considera las variables una por una, aisladamente; sin embargo, el investigador
social difcilmente se contenta con datos simples, pues suele encontrarse ms
interesado en saber cmo correlacionan las variables entre s. Ello nos lleva al
problema de que al disminuir el tamao de la muestra aumenta el error de muestreo.
Veamos por qu.

En un anlisis univariado, saber que N = 50.000, n = 420 y p = 25,7 % de catlicos


practicantes en n, nos lleva a que para z = 95 % e = 4,2 %, lo que nos permite afirmar
que con un probabilidad del 95 % el porcentaje de catlicos practicantes es del 25,7
4,2 % para N. Sin embargo, quizs el investigador social desee relacionar la prctica
religiosa con la educacin (anlisis bivariado). Entonces, si N = 50.000, n = 265 personas
con educacin superior y p = 22,6 % de catlicos practicantes en n, nos lleva a que
para z = 95 % e = 5 %, lo que nos permite afirmar que con una probabilidad del 95 % el
porcentaje de catlicos practicantes con un nivel acadmico alto es del 22,6 5 %
para N. Como se observa, el error de muestreo ha aumentado al reducirse la muestra.
Si deseamos ir introduciendo sucesivas variables (prctica religiosa, estudios y edad), el
error de muestreo ir aumentando a medida que se va fraccionando la muestra). Por
tanto, el tamao de la muestra deber ser ms grande cuanto ms minoritario sea el
fenmeno que se desee estudiar.

Un ejemplo de ello son los estudios de movilidad social. Si se desea relacionar la


profesin de los entrevistados con la de sus padres, diferenciando el anlisis para
hombres y mujeres, y a su vez diferenciando las dos generaciones, tenemos que:
considerando 7 tipos de ocupacin se fracciona la muestra en una tabla de 7 x 7 = 49
celdas, que al dividirlas en dos para ambos gneros se convierte en una tabla de 98
celdas, y que al subdividirlas por dos para las dos generaciones se convierte en una
tabla de 196 celdas. En este caso, una muestra de 1.960 casos parecera suficiente (10
casos por celda), pero es indudable que obtendramos muchas celdas a cero para las
profesiones menos comunes; por tanto, en este caso necesitaramos una muestra
mucho mayor para dar fiabilidad al estudio, buscando que todas las celdas contasen
con una representacin suficiente.

4. MUESTRAS PROBABILSTICAS

Se denomina muestra probabilstica ( aleatoria) a aquella en la que cada unidad que


la compone se extrae con una probabilidad conocida y distinta de cero. As, la
muestra del Literary Digest no era probabilstica, pues quienes no disponan de
telfono o de coche tenan una probabilidad cero de ser elegidos para participar en
ella. Pero, cmo se elige la muestra? Existen los siguientes modelos de tipo
probabilstico:
a) Muestreo aleatorio simple

Existe muestreo aleatorio simple cuando todas las unidades de la poblacin


tienen la misma probabilidad de ser incluidas en la muestra, siendo elegidas de
forma aleatoria (p. e., asignndoles un nmero y extrayendo los de la muestra
por sorteo). Obviamente, este modelo obliga a que los investigadores dispongan
de una lista completa de todos los miembros de la poblacin. Su ventaja es su
aparente sencillez; sus inconvenientes son (1) que la seleccin se encomienda
completamente a la casualidad sin incorporar las informaciones conocidas de la
poblacin, (2) que suele suponer un plan de investigacin caro y de difcil
realizacin para acceder a todos los elementos de la muestra seleccionada, y
(3) que con frecuencia no se dispone de la lista completa de las unidades de la
poblacin.

b) Muestreo sistemtico

Este modelo difiere del anterior slo en la tcnica de extraccin, pues los casos
de la muestra no se eligen por sorteo, sino uno cada k (intervalo de muestreo).
Existen dos posibilidades: (1) si se conoce N, entonces k = N/n, comenzando la
eleccin por un nmero elegido al azar entre 1 y k; en este caso, se deben vigilar
las periodicidades coincidentes en la poblacin, a fin de evitar que la muestra
rena unidades de anlisis con las mismas caractersticas. (2) Si no se conoce N,
entonces el investigador debe elegir un k lo ms aproximado posible: entrevistar
a un elector de cada k que salen del colegio electoral o de cada k
compradores que salen de un supermercado. La ventaja de este modelo es que
permite obtener muestras aleatorias incluso cuando no se dispone de lista de
miembros de la poblacin.

c) Muestreo estratificado

Si el fenmeno estudiado presenta una variabilidad elevada (poblacin


heterognea), para mantener un grado determinado de precisin en las
estimaciones es necesario aumentar el tamao de la muestra. Como alternativa,
si dicho fenmeno presenta reas de homogeneidad en la poblacin es posible
aumentar la eficiencia de la muestra (mayor precisin a igualdad de tamao)
recurriendo al muestreo estratificado. Este modelo consiste en: (1) subdividir la
poblacin en subpoblaciones (estratos) lo ms homogneos posible empleando
una variable correlacionada con el fenmeno estudiado; (2) extraer una
muestra de cada estrato por muestreo aleatorio simple; y (3) unir las muestras de
los estratos para obtener la muestra total.

As, si deseamos estudiar la renta en una poblacin heterognea, lo cual


requerira una muestra muy amplia, podemos emplear el muestreo estratificado:
(1) subdividir la poblacin en cuatro estratos homogneos en funcin del
empleo, que es una variable relacionada con la renta: obreros, empleados,
autnomos y profesionales liberales; (2) extraer una muestra simplificada simple; y
(3) unir las cuatro muestras parciales en la muestra total, que siempre ser mucho
menor que la muestra requerida para el estudio en base a la poblacin total.

Hablamos de muestreo estratificado proporcional (o autoponderado) si el


tamao de las muestras de los estratos reproduce su composicin en la
poblacin. En el ejemplo anterior, si n = 1.000 y los empleos suponen el 40, el 40,
el 15 y el 5 % de la poblacin, las muestras de los estratos deberan ser 400, 400,
150 y 50 individuos. En caso contrario, se tratar de un muestreo estratificado no
proporcional, lo que supondr sobrerrepresentar unos estratos y subrepresentar
otros, obligando a realizar una operacin de ponderacin durante el anlisis de
los datos. Entre los distintos tipos de muestreo estratificado no proporcional el
ms eficiente es el muestreo estratificado ptimo, que consiste en que el tamao
de la muestra de cada estrato resulte proporcional a la variabilidad del
fenmeno estudiado dentro de ese estrato.

d) Muestreo a estadios mltiples

En este modelo se subdivide la poblacin en varios niveles ordenados


jerrquicamente, que se extraen sucesivamente por un procedimiento de
embudo aplicando el muestreo aleatorio simple. As, para seleccionar una
muestra de profesores de primaria a nivel nacional se pueden disear dos
niveles: las circunscripciones didcticas y los profesores; en primer lugar se
selecciona una muestra de circunscripciones, y a continuacin se elige una
muestra de profesores en las seleccionadas. Por tanto, este modelo consiste en
sucesivas aplicaciones de muestreo aleatorio simple en cada uno de los niveles,
y resulta muy til cuando las unidades de anlisis se encuentran excesivamente
dispersas en un territorio muy amplio. Entre sus ventajas se encuentra (1) la
simplificacin del procedimiento de extraccin, (2) la disminucin de los costes
de la investigacin, y (3) que no es necesario disponer de la lista de toda la
poblacin, sino slo de los unidades de orden superior extradas; entre las
desventajas se encuentra (1) el hecho de que las unidades pertenecientes a una
misma unidad de orden superior tienden a parecerse, y (2) que la tcnica
estadstica ligada a este modelo es bastante compleja.
e) Muestreo por conglomerados

Este modelo es bsicamente similar al anterior, pues se emplea cuando la


poblacin se subdivide de forma natural en grupos de unidades
(conglomerados) y en lugar de seleccionar a los individuos se seleccionan dichos
conglomerados. As, si deseamos estudiar a los hinchas de un club de ftbol,
podemos tomar como poblacin de referencia a todos los hinchas que viajan en
un tren para seguir un partido, seleccionar con muestreo sistemtico un par de
vagones, y a continuacin un par de compartimentos en cada vagn, pasando
a entrevistar a los hinchas de los compartimentos seleccionados. Este modelo es
muy til cuando se desconoce la lista completa de la poblacin a estudio, y es
el modelo empleado por el INE para la Encuesta de Poblacin Activa (EPA), pues
selecciona una muestra de 3.484 secciones censales de toda Espaa ( 32.000),
de las cuales selecciona una muestra de entre 18-22 familias, cuyos
componentes sern los entrevistados.

f) Muestreo por reas

El muestreo a estadios mltiples slo es aplicable si se dispone de la lista


completa de la poblacin. En caso contrario, se suele aplicar el muestreo por
reas, que consiste en subdividir el territorio donde se ubica la poblacin de
referencia en reas sucesivamente ms pequeas. As, el Survey Research
Center (Universidad de Michigan) divide EEUU en (1) reas primarias (comarcas,
grandes reas metropolitanas), (2) localizaciones (grandes ciudades o reas
rurales), (3) divisiones (ciudades pequeas, barrios, reas rurales delimitadas) y
(4) sectores (reas urbanas, pequeas zonas rurales), cada una de las cuales
cuenta entre 4-16 unidades familiares, entre las que se eligen las que realizar las
entrevistas. En general, las elecciones sucesivas se realizan mediante muestreo
aleatorio simple, y una de las ventajas de este modelo es que ofrece ms
posibilidades de tener en cuenta a inmigrantes ilegales, personas no censadas,
residentes temporales

5. MUESTRAS NO PROBABILSTICAS

Recordemos que una muestra probabilstica se define porque cada unidad de la


poblacin tiene una probabilidad de seleccin conocida y distinta de cero y el
proceso de seleccin es aleatorio. Se denomina muestra no probabilstica a aquella
que no rene las condiciones de una muestra probabilstica. Entre sus modelos se
encuentran:

a) Muestreo por cuotas

Bsicamente, este modelo es idntico al muestreo estratificado, salvo en que


ahora el entrevistador es libre de elegir a los sujetos a entrevistar. Consiste en: (1)
subdividir la poblacin de referencia en estratos definidos por algunas variables
de distribucin conocida (gnero, edad, estudios); (2) calcular el peso
proporcional de cada estrato en la poblacin, es decir, la cuota de la poblacin
total que pertenece a cada estrato; (3) multiplicar el peso de cada estrato por el
tamao de la muestra (n), a fin de obtener el nmero de entrevistas a realizar
para cada estrato.

Este modelo es el ms difundido en sondeos de opinin y estudios de mercado.


Su mayor ventaja es el ahorro econmico; su limitacin ms criticada es que el
entrevistador suele seguir criterios de seleccin utilitaristas, distorsionando la
muestra a favor de los individuos ms fcilmente localizables, incluso entre su
propio crculo de amistades. Por ello, se suelen poner restricciones a la libertad
de los entrevistadores, fijndoles un recorrido territorial preestablecido en el que
conseguir sus entrevistas.

b) Muestreo de bola de nieve

Este modelo consiste en partir de un pequeo nmero de individuos que


presentan los requisitos exigidos, e identificar al resto de los sujetos de la muestra
a partir de stos, que son utilizados como informadores para identificarlos. Este
modelo es til para el estudio de elementos raros, grupos poco numerosos y
dispersos en el territorio, y especialmente de las poblaciones clandestinas, grupos
sociales cuyos miembros, por motivos morales, legales, ideolgicos o polticos,
tienden a ocultar su identidad: inmigrantes ilegales, miembros de sectas,
evasores fiscales, drogadictos, delincuentes Entre sus limitaciones est que
suele acabar seleccionando a las personas ms activas y ms visibles, incluso en
mbitos tan restringidos.

c) Modelo subjetivo por decisin razonada


En este modelo el proceso de seleccin no recurre a la seleccin casual, sino a
consideraciones racionales, en funcin de las caractersticas de las unidades de
la muestra. Por tanto, este modelo no ofrece las garantas de una muestra
probabilstica, ni las ventajas de la sencillez de ejecucin del muestreo por
cuotas, pero es muy til en el caso de muestras muy pequeas, sobre todo
cuando las unidades de anlisis no son individuos, sino instituciones, municipios u
organismos, y especialmente en aquellos casos en los que la importancia de
algunas unidades exige su inclusin en la muestra para que las informaciones
recogidas sean completas. Un ejemplo sera un estudio sobre los barrios de una
ciudad, en cuya muestra sera conveniente incluir el mismo nmero de barrios
cntricos que perifricos, de barrios obreros que de burgueses, de muy poblados
que de poco poblados

Una variante de este modelo es el muestreo compensado o equilibrado, que


consiste en seleccionar las unidades de forma que su media en determinadas
variables est prxima a la media de la poblacin. En el ejemplo anterior, si la
media de la poblacin est en 45 aos de edad, se tratara de elegir barrios que,
entre otras consideraciones, su media de edad se encuentre en 45 3 aos de
edad.

6. PROBLEMAS DE MUESTREO EN LA INVESTIGACIN SOCIAL

La aplicacin ms comn de las tcnicas de muestreo es en la encuesta por muestreo,


donde recurrir a una muestra de una poblacin es una exigencia ineludible. Sin
embargo, su asiduidad no evita que la aplicacin sobre individuos sea una de las que
cuenta con ms dificultades, especialmente debido al error de seleccin, que cuenta
con tres componentes: el error de muestreo, el error de cobertura y el error de no
respuesta:

a) Error de muestreo. Realizar la investigacin sobre una muestra conlleva un error


que con otra muestra podra ser distinto.

b) Error de cobertura. Como sabemos, para obtener una muestra probabilstica


debemos poder asignar a todas las unidades de la poblacin una probabilidad
conocida de ser extradas, lo que exige disponer de la lista completa de las
unidades de dicha poblacin. El error de cobertura se plantea cuando la lista de
la poblacin que poseen los investigadores es incompleta, dejando fuera a una
parte de sus miembros. En general, no suelen existir grandes problemas cuando
el objeto de estudio lo constituye un colectivo (escuelas, universidades,
empresas, hospitales) o la poblacin total (censo nacional, censos municipales,
listas electorales), pero no es as cuando se quiere indagar sobre franjas
particulares de la poblacin (inmigrantes, catlicos practicantes, delincuentes,
drogadictos); incluso no es suficiente que las listas existan, pues hay que tener
en cuenta los problemas de la actualizacin, de las duplicaciones y de las
omisiones. Por todo ello, en todos los casos en que no existe una lista de la
poblacin hay que renunciar a tcnicas de muestreo probabilstico. En estos
casos, el investigador tiene ante s tres opciones:

a. Redefinir a la poblacin. Por ejemplo, decir que la investigacin no se


realiza sobre los comerciantes, sino slo sobre los comerciantes inscritos
en las asociaciones de comerciantes, hacindolo constar en el anlisis.

b. Obviar a los excluidos. El problema de las omisiones no es el de las


ausencias en s, sino el hecho de que quienes estn en la lista no sean
una muestra aleatoria de la poblacin total; es decir, que quienes estn
en las listas posean cualidades distintas a los ausentes. Por ello, cuando
se tiene constancia de que las omisiones no son muchas (10-15 %) y que
sus cualidades no son distintas a las de quienes estn en las listas, el error
puede considerarse un error tolerado y obviar a los excluidos.

c. Proceder a una integracin de la muestra. Por ejemplo, en un pas en el


que el 20 % de la poblacin no tiene telfono se podra extraer una
muestra de las listas telefnicas que conformara el 80 % de la muestra, y
el restante 20 % de personas que no poseen telfono, seleccionndolas
de la poblacin mediante otras tcnicas de muestreo.

c) Error de no respuesta. Aunque una muestra probabilstica est correctamente


diseada, puede ocurrir que al trmino de la recogida de datos haya dejado de
serlo a causa del error de no-respuesta, consistente en no conseguir las
respuestas de algunos de los individuos de la muestra seleccionada. Ello se
puede producir por dos causas bsicas: (a) por la falta de contacto con los
sujetos extrados, bien sea por dificultades para llegar hasta ellos, bien por su no
localizacin; o (b) por rechazo de los sujetos a contestar. La primera causa es
fundamentalmente un problema de costes, y se puede subsanar mediante
diseos de muestreo alternativos o destinando ms recursos en la fase de
localizacin. Sin embargo, los rechazos suponen un problema ms grave, pues
quienes se niegan a contestar suelen ser distintos a quienes contestan: ancianos,
mujeres, personas que viven solas, analfabetos, personas muy ocupadas
Adems, la motivacin para contestar es distinta en funcin de las
caractersticas del entrevistado; as, a la pregunta de si se est inscrito en un
partido poltico suele mostrarse ms reticente el inscrito que el no inscrito, el del
partido de la oposicin que el del gobernante, el obrero que el profesional
liberal

La gravedad del problema se observa en la tasa de no-respuestas: el 25 % en


entrevistas cara-a-cara y ms del 30 % en las telefnicas. Aunque la
contrariedad se resuelve en la prctica reemplazando a aquellos a los que no se
ha conseguido entrevistar con nombres en la reserva, resulta obvio que ello no
anula la posible distorsin de la muestra en el sentido de infrarrepresentar ciertos
grupos (ancianos, no instruidos). Entre los recursos del investigador para evitarlo
se encuentran el incremento de los costes de la investigacin a travs de reiterar
los intentos de llegar hasta las personas no localizadas, o recurrir a las tcnicas
de ponderacin, atribuyendo a las personas no entrevistadas las respuestas
medias dadas por el grupo social al que pertenecen (captulo siguiente).

7. PONDERACIN

La ponderacin se define como el procedimiento con el que se modifica


artificialmente la composicin de la muestra para hacerla ms prxima a la
distribucin real de la poblacin, lo que se realiza atribuyendo un peso distinto a
cada caso de la muestra segn sus caractersticas.

Este procedimiento ha sido criticado, pues no deja de ser una manipulacin de los
datos; sin embargo, y a pesar de su componente de arbitrariedad, resulta obvio que
toda muestra conlleva un error de distorsin cierto que la ponderacin contribuye a
corregir, aunque nunca de forma definitiva y completa. Los tres procedimientos de
ponderacin ms habituales son:

a) Ponderacin en funcin de las probabilidades de inclusin de los sujetos en la


muestra. Son aquellos casos en que la probabilidad de inclusin no es igual para
todos los sujetos de la poblacin, pero es conocida, y en base a ello se calculan
los pesos de ponderacin de cada elemento. Pueden darse dos casos:

a. La muestra aparece sobre/infrarrepresentada. Un ejemplo sera un estudio


sobre la estructura familiar. Al no existir un censo de familias, se tratara de
extraer una muestra de individuos del censo y estudiar sus familias; sin
embargo, resultaran sobrerrepresentadas las familias numerosas. En ese
caso, habra que ponderar los datos aportados por cada individuo de un
modo inversamente proporcional al nmero de sus componentes.

b. La muestra se sobrerrepresenta intencionadamente. En ocasiones se puede


sobrerrepresentar intencionadamente a un colectivo, a fin de contar con
un nmero suficiente de sus miembros para estudiarlo adecuadamente; ello
obliga a ponderar sus datos al relacionarlos con el resto de la muestra. Un
ejemplo sera un estudio sobre profesiones; en la poblacin las mujeres
empresarias son el 2,5 %, pero, dado que ese porcentaje resultara mnimo
en una muestra normal, las podemos sobrerrepresentar al 5 % de la muestra
para poder realizar estudios sobre ellas, siempre y cuando ponderemos
adecuadamente sus datos al relacionarlos con los de otras profesiones.

b) Ponderacin en funcin de los conocimientos que se tienen de la poblacin. Este


ponderacin se aplica para contrarrestar el error de cobertura, y consiste en
realizar una posestratificacin de la muestra una vez finalizada la fase de
recogida de datos, en funcin de la distribucin conocida de las variables en la
poblacin. La operacin se efecta multiplicando cada caso de la muestra por
un coeficiente de ponderacin (peso) igual a la relacin proporcin verdadera
(poblacin)-proporcin observada (muestra). As, si en una poblacin hay un 48
% de varones y un 52 % de mujeres, y en la muestra observamos un 51 % y un 49
%, deberemos multiplicar cada varn por su peso (48/51=0,94) y cada mujer por
el suyo (51/49=1,04). El nmero de la muestra se mantiene, ponderndose la
proporcin de los casos, y el cambio proporcional interviene en todas las
elaboraciones de los datos (frecuencias, medias, correlaciones...).

c) Ponderacin en funcin del conocimiento de las caractersticas de los que no


contestan. Este modelo de ponderacin se aplica para contrarrestar el error de
no-respuesta, y consiste en atribuir a los que no contestan el comportamiento
medio de las personas pertenecientes a su mismo grupo social. As, en una
encuesta electoral tomada a la salida de los colegios electorales se puede
detectar que el 9 % son mujeres ancianas, pero que de stas el 4 % ha rehusado
contestar; por tanto, se opta por atribuir a los datos de las que s han contestado
un coeficiente de ponderacin (peso) igual al inverso de la tasa de respuesta de
su categora, es decir, 9/5 = 1,8. Es decir, que se sobrerrepresenta a quienes s
han contestado para cubrir a quienes han rehusado.

8. REPRESENTATIVIDAD Y AMPLITUD DE LA MUESTRA

La calidad de una muestra viene de la mano de dos factores: su representatividad y su


amplitud, ambos relacionados entre s. Por un lado, la representatividad de una
muestra es lo opuesto al error de seleccin (errores de muestreo, cobertura y no-
respuesta), y depende en gran medida de su tamao: una muestra de 10 elementos
puede ser perfectamente aleatoria, pero carecer de representatividad. Por otro lado,
la amplitud por s sola no es garanta de calidad, pues una muestra puede ser grande y
carecer de representatividad, debido a la existencia de errores de seleccin.
Aunque es prcticamente imposible evitar por completo los errores de cobertura y no-
respuesta, el investigador puede minimizarlos acercando lo ms posible su
procedimiento de muestreo al modelo de muestreo probabilstico. Sin embargo, los
dos objetivos de reduccin del error muestral y de las distorsiones (cobertura y no-
respuesta) pueden entrar en conflicto, hacindose necesario alcanzar un equilibrio
entre ambos. En general, la ausencia de distorsin es ms relevante que el error
muestral: conviene ms entrevistar a 300 profesores elegidos aleatoriamente de la lista
completa proporcionada por las autoridades educativas, que a 1.000 localizados a
travs de amigos y cuestionarios autocumplimentados en salas de profesores
(autoseleccin). La eleccin impropia de los sujetos comporta una distorsin de la
muestra que est fuera del control del investigador y que puede influir de modo
determinante en los resultados.

Por ltimo, es importante sealar que la estructura de una muestra depende, de forma
decisiva, del objetivo del estudio. As, por un lado se habla de:

a) Estudios descriptivos. Su objetivo es la descripcin ms exacta posible de la


distribucin de cada una de las variables del estudio, lo que obliga a que la
muestra est lo ms libre posible de distorsiones. Un ejemplo es un sondeo
electoral, donde lo ms importante es diagnosticar la previsin porcentual de
votos a cada partido; obviamente, un error de unos pocos puntos porcentuales
puede alterar significativamente la asignacin de escaos y la distribucin del
poder poltico.

b) Estudios explicativos. Su objetivo es el anlisis de las relaciones entre variables. En


este caso lo ms importante es disponer de un gran nmero de casos para poder
fraccionar la muestra lo ms posible. Un sondeo electoral tambin puede ser un
ejemplo de estudio explicativo, si su objetivo es estudiar la relacin entre edad,
gnero, ocupacin y voto; en este caso, se precisa una muestra bastante
grande para poder fraccionarla hasta el punto de poder estudiar qu votan los
jvenes-varones-obreros-no religiosos (vase Captulo 8.3 sobre el tamao de la
muestra).

Anda mungkin juga menyukai