Muestras Complejas
1. Introduccion
En este documento, describiremos la aplicacion del programa estadstico SPSS
en el ambito del muestreo en poblaciones finitas, en su doble vertiente de disenar y
analizar encuestas por muestreo.
Como es sabido, este potente programa estadstico contiene numerosas herramien-
tas para el procesamiento estadstico de datos, tanto desde el puro analisis descriptivo,
a las tecnicas mas avanzadas de la inferencia estadstica y el analisis multivariante.
Recientemente, desde la version 13, este programa ha sido ampliado con la posibilidad
de construir y analizar muestras complejas, terminologa que ya aclararemos con
todo lujo de detalles, pero que ahora, de forma anticipada podemos decir que significa
que ya podemos emplear el SPSS de forma especfica en relacion a las tecnicas usuales
del muestreo en poblaciones finitas, es decir, obtener muestras y analizarlas.
En concreto, el modulo que realiza estas tareas especficas se denomina muestras
complejas, lo que es una traduccion de la terminologa inglesa complex samples,
es decir, muestras complejas. Para justificar esta denominacion y tambien a modo de
introduccion [recordatorio para algunos] a los conceptos de la Teora del Muestreo
en Poblaciones Finitas que se van a manejar en relacion a este programa, vamos
a ver a continuacion una descripcion generica, empleando ejemplos conectados con
la realidad, de los disenos muestrales complejos. Aconsejamos dedicar la maxima
atencion a las probabilidades de inclusion, pues a partir de ellas se derivara el
concepto de peso, que como veremos es fundamental para la aplicacion de este potente
software.
Muestreo de Bernoulli.
Y un largo etcetera.
Notese tambien que una vez construida la muestra de conglomerados, estos se estu-
dian AL COMPLETO, por ello, este proceso se denomina MUESTREO POR CONGLO-
MERADOS EN UNA ETAPA, por que solo hay una etapa o fase de muestreo, la de los
conglomerados.
Ademas, a todo esto, hay que anadirle las multiples posibilidades que hay al
realizar los muestreos basicos, en los que podemos emplear Muestreo Aleatorio Simple,
Muestreo Sistematico Uniforme, Muestreo PS en sus variadas formas, y un largo
etcetera. La cosa entonces se nos presenta como muy complicada e inabordable pero
que no cunda el panico.
En cualquiera de estas situaciones, sea cual sea la combinacion de procedimientos,
al final tenemos como resultante UN DISENO MUESTRAL que es el producto
final de la mezcla de todos los disenos muestrales que intervienen. Un diseno muestral
de este tipo se denomina diseno muestral complejo. Las muestras obtenidas con
tales disenos se pueden por ello denominar muestras complejas. El modulo de SPSS
denominado precisamente Muestras Complejas nos permite,
siendo,
1
i = i m
i
es decir, al final siempre nos encontramos con una combinacion lineal de los valores
yi multiplicados por unas cantidades, i que son los pesos o ponderaciones. Este
concepto debe pues estar meridianamente claro.
Si lo que queremos estimar es la media poblacional de la variable, es decir, el
parametro Y , podemos emplear nuevamente el estimador de Horvitz-Thompson,
1 X yi
Yb HT =
N im i
o tambien el estimador de Hajek,
X
yi /i
im
Y HJ = X
b
1/i
im
muestral complejo.
Con la opcion Archivo - Nuevo - Datos podemos abrir un editor de datos
en blanco. A este modulo se accede a partir de la opcion general Analizar, y a con-
tinuacion, la subopcion Muestras Complejas. Seguidamente describimos con algunos
ejemplos el funcionamiento de este modulo. Para un estudio mas profundo recomen-
damos la lectura de los manuales tecnicos y de los documentos donde se describen los
algoritmos y expresiones matematicas implementadas.
Esta opcion se encuentra dentro del menu Transformar y permite construir una
variable calculando sus valores. Es una opcion es muy potente y contiene posibilidades
de todo tipo. As, se pueden construir nuevas variables a partir de una formula ma-
tematica en la que pueden intervenir todo tipo de operaciones y funciones, y tambien
otras variables. Tambien posee funciones logicas mediante las cuales, por ejemplo, se
pueden calcular pesos distintos para elementos que estuvieran en estratos distintos o
conglomerados distintos.
Ahora nos contentaremos con describirla en su forma mas simple, aplicada a nues-
tro actual ejemplo. Supongamos que queremos construir la variable PESO. Partimos
de los datos sin esta variable. Accedemos a la opcion Transformar, y dentro de ella, la
sub-opcion Calcular. Aparece una ventana como la que se muestra a continuacion en
la cual, en la miniventana Variable de Destino introducimos el nombre de la varia-
ble que estamos calculando, y en la ventana Expresion Numerica introducimos la
expresion correspondiente, es decir. Pulsando Aceptar se calculara la variable PESO
de forma automatica.
Sea cual sea la forma de construir la variable PESO, suponemos que ya disponemos
de esta variable, que como hemos dicho antes es imprescindible para realizar el analisis.
Como vemos, hay dos posibilidades, Crear para el caso de que queramos construir
un archivo de este tipo, caso que se dara usualmente cuando sea la primera vez que
realicemos un analisis, o Editar cuando ya tenemos un Archivo de Plan anterior, y
queramos modifica alguna especificacion del mismo. En el ejemplo que nos ocupa,
como no tenemos aun ningun fichero de este tipo, crearemos uno con el nombre
plan prensa.
Recomendamos especificar un directorio de trabajo propio y especfico, el lugar
del generico que emplea SPSS por defecto, en el cual colocaremos nuestros archivos
de datos, archivos de planes y archivos de resultados. El programa SPSS ya se encar-
gara de anadir la extension csaplan con lo que el fichero se grabara con el nombre
final plan prensa.csaplan.
IMPORTANTE: Si introducimos directamente el nombre del plan de analisis en la
ventanita, sin usar la opcion Examinar, es obligatorio escribir la extension .CSA-
PLAN, pues en caso contrario el SPSS grabara el fichero de plan sin extension alguna,
lo que puede ocasionar dificultades y problemas posteriores.
Seguidamente, iremos avanzando para introducir informacion sobre conglomera-
dos, estratos y pesos. Notemos que el Fichero de Plan de Analisis contiene la infor-
macion sobre las estructuras poblacionales que han intervenido en el muestreo, ya
sean estratos y/o conglomerados, sobre los tipos de muestreos empleados, sobre los
tamanos poblacionales o de estratos y conglomerados, y sobre las probabilidades de
inclusion, que aparecen implcitamente en la variable o variables de peso.
Pero no contiene informacion sobre las variables de estudio que se van a analizar,
en nuestro caso SEXO, LECTOR, etc., que ya se consideraran cuando vayan a ser
analizadas. Por ejemplo, la variable SEXO podra ser empleada para estratificar, y en
tal caso SI tendra que constar en el Archivo de Plan. Este no es el caso en nuestro
ejemplo por lo que dicha variable NO aparece en plan de analisis , aunque s puede
ser considerada durante el analisis para desagregar las estimaciones por sexos.
Una vez elaborado y grabado en un fichero el plan, podemos realizar las estima-
ciones.
Por ejemplo, si queremos estimar proporciones (porcentajes en SPSS), seleccio-
naremos la opcion Frecuencias. Se nos pedira una serie de informaciones sobre las
variables que queramos procesar, por ejemplo, PERIODICO. Opcionalmente podre-
mos considerar subpoblaciones, por ejemplo si queremos las proporciones, ademas de
para toda la poblacion, desagregadas por ejemplo por sexos.
Con Opciones podremos decidir si queremos los porcentajes, los totales o ambas
cosas. Si queremos el error estimado (desviacion tpica estimada), intervalos de con-
fianza, etc.
Mencionemos que tambien podemos calcular el efecto del diseno, es decir, el cocien-
te entre la varianza (estimada) que se obtiene empleando las estructuras de estratos,
conglomerados, y metodos de muestreo distintos del Aleatorio Simple, y la que se
obtendra con Muestreo Aleatorio Simple.
El resto es similar. Una vez creado el archivo de plan, podemos realizar las esti-
maciones. Por ejemplo, si queremos estimar las proporciones de lectores de distintos
periodicos, en el apartados Muestras Complejas seleccionaremos Frecuencias e intro-
duciremos la variable periodico. Estimaremos tambien desagregando por sexos. En la
Figura 12. se exponen los resultados obtenidos.
[2] Fernandez Garca, F.R. y Mayor Gallego, J.A. (1995b). Ejercicios y practicas de
muestreo en poblaciones finitas. E.U.B. Ediciones Universitarias de Barcelona.
[3] SPSS. Complex Samples Version 13.0. Fichero suministrado por el profesor.