Anda di halaman 1dari 29

Curso de SPSS: Modulo de

Muestras Complejas

I.E.A. Curso de SPSS


Mayo de 2009

Jose A. Mayor Gallego


Departamento de Estadstica e Investigacion Operativa
Universidad de Sevilla
Indice
1. Introduccion 1

2. Disenos muestrales complejos y muestras complejas 1

3. Estimacion de parametros. Ponderaciones 6

4. Calculo de los pesos 7


4.1. Muestreo Aleatorio Simple Basico . . . . . . . . . . . . . . . . . . . . 7
4.2. Muestreo con Probabilidades Variables Basico . . . . . . . . . . . . . 7
4.3. Muestreo Aleatorio Simple Estratificado . . . . . . . . . . . . . . . . 8
4.4. Muestreo por Conglomerados en Una Etapa. Seleccion de Conglome-
rados mediante Muestreo Aleatorio Simple . . . . . . . . . . . . . . . 8
4.5. Muestreo por Conglomerados en Dos Etapa. Seleccion de conglomera-
dos y de elementos mediante Muestreo Aleatorio Simple . . . . . . . . 8
4.6. Muestreo por Conglomerados en Dos Etapa. Seleccion de conglomera-
dos con Probabilidades Variables, y de elementos mediante Muestreo
Aleatorio Simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

5. Introduccion basica al programa SPSS 9


5.1. Editor de Datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
5.2. Manejo de archivos. Importacion y exportacion . . . . . . . . . . . . 10
5.3. Calculo sobre variables . . . . . . . . . . . . . . . . . . . . . . . . . . 10
5.4. Visor de resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
5.5. Aplicacion del programa SPSS al diseno y analisis de muestras . . . . 10

6. Seleccionar una muestra. Plan de Muestreo 11

7. Analizar una muestra 12


7.1. Estimacion de parametros a partir de una Muestra Aleatoria Simple.
DATOS LEC PRENSA 1 . . . . . . . . . . . . . . . . . . . . . . . . 12
7.1.1. La opcion Calcular . . . . . . . . . . . . . . . . . . . . . . . . 14
7.1.2. Analisis de los datos muestrales: Plan de analisis . . . . . . . . 15
7.1.3. Analisis de los datos muestrales: Estimaciones . . . . . . . . . 23
7.2. Estimacion de parametros a partir de Muestreo Aleatorio Simple Es-
tratificado. DATOS LEC PRENSA EST . . . . . . . . . . . . . . . . 24
SPSS Muestras Complejas 1

1. Introduccion
En este documento, describiremos la aplicacion del programa estadstico SPSS
en el ambito del muestreo en poblaciones finitas, en su doble vertiente de disenar y
analizar encuestas por muestreo.
Como es sabido, este potente programa estadstico contiene numerosas herramien-
tas para el procesamiento estadstico de datos, tanto desde el puro analisis descriptivo,
a las tecnicas mas avanzadas de la inferencia estadstica y el analisis multivariante.
Recientemente, desde la version 13, este programa ha sido ampliado con la posibilidad
de construir y analizar muestras complejas, terminologa que ya aclararemos con
todo lujo de detalles, pero que ahora, de forma anticipada podemos decir que significa
que ya podemos emplear el SPSS de forma especfica en relacion a las tecnicas usuales
del muestreo en poblaciones finitas, es decir, obtener muestras y analizarlas.
En concreto, el modulo que realiza estas tareas especficas se denomina muestras
complejas, lo que es una traduccion de la terminologa inglesa complex samples,
es decir, muestras complejas. Para justificar esta denominacion y tambien a modo de
introduccion [recordatorio para algunos] a los conceptos de la Teora del Muestreo
en Poblaciones Finitas que se van a manejar en relacion a este programa, vamos
a ver a continuacion una descripcion generica, empleando ejemplos conectados con
la realidad, de los disenos muestrales complejos. Aconsejamos dedicar la maxima
atencion a las probabilidades de inclusion, pues a partir de ellas se derivara el
concepto de peso, que como veremos es fundamental para la aplicacion de este potente
software.

2. Disenos muestrales complejos y muestras com-


plejas
En el ambito de la teora del muestreo en poblaciones finitas, denominamos generi-
camente DISENO COMPLEJO o DISENO MUESTRAL COMPLEJO a un diseno
muestral [para entendernos, un procedimiento para seleccionar una muestra a partir
de una poblacion] en el cual intervienen distintas estructuras poblacionales, ya sean
naturales, de tipo administrativo, etc. Ya sabemos que, en su aspecto mas basico, el
proceso de muestreo y estimacion comienza seleccionando de una poblacion, U , un
conjunto de elementos que determinan una muestra m. Esta seleccion es aleatoria y
se puede hacer de muchas formas,

Muestreo Aleatorio Simple.

Muestreo de Bernoulli.

Muestreo Sistematico Uniforme.

Muestreos con Probabilidades Variables: Sampford, Madow, etc.

Jose A. Mayor Gallego. Universidad de Sevilla


SPSS Muestras Complejas 2

Y un largo etcetera.

En la referencias 1 y 2, el lector podra encontrar informacion pormenorizada sobre


estos procedimientos.
En su forma mas simple, y para que los estudiantes primerizos lo vayan enten-
diendo, los muestreos se estudian como si la muestra se extrajera directamente de
la poblacion, es decir, como si la poblacion U fuera un marco directamente acce-
sible, y los elementos de la muestra se seleccionaran de dicho marco mediante un
procedimiento que se aplica directamente sobre este.
Esto que puede ser factible en algunas ocasiones, y de hecho se hace a veces,
es problematico, difcil o imposible en muchas otras. Veamos dos situaciones para-
digmaticas.

1. Los elementos de la poblacion presentan mucha variabilidad en relacion a la


caracterstica que se estudia, lo que produce que las estimaciones presente mucho
error de muestreo. Una forma de disminuir este error es dividir la poblacion en
partes mas homogeneas y realizar muestreos en todas y cada una de estas partes.
Las muestras obtenidas se unen o juntan para producir una unica muestra
final, m. Como puede verse, aqu los elementos no se seleccionan directamente,
mediante un muestreo, de la poblacion original, sino que esta se estructura en
partes, y la seleccion se realiza en cada parte. Como vemos, en esta situacion lo
que se pretende en disminuir el error.

2. La poblacion, U , no es facilmente accesible por determinadas circunstancias.


Hay que decir que las cosas no son tan simples en la vida real, y que muchas
veces no se dan las circunstancias adecuadas para construir una muestra pues no
necesariamente se dispone de un marco o ambito bien definido de los elementos
de los que se quiere seleccionar aquella.
Si un encuestador es enviado a Jardines de Hercules [una urbanizacion formada
por un considerable numero de grandes torres de apartamentos, en las afueras
de Sevilla, cerca del barrio exterior de Bellavista] para hacer una encuesta a
las familias que all habitan, puede tener problemas para seleccionar la muestra
pues con seguridad no va a disponer de una lista bien elaborada de las unidades
familiares.
Una solucion sera seleccionar previamente mediante un muestreo en el conjunto
de torres, poe ejemplo tres de las mismas, y a continuacion estudiar cada una
de estas tres torres seleccionadas, ya sea mediante un analisis exhaustivo de las
tres, ya sea realizando nuevamente muestreos [seran tres] en cada una de ellas.
No cabe duda de que el problema se ha simplificado bastante. Como vemos, en
esta situacion lo que se pretende es facilitar, o incluso a veces hacer posible, el
muestreo.

Jose A. Mayor Gallego. Universidad de Sevilla


SPSS Muestras Complejas 3

A continuacion, mediante diferentes ejemplos vamos a describir varias formas de


seleccionar la muestra en situaciones reales, que a lo largo de decadas han sido ideadas
y perfeccionadas por los estudiosos e investigadores en estas materias.

EJEMPLO 1. MUESTREO ESTRATIFICADO. En una provincia geografica,


con gran actividad agrcola y dividida en siete comarcas de similar tamano, se quiere reali-
zar un estudio de la produccion de cereal mediante la seleccion de una muestra de granjas
en toda la provincia. Para ello, en cada comarca se realiza un muestreo seleccionando 10
granjas por comarca. Al final, tenemos una muestra de 70 granjas formada por la union
de las muestras obtenidas en cada comarca. Se supone que los siete muestreos basicos
son independientes.
En este caso, las unidades que se van a estudiar son las granjas de la provincia. Las
divisiones que se utilizan, es decir, las comarcas, son de tipo administrativo. Esto es un
caso tpico de MUESTREO ESTRATIFICADO y las mencionadas divisiones se denominan
ESTRATOS. El muestreo se lleva a cabo de forma que en todas y cada una de las divisiones
o estratos se realiza un muestreo.
Notese que el muestreo es complejo en el sentido de que para obtener la muestra
final se ha aplicado una estructura especial de la poblacion como son las comarcas, y el
muestreo se he realizad realmente en cada una. Al final tenemos una muestra final de 70
granjas que NO se han obtenido directamente de la poblacion provincial de granjas, sino
a traves de las comarcas.

EJEMPLO 2. MUESTREO POR CONGLOMERADOS. UNA ETAPA. En


un distrito municipal de una gran ciudad se desea realizar una encuesta entre la pobla-
cion joven de entre 16 y 25 anos, para estudiar sus habitos de lectura. Dicho distrito
esta dividido en 47 secciones censales no muy extensas.
Indiquemos que las secciones censales de un municipio son areas geograficas de tipo
administrativo delimitadas o definidas por ejemplo por ciertas calles o plazas. Estas divisio-
nes son realizadas por los servicios estadsticos de los organismos publicos para facilitar el
acceso a la informacion o poder llevar a cabo una labor administrativa racionalizada. Por
ejemplo, el Distrito Sur de Sevilla, en el cual se ubica nuestra Facultad de Matematicas,
cuenta con 82 secciones censales.
Para seleccionar la muestra de jovenes, se selecciona previamente una muestra de
cuatro secciones censales. A continuacion, esas cuatro secciones se estudian de forma
exhaustiva o completa, es decir, todos los jovenes de las mismas son entrevistados. As, si
las secciones censales de la muestra tienen respectivamente 200, 350, 120 y 250 jovenes,
la muestra final tendra 920 jovenes.
En este caso, las unidades que se van a estudiar son los jovenes del distrito, pero el
muestreo se hace inicialmente sobre las secciones, que son divisiones de tipo administra-
tivo. Esto es un caso tpico de MUESTREO POR CONGLOMERADOS. Las secciones
censales son los conglomerados. Notese la diferencia entre este ejemplo y el anterior. En
los dos ejemplo, la poblacion esta dividida en partes, pero en el anterior, se hace un
muestreo EN cada parte, mientras que ahora se hace un muestreo DE partes.

Jose A. Mayor Gallego. Universidad de Sevilla


SPSS Muestras Complejas 4

Notese tambien que una vez construida la muestra de conglomerados, estos se estu-
dian AL COMPLETO, por ello, este proceso se denomina MUESTREO POR CONGLO-
MERADOS EN UNA ETAPA, por que solo hay una etapa o fase de muestreo, la de los
conglomerados.

EJEMPLO 3. MUESTREO POR CONGLOMERADOS. DOS ETAPAS.


Es una variacion del ejemplo anterior. En un distrito municipal de una gran ciudad se
desea realizar una encuesta entre la poblacion joven de entre 16 y 25 anos, para estudiar
sus habitos de lectura. Dicho distrito esta dividido en 75 secciones censales cada una de
las cuales con un numero considerable de jovenes.
Indiquemos que las secciones censales de un municipio son areas geograficas de tipo
administrativo delimitadas o definidas por ejemplo por ciertas calles o plazas. Estas divisio-
nes son realizadas por los servicios estadsticos de los organismos publicos para facilitar el
acceso a la informacion o poder llevar a cabo una labor administrativa racionalizada. Por
ejemplo, el Distrito Sur de Sevilla, en el cual se ubica nuestra Facultad de Matematicas,
cuenta con 82 secciones censales.
Para seleccionar la muestra de jovenes, se selecciona previamente una muestra de
seis secciones censales. A continuacion, en cada una de esas seis secciones se realiza un
muestreo para seleccionar un conjunto de jovenes.
Notese que ahora el muestreo global esta compuesto de 1 + 6 = 7 muestreos distintos.
En una primera fase o etapa se obtiene la muestra de secciones, y en una segunda fase o
etapa, en cada seccion de la muestra anterior, se obtienen muestras de jovenes.
Aqu tenemos un caso tpico de lo que se denomina MUESTREO POR CONGLOME-
RADOS EN DOS ETAPAS, pues hay dos etapas o fases de muestreo, como se describe
en el parrafo anterior.

De estos ejemplos se desprende una idea importante: en la practica no nos vamos


a encontrar, usualmente, con un muestreo basico o directo de los elementos. Pero
tenemos que decir que ni siquiera nos vamos a encontrar con situaciones menos simples
como un muestreo estratificado o un muestreo por conglomerados. Muy al contrario,
lo mas usual sera tener una combinacion o mezcla de diferentes estructuras y disenos
muestrales. Por ejemplo,

Un muestreo estratificado, en el cual, en cada estrato, se realiza un muestreo


por conglomerados en dos etapas.
Un muestreo por conglomerados en dos etapas, en el cual, la segunda etapa se
realiza mediante muestreo estratificado en cada conglomerado.
Un muestreo por conglomerados en dos etapas, en el cual, la segunda etapa es
a su vez un muestreo por conglomerados en dos etapas.
Un muestreo estratificado, en el cual, en cada estrato, se realiza un muestreo
por conglomerados en dos etapas, y en el cual, a su vez, la segunda etapa se
realiza mediante muestreo estratificado en cada conglomerado.

Jose A. Mayor Gallego. Universidad de Sevilla


SPSS Muestras Complejas 5

Y un largo etcetera de muchas mas combinaciones.

Ademas, a todo esto, hay que anadirle las multiples posibilidades que hay al
realizar los muestreos basicos, en los que podemos emplear Muestreo Aleatorio Simple,
Muestreo Sistematico Uniforme, Muestreo PS en sus variadas formas, y un largo
etcetera. La cosa entonces se nos presenta como muy complicada e inabordable pero
que no cunda el panico.
En cualquiera de estas situaciones, sea cual sea la combinacion de procedimientos,
al final tenemos como resultante UN DISENO MUESTRAL que es el producto
final de la mezcla de todos los disenos muestrales que intervienen. Un diseno muestral
de este tipo se denomina diseno muestral complejo. Las muestras obtenidas con
tales disenos se pueden por ello denominar muestras complejas. El modulo de SPSS
denominado precisamente Muestras Complejas nos permite,

Construir este tipo de muestras, mediante distintas opciones de muestreo, y


suponiendo que intervienen diferentes estructuras, posiblemente combinadas:
estratos y conglomerados.

Analizar los datos muestrales para obtener estimaciones de parametros, tanto


si hemos obtenido la muestra ayudandonos con el propio SPSS como si no.

En esta condensada panoramica trataremos ambas lneas, es decir, veremos como


obtener muestras a partir de diversas especificaciones, y tambien veremos la forma de
analizar estos muestrales para obtener estimaciones de parametros.
IMPORTANTE: Es importante hacer notar que mediante SPSS podemos analizar
una muestra que haya sido disenada o construida con el propio SPSS. Pero tam-
bien podemos analizar muestras obtenidas o construidas de otra forma, siempre que
dispongamos de la informacion adecuada.
Como estrategia de estudio emplearemos la tactica de de empezar con situaciones
muy simples para ir introduciendo paulatinamente una complejidad mayor. As, aun-
que parezca trivial, empezaremos considerando la estimacion de parametros basada
en una muestra aleatoria simple, sin estratos ni conglomerados de ningun tipo.
Para ir captando la potencia de este software s nos vamos a permitir considerar
subpoblaciones, realizando estimaciones, tanto globales como en dichas subpoblacio-
nes. En todos los casos, utilizaremos ejemplos concretos, aunque no necesariamente
reales.
Queremos hacer notar que para realizar las estimaciones con un diseno complejo,
en general no son utiles las expresiones basicas vistas en los tratados usuales sobre
muestreo estratificado y muestreo por conglomerados, que han sido obtenidas en si-
tuaciones muy simplificadas. Entonces Como proceder en tales situaciones? La clave
de todo, tanto si quisieramos hacer los calculos sin ayuda de SPSS, como si vamos a
emplear este programa, es calcular la probabilidades de inclusion.

Jose A. Mayor Gallego. Universidad de Sevilla


SPSS Muestras Complejas 6

3. Estimacion de parametros. Ponderaciones


Si queremos estimar parametros a partir de un muestreo realizado con un diseno
complejo, por complicado que sea, al final nos vamos a encontrar con una muestra
de elementos, y la clave consiste, basicamente, en calcular las probabilidades de
inclusion.
Si por ejemplo, queremos estimar el total de la variable Y a partir de una muestra
m, por compleja que sea la estructura, la cosa es tan simple como calcular las proba-
bilidades de inclusion de primer orden de los elementos de la muestra, es decir, las i
para i m, y aplicar el estimador de Horvitz-Thompson,
X yi X
TbHT (Y ) = = i yi
im i im

siendo,
1
i = i m
i
es decir, al final siempre nos encontramos con una combinacion lineal de los valores
yi multiplicados por unas cantidades, i que son los pesos o ponderaciones. Este
concepto debe pues estar meridianamente claro.
Si lo que queremos estimar es la media poblacional de la variable, es decir, el
parametro Y , podemos emplear nuevamente el estimador de Horvitz-Thompson,
1 X yi
Yb HT =
N im i
o tambien el estimador de Hajek,
X
yi /i
im
Y HJ = X
b
1/i
im

Es importante notar que el programa SPSS emplea el estimador de Horvitz-


Thompson para la estimacion de los totales, y el de Hajek para la estimacion de
medias y proporciones.
Es decir, cuando el SPSS estima un total poblacional, emplea el estimador de
HorvitzThompson,
X yi X
TbHT (Y ) = = i yi
im i im
siendo yi la variable que se estudia, y i = 1/i los pesos que suministraremos al
programa.
Cuando el parametro es una media poblacional, o una proporcion, emplea el esti-
mador de Hajek, X X
yi /i i yi
im im
Y HJ = X
b
= X
1/i i
im im

Jose A. Mayor Gallego. Universidad de Sevilla


SPSS Muestras Complejas 7

En suma pues, como puede verse, la clave es,

Calcular las Probabilidades de Inclusion


y a partir de las mismas
Calcular los Pesos

4. Calculo de los pesos


Cuando la muestra a analizar ha sido previamente disenada y obtenida mediante
SPSS, es usual que contenga informacion sobre los pesos. Si no tenemos los pesos,
ya sea por que la muestra ha sido obtenida por otros medios, o por otras razones,
tendremos que calcularlos. Damos ahora algunas indicaciones.

4.1. Muestreo Aleatorio Simple Basico


Si N es el tamano de la poblacion, y n es el tamano de la muestra, las probabili-
dades de inclusion son,
n
i =
N
por lo que los pesos son,
N
i =
n

4.2. Muestreo con Probabilidades Variables Basico


Estos muestreos se realizan empleando una variable de TAMANO, de tal forma
que los elementos MAS GRANDES tengan mas probabilidad de ser seleccionados.
Si denotamos Xi a dicha variable, T (X) a la suma, sobre la poblacion, de todos los
tamanos, y n al tamano de la muestra, las probabilidades de inclusion son,
nXi
i =
T (X)

por lo que los pesos son,


T (X)
i =
nXi
Uno de los procedimientos de este tipo mas empleados es el metodo de Sampford.
Dicho metodo permite obtener n elementos muestrales sin reemplazamiento y con
probabilidades de inclusion variables y proporcionales a Xi .
IMPORTANTE: SPSS solo contempla este tipo de muestreo cuando se seleccionan
conglomerados, y exclusivamente en la primera etapa.

Jose A. Mayor Gallego. Universidad de Sevilla


SPSS Muestras Complejas 8

4.3. Muestreo Aleatorio Simple Estratificado


Para simplificar supongamos dos estratos, de tamanos N1 y N2 , en los que se
seleccionan respectivamente n1 y n2 elementos mediante sendos muestreos aleatorios
simples en cada estrato. Las probabilidades de inclusion son,
n1 n2
i = en el estrato 1 y i = en el estrato 2
N1 N2
por lo que los pesos son,
N1 N2
i = en el estrato 1 y i = en el estrato 2
n1 n2

4.4. Muestreo por Conglomerados en Una Etapa. Seleccion


de Conglomerados mediante Muestreo Aleatorio Simple
Supongamos que hay M conglomerados, y se seleccionan g. La probabilidad de
inclusion de un elementos sera la del conglomerados al que pertenece, es decir,
g
i =
M
por lo que los pesos son,
M
i =
g

4.5. Muestreo por Conglomerados en Dos Etapa. Seleccion


de conglomerados y de elementos mediante Muestreo
Aleatorio Simple
Supongamos que hay M conglomerados, y se seleccionan g. En el conglomerado
k, con Nk elementos, seleccionamos nk . La probabilidad de inclusion de un elementos
sera la del conglomerados al que pertenece multiplicada por la del elemento dentro
del conglomerado, es decir,
g nk
i =
M Nk
por lo que los pesos son,
M Nk
i =
g nk
En general, habra tantos pesos distintos como conglomerados.

Jose A. Mayor Gallego. Universidad de Sevilla


SPSS Muestras Complejas 9

4.6. Muestreo por Conglomerados en Dos Etapa. Seleccion


de conglomerados con Probabilidades Variables, y de
elementos mediante Muestreo Aleatorio Simple
Supongamos que hay M conglomerados, y se seleccionan g. La seleccion se hace,
por ejemplo mediante el metodo de Sampford, empleando el tamano de los conglo-
merados como variable tamano. Notemos que la suma de todos los tamanos es N
En el conglomerado k, con Nk elementos, seleccionamos nk mediante muestreo
aleatorio simple. La probabilidad de inclusion de un elementos sera la del conglome-
rados al que pertenece multiplicada por la del elemento dentro del conglomerado, es
decir,
gNk nk gnk
i = =
N Nk N
por lo que los pesos son,
N
i =
gnk

5. Introduccion basica al programa SPSS


El programa estadstico SPSS contiene una imponente batera de procedimientos
estadsticos que cubren numerosos campos de la Estadstica: Analisis Descriptivo,
Multivariante, Inferencia, Graficos, y un largo etcetera. No es la finalidad de este
curso abarcar todo el SPSS, lo que sera ademas imposible en tan corto espacio de
tiempo. Nos centraremos en el modulo de Muestras Complejas, y tambien veremos
algunos aspectos basicos que son indisponsables.

5.1. Editor de Datos


Al entrar en SPSS usualmente nos encontraremos el editor o visor de datos. Es
una cuadrcula, similar a una hoja de calculo. Tiene dos pestanas:

Vista de datos: Activa el editor de datos propiamente dicho. Cada columna es


una variable. Por defecto las variables son denotadas V00001, V00002, etc. Tam-
bien por defecto son numericas, con una anchura de 8 dgitos, y dos decimales.
Estos parametros pueden modificarse.

Vista de variables: Activa el editor de variables, donde podemos cambiar los


nombres de las mismas, el tipo, las dimensiones, etc. Tambien podemos asignar
nombres significativos a los valores de una variable cualitativa codificada.

Jose A. Mayor Gallego. Universidad de Sevilla


SPSS Muestras Complejas 10

5.2. Manejo de archivos. Importacion y exportacion


El SPSS tiene su formato propio de datos con la extension .SAV. Es posible, de
forma directa y facil, importar datos de otros formatos como EXCEL, as como grabar
a otros formatos.
Con la opcion Archivo - Nuevo - Datos podemos abrir un editor de datos en
blanco.
Con la opcion Archivo - Abrir - Datos podemos abrir un archivo de datos ya
existente.
Las opciones Archivo - Guardar y Archivo - Guardar como son las usuales
en los programas del entorno Windows.

5.3. Calculo sobre variables


A veces, es necesario realizar un conjunto de operaciones sobre una o varias va-
riables para obtener otras nuevas que necesitamos para ejecutar un analisis.
Por ejemplo, si tenemos una muestra obtenida en dos etapas, y en dos variables
tenemos respectivamente las ponderaciones de la primera y segunda etapa, podemos
multiplicar ambas ponderaciones, para cada elemento de la muestra, y obtener una
nueva variable con las ponderaciones de todo el proceso muestral.
Este tipo de operaciones se realiza con la opcion Transformar - Calcular, que
permite manipular y operar sobre varias variables y guardar los resultados en una
nueva variable.

5.4. Visor de resultados


SPSS coloca todos los resultados que se van obteniendo de los sucesivos analisis
en una ventana denominada Visor de Resultados. Mediante una estructura de
arbol que aparece a la izquierda, es posible moverse comodamente a traves de todo
el contenido, que usualmente puede llegar a ser muy extenso.
Es posible seleccionar un objeto (grafico, tabla, etc), copiarlo y pegarlo en otra
aplicacion de Windows, como Word o Excel.
Tambien es posible, mediante Edicion - Seleccionar todo - Copiar objetos,
copiar y pegar el contenido completo del visor.

5.5. Aplicacion del programa SPSS al diseno y analisis de


muestras
Como hemos mencionado anteriormente, desde la version 13., el programa SPSS
incluye un modulo para el diseno y analisis de datos recogidos a partir de un diseno

Jose A. Mayor Gallego. Universidad de Sevilla


SPSS Muestras Complejas 11

muestral complejo.
Con la opcion Archivo - Nuevo - Datos podemos abrir un editor de datos
en blanco. A este modulo se accede a partir de la opcion general Analizar, y a con-
tinuacion, la subopcion Muestras Complejas. Seguidamente describimos con algunos
ejemplos el funcionamiento de este modulo. Para un estudio mas profundo recomen-
damos la lectura de los manuales tecnicos y de los documentos donde se describen los
algoritmos y expresiones matematicas implementadas.

6. Seleccionar una muestra. Plan de Muestreo


Para llevar a cabo esta tarea, suponemos que en el editor de datos tenemos LA
POBLACION. Esto no significa que tengamos todos los datos poblacionales al com-
pleto, incluidas las variables de estudio, pues en tal caso el muestreo carecera de
sentido. Se puede decir que lo que tenemos en el ordenador es el MARCO.
Podemos tener las variables que definen las estructuras basicas, como son estratos
y conglomerados. Las variables de tamano, para llevar a cabo muestreos con proba-
bilidades variables, etc. Incluso, en un muestreo en varias etapas, podemos tener la
informacion solo de la primera etapa, para obtener una primera muestra de conglo-
merados.
La idea basica es pues que primero obtendremos la muestra de individuos, y a
continuacion realizaremos la recoleccion de datos de estudio sobre la misma. SPSS nos
ahorra pues todo el proceso de seleccion aleatoria de individuos, que en un muestreo
de varias etapas puede ser sumamente complicado.
Ahora necesitamos elaborar un PLAN DE MUESTREO. Un plan de muestreo es
un conjunto de especificaciones que, a partir de la estructura de los datos que vamos
a muestrear, sirve al programa SPSS para realizar la seleccion de elementos.
Este plan de muestreo se puede definir de varias formas, pero nosotros lo haremos
siempre empleando el llamado Asistente de Muestreo. Al final, este plan o conjunto
de especificaciones se graba en un Fichero de Plan, que tiene la extension .CSPLAN.
Elegiremos la opcion Analizar - Muestras Complejas - Seleccionar una muestra. Apa-
rece una ventana en la que podemos elegir entre CREAR un plan de muestreo nuevo,
EDITAR un plan de muestreo ya existente, o pasar directamente a la EXTRACCION
de una muestra (esto requiere que ya haya un plan).
En principio, si estamos en el inicio, emplearemos la primera opcion. Mediante la
opcion Examinar es posible escoger el directorio en el cual se grabara el fichero con
el plan que creemos, as como su nombre. Por defecto la extension es .CSPLAN.
IMPORTANTE: Si introducimos directamente el nombre del plan de muestreo
en la ventanita, sin usar la opcion Examinar, es obligatorio escribir la extension
.CSPLAN, pues en caso contrario el SPSS grabara el fichero de plan sin extension
alguna, lo que puede ocasionar dificultades y problemas posteriores.

Jose A. Mayor Gallego. Universidad de Sevilla


SPSS Muestras Complejas 12

Seguidamente, a lo largo de una serie de menus, iremos escogiendo las opciones


adecuadas a nuestro problema, seleccionando las variables que definiran estratos y
conglomerados en las sucesivas etapas.
Al final, podemos optar por colocar la muestra sobre nuestra misma ventana
del Editor de Datos, o en una ventana distinta, o incluso enviarlo a un fichero con
extension .SAV, es decir, el formato de SPSS.

7. Analizar una muestra


Para describir este proceso, emplearemos varios ejemplos, empezando por el mas
basico, o sea, el Muestreo Aleatorio Simple. Posteriormente anadiremos nuevas es-
tructuras como estratos conglomerados.

7.1. Estimacion de parametros a partir de una Muestra Alea-


toria Simple. DATOS LEC PRENSA 1
De una poblacion de N = 10000 personas mayores de 16 anos, hemos seleccionado
una muestra de n = 80 empleando Muestreo Aleatorio Simple, MAS(10000, 80), con
objeto de realizar un estudio sobre habitos de lectura de periodicos en el mes ante-
rior. Como suele ser bastante habitual, los distintos valores de las variables se han
codificado mediante cantidades numericas. Las variables estudiadas son,

1. LECTOR: Lee Vd. regularmente algun periodico? [1: S, 2: No]


2. N MENSUAL: Numero de periodicos que compro Vd. mensualmente en el
anterior mes.
3. PERIODICO: Que periodico lee usualmente Vd.? [1: El Pas, 2: El Mundo,
3: ABC, 4: Ninguno]
4. SEXO: Sexo [1: Hombre, 2: Mujer]
5. EDAD: Grupo de Edad [1: De 16 a 30 anos, 2: De 31 a 65 anos, 3: De 66 anos
en adelante]

Notese que en este ejemplo no hay estratos ni conglomerados. La muestra se ob-


tiene ntegramente de la poblacion total, sin intervencion de ninguna estructura pre-
determinada. Esto no es muy realista pero nos servira para ir asimilando la mecanica
del programa poco a poco. S existen dos variables, SEXO y EDAD, que definen sub-
poblaciones, tanto individualmente como por su cruce, y que nos permitiran realizar
estimaciones desagregadas como por ejemplo, la estimacion de la proporcion de lecto-
res de ABC en las mujeres, o la estimacion del numero medio de periodicos adquiridos
por los hombres de 66 anos en adelante. Los datos recogidos tienen un aspecto como
el que se expone a continuacion,

Jose A. Mayor Gallego. Universidad de Sevilla


SPSS Muestras Complejas 13

Elemento Encuestado SEXO EDAD LECTOR N_MENSUAL PERIODICO


1 1 1 1 15 1
2 1 2 2 0 4
3 2 1 1 12 1
....... ... ... ... .... ...

La primera tarea que hay que llevar a cabo es la introduccion de datos en la


plantilla de SPSS. Esto se hace en la forma habitual. La primera columna no es
necesaria pues ya SPSS introduce automaticamente un numero de orden. El resto de
variables se introduce de forma habitual. En nuestro caso, hemos anadido toda la
informacion necesaria para que el las tablas de resultados no aparezcan los codigos
sino lo que representan, por ejemplo, para la variable PERIODICO, no aparezca 3
sino ABC, que es mas inteligible.
Ademas de estas variables de estudio, SPSS necesita ineludiblemente una nueva
variable, creada por nosotros, que contiene los pesos o ponderaciones de cada indi-
viduo (indicamos la terminologa inglesa, weight, por si alguna vez empleamos una
version no traducida del programa ). En este caso los pesos son,
1 1 10000
i = = = = 125
i 80/10000 80
por lo que habra que anadir una columna adicional, que por ejemplo llamaremos
PESO, con estos valores.
Notemos que si la muestra ha sido obtenida mediante SPSS, es posible que ya
tengamos los pesos en una variable creada por el propio programa. En este caso,
suponemos que no disponemos de las pesos a priori.
De esta forma, tendremos en SPSS una hoja de datos con el aspecto que se muestra
a continuacion,

Figura 1. Hoja de datos de SPSS para la informacion sobre la lectura de prensa de 80


personas.

Jose A. Mayor Gallego. Universidad de Sevilla


SPSS Muestras Complejas 14

Suponemos que estos datos se encuentran en un fichero denominado,

DATOS LEC PRENSA 1.SAV

es decir, el formato usual de datos en SPSS.


Notemos que todos los pesos son iguales (en otras situaciones esto no sera cierto).
SPSS nos da la posibilidad directa de escribirlos directamente (o escribir uno y copiarlo
en toda la columna) o tambien de calcular la variable a partir de una opcion especial
que por su importancia, vamos a considerar a continuacion.

7.1.1. La opcion Calcular

Esta opcion se encuentra dentro del menu Transformar y permite construir una
variable calculando sus valores. Es una opcion es muy potente y contiene posibilidades
de todo tipo. As, se pueden construir nuevas variables a partir de una formula ma-
tematica en la que pueden intervenir todo tipo de operaciones y funciones, y tambien
otras variables. Tambien posee funciones logicas mediante las cuales, por ejemplo, se
pueden calcular pesos distintos para elementos que estuvieran en estratos distintos o
conglomerados distintos.
Ahora nos contentaremos con describirla en su forma mas simple, aplicada a nues-
tro actual ejemplo. Supongamos que queremos construir la variable PESO. Partimos
de los datos sin esta variable. Accedemos a la opcion Transformar, y dentro de ella, la
sub-opcion Calcular. Aparece una ventana como la que se muestra a continuacion en
la cual, en la miniventana Variable de Destino introducimos el nombre de la varia-
ble que estamos calculando, y en la ventana Expresion Numerica introducimos la
expresion correspondiente, es decir. Pulsando Aceptar se calculara la variable PESO
de forma automatica.

Jose A. Mayor Gallego. Universidad de Sevilla


SPSS Muestras Complejas 15

Figura 2. La opcion Calcular para construir una nueva variable.

Sea cual sea la forma de construir la variable PESO, suponemos que ya disponemos
de esta variable, que como hemos dicho antes es imprescindible para realizar el analisis.

7.1.2. Analisis de los datos muestrales: Plan de analisis

A la hora de realizar el analisis de los datos muestrales con objeto de obtener


las distintas estimaciones, y tanto para situaciones simples, como la que estamos
considerando en este, nuestro primer ejemplo, como para cualquier otra situacion,
SIEMPRE necesitaremos, de forma ineludible,

Elaborar un PLAN DE ANALISIS.


Un plan de analisis es un conjunto de especificaciones que, a partir de la estruc-
tura de los datos que vamos a analizar, sirve al programa SPSS para procesar
la informacion y obtener las estimaciones.
Este plan de analisis se puede definir de varias formas, pero nosotros lo haremos
siempre empleando el llamado Asistente de Muestreo. Al final, este plan de
analisis o conjunto de especificaciones se graba en un Fichero de Plan, que tiene
la extension .CSAPLAN.

Jose A. Mayor Gallego. Universidad de Sevilla


SPSS Muestras Complejas 16

Un Fichero de plan de analisis ya elaborado previamente puede ser editado y


modificado cuantas veces se quiera.

Tener los datos en la ventana de datos.


Es decir, Para elaborar el plan de analisis anteriormente citado, no podemos
partir de la nada, necesitamos que los datos esten presentes, para que el asistente
de muestreo pueda ir avanzando en la elaboracion de dicho plan.
De hecho, el plan de analisis emplea informacion relativa al nombre de las varia-
bles que van a definir los posibles estratos y conglomerados, as como los pesos.
Por esta razon si no hay datos no hay plan.

Precisamente, un plan de analisis contendra la informacion sobre las posibles es-


tructuras existentes, ya sean estratos, conglomerados o ambas cosas entremezcladas,
las etapas de muestreo, los tamanos poblacionales o de los posibles estratos, los ta-
manos de los posibles conglomerados, el metodo de muestreo empleado para seleccio-
nar la muestra, las variables que contienen los pesos y la informacion sobre estratos
o conglomerados, y un largo etcetera.
Es mas, en determinadas circunstancias y con determinados fines, podemos definir
varios planes de analisis distintos para el mismo conjunto de datos.
Veamos sin mas dilacion como construir un plan de analisis para nuestro ejem-
plo. Recordemos que NO hay estratos, NO hay conglomerados, los pesos estan en la
variable PESO, la muestra se ha obtenido mediante muestreo aleatorio simple sin re-
emplazamiento, y la poblacion tiene N = 10000 elementos. Con los datos muestrales
en la ventana de datos, eligiremos la opcion Analizar, sub-opcion Muestras Comple-
jas, sub-sub-opcion Preparar para el Analisis, y obtendremos una ventana como la que
aparece a continuacion,

Jose A. Mayor Gallego. Universidad de Sevilla


SPSS Muestras Complejas 17

Figura 3. Creando, o editando, un Archivo de Plan.

Como vemos, hay dos posibilidades, Crear para el caso de que queramos construir
un archivo de este tipo, caso que se dara usualmente cuando sea la primera vez que
realicemos un analisis, o Editar cuando ya tenemos un Archivo de Plan anterior, y
queramos modifica alguna especificacion del mismo. En el ejemplo que nos ocupa,
como no tenemos aun ningun fichero de este tipo, crearemos uno con el nombre
plan prensa.
Recomendamos especificar un directorio de trabajo propio y especfico, el lugar
del generico que emplea SPSS por defecto, en el cual colocaremos nuestros archivos
de datos, archivos de planes y archivos de resultados. El programa SPSS ya se encar-
gara de anadir la extension csaplan con lo que el fichero se grabara con el nombre
final plan prensa.csaplan.
IMPORTANTE: Si introducimos directamente el nombre del plan de analisis en la
ventanita, sin usar la opcion Examinar, es obligatorio escribir la extension .CSA-
PLAN, pues en caso contrario el SPSS grabara el fichero de plan sin extension alguna,
lo que puede ocasionar dificultades y problemas posteriores.
Seguidamente, iremos avanzando para introducir informacion sobre conglomera-
dos, estratos y pesos. Notemos que el Fichero de Plan de Analisis contiene la infor-
macion sobre las estructuras poblacionales que han intervenido en el muestreo, ya

Jose A. Mayor Gallego. Universidad de Sevilla


SPSS Muestras Complejas 18

sean estratos y/o conglomerados, sobre los tipos de muestreos empleados, sobre los
tamanos poblacionales o de estratos y conglomerados, y sobre las probabilidades de
inclusion, que aparecen implcitamente en la variable o variables de peso.
Pero no contiene informacion sobre las variables de estudio que se van a analizar,
en nuestro caso SEXO, LECTOR, etc., que ya se consideraran cuando vayan a ser
analizadas. Por ejemplo, la variable SEXO podra ser empleada para estratificar, y en
tal caso SI tendra que constar en el Archivo de Plan. Este no es el caso en nuestro
ejemplo por lo que dicha variable NO aparece en plan de analisis , aunque s puede
ser considerada durante el analisis para desagregar las estimaciones por sexos.

Figura 4. Creando, o editando, un Archivo de Plan. Estructuras y pesos.

En la Figura 4. puede verse la forma de suministrar los pesos, mediante la variable


adecuada. Los campos relativos a estratos y conglomerados se dejan vacos.
Siguiendo el proceso, en la Figura 5. aparece la ventana en la que se da la infor-
macion sobre el tipo de muestreo empleado, en este caso Muestreo Aleatorio Simple,
o Igual SR segun la terminologa de SPSS.

Jose A. Mayor Gallego. Universidad de Sevilla


SPSS Muestras Complejas 19

Figura 5. Creando, o editando, un Archivo de Plan. Tipo de muestreo.

A continuacion aparece una ventana en la cual se nos da la posibilidad de decidir si


se van a introducir probabilidades de inclusion o tamanos poblacionales. La segunda
opcion es mas usual, y una vez seleccionada, nos conducira a introducir dicho tamano,
en este caso, N = 10000.
Notemos que si hubiera estratos, el programa lo detectara y entonces tendamos
que introducir los tamanos de los estratos. Para ello se abrira una ventana especfica.
Todo esto aparece en la Figura 6.

Jose A. Mayor Gallego. Universidad de Sevilla


SPSS Muestras Complejas 20

Figura 6. Creando, o editando, un Archivo de Plan. Tamanos poblacionales.

Seguidamente, se nos pregunta si queremos indicar que hubo mas etapas en el


muestreo. En este caso, es un Muestreo Aleatorio Simple basico, por lo que no hay
etapas adicionales. Esto se muestra an la Figura 7.

Jose A. Mayor Gallego. Universidad de Sevilla


SPSS Muestras Complejas 21

Figura 7. Creando, o editando, un Archivo de Plan. Informacion sobre etapas.

A continuacion se nos pregunta si queremos guardar las especificaciones del plan


en el archivo correspondiente, que es lo que haremos usualmente. O por contra, crear
una ventana de sintaxis con el plan de analisis traducido al lenguaje de SPSS. Esto
ultimo puede ser muy util para retocar a mano un plan de analisis, introduciendo
s una flexibilidad adicional que el Asistente a veces no permite.

Jose A. Mayor Gallego. Universidad de Sevilla


SPSS Muestras Complejas 22

Figura 8. Creando, o editando, un Archivo de Plan. Grabando archivo de plan.

Jose A. Mayor Gallego. Universidad de Sevilla


SPSS Muestras Complejas 23

Finalmente obtendremos en una ventada de resultados informacion pormenorizada


sobre todo el proceso que hemos seguido.

Figura 9. Creando, o editando, un Archivo de Plan. Resultado

7.1.3. Analisis de los datos muestrales: Estimaciones

Una vez elaborado y grabado en un fichero el plan, podemos realizar las estima-
ciones.
Por ejemplo, si queremos estimar proporciones (porcentajes en SPSS), seleccio-
naremos la opcion Frecuencias. Se nos pedira una serie de informaciones sobre las
variables que queramos procesar, por ejemplo, PERIODICO. Opcionalmente podre-
mos considerar subpoblaciones, por ejemplo si queremos las proporciones, ademas de
para toda la poblacion, desagregadas por ejemplo por sexos.
Con Opciones podremos decidir si queremos los porcentajes, los totales o ambas
cosas. Si queremos el error estimado (desviacion tpica estimada), intervalos de con-
fianza, etc.
Mencionemos que tambien podemos calcular el efecto del diseno, es decir, el cocien-
te entre la varianza (estimada) que se obtiene empleando las estructuras de estratos,
conglomerados, y metodos de muestreo distintos del Aleatorio Simple, y la que se
obtendra con Muestreo Aleatorio Simple.

Jose A. Mayor Gallego. Universidad de Sevilla


SPSS Muestras Complejas 24

As, el efecto de diseno permite calibrar la mejora (o empeoramiento) que se


produce al emplear el disenos que hemos aplicado, con relacion a lo que obtendramos
mediante un Muestreo Aleatorio Simple puro y duro de elementos de la poblacion. En
nuestro ejemplo obtenemos para el efecto de diseno el valor 1, como era de esperar.

7.2. Estimacion de parametros a partir de Muestreo Aleato-


rio Simple Estratificado. DATOS LEC PRENSA EST
El ejemplo que hemos considerado anteriormente es el mas simple posible. La
siguiente posibilidad es considerar estratos, es decir,suponer que el muestreo realizado
es estratificado.
Como ejemplo, consideramos la poblacion de lectores, estratificada por edades.
Hay tres estratos, el de 16 a 30 anos, el de 31 a 65, y el de mayores de 65. Suponemos
que los datos se encuentran en el fichero DATOS LEC PRENSA EST.SAV. Ahora,
la poblacion de 10000 lectores esta dividida en 3500 elementos del estrato 1, 5000 del
estrato 2 y 1500 del estrato 3. Los tamanos muestrales respectivos son 30, 35 y 15,
por lo que los pesos de los elementos de cada estrato son respectivamente 3500/30,
5000/35 y 1500/15. Estos pesos se colocaran en la variable PESO.
Al crear el plan de analisis, seguiremos pasos similares al ejemplo anterior, con
la diferencia de que en la ventana correspondiente introduciremos la variable EDAD
para definir los estratos, tal y como se observa en la Figura 10.

Jose A. Mayor Gallego. Universidad de Sevilla


SPSS Muestras Complejas 25

Figura 10. Plan de analisis. Estratos.

En la pagina correspondiente a tamanos poblacionales, tendremos que diferenciar


por estratos apareciendo una pantalla en la introduciremos los tamanos de cada uno.
Esto se muestra en la Figura 11.

Jose A. Mayor Gallego. Universidad de Sevilla


SPSS Muestras Complejas 26

Figura 11. Plan de analisis. Tamanos de los estratos.

El resto es similar. Una vez creado el archivo de plan, podemos realizar las esti-
maciones. Por ejemplo, si queremos estimar las proporciones de lectores de distintos
periodicos, en el apartados Muestras Complejas seleccionaremos Frecuencias e intro-
duciremos la variable periodico. Estimaremos tambien desagregando por sexos. En la
Figura 12. se exponen los resultados obtenidos.

Jose A. Mayor Gallego. Universidad de Sevilla


SPSS Muestras Complejas 27

Figura 12. Estimacion de proporciones.

Referencias y bibliografa recomendada


[1] Fernandez Garca, F.R. y Mayor Gallego, J.A. (1995a). Muestreo en poblaciones
finitas: Curso basico. E.U.B. Ediciones Universitarias de Barcelona.

[2] Fernandez Garca, F.R. y Mayor Gallego, J.A. (1995b). Ejercicios y practicas de
muestreo en poblaciones finitas. E.U.B. Ediciones Universitarias de Barcelona.

[3] SPSS. Complex Samples Version 13.0. Fichero suministrado por el profesor.

Jose A. Mayor Gallego. Universidad de Sevilla

Anda mungkin juga menyukai