Anda di halaman 1dari 217

i

Muestras complejas de SPSS 15.0

Si desea obtener ms informacin sobre los productos de software de SPSS, visite nuestra pgina Web en http://www.spss.com o pngase en contacto con SPSS Inc. 233 South Wacker Drive, 11th Floor Chicago, IL 60606-6412 EE.UU. Tel: (312) 651-3000 Fax: (312) 651-3668 SPSS es una marca registrada; los dems nombres de productos son marcas comerciales de SPSS Inc. para los programas de software de su propiedad. El material descrito en este software no puede ser reproducido ni distribuido sin la autorizacin expresa por escrito por parte de los propietarios de la marca registrada y de los derechos de la licencia en el software y en los copyrights de los materiales publicados. El SOFTWARE y la documentacin se proporcionan con DERECHOS LIMITADOS. Su uso, duplicacin o revelacin por parte del Gobierno estn sujetos a las restricciones establecidas en la subdivisin (c)(1)(ii) de la clusula Rights in Technical Data and Computer Software en 52.227-7013. El fabricante es SPSS Inc., 233 South Wacker Drive, 11th Floor, Chicago, IL 60606-6412, EE.UU. N de patente 7,023,453 Aviso general: El resto de los nombres de productos mencionados en este documento se utilizan slo con nes identicativos y pueden ser marcas comerciales de sus respectivas empresas. TableLook es una marca comercial de SPSS Inc. Windows es una marca comercial registrada de Microsoft Corporation. DataDirect, DataDirect Connect, INTERSOLV y SequeLink son marcas comerciales registradas de DataDirect Technologies. Algunas partes de este producto se han creado utilizando LEADTOOLS 19912000, LEAD Technologies, Inc. TODOS LOS DERECHOS RESERVADOS. LEAD, LEADTOOLS y LEADVIEW son marcas comerciales registradas de LEAD Technologies, Inc. Sax Basic es una marca comercial de Sax Software Corporation. Copyright 19932004 de Polar Engineering and Consulting. Reservados todos los derechos. Una parte del software de SPSS contiene tecnologa zlib. Copyright 19952002 de Jean-loup Gailly y Mark Adler. El software zlib se proporciona tal cual, sin ningn tipo de garanta implcita o explcita. Una parte del software de SPSS contiene bibliotecas de Sun Java Runtime. Copyright 2003 de Sun Microsystems, Inc. Reservados todos los derechos. Las bibliotecas de Sun Java Runtime incluyen cdigo con licencia de RSA Security, Inc. Algunas partes de las bibliotecas tienen licencia de IBM y estn disponibles en http://www-128.ibm.com/developerworks/opensource/. Muestras complejas de SPSS 15.0 Copyright 2006 de SPSS Inc. Todos los derechos reservados. Impreso en Estados Unidos de Amrica. Queda prohibida la reproduccin, el almacenamiento en sistemas de recuperacin o la transmisin de cualquier parte de esta publicacin en cualquier forma y por cualquier medio (electrnico o mecnico, fotocopia, grabacin o cualquier otro) sin previa autorizacin expresa y por escrito de parte del editor. 1234567890 09 08 07 06

ISBN-13: 978-1-56827-754-7 ISBN-10: 1-56827-754-7

Prefacio

SPSS 15.0 es un sistema global para el anlisis de datos. El mdulo adicional opcional SPSS Muestras complejas proporciona las tcnicas de anlisis adicionales que se describen en este manual. El mdulo adicional Muestras complejas se debe utilizar con el sistema Base de SPSS 15.0 y est completamente integrado en dicho sistema.
Instalacin

Para instalar SPSS Muestras complejas mdulo adicional, ejecute el Asistente para autorizacin de licencia utilizando el cdigo de autorizacin que le envi SPSS Inc. Para obtener ms informacin, consulte las instrucciones de instalacin proporcionadas con SPSS Muestras complejas mdulo adicional.
Compatibilidad

SPSS est diseado para ejecutarse en gran cantidad de sistemas de ordenadores. Consulte las instrucciones de instalacin entregadas con su sistema para obtener informacin especca acerca de los requisitos mnimos y los recomendados.
Nmeros de serie

El nmero de serie es su nmero de identicacin con SPSS Inc. Necesitar este nmero cuando se ponga en contacto con SPSS Inc. para recibir informacin sobre asistencia, formas de pago o actualizacin del sistema. El nmero de serie se incluye en el sistema Base de SPSS.
Servicio al cliente

Si tiene cualquier duda referente a la forma de envo o pago, pngase en contacto con su ocina local, que encontrar en la pgina Web de SPSS en http://www.spss.com/worldwide. Tenga preparado su nmero de serie para identicarse.
Cursos de preparacin

SPSS Inc. ofrece cursos de preparacin, tanto pblicos como in situ. En todos los cursos habr talleres prcticos. Estos cursos tendrn lugar peridicamente en las principales capitales. Si desea obtener ms informacin sobre estos cursos, pngase en contacto con su ocina local que encontrar en la pgina Web de SPSS en http://www.spss.com/worldwide.
iii

Asistencia tcnica

El servicio de asistencia tcnica de SPSS est a disposicin de todos los clientes de mantenimiento. Los clientes podrn ponerse en contacto con este servicio de asistencia tcnica si desean recibir ayuda sobre la utilizacin de SPSS o sobre la instalacin en alguno de los entornos de hardware admitidos. Para ponerse en contacto con el servicio de asistencia tcnica, consulte la pgina Web de SPSS en http://www.spss.com, o pngase en contacto con la ocina ms cercana, que encontrar en la pgina Web de SPSS en http://www.spss.com/worldwide. Tenga preparada la informacin necesaria para identicarse personalmente, a su organizacin y el nmero de serie de su sistema.
Publicaciones adicionales

Puede adquirir copias adicionales de los manuales de los productos de SPSS directamente de SPSS Inc. Visite la seccin Store de la pgina Web de SPSS en http://www.spss.com/estore o pngase en contacto con su ocina de SPSS local que encontrar en la pgina Web de SPSS en http://www.spss.com/worldwide. Para pedidos telefnicos en Estados Unidos y Canad, llame a SPSS Inc. al 800-543-2185. Para pedidos telefnicos desde otros pases, pngase en contacto con la ocina ms cercana que encontrar en la pgina Web de SPSS. SPSS Statistical Procedures Companion, por Marija Noruis, ha sido publicado por Prentice Hall. Se prev una nueva versin de este libro, actualizado para SPSS 15.0. El libro SPSS Advanced Statistical Procedures Companion, que tambin se basa en SPSS 15.0, se publicar muy pronto. El libro SPSS Guide to Data Analysis para SPSS 15.0 tambin est en proceso de desarrollo. Las publicaciones anunciadas de forma exclusiva por Prentice Hall estarn disponibles en la pgina Web de SPSS en http://www.spss.com/estore (seleccione su pas de origen y pulse en Books).
Dganos su opinin

Sus comentarios son importantes. Hganos saber su experiencia con los productos SPSS. Nos interesa especialmente recibir noticias sobre aplicaciones nuevas e interesantes para SPSS Muestras complejas mdulo adicional. Envenos un correo electrnico a suggest@spss.com o escriba a SPSS Inc., Attn.: Director of Product Planning, 233 South Wacker Drive, 11th Floor, Chicago, IL 60606-6412, EE.UU.
Acerca de este manual

Este manual es la documentacin de la interfaz grca del usuario para los procedimientos incluidos en SPSS Muestras complejas mdulo adicional. Las ilustraciones de los cuadros de dilogo estn tomadas de SPSS para Windows. Los cuadros de dilogo de los dems sistemas operativos son similares. La informacin detallada sobre la sintaxis de comandos para SPSS Muestras complejas mdulo adicional est disponible en dos formatos: integrada en el sistema de ayuda global y como un documento independiente en formato PDF en la referencia de sintaxis de comandos (SPSS 15.0 Command Syntax Reference), disponible en el men Ayuda.
iv

Cmo ponerse en contacto con SPSS

Si desea pertenecer a nuestra lista de correo, pngase en contacto con nuestras ocinas que encontrar en la pgina Web en http://www.spss.com/worldwide.

Contenido
Parte I: Manual del usuario 1 Introduccin a los procedimientos de muestras complejas de SPSS 1
Propiedades de las muestras complejas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 Uso de los procedimientos de Muestras complejas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Archivos de plan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Lecturas adicionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

Muestreo a partir de un diseo complejo

Creacin de un nuevo plan de muestreo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 Asistente de muestreo: Variables del diseo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 Controles de rbol para navegar por el Asistente de muestreo. . . . . . . . . . . . . . . . . . . . . . . . 7 Asistente de muestreo: Mtodo de muestreo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 Asistente de muestreo: Tamao muestral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 Definir tamaos desiguales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 Asistente de muestreo: Variables de resultado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 Asistente de muestreo: Resumen del plan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 Asistente de muestreo: Extraer muestra: Opciones de seleccin . . . . . . . . . . . . . . . . . . . . . . . . 14 Asistente de muestreo: Extraer muestra: Archivos de resultado . . . . . . . . . . . . . . . . . . . . . . . . . 15 Asistente de muestreo: Finalizar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 Modificar un plan de muestreo existente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 Asistente de muestreo: Resumen del plan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 Ejecutar un plan de muestreo existente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 Funciones adicionales de los comandos CSPLAN y CSSELECT . . . . . . . . . . . . . . . . . . . . . . . . . . 18

Preparacin de una muestra compleja para su anlisis

19

Creacin de un nuevo plan de anlisis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

vi

Asistente de preparacin del anlisis: Variables del diseo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 Controles de rbol para desplazarse por el Asistente para el anlisis. . . . . . . . . . . . . . . . . . 22 Asistente de preparacin del anlisis: Mtodo de estimacin. . . . . . . . . . . . . . . . . . . . . . . . . . . 22 Asistente de preparacin del anlisis: Tamao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 Definir tamaos desiguales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 Asistente de preparacin del anlisis: Resumen del plan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 Asistente de preparacin del anlisis: Finalizar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 Modificar un plan de anlisis existente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 Asistente de preparacin del anlisis: Resumen del plan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

4 5

Plan de muestras complejas Frecuencias de Muestras complejas

28 29

Frecuencias de Muestras complejas: Estadsticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 Muestras complejas: Valores perdidos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 Opciones de Muestras complejas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

Descriptivos de Muestras complejas

33

Descriptivos de Muestras complejas: Estadsticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 Valores perdidos en los descriptivos de Muestras complejas . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 Opciones de Muestras complejas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

Tablas de contingencia de Muestras complejas

37

Tablas de contingencia de Muestras complejas: Estadsticos . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 Muestras complejas: Valores perdidos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 Opciones de Muestras complejas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

Razones de Muestras complejas

42

Razones de Muestras complejas. Estadsticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

vii

Razones de Muestras complejas: Valores perdidos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 Opciones de Muestras complejas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

Modelo lineal general de muestras complejas

46

Estadsticos de Modelo lineal general de muestras complejas . . . . . . . . . . . . . . . . . . . . . . . . . . 49 Muestras complejas: Contrastes de hiptesis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 Medias estimadas del Modelo lineal general de muestras complejas . . . . . . . . . . . . . . . . . . . . . 51 Modelo lineal general de muestras complejas: Guardar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 Modelo lineal general de muestras complejas: Opciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 Funciones adicionales del comando CSGLM. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

10 Regresin logstica de muestras complejas

55

Regresin logstica de muestras complejas: Categora de referencia . . . . . . . . . . . . . . . . . . . . . 56 Regresin logstica de muestras complejas: Modelo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 Regresin logstica de muestras complejas: Estadsticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 Muestras complejas: Contrastes de hiptesis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 Regresin logstica de muestras complejas: Razones de las ventajas . . . . . . . . . . . . . . . . . . . . . 61 Regresin logstica de muestras complejas: Guardar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 Regresin logstica de muestras complejas: Opciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 Funciones adicionales del comando CSLOGISTIC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

11 Regresin ordinal de muestras complejas

65

Regresin ordinal de muestras complejas: Probabilidades de respuesta. . . . . . . . . . . . . . . . . . . 67 Regresin ordinal de muestras complejas: Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 Regresin ordinal de muestras complejas: Estadsticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 Muestras complejas: Contrastes de hiptesis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 Regresin ordinal de muestras complejas: Razones de las ventajas . . . . . . . . . . . . . . . . . . . . . . 72 Regresin ordinal de muestras complejas: Guardar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 Regresin ordinal de muestras complejas: Opciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 Funciones adicionales del comando CSORDINAL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

viii

Parte II: Ejemplos 12 Asistente de muestreo de la opcin Muestras complejas


Uso del asistente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Resumen del plan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Resumen de muestreo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Resultados de la muestra. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Obtencin de una muestra a partir de un marco de muestreo parcial . ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. .. .. .. ..

77
77 87 87 88 89

Obtencin de una muestra a partir de un marco de muestreo completo . . . . . . . . . . . . . . . . . . . 77

Uso del asistente para extraer la muestra del primer marco parcial . . Resultados de la muestra. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Uso del asistente para extraer la muestra del segundo marco parcial Resultados de la muestra. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Muestreo con probabilidad proporcional al tamao (PPS). . . . . . . . . . . . . Uso del asistente . . . . . . Resumen del plan . . . . . . Resumen de muestreo . . . Resultados de la muestra. Procedimientos relacionados . ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...

. . 89 . 102 . 102 . 107 . 107 . . . . . 108 119 119 121 124

13 Asistente de preparacin del anlisis de la opcin Muestras complejas 125


Uso del Asistente de preparacin del anlisis de la opcin Muestras complejas para preparar los datos de uso pblico de la NHIS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 Uso del asistente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 Preparacin del anlisis cuando las ponderaciones muestrales no se encuentran en el archivo de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 Clculo de las probabilidades de inclusin y las ponderaciones muestrales. . Uso del asistente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Procedimientos relacionados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ... ... ... ... ... ... ... ... ... ... ... ... . . . . 128 131 139 139

ix

14 Frecuencias de Muestras complejas

140

Uso de Frecuencias de muestras complejas para analizar el consumo de suplementos nutritivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140 Ejecucin del anlisis . . . . . . Tabla de frecuencia . . . . . . . . Frecuencia por subpoblacin. Resumen . . . . . . . . . . . . . . . . Procedimientos relacionados . . . . ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... . . . . . 140 142 143 143 144

15 Descriptivos de Muestras complejas


Ejecucin del anlisis . . . . . . . . . . . . . . . . . . Estadsticos univariantes . . . . . . . . . . . . . . . . Estadsticos univariantes por subpoblacin . . Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . Procedimientos relacionados . . . . . . . . . . . . . . . . ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...

145
. . . . . 145 148 149 150 150

Uso de los descriptivos de Muestras complejas para analizar los niveles de actividad . . . . . . . 145

16 Tablas de contingencia de Muestras complejas

151

Uso de muestras complejas de tablas de contingencia para medir el riesgo relativo de un evento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151 Ejecucin del anlisis . . . . . . . . . . . . . . . Tabla de contingencia . . . . . . . . . . . . . . . Estimacin de riesgo . . . . . . . . . . . . . . . . Estimacin del riesgo por subpoblacin . . Resumen . . . . . . . . . . . . . . . . . . . . . . . . . Procedimientos relacionados . . . . . . . . . . . . . ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... . . . . . . 151 154 154 155 156 156

17 Razones de Muestras complejas

157

Uso de razones de Muestras complejas como ayuda en la evaluacin de los valores de las propiedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157 Ejecucin del anlisis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157 Razones. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159

Tabla de razones pivotada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160 Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161 Procedimientos relacionados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161

18 Modelo lineal general de muestras complejas


Ejecucin del anlisis . . . . . . . . . Resumen del modelo . . . . . . . . . . Pruebas de efectos del modelo . . Estimaciones de los parmetros . Medias marginales estimadas . . Resumen . . . . . . . . . . . . . . . . . . Procedimientos relacionados . . . . . . . ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...

162
. . . . . . . 162 167 167 168 169 171 171

Uso del Modelo lineal general de muestras complejas para ajustar ANOVA de dos factores . . . 162

19 Regresin logstica de muestras complejas

173

Uso del procedimiento Regresin logstica de muestras complejas para evaluar riesgos de crdito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173 Ejecucin del anlisis . . . . . . . . . Pseudo R cuadrado . . . . . . . . . . . Clasificacin . . . . . . . . . . . . . . . . Pruebas de efectos del modelo . . Estimaciones de los parmetros . Razones de las ventajas. . . . . . . . Resumen . . . . . . . . . . . . . . . . . . . Procedimientos relacionados . . . . . . . ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... . . . . . . . . 173 177 178 179 179 180 181 182

20 Regresin ordinal de muestras complejas


Ejecucin del anlisis . . . . . . . . . . . . . . . . . . Pseudo R cuadrado . . . . . . . . . . . . . . . . . . . . Pruebas de efectos del modelo . . . . . . . . . . . Estimaciones de los parmetros . . . . . . . . . . Clasificacin . . . . . . . . . . . . . . . . . . . . . . . . . Razones de las ventajas. . . . . . . . . . . . . . . . . Modelo acumulado generalizado . . . . . . . . . . Exclusin de los predictores no significativos ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...

183
. . . . . . . . 183 188 189 189 191 192 193 194

Uso de la regresin ordinal de muestras complejas para analizar los resultados de encuestas . 183

xi

Advertencias . . . . . . . . . . . . . Comparacin de los modelos . Resumen . . . . . . . . . . . . . . . . Procedimientos relacionados . . . .

... ... ... ...

... ... ... ...

... ... ... ...

... ... ... ...

... ... ... ...

... ... ... ...

... ... ... ...

... ... ... ...

... ... ... ...

... ... ... ...

... ... ... ...

... ... ... ...

... ... ... ...

... ... ... ...

... ... ... ...

. . . .

196 197 198 198

Apndices Bibliografa ndice 200 201

xii

Manual del usuario

Captulo

Introduccin a los procedimientos de muestras complejas de SPSS

Un supuesto inherente a los procedimientos de anlisis en los paquetes de software tradicionales es que las observaciones de un archivo de datos representan una muestra aleatoria simple de la poblacin de inters. Este supuesto es insostenible para un nmero cada vez mayor de empresas e investigadores que consideran ms econmico y cmodo obtener las muestras de una forma ms estructurada. La opcin Muestras complejas de SPSS permite seleccionar una muestra de acuerdo con un diseo complejo e incorporar las especicaciones del diseo al anlisis de los datos, asegurando as que los resultados sern vlidos.

Propiedades de las muestras complejas


Una muestra compleja puede ser distinta de una muestra aleatoria simple en muchos aspectos. En una muestra aleatoria simple, las unidades de muestreo individuales se seleccionan aleatoriamente con la misma probabilidad y sin reposicin (SR) directamente a partir de la totalidad de la poblacin. Por lo contrario, una muestra compleja determinada puede tener alguna o todas las caractersticas siguientes:
Estratificacin. El muestreo estraticado implica seleccionar muestras independientemente

dentro de los subgrupos de la poblacin que no se solapen o estratos. Por ejemplo, los estratos pueden ser grupos socioeconmicos, categoras laborales, grupos de edad o grupos tnicos. Con la estraticacin, puede asegurar que los tamaos muestrales de los subgrupos de inters son adecuados, mejorar la precisin de las estimaciones globales y utilizar distintos mtodos de muestreo entre los diferentes estratos.
Conglomerados. El muestreo por conglomerados implica la seleccin de grupos de unidades

muestrales o conglomerados. Por ejemplo, los conglomerados pueden ser escuelas, hospitales o zonas geogrcas y las unidades muestrales pueden ser alumnos, pacientes o ciudadanos. El conglomerado es comn en los diseos polietpicos y en las muestras de zona (geogrca).
Mltiples etapas. En el muestreo polietpico, se selecciona una muestra de primera etapa basada en conglomerados. A continuacin, se crea una muestra de segunda etapa extrayendo submuestras a partir de los conglomerados seleccionados. Si la muestra de segunda etapa est basada en subconglomerados, entonces puede aadir una tercera etapa a la muestra. Por ejemplo, en la primera etapa de una encuesta, se podra extraer una muestra de ciudades. A continuacin, y a partir de las ciudades seleccionadas, se podran muestrear unidades familiares. Finalmente, a partir de las unidades familiares seleccionadas, se podra encuestar a individuos. Los Asistentes de muestreo y preparacin del anlisis permiten especicar tres etapas en un diseo.
1

2 Captulo 1

Muestreo no aleatorio. Cuando es difcil obtener la muestra aleatoriamente, las unidades se pueden

muestrear sistemticamente (con un intervalo jo) o secuencialmente.


Probabilidades de seleccin desiguales. Cuando se muestrean conglomerados que contienen

nmeros de unidades desiguales, puede utilizar el muestreo probabilstico proporcional al tamao (PPS) para que la probabilidad de seleccin del conglomerado sea igual a la proporcin de unidades que contiene. El muestreo PPS tambin puede utilizar esquemas de ponderacin ms generales para seleccionar unidades.
Muestreo no restringido. El muestreo no restringido selecciona las unidades con reposicin (CR).

Por lo tanto, se puede seleccionar ms de una vez una unidad individual para la muestra.
Ponderaciones muestrales. Las ponderaciones muestrales se calculan automticamente al extraer una muestra compleja y de forma ideal se corresponden con la frecuencia que cada unidad muestral representa en la poblacin objetivo. Por lo tanto, la suma de las ponderaciones muestrales debe estimar el tamao de la poblacin. Los procedimientos de anlisis de muestras complejas requieren las ponderaciones muestrales para poder analizar correctamente una muestra compleja. Tenga en cuenta que estas ponderaciones se deben utilizar exclusivamente dentro de la opcin Muestras complejas y no con otros procesos analticos a travs del procedimiento Ponderar casos, el cual trata las ponderaciones como rplicas de casos.

Uso de los procedimientos de Muestras complejas


El uso de los procedimientos de Muestras complejas depende de las necesidades especcas. Los tipos fundamentales de usuarios son aqullos que: Planican y llevan a cabo encuestas de acuerdo con diseos complejos, analizando posiblemente la muestra ms tarde. La herramienta principal de los encuestadores es el: Asistente de muestreo. Analiza archivos de datos muestrales obtenidos previamente segn diseos complejos. Antes de utilizar los procedimientos de anlisis de muestras complejas puede que deba utilizar el Asistente de preparacin del anlisis. Independientemente del tipo de usuario que sea, debe proporcionar informacin del diseo a los procedimientos de Muestras complejas. Esta informacin est almacenada en un archivo de plan para volver a utilizarla con mayor facilidad.

Archivos de plan
Los archivos de plan contienen especicaciones de la muestra compleja. Existen dos tipos de archivos de plan:
Plan de muestreo. Las especicaciones dadas en el Asistente de muestreo denen un diseo muestral que se utiliza para extraer una muestra compleja. El archivo del plan de muestreo contiene esas especicaciones. El archivo del plan de muestreo tambin contiene un plan de anlisis por defecto que utiliza mtodos de estimacin adecuados para el diseo muestral especicado.

3 Introduccin a los procedimientos de muestras complejas de SPSS

Plan de anlisis. Este archivo de plan contiene la informacin necesaria en los procedimientos de anlisis de Muestras complejas para calcular correctamente las estimaciones de la varianza de una muestra compleja. El plan incluye la estructura de la muestra, los mtodos de estimacin de cada etapa y las referencias para variables necesarias como por ejemplo, las ponderaciones muestrales. El Asistente de preparacin del anlisis permite crear y editar los planes de anlisis.

Existen distintas ventajas al guardar las especicaciones en un archivo de plan, por ejemplo: Un encuestador puede especicar la primera etapa de un plan de muestreo de varias etapas y extraer en el momento las unidades de la primera etapa, reunir informacin sobre las unidades muestrales para la segunda etapa y a continuacin, modicar el plan de muestreo para incluir la segunda etapa. Un analista que no tenga acceso al archivo del plan de muestreo puede especicar un plan de anlisis y hacer referencia a ese plan en cada procedimiento de anlisis de Muestras complejas. Un diseador de muestras a gran escala de uso pblico puede publicar el archivo del plan de muestreo, lo que simplica las instrucciones para el analista y evita que cada analista deba especicar sus propios planes de anlisis.

Lecturas adicionales
Si desea obtener ms informacin sobre las tcnicas de muestreo, consulte los siguientes textos: Cochran, W. G. 1977. Sampling Techniques, 3rd ed. Nueva York: John Wiley and Sons. Kish, L. 1965. Survey Sampling. Nueva York: John Wiley and Sons. Kish, L. 1987. Statistical Design for Research. Nueva York: John Wiley and Sons. Murthy, M. N. 1967. Sampling Theory and Methods. Calcuta (India): Statistical Publishing Society. Srndal, C., B. Swensson, y J. Wretman. 1992. Model Assisted Survey Sampling. Nueva York: Springer-Verlag.

Captulo

Muestreo a partir de un diseo complejo

Figura 2-1 Asistente de muestreo: paso Bienvenida

El Asistente de muestreo le gua a travs de los pasos necesarios para crear, modicar o ejecutar un archivo de plan de muestreo. Antes de utilizar el Asistente, debe tener en mente una poblacin objetivo bien denida, una lista de las unidades muestrales y un diseo muestral adecuado.

Creacin de un nuevo plan de muestreo


E Elija en los mens: Analizar Muestras complejas Seleccionar una muestra... 4

5 Muestreo a partir de un diseo complejo E Seleccione Disear una muestra y elija un nombre de archivo de plan para guardar el plan de

muestreo.
E Pulse Siguiente para continuar usando el Asistente. E Si lo desea, en el paso Denir las variables puede denir estratos, conglomerados e introducir ponderaciones muestrales. Despus de denirlos, pulse Siguiente. E Si lo desea, en el paso Mtodo de muestreo, puede elegir un mtodo para seleccionar los

elementos. Si selecciona Muestreo de Brewer proporcional al tamao o Muestreo de Murthy proporcional al tamao, puede pulsar Finalizar para extraer la muestra. En caso contrario, pulse Siguiente y a continuacin:
E En el paso Tamao muestral, especique el nmero o proporcin de unidades que muestrear.

Ahora puede pulsar Finalizar para extraer la muestra. Opcionalmente, en los siguientes pasos, puede: Elegir las variables de resultado para guardar. Aadir una segunda o tercera etapa al diseo. Establecer varias opciones de seleccin, incluyendo las etapas a partir de las cuales se van a extraer las muestras, la semilla de aleatorizacin y si los valores perdidos denidos por el usuario se van a tratar como valores vlidos de las variables del diseo. Elegir dnde guardar los datos de resultado. Pegar las selecciones como sintaxis de comandos.

6 Captulo 2

Asistente de muestreo: Variables del diseo


Figura 2-2 Asistente de muestreo: paso Variables del diseo

Este paso permite seleccionar las variables de estraticacin y conglomeracin y denir unas ponderaciones muestrales de entrada. Tambin puede especicar una etiqueta para la etapa.
Estratificar por. La clasicacin conjunta por las variables de estraticacin dene distintas subpoblaciones o estratos. Se obtienen muestras individuales para cada estrato. Para mejorar la precisin de las estimaciones, las unidades de los estratos deben ser tan homogneas como sea posible respecto a las caractersticas de inters. Conglomerados. Las variables de conglomeracin denen grupos de unidades de observacin o

conglomerados. Los conglomerados son tiles cuando es difcil o imposible realizar el muestreo de las unidades de observacin directamente desde la poblacin; en su lugar, se puede realizar el muestreo de los conglomerados a partir de la poblacin y a continuacin, realizar el muestreo de las unidades de observacin a partir de los conglomerados seleccionados. Sin embargo, el uso de conglomerados puede introducir correlaciones entre las unidades muestrales, con la consiguiente prdida de precisin. Para minimizar este efecto, las unidades de los conglomerados deben ser tan heterogneas como sea posible respecto a las caractersticas de inters. Deber denir una variable de conglomeracin como mnimo para planicar un diseo de varias etapas. Los conglomerados tambin son necesarios al utilizar distintos mtodos de muestreo. Si desea obtener ms informacin, consulte Asistente de muestreo: Mtodo de muestreo en p. 8.

7 Muestreo a partir de un diseo complejo

Introducir ponderacin muestral. Si el diseo muestral actual forma parte de un diseo muestral

mayor, puede disponer de ponderaciones muestrales de una etapa anterior del diseo mayor. Puede especicar una variable numrica que contenga estas ponderaciones en la primera etapa del diseo actual. Las ponderaciones muestrales se calculan automticamente para las etapas posteriores del diseo actual.
Etiqueta de etapa. Puede especicar una etiqueta de cadena opcional para cada etapa. Esto se

utiliza en los resultados para facilitar la identicacin de la informacin por etapas. Nota: La lista de variables origen tiene el mismo contenido a lo largo de los pasos del Asistente. En otras palabras, las variables de la lista de origen eliminadas en un paso determinado se borran de la lista en todos los pasos. Las variables devueltas a la lista de origen aparecen en la lista en todos los pasos.

Controles de rbol para navegar por el Asistente de muestreo


En la parte izquierda de cada paso del Asistente de muestreo se muestra un esquema de los titulares de todos los pasos. Puede navegar por el Asistente al pulsar el nombre de uno de los pasos activados en el esquema. Los pasos estn activados cuando todos los pasos anteriores sean vlidos, es decir, si cada uno de los pasos anteriores dispone de las especicaciones mnimas necesarias para ese paso. Consulte la ayuda de los pasos individuales para obtener ms informacin sobre los motivos por los que un paso determinado puede no ser vlido.

8 Captulo 2

Asistente de muestreo: Mtodo de muestreo


Figura 2-3 Asistente de muestreo: paso Mtodo

Este paso permite especicar cmo seleccionar los casos del conjunto de datos activo.
Mtodo. Los controles de este grupo se utilizan para elegir un mtodo de seleccin. Algunos tipos

de muestreo permiten elegir entre realizar un muestreo con reposicin (CR) o sin reposicin (SR). Si desea obtener ms informacin, consulte las descripciones de los tipos. Tenga en cuenta que algunos tipos de probabilidad proporcional al tamao (PPS) estn disponibles slo cuando se han denido conglomerados y todos los tipos de PPS estn disponibles slo en la primera etapa de un diseo. Adems, los mtodos SR estn disponibles slo en la ltima etapa de un diseo.
Muestreo aleatorio simple: Las unidades se seleccionan con probabilidad igual. Se pueden

seleccionar con o sin reposicin.


Sistemtico simple. Las unidades se seleccionan con un intervalo jo en todo el marco

muestral (o en los estratos, si se han especicado) y se extraen sin reposicin. Se selecciona una unidad aleatoriamente dentro del primer intervalo como el punto inicial.
Secuencial simple. Las unidades se seleccionan de forma secuencial con probabilidad igual y

sin reposicin.
Probabilidad proporcional al tamao. Mtodo de primera etapa que selecciona unidades de

forma aleatoria con probabilidad proporcional al tamao. Se puede seleccionar cualquier unidad con reposicin; slo se puede realizar muestreo sin reposicin de los conglomerados.

9 Muestreo a partir de un diseo complejo

Muestreo sistemtico proporcional al tamao. Mtodo de primera etapa que selecciona

unidades de forma sistemtica con probabilidad proporcional al tamao. Se seleccionan sin reposicin.
Muestreo secuencial proporcional al tamao. Mtodo de primera etapa que selecciona

unidades de forma secuencial con probabilidad proporcional al tamao del conglomerado y sin reposicin.
Muestreo de Brewer proporcional al tamao. Mtodo de primera etapa que selecciona dos

conglomerados de cada estrato con probabilidad proporcional al tamao del conglomerado y sin reposicin. Se debe especicar una variable de conglomeracin para utilizar este mtodo.
Muestreo de Murthy proporcional al tamao. Mtodo de primera etapa que selecciona dos

conglomerados de cada estrato con probabilidad proporcional al tamao del conglomerado y sin reposicin. Se debe especicar una variable de conglomeracin para utilizar este mtodo.
Muestreo de Sampford proporcional al tamao. Mtodo de primera etapa que selecciona

ms de dos conglomerados de cada estrato con probabilidad proporcional al tamao del conglomerado y sin reposicin. Es una extensin del mtodo de Brewer. Se debe especicar una variable de conglomeracin para utilizar este mtodo.
Usar estimacin CR para el anlisis. Por defecto, el mtodo de estimacin se especica en el

archivo de plan de manera coherente con el mtodo de muestreo seleccionado. Esta opcin permite utilizar la estimacin con reposicin incluso si el mtodo de muestreo implica la estimacin SR. Esta opcin solamente est disponible en la etapa 1.
Medida del tamao (MDT). Si se selecciona un mtodo PPS, deber especicar una medida del tamao que dena el tamao de cada unidad. Estos tamaos pueden denirse explcitamente en una variable o se pueden calcular a partir de los datos. Opcionalmente, se pueden establecer los lmites inferior y superior de la MDT, anulando cualquier valor encontrado en la variable MDT o calculado a partir de los datos. Estas opciones solamente estn disponibles en la etapa 1.

10 Captulo 2

Asistente de muestreo: Tamao muestral


Figura 2-4 Asistente de muestreo: paso Tamao muestral

Este paso permite especicar el nmero o la proporcin de unidades que se van a muestrear dentro de la etapa actual. El tamao muestral puede ser jo o variar entre estratos. Para el propsito de especicar el tamao muestral, se pueden utilizar los conglomerados elegidos en etapas anteriores para denir estratos.
Unidades. Puede especicar un tamao muestral exacto o una proporcin de unidades a muestrear. Valor. Se aplica un valor particular a todos los estratos. Si se selecciona Recuentos como la

unidad mtrica, deber introducir un entero positivo. Si se selecciona Proporciones, deber introducir un valor no negativo. A no ser que se realice una muestra con reposicin, los valores de proporcin no debern ser mayores que 1.
Valores desiguales para estratos. Permite introducir distintos valores de tamao para cada

estrato a travs del cuadro de dilogo Denir tamaos desiguales.


Leer valores de la variable. Permite seleccionar una variable numrica que contenga los

valores de tamao para los estratos. Si se selecciona Proporciones, tiene la opcin de establecer los lmites inferior y superior para el nmero de unidades muestreadas.

11 Muestreo a partir de un diseo complejo

Definir tamaos desiguales


Figura 2-5 Cuadro de dilogo Definir tamaos desiguales

El cuadro de dilogo Denir tamaos desiguales permite introducir los tamaos para cada estrato.
Rejilla de especificaciones de tamao. La rejilla muestra la clasicacin conjunta de hasta cinco

variables de conglomeracin o estrato, con una combinacin de estrato/conglomerado por la. Las variables elegibles en la rejilla sern todas las variables de estraticacin de las etapas anteriores y actuales adems de todas las variables de conglomeracin de las etapas anteriores. Las variables se pueden reordenar dentro de la rejilla o ser desplazadas a la lista Excluir. Introduzca los tamaos en la ltima columna de la derecha. Pulse en Etiquetas o Valores para conmutar entre la visualizacin de las etiquetas de valor y los valores de los datos para las variables de estraticacin y de conglomeracin de las casillas de la rejilla. Las casillas que contienen valores sin etiquetas siempre muestran valores. Pulse Actualizar estratos para volver a rellenar la rejilla con cada combinacin de los valores de los datos etiquetados para las variables de la rejilla.
Excluir. Para especicar los tamaos de un subconjunto de combinaciones de estrato/conglomerado, desplace una o ms variables a la lista Excluir. Estas variables no se utilizan para denir tamaos muestrales.

12 Captulo 2

Asistente de muestreo: Variables de resultado


Figura 2-6 Asistente de muestreo: paso Variables de resultado

Este paso permite elegir las variables que desea guardar cuando se extraiga la muestra.
Tamao de la poblacional. El nmero estimado de unidades en la poblacin de una etapa dada.

El nombre raz de la variable guardada es TamaoPoblacin_.


Proporcin muestral. Tasa de la muestra en una etapa dada. El nombre raz de la variable guardada

es TasaMuestreo_.
Tamao muestral. Nmero de unidades extradas en una etapa dada. El nombre raz de la variable

guardada es TamaoMuestra_.
Ponderacin muestral. La inversa de las probabilidades de inclusin. El nombre raz de la variable guardada es PonderacinMuestra_.

Algunas variables por etapa se generan automticamente. Entre stos se incluyen:


Probabilidades de inclusin. Proporcin de unidades extradas en una etapa dada. El nombre raz

de la variable guardada es ProbabilidadInclusin_.


Ponderacin acumulada. Ponderacin de la muestra acumulada a lo largo de las etapas

anteriores a la actual e incluyendo esta ltima. El nombre raz de la variable guardada es PonderacinMuestraAcumulada_.
ndice. Identica las unidades seleccionadas varias veces dentro de una etapa dada. El nombre

raz de la variable guardada es ndice_.

13 Muestreo a partir de un diseo complejo

Nota: Los nombres raz de la variable guardada incluyen un sujo entero que reeja el nmero de la etapa, por ejemplo, TamaoPoblacin_1_ para el tamao de la poblacin guardada de la etapa 1.

Asistente de muestreo: Resumen del plan


Figura 2-7 Asistente de muestreo: paso Resumen del plan

ltimo paso de cada etapa que proporciona un resumen de las especicaciones del diseo muestral hasta la etapa actual. A partir de aqu, puede pasar a la siguiente etapa (crendola si es necesario) o denir las opciones para extraer la muestra.

14 Captulo 2

Asistente de muestreo: Extraer muestra: Opciones de seleccin


Figura 2-8 Asistente de muestreo: Extraer muestra, paso Opciones de seleccin

Este paso permite elegir si desea extraer una muestra. Tambin puede controlar otras opciones del muestreo, como la semilla aleatoria y el tratamiento de los valores perdidos.
Extraer muestra. Adems de elegir si desea extraer una muestra, tambin puede elegir ejecutar

parte del diseo muestral. Las etapas se deben extraer en orden es decir, la etapa 2 no se puede extraer a menos que ya se haya extrado la etapa 1. Al editar o ejecutar un plan, no puede volver a muestrear etapas bloqueadas.
Semilla. Permite elegir un valor de semilla para la generacin de nmeros aleatorios. Incluye los valores perdidos definidos por el usuario. Determina si los valores perdidos denidos

por el usuario son tratados como vlidos Si es as, los valores perdidos denidos por el usuario se tratan como una categora diferente.
Los datos ya estn ordenados. Si el marco muestral est clasicado previamente por los valores de

las variables de estraticacin, esta opcin permite acelerar el proceso de seleccin.

15 Muestreo a partir de un diseo complejo

Asistente de muestreo: Extraer muestra: Archivos de resultado


Figura 2-9 Asistente de muestreo: Extraer muestra, paso Archivos de resultado

Este paso permite elegir dnde dirigir los casos muestreados, las variables de ponderacin, las probabilidades conjuntas y las reglas de seleccin de casos.
Datos muestrales. Estas opciones permiten determinar dnde se escribe el resultado de la muestra.

Se puede aadir a un conjunto de datos activo, escribir en un nuevo conjunto de datos o guardar en un archivo de datos con formato SPSS externo. Los conjuntos de datos estn disponibles durante la sesin actual, pero no as en las sesiones posteriores, a menos que los haya guardado explcitamente como archivos de datos. El nombre de un conjunto de datos debe cumplir las normas de denominacin de variables de SPSS. Si se especica un archivo externo o un nuevo conjunto de datos, se escribirn las variables de los resultados del muestreo y las variables del conjunto de datos activo para los casos seleccionados.
Probabilidades conjuntas. Estas opciones permiten determinar dnde se escriben las

probabilidades conjuntas. stas se guardan en un archivo de datos con formato SPSS externo. Las probabilidades conjuntas se producen si se seleccionan la probabilidad proporcional al tamao sin reposicin, el muestreo de Brewer proporcional al tamao, el muestreo de Sampford proporcional al tamao, o el muestreo de Murthy proporcional al tamao y la estimacin con reposicin no se especica.
Reglas de seleccin de casos. Si est construyendo la muestra por etapas, es posible que quiera

guardar las reglas de seleccin de casos en un archivo de texto. Son tiles para construir el submarco de las etapas posteriores.

16 Captulo 2

Asistente de muestreo: Finalizar


Figura 2-10 Asistente de muestreo: paso Finalizar

Este paso es el ltimo. Puede guardar el archivo de plan y extraer la muestra ahora o pegar las selecciones en una ventana de sintaxis. Al realizar cambios a las etapas del archivo de plan existente, puede guardar el plan editado en un archivo nuevo o sobrescribir el archivo existente. Al aadir etapas sin realizar cambios en las etapas existentes, el asistente sobrescribe de manera automtica el archivo de planicacin existente. Si desea guardar la planicacin en un nuevo archivo, seleccione Pegar la sintaxis generada por el asistente en una ventana de sintaxis y cambie el nombre del archivo en los comandos de sintaxis.

Modificar un plan de muestreo existente


E Elija en los mens: Analizar Muestras complejas Seleccionar una muestra... E Seleccione Editar un diseo muestral y elegir un archivo de plan para editar. E Pulse Siguiente para continuar usando el Asistente.

17 Muestreo a partir de un diseo complejo E Revise el plan de muestreo del paso Resumen del plan, y a continuacin pulse Siguiente.

Los pasos posteriores son prcticamente iguales que los de un diseo nuevo. Si desea obtener ms informacin sobre los pasos individuales, consulte la ayuda.
E Vaya al paso nal y especique un nombre nuevo para el archivo de plan editado o sobrescriba el

archivo de plan existente. Si lo desea, puede: Especicar las etapas que ya se han muestreado. Eliminar etapas del plan.

Asistente de muestreo: Resumen del plan


Figura 2-11 Asistente de muestreo: paso Resumen del plan

Este paso permite revisar el plan de muestreo e indicar las etapas que ya se han muestreado. Al editar un plan, tambin puede eliminar etapas del plan.
Etapas muestreadas previamente. Si un marco de muestreo ampliado no est disponible, deber

ejecutar un diseo muestral polietpico etapa por etapa. Seleccione las etapas que ya se han muestreado en la lista desplegable. Las etapas que ya se hayan ejecutado estarn bloqueadas, por lo que no estarn disponibles en el paso Extraer muestra: Opciones de seleccin y no se podrn modicar al editar un plan.
Eliminar etapas. Puede eliminar las etapas 2 y 3 de un diseo polietpico.

18 Captulo 2

Ejecutar un plan de muestreo existente


E Elija en los mens: Analizar Muestras complejas Seleccionar una muestra... E Seleccione Extraer una muestra y elija un archivo de plan para ejecutar. E Pulse Siguiente para continuar usando el Asistente. E Revise el plan de muestreo del paso Resumen del plan, y a continuacin pulse Siguiente. E Cuando se ejecuta un plan de muestreo se omiten los pasos individuales que contienen

informacin de la etapa. Ya puede pasar al paso de nalizacin. Si lo desea, puede: Especicar las etapas que ya se han muestreado.

Funciones adicionales de los comandos CSPLAN y CSSELECT


El lenguaje de comandos de SPSS tambin permite: Especicar nombres personalizados para las variables de resultado. Controlar los resultados en el Visor. Por ejemplo, puede suprimir el resumen por etapas del plan que se muestra si se disea o modica una muestra, suprimir el resumen de la distribucin de los casos muestreados por etapas que se muestra si el diseo muestral se ejecuta y solicitar un resumen del procesamiento de los casos. Elegir un subconjunto de las variables existentes en el conjunto de datos activo para escribirlo en un archivo muestral externo o en otro conjunto de datos. Si desea informacin detallada sobre la sintaxis, consulte la referencia de sintaxis de comandos de SPSS (SPSS Command Syntax Reference).

Captulo

Preparacin de una muestra compleja para su anlisis

Figura 3-1 Asistente de preparacin del anlisis: paso Bienvenida

El Asistente de preparacin del anlisis le gua a travs de los pasos para crear o modicar un plan de anlisis y utilizarlo con los distintos procedimientos de anlisis de Muestras complejas. Antes de utilizar el Asistente, debe haber extrado la muestra de acuerdo con un diseo complejo. Es ms til crear un plan nuevo cuando no se tiene acceso al archivo del plan de muestreo utilizado para extraer la muestra (recuerde que el plan de muestreo contiene un plan de anlisis por defecto). Si no tiene acceso al archivo del plan de muestreo utilizado para extraer la muestra, puede utilizar el plan de anlisis contenido por defecto en el archivo del plan de muestreo u omitir las especicaciones del anlisis por defecto y guardar los cambios en un archivo nuevo.

19

20 Captulo 3

Creacin de un nuevo plan de anlisis


E Elija en los mens: Analizar Muestras complejas Preparar para el anlisis... E Seleccione Crear un archivo de plan, y elija un nombre de archivo de plan para guardar el plan

del anlisis.
E Pulse Siguiente para continuar usando el Asistente. E Especique la variable que contiene las ponderaciones muestrales en el paso Variables del diseo,

si lo desea puede denir estratos y conglomerados. Ahora puede pulsar Finalizar para guardar el plan. Si lo desea, en los siguientes pasos puede: Seleccionar el mtodo de estimacin de los errores tpicos en el paso Mtodo de estimacin. Especicar el nmero de unidades muestrales o la probabilidad de inclusin por unidad en el paso Tamao. Aadir una segunda o tercera etapa al diseo. Pegar las selecciones como sintaxis de comandos.

21 Preparacin de una muestra compleja para su anlisis

Asistente de preparacin del anlisis: Variables del diseo


Figura 3-2 Asistente de preparacin del anlisis, paso Variables del diseo

Este paso permite identicar las variables de estraticacin y conglomeracin y denir las ponderaciones muestrales. Tambin puede proporcionar una etiqueta para la etapa.
Estratos. La clasicacin conjunta por las variables de estraticacin dene distintas

subpoblaciones o estratos. El total muestral representa la combinacin de las muestras independientes pertenecientes a cada estrato.
Conglomerados. Las variables de conglomeracin denen grupos de unidades de observacin

o conglomerados. Las muestras extradas en varias etapas seleccionan conglomerados en las etapas anteriores y, a continuacin, unidades de submuestreo dentro de los conglomerados seleccionados. Al analizar un archivo de datos obtenido mediante el muestreo de conglomerados con reposicin, debe incluir el ndice de duplicacin como una variable de conglomeracin.
Ponderacin muestral. Debe proporcionar ponderaciones muestrales en la primera etapa. Las

ponderaciones muestrales se calculan automticamente para las etapas posteriores del diseo actual.
Etiqueta de etapa. Puede especicar una etiqueta de cadena opcional para cada etapa. Esto se

utiliza en los resultados para facilitar la identicacin de la informacin por etapas.

22 Captulo 3

Nota: la lista de variables de origen tiene el mismo contenido a lo largo de los pasos del Asistente. En otras palabras, las variables de la lista de origen eliminadas en un paso determinado se borran de la lista en todos los pasos. Las variables devueltas a la lista de origen aparecen en todos los pasos.

Controles de rbol para desplazarse por el Asistente para el anlisis


En la parte izquierda de cada paso del Asistente para el anlisis se muestra un esquema con los titulares de todos los pasos. Puede navegar por el Asistente al pulsar el nombre de uno de los pasos activados en el esquema. Los pasos estn activados mientras todos los pasos anteriores sean vlidos, es decir, mientras cada uno de los pasos anteriores tenga las especicaciones mnimas necesarias para ese paso. Consulte la ayuda de los pasos individuales para obtener ms informacin sobre los motivos por los que un paso dado puede no ser vlido.

Asistente de preparacin del anlisis: Mtodo de estimacin


Figura 3-3 Asistente de preparacin del anlisis, paso Mtodo de estimacin

Este paso permite especicar un mtodo de estimacin para la etapa.


CR (muestreo con reposicin). La estimacin CR no incluye una correccin de muestreo para

poblaciones nitas (FPC) al estimar la varianza bajo el diseo de muestreo complejo. Puede incluir o excluir la FPC al estima la varianza bajo muestreo aleatorio simple (SRS).

23 Preparacin de una muestra compleja para su anlisis

Se recomienda no incluir la FPC para la estimacin de varianza SRS cuando las ponderaciones de anlisis se hayan escalado de forma que no se agreguen al tamao de la poblacin. La estimacin de varianza SRS se utiliza para calcular estadsticos como el efecto del diseo. La estimacin CR slo se puede especicar en la etapa nal de un diseo; el Asistente no permitir aadir otra etapa si se selecciona la estimacin CR.
Igual SR (muestreo de igual probabilidad sin reposicin). La estimacin Igual SR incluye la

correccin para poblaciones nitas y supone que las unidades se muestrearon con la misma probabilidad. El mtodo Igual SR se puede especicar en cualquiera de las etapas de un diseo.
Desigual SR (muestreo de probabilidad desigual sin reposicin). Adems de utilizar la correccin

para poblaciones nitas, el mtodo Desigual SR tiene en cuenta las unidades muestrales (normalmente conglomerados) que han sido seleccionadas con probabilidades desiguales. Este mtodo de estimacin slo est disponible en la primera etapa.

Asistente de preparacin del anlisis: Tamao


Figura 3-4 Asistente de preparacin del anlisis, paso Tamao

Este paso se utiliza para especicar las probabilidades de inclusin o los tamaos poblacionales para la etapa actual. Los tamaos pueden ser jos o variar entre estratos. Para especicar los tamaos, los conglomerados especicados en las etapas anteriores se pueden utilizar para denir estratos. Tenga en cuenta que este paso slo es necesario cuando se elige el mtodo Igual SR como mtodo de estimacin.

24 Captulo 3

Unidades. Puede especicar los tamaos poblacionales exactos o las probabilidades con las que

se ha realizado el muestreo de las unidades.


Valor. Se aplica un valor particular a todos los estratos. Si se selecciona Tamaos poblacionales

como la unidad mtrica, se deber introducir un entero no negativo. Si se selecciona Probabilidades de inclusin, se deber introducir un valor entre 0 y 1, ambos incluidos.
Valores desiguales para estratos. Permite introducir distintos valores de tamao para cada

estrato a travs del cuadro de dilogo Denir tamaos desiguales.


Leer valores de la variable. Permite seleccionar una variable numrica que contenga los

valores de tamao para los estratos.

Definir tamaos desiguales


Figura 3-5 Cuadro de dilogo Definir tamaos desiguales

El cuadro de dilogo Denir tamaos desiguales permite introducir los tamaos para cada estrato.
Rejilla de especificaciones de tamao. La rejilla muestra la clasicacin conjunta de hasta cinco

variables de conglomeracin o estrato, con una combinacin de estrato/conglomerado por la. Las variables elegibles en la rejilla sern todas las variables de estraticacin de las etapas anteriores y actuales adems de todas las variables de conglomeracin de las etapas anteriores. Las variables se pueden reordenar dentro de la rejilla o ser desplazadas a la lista Excluir. Introduzca los tamaos en la ltima columna de la derecha. Pulse en Etiquetas o Valores para conmutar entre la visualizacin de las etiquetas de valor y los valores de los datos para las variables de estraticacin y de conglomeracin de las casillas de la rejilla. Las casillas que contienen valores sin etiquetas siempre muestran valores. Pulse Actualizar estratos para volver a rellenar la rejilla con cada combinacin de los valores de los datos etiquetados para las variables de la rejilla.
Excluir. Para especicar los tamaos de un subconjunto de combinaciones de

estrato/conglomerado, desplace una o ms variables a la lista Excluir. Estas variables no se utilizan para denir tamaos muestrales.

25 Preparacin de una muestra compleja para su anlisis

Asistente de preparacin del anlisis: Resumen del plan


Figura 3-6 Asistente de preparacin del anlisis, paso Resumen del plan

Este paso es el ltimo de cada etapa y proporciona un resumen de las especicaciones del diseo del anlisis hasta la etapa actual, sta incluida. A partir de aqu, puede pasar a la siguiente etapa (crendola si fuera necesario) o guardar las especicaciones del anlisis. Si no puede aadir otra etapa, esto puede deberse a: No se especic ninguna variable de conglomeracin en el paso Variables del diseo. Seleccion la estimacin CR en el paso Mtodo de estimacin. Este paso es el tercero del anlisis; el Asistente admite un mximo de tres etapas.

26 Captulo 3

Asistente de preparacin del anlisis: Finalizar


Figura 3-7 Asistente de preparacin del anlisis: Finalizacin

Este paso es el ltimo. Puede guardar el archivo del plan ahora o pegar las selecciones en una ventana de sintaxis. Al realizar cambios a las etapas del archivo de plan existente, puede guardar el plan editado en un archivo nuevo o sobrescribir el archivo existente. Al aadir etapas sin realizar cambios en las etapas existentes, el asistente sobrescribe de manera automtica el archivo de planicacin existente. Si desea guardar la planicacin en un nuevo archivo, elija Pegar la sintaxis generada por el asistente en una ventana de sintaxis y cambie el nombre del archivo en los comandos de sintaxis.

Modificar un plan de anlisis existente


E Elija en los mens: Analizar Muestras complejas Preparar para el anlisis... E Seleccione Editar un archivo de plan y elija un nombre de archivo de plan en el que se guardar

el plan del anlisis.


E Pulse Siguiente para continuar usando el Asistente.

27 Preparacin de una muestra compleja para su anlisis E Revise el plan de anlisis en el paso Resumen del plan y, a continuacin, pulse Siguiente.

Los pasos posteriores son prcticamente iguales que los de un diseo nuevo. Si desea obtener ms informacin, consulte la ayuda sobre los pasos individuales.
E Vaya al paso nal y especique un nombre nuevo para el archivo de plan editado o sobrescriba el

archivo de plan existente. Si lo desea, puede: Eliminar etapas del plan.

Asistente de preparacin del anlisis: Resumen del plan


Figura 3-8 Asistente de preparacin del anlisis, paso Resumen del plan

Este paso permite revisar el plan de anlisis y eliminar etapas del plan.
Eliminar etapas. Puede eliminar las etapas 2 y 3 de un diseo polietpico. Debido a que los planes

deben tener al menos una etapa, puede editar la etapa 1 pero no eliminarla del diseo.

Captulo

Plan de muestras complejas

Los procedimientos de anlisis de Muestras complejas requieren las especicaciones de anlisis de un archivo de plan de muestreo o un plan de anlisis para poder proporcionar resultados vlidos.
Figura 4-1 Cuadro de dilogo Plan de muestras complejas

Plan. Especique la ruta de un archivo de plan de muestreo o anlisis. Probabilidades conjuntas. Para utilizar una estimacin Desigual SR para los conglomerados

extrados utilizando un mtodo PPS SR, debe especicar un archivo independiente o un conjunto de datos abierto que contenga las probabilidades conjuntas. El archivo o conjunto de datos se crea mediante el Asistente de muestreo durante el muestreo.

28

Captulo

Frecuencias de Muestras complejas

El procedimiento Frecuencias de Muestras complejas genera tablas de frecuencias para las variables seleccionadas y muestra estadsticos univariantes. Si lo desea, puede solicitar estadsticos por subgrupos, denidos por una o ms variables categricas.
Ejemplo. Mediante el procedimiento Frecuencias de Muestras complejas, puede obtener

estadsticos tabulares univariantes para el consumo de vitaminas entre los ciudadanos de EE.UU., basados en los resultados del National Health Interview Survey (NHIS, Centro Nacional de Estadsticas de Salud) y con un plan de anlisis adecuado para estos datos de uso pblico.
Estadsticos. El procedimiento genera estimaciones de los tamaos poblacionales de las casillas,

adems de errores tpicos, intervalos de conanza, coecientes de variacin, efectos del diseo, raz cuadrada de los efectos del diseo, valores acumulados y recuentos no ponderados para cada estimacin. Adems, se calculan los estadsticos de chi-cuadrado y la razn de verosimilitud para el contraste de proporciones de casilla iguales.
Datos. Variables para las que se generan las tablas de frecuencias deben ser categricas. Las variables que denen las subpoblaciones pueden ser numricas o de cadena, pero siempre deben ser categricas. Supuestos. Los casos del archivo de datos representan una muestra de un diseo complejo que

se debe analizar segn las especicaciones del archivo seleccionado en el Cuadro de dilogo Plan de muestras complejas.
Obtencin de Frecuencias de Muestras complejas
E Elija en los mens: Analizar Muestras complejas Frecuencias... E Seleccione un archivo de plan y, si lo desea, seleccione un archivo de probabilidades conjuntas

personalizado.
E Pulse en Continuar.

29

30 Captulo 5 Figura 5-1 Cuadro de dilogo Frecuencias

E Seleccione al menos una variable de frecuencia.

Si lo desea, puede: Especicar variables para denir subpoblaciones. Los estadsticos se calculan por separado para cada subpoblacin.

Frecuencias de Muestras complejas: Estadsticos


Figura 5-2 Cuadro de dilogo Frecuencias: Estadsticos

Casillas. Este grupo permite solicitar estimaciones de los tamaos poblacionales de las casillas as como porcentajes de tabla. Estadsticos. Este grupo genera estadsticos asociados con el tamao poblacional o los porcentajes

de tabla.

31 Frecuencias de Muestras complejas

Error tpico. El error tpico de la estimacin. Intervalo de confianza. Intervalo de conanza para la estimacin, utilizando el nivel

especicado.
Coeficiente de variacin. Cociente del error tpico de la estimacin dividida por la estimacin. Recuento no ponderado. Nmero de unidades utilizadas para calcular la estimacin. Efecto del diseo. Cociente de la variacin de la estimacin entre la variacin obtenida

al suponer que la muestra es una muestra aleatoria simple. Es una medida del efecto de especicar un diseo complejo donde los valores ms distantes de 1 indican efectos mayores.
Raz cuadrada del efecto del diseo. Es una medida del efecto de especicar un diseo

complejo donde los valores ms distantes de 1 indican efectos mayores.


Valores acumulados. La estimacin acumulada a travs de los valores de la variable. Contraste sobre proporciones de casilla iguales. Esto genera los contrastes de chi-cuadrado y la razn de verosimilitud sobre la hiptesis de que las categoras de una variable tienen la misma frecuencia. Se realizan contrastes por separado para cada variable.

Muestras complejas: Valores perdidos


Figura 5-3 Cuadro de dilogo Valores perdidos

Tablas. Este grupo determina los casos que se utilizan en el anlisis. Utilizar todos los datos disponibles. Los valores perdidos se determinan en base a tabla por

tabla. As, los casos utilizados para calcular los estadsticos pueden variar a travs de la frecuencia o tablas de contingencia.
Utilizar una base coherente para los casos. Los valores perdidos se determinan a travs de

todas las variables. Por lo tanto, los casos utilizados para calcular los estadsticos son coherentes con las tablas.
Variables categricas del diseo. Este grupo determina si los valores perdidos denidos por el

usuario son considerados vlidos o invlidos.

32 Captulo 5

Opciones de Muestras complejas


Figura 5-4 Cuadro de dilogo Opciones

Presentacin de las subpoblaciones. Puede elegir entre mostrar las subpoblaciones en la misma

tabla o en tablas separadas.

Captulo

Descriptivos de Muestras complejas

El procedimiento Descriptivos de Muestras complejas muestra estadsticos de resumen univariantes para distintas variables. Si lo desea, puede solicitar estadsticos por subgrupos, denidos por una o ms variables categricas.
Ejemplo. Mediante el procedimiento Descriptivos de Muestras complejas, puede obtener

estadsticos descriptivos univariantes de los niveles de actividad de los ciudadanos de EE.UU., basados en los resultados de la National Health Interview Survey (NHIS, Centro Nacional de Estadsticas de Salud) y con un plan de anlisis adecuado para estos datos de uso pblico.
Estadsticos. El procedimiento genera medias y sumas, adems de pruebas t, errores tpicos,

intervalos de conanza, coecientes de variacin, recuentos no ponderados, efectos del diseo y la raz cuadrada del efecto del diseo de cada estimacin.
Datos. Las medidas deben ser variables de escala. Las variables que denen las subpoblaciones pueden ser numricas o de cadena, pero siempre deben ser categricas. Supuestos. Los casos del archivo de datos representan una muestra de un diseo complejo que

se debe analizar segn las especicaciones del archivo seleccionado en el Cuadro de dilogo Plan de muestras complejas.
Obtencin de Descriptivos de Muestras complejas
E Elija en los mens: Analizar Muestras complejas Descriptivos... E Seleccione un archivo de plan y, si lo desea, seleccione un archivo de probabilidades conjuntas

personalizado.
E Pulse en Continuar.

33

34 Captulo 6 Figura 6-1 Cuadro de dilogo Descriptivos

E Seleccione al menos una variable de medida.

Si lo desea, puede: Especicar variables para denir subpoblaciones. Los estadsticos se calculan por separado para cada subpoblacin.

Descriptivos de Muestras complejas: Estadsticos


Figura 6-2 Cuadro de dilogo Descriptivos: Estadsticos

Resmenes. Este grupo permite solicitar estimaciones de las medias y sumas de las variables

de medida. Adems, puede solicitar pruebas t de las estimaciones con respecto a un valor especicado.

35 Descriptivos de Muestras complejas

Estadsticos. Este grupo genera estadsticos asociados con la media o la suma. Error tpico. El error tpico de la estimacin. Intervalo de confianza. Intervalo de conanza para la estimacin, utilizando el nivel

especicado.
Coeficiente de variacin. Cociente del error tpico de la estimacin dividida por la estimacin. Recuento no ponderado. Nmero de unidades utilizadas para calcular la estimacin. Tamao de la poblacional. Nmero estimado de unidades en la poblacin. Efecto del diseo. Cociente de la variacin de la estimacin entre la variacin obtenida

al suponer que la muestra es una muestra aleatoria simple. Es una medida del efecto de especicar un diseo complejo donde los valores ms distantes de 1 indican efectos mayores.
Raz cuadrada del efecto del diseo. Es una medida del efecto de especicar un diseo

complejo donde los valores ms distantes de 1 indican efectos mayores.

Valores perdidos en los descriptivos de Muestras complejas


Figura 6-3 Cuadro de dilogo Valores perdidos de descriptivos

Estadsticos para las variables de medida. Este grupo determina los casos que se utilizan en

el anlisis.
Utilizar todos los datos disponibles. Los valores perdidos se determinan variable por variable;

por ello los casos utilizados para calcular los estadsticos pueden variar entre las variables de medida.
Asegurar una base coherente para los casos. Los valores perdidos se determinan a partir de

todas las variables, as, los casos utilizados para calcular los estadsticos son coherentes.
Variables categricas del diseo. Este grupo determina si los valores perdidos denidos por el

usuario son considerados vlidos o invlidos.

36 Captulo 6

Opciones de Muestras complejas


Figura 6-4 Cuadro de dilogo Opciones

Presentacin de las subpoblaciones. Puede elegir entre mostrar las subpoblaciones en la misma

tabla o en tablas separadas.

Captulo

Tablas de contingencia de Muestras complejas

El procedimiento Tablas de contingencia de Muestras complejas genera tablas de contingencia para los pares de variables seleccionadas y muestra estadsticos sobre la clasicacin bivariante. Si lo desea, puede solicitar estadsticos por subgrupos, denidos por una o ms variables categricas.
Ejemplo. Mediante el procedimiento Tablas de contingencia de Muestras complejas, se pueden obtener estadsticos de clasicaciones cruzadas de la frecuencia de consumo de tabaco por el consumo de vitaminas en los ciudadanos de EE.UU, basado en los resultados del National Health Interview Survey (NHIS, Centro Nacional de Estadsticas de Salud) y con un plan de anlisis adecuado para estos datos de uso pblico. Estadsticos. El procedimiento genera estimaciones de los tamaos poblacionales de las casillas,

as como porcentajes de tabla, columna y la, adems de errores tpicos, intervalos de conanza, coecientes de variacin, valores esperados, efectos del diseo, raz cuadrada de los efectos del diseo, residuos, residuos corregidos y frecuencias no ponderadas para cada estimacin. Para las tablas 2 por 2, se calculan la razn de ventajas, el riesgo relativo y la diferencia de riesgos. Adems, para el contraste de independencia de las variables de las las y las variables de las columnas, se calculan los estadsticos de Pearson y de la razn de verosimilitud.
Datos. Las variables de la y columna deben ser categricas. Las variables que denen las

subpoblaciones pueden ser numricas o de cadena, pero siempre deben ser categricas.
Supuestos. Los casos del archivo de datos representan una muestra de un diseo complejo que

se debe analizar segn las especicaciones del archivo seleccionado en el Cuadro de dilogo Plan de muestras complejas.
Obtencin de Tablas de contingencia de Muestras complejas
E Elija en los mens: Analizar Muestras complejas Tablas de contingencia... E Seleccione un archivo de plan y, si lo desea, seleccione un archivo de probabilidades conjuntas

personalizado.
E Pulse en Continuar. 37

38 Captulo 7 Figura 7-1 Cuadro de dilogo Tablas de contingencia

E Seleccione al menos una variable de la y una variable de columna.

Si lo desea, puede: Especicar variables para denir subpoblaciones. Los estadsticos se calculan por separado para cada subpoblacin.

39 Tablas de contingencia de Muestras complejas

Tablas de contingencia de Muestras complejas: Estadsticos


Figura 7-2 Cuadro de dilogo Tablas de contingencia: Estadsticos

Casillas. Este grupo permite solicitar estimaciones del tamao poblacional de las casillas as

como porcentajes de columna, la y de tabla.


Estadsticos. Este grupo genera estadsticos asociados con el tamao de la poblacin y los porcentajes de tabla, columna y la. Error tpico. El error tpico de la estimacin. Intervalo de confianza. Intervalo de conanza para la estimacin, utilizando el nivel

especicado.
Coeficiente de variacin. Cociente del error tpico de la estimacin dividida por la estimacin. Valores esperados. Valor esperado de la estimacin, bajo la hiptesis de independencia de las

variables de la y columna.
Recuento no ponderado. Nmero de unidades utilizadas para calcular la estimacin. Efecto del diseo. Cociente de la variacin de la estimacin entre la variacin obtenida

al suponer que la muestra es una muestra aleatoria simple. Es una medida del efecto de especicar un diseo complejo donde los valores ms distantes de 1 indican efectos mayores.
Raz cuadrada del efecto del diseo. Es una medida del efecto de especicar un diseo

complejo donde los valores ms distantes de 1 indican efectos mayores.

40 Captulo 7

Residuos. El valor pronosticado es el nmero de casos que se esperara encontrar en la casilla

si no hubiera relacin entre las dos variables. Un residuo positivo indica que hay ms casos en la casilla de los que habra en ella si las variables de la y columna fueran independientes.
Residuos corregidos. El residuo de una casilla (el valor observado menos el valor

pronosticado) dividido por una estimacin de su error tpico. El residuo tipicado resultante viene expresado en unidades de desviacin tpica, por encima o por debajo de la media.
Resmenes para las tablas 2 por 2. Este grupo genera estadsticos para las tablas en las que la

variable de la y la de columna tienen dos categoras. Cada una es una medida de la fuerza de la asociacin entre la presencia de un factor y la aparicin de un evento.
Razn de las ventajas. Cuando la ocurrencia del factor es poco comn, se puede utilizar la

razn de las ventajas como estimacin del riesgo relativo.


Riesgo relativo. La razn del riesgo de un evento en presencia del factor respecto al riesgo

del evento en ausencia del factor.


Diferencia de riesgos. La diferencia entre el riesgo de un evento en presencia del factor y

el riesgo del evento en ausencia del factor.


Contraste sobre la independencia de filas y columnas. Esta opcin genera los contrastes de chi-cuadrado y la razn de verosimilitud sobre la hiptesis de que las variables de la y columna son independientes. Se realizan contrastes por separado para cada pareja de variables.

Muestras complejas: Valores perdidos


Figura 7-3 Cuadro de dilogo Valores perdidos

Tablas. Este grupo determina los casos que se utilizan en el anlisis. Utilizar todos los datos disponibles. Los valores perdidos se determinan en base a tabla por

tabla. As, los casos utilizados para calcular los estadsticos pueden variar a travs de la frecuencia o tablas de contingencia.
Utilizar una base coherente para los casos. Los valores perdidos se determinan a travs de

todas las variables. Por lo tanto, los casos utilizados para calcular los estadsticos son coherentes con las tablas.

41 Tablas de contingencia de Muestras complejas

Variables categricas del diseo. Este grupo determina si los valores perdidos denidos por el

usuario son considerados vlidos o invlidos.

Opciones de Muestras complejas


Figura 7-4 Cuadro de dilogo Opciones

Presentacin de las subpoblaciones. Puede elegir entre mostrar las subpoblaciones en la misma

tabla o en tablas separadas.

Captulo

Razones de Muestras complejas

El procedimiento Razones de Muestras complejas muestra estadsticos de resumen univariantes para razones de variables. Si lo desea, puede solicitar estadsticos por subgrupos, denidos por una o ms variables categricas.
Ejemplo. Mediante el procedimiento Razones de Muestras complejas, puede obtener estadsticos

descriptivos para el cociente del valor de la propiedad actual sobre el ltimo valor certicado, basado en los resultados de una encuesta a nivel estatal llevada a cabo segn un diseo complejo y con un plan de anlisis adecuado para los datos.
Estadsticos. El procedimiento genera estimaciones de razn, pruebas t, errores tpicos, intervalos

de conanza, coecientes de variacin, recuentos no ponderados, tamaos poblacionales, efectos del diseo y raz cuadrada del efecto del diseo.
Datos. Los numeradores y los denominadores deben ser variables de escala con valores positivos.

Las variables que denen las subpoblaciones pueden ser numricas o de cadena, pero siempre deben ser categricas.
Supuestos. Los casos del archivo de datos representan una muestra de un diseo complejo que

se debe analizar segn las especicaciones del archivo seleccionado en el Cuadro de dilogo Plan de muestras complejas.
Obtencin de razones de Muestras complejas
E Elija en los mens: Analizar Muestras complejas Razones... E Seleccione un archivo de plan y, si lo desea, seleccione un archivo de probabilidades conjuntas

personalizado.
E Pulse en Continuar.

42

43 Razones de Muestras complejas Figura 8-1 Cuadro de dilogo Razones de Muestras complejas

E Seleccione al menos una variable de numerador y una variable de denominador.

Si lo desea, puede: Especicar variables para denir subgrupos para los que se desea generar estadsticos.

Razones de Muestras complejas. Estadsticos


Figura 8-2 Cuadro de dilogo Estadsticos de la razn

Estadsticos. Este grupo genera estadsticos asociados con la estimacin de la razn. Error tpico. El error tpico de la estimacin. Intervalo de confianza. Intervalo de conanza para la estimacin, utilizando el nivel

especicado.
Coeficiente de variacin. Cociente del error tpico de la estimacin dividida por la estimacin. Recuento no ponderado. Nmero de unidades utilizadas para calcular la estimacin.

44 Captulo 8

Tamao de la poblacional. Nmero estimado de unidades en la poblacin. Efecto del diseo. Cociente de la variacin de la estimacin entre la variacin obtenida

al suponer que la muestra es una muestra aleatoria simple. Es una medida del efecto de especicar un diseo complejo donde los valores ms distantes de 1 indican efectos mayores.
Raz cuadrada del efecto del diseo. Es una medida del efecto de especicar un diseo

complejo donde los valores ms distantes de 1 indican efectos mayores.


Prueba t. Puede solicitar pruebas t de las estimaciones con respecto a un valor especicado.

Razones de Muestras complejas: Valores perdidos


Figura 8-3 El cuadro de dilogo Razones de Muestras complejas: Valores perdidos

Razones. Este grupo determina los casos que se utilizan en el anlisis. Utilizar todos los datos disponibles. Los valores perdidos se determinan en base a razn por

razn. As, los casos utilizados para calcular los estadsticos pueden variar a travs de pares numerador-denominador.
Asegurar una base coherente para los casos. Los valores perdidos se determinan a travs

de todas las variables. Por lo tanto, los casos utilizados para calcular los estadsticos son coherentes con las tablas.
Variables categricas del diseo. Este grupo determina si los valores perdidos denidos por el

usuario son considerados vlidos o invlidos.

Opciones de Muestras complejas


Figura 8-4 Cuadro de dilogo Opciones

45 Razones de Muestras complejas

Presentacin de las subpoblaciones. Puede elegir entre mostrar las subpoblaciones en la misma

tabla o en tablas separadas.

Captulo

Modelo lineal general de muestras complejas

El procedimiento Modelo lineal general de muestras complejas (CSGLM) realiza anlisis de regresin lineal y anlisis de varianza y covarianza de muestras extradas mediante mtodos de muestreo complejo. Si lo desea, puede solicitar anlisis de una subpoblacin.
Ejemplo. Una cadena de tiendas de alimentos realiza una encuesta sobre los hbitos de compra de una serie de clientes basndose en un diseo complejo. Una vez obtenidos los resultados de la encuesta y la cantidad que cada cliente gast el mes anterior, la cadena desea averiguar si la frecuencia con que los clientes hacen la compra est relacionada con la cantidad mensual que gastan, controlando el sexo del cliente e incorporando el diseo del muestreo. Estadsticos. El procedimiento genera estimaciones, errores tpicos, pruebas t, efectos del diseo, raz cuadrada de los efectos del diseo para parmetros de modelo y las correlaciones y covarianzas entre las estimaciones de los parmetros. Las medidas de ajuste del modelo y los estadsticos descriptivos de las variables dependientes e independientes tambin estn disponibles. Adems, se pueden solicitar medias marginales estimadas para los niveles de factores de modelado u las interacciones de los factores. Datos. La variable dependiente es cuantitativa. Los factores son categricos; pueden tener valores numricos o valores de cadena de hasta ocho caracteres. Las covariables son variables cuantitativas que estn relacionadas con la variable dependiente. Las variables que denen las subpoblaciones pueden ser numricas o de cadena, pero siempre deben ser categricas. Supuestos. Los casos del archivo de datos representan una muestra de un diseo complejo que se debe analizar segn las especicaciones del archivo seleccionado en el Cuadro de dilogo Plan de muestras complejas. Para obtener un Modelo lineal general de muestras complejas

Elija en los mens:


Analizar Muestras complejas Modelo lineal general... E Seleccione un archivo de plan y, si lo desea, seleccione un archivo de probabilidades conjuntas

personalizado.
E Pulse en Continuar. 46

47 Modelo lineal general de muestras complejas Figura 9-1 Cuadro de dilogo Modelo lineal general de muestras complejas

E Seleccione una variable dependiente.

Si lo desea, puede: Seleccione variables para factores y covariables, segn corresponda a los datos. Especique una variable para denir una subpoblacin. El anlisis se lleva a cabo nicamente en la categora seleccionada de la variable de subpoblacin.

48 Captulo 9 Figura 9-2 Cuadro de dilogo Modelo

Especificar efectos del modelo. Por defecto, el procedimiento crea un modelo de efectos principales utilizando los factores y las covariables especicadas en el cuadro de dilogo principal. Si lo desea, tambin puede crear un modelo personalizado que contenga los efectos de la interaccin y los trminos anidados. Trminos no anidados

Para las covariables y los factores seleccionados:


Interaccin. Crea el trmino de interaccin de mayor nivel para todas las variables seleccionadas. Efectos principales. Crea un trmino de efectos principales para cada variable seleccionada. Todas de 2. Crea todas las interacciones dobles posibles de las variables seleccionadas. Todas de 3. Crea todas las interacciones triples posibles de las variables seleccionadas. Todas de 4. Crea todas las interacciones cudruples posibles de las variables seleccionadas. Todas de 5. Crea todas las interacciones quntuples posibles de las variables seleccionadas.

49 Modelo lineal general de muestras complejas

Trminos anidados

En este procedimiento, puede construir trminos anidados para el modelo. Los trminos anidados resultan tiles para modelar el efecto de un factor o covariable cuyos valores no interactan con los niveles de otro factor. Por ejemplo, una cadena de tiendas de comestibles desea realizar un seguimiento de los hbitos de gasto de los clientes en las diversas ubicaciones de sus tiendas. Dado que cada cliente frecuenta tan slo una de estas ubicaciones, se puede decir que el efecto de Cliente est anidado dentro del efecto de Ubicacin de la tienda. Adems, puede incluir efectos de interaccin, como trminos polinmicos que implican a la misma covariable, o aadir varios niveles de anidacin al trmino anidado.
Limitaciones. Existen las siguientes restricciones para los trminos anidados:

Todos los factores incluidos en una interaccin deben ser exclusivos entre s. Por consiguiente, si A es un factor, no es vlido especicar A*A. Todos los factores incluidos en un efecto anidado deben ser exclusivos entre s. Por consiguiente, si A es un factor, no es vlido especicar A(A). No se puede anidar ningn efecto dentro de una covariable. Por consiguiente, si A es un factor y X es una covariable, no es vlido especicar A(X).
Interseccin. La interseccin se incluye normalmente en el modelo. Si asume que los datos pasan

por el origen, puede excluir la interseccin. Incluso aunque incluya la interseccin en el modelo, puede suprimir los estadsticos relacionados con ella.

Estadsticos de Modelo lineal general de muestras complejas


Figura 9-3 Cuadro de dilogo Modelo lineal general de muestras complejas: Estadsticos

Parmetros del modelo. Este grupo permite controlar la presentacin de estadsticos relacionados

con los parmetros del modelo.


Estimacin. Muestra estimaciones de los coecientes.

50 Captulo 9

Error tpico. Muestra el error tpico de cada estimacin de los coecientes. Intervalo de confianza. Muestra un intervalo de conanza para cada estimacin de los

coecientes. El nivel de conanza de los intervalos se congura en el cuadro de dilogo Opciones.


Prueba t. Muestra una prueba t de cada estimacin de coecientes. La hiptesis nula de cada

prueba es que el valor del coeciente sea 0.


Covarianzas de las estimaciones de los parmetros. Muestra una estimacin de la matriz de

covarianzas de los coecientes del modelo.


Correlaciones de las estimaciones de los parmetros. Muestra una estimacin de la matriz de

correlaciones de los coecientes del modelo.


Efecto del diseo. Cociente de la variacin de la estimacin entre la variacin obtenida

al suponer que la muestra es una muestra aleatoria simple. Es una medida del efecto de especicar un diseo complejo donde los valores ms distantes de 1 indican efectos mayores.
Raz cuadrada del efecto del diseo. Es una medida del efecto de especicar un diseo

complejo donde los valores ms distantes de 1 indican efectos mayores.


Ajuste del modelo. Muestra R2 y estadsticos de error cuadrtico medio. Medias de poblacin de covariables y variables dependientes. Muestra informacin resumida

acerca de los factores, las covariables y las variables dependientes.


Informacin del diseo muestral. Muestra informacin resumida acerca de la muestra, incluidos un recuento no ponderado y el tamao de la poblacin.

Muestras complejas: Contrastes de hiptesis


Figura 9-4 Cuadro de dilogo Contrastes de hiptesis

51 Modelo lineal general de muestras complejas

Estadstico de contraste. Este grupo le permite seleccionar el tipo de estadstico utilizado para

contrastar las hiptesis. Es posible elegir entre F, F corregida, chi-cuadrado y chi-cuadrado corregido.
Muestreo de grados de libertad. Este grupo permite controlar los grados de libertad en el diseo de

muestra usados para calcular los valores p de todos los estadsticos de contraste. Si se basa en el diseo muestral, el valor es la diferencia entre el nmero de unidades de muestra primarias y el nmero de estratos de la primera etapa del muestreo. Si lo desea, puede especicar los grados de libertad que desee introduciendo un nmero entero positivo.
Correccin para comparaciones mltiples. Al realizar contrastes de hiptesis con varios contrastes,

el nivel de signicacin global se puede ajustar utilizando los niveles de signicacin de los contrastes incluidos. Este grupo permite elegir el mtodo de ajuste.
Diferencia menos significativa. Este mtodo no controla la probabilidad general de rechazar

las hiptesis de que algunos contrastes lineales son diferentes a los valores de hiptesis nula.
Sidak secuencial. Este es un procedimiento de Sidak de rechazo secuencial decreciente que

es mucho menos conservador en trminos de rechazar las hiptesis individuales pero que mantiene el mismo nivel de signicacin global.
Bonferroni secuencial. Este es un procedimiento de Bonferroni de rechazo secuencial

decreciente que es mucho menos conservador en trminos de rechazar las hiptesis individuales pero que mantiene el mismo nivel de signicacin global.
Sidak. Este mtodo ofrece lmites ms estrechos que los de la aproximacin de Bonferroni. Bonferroni. Este mtodo corrige el nivel de signicacin observado por el hecho de que se

estn poniendo a prueba mltiples contrastes.

Medias estimadas del Modelo lineal general de muestras complejas


Figura 9-5 Cuadro de dilogo Modelo lineal general de muestras complejas: Medias estimadas

52 Captulo 9

En el cuadro de dilogo Medias estimadas se pueden ver las medias marginales estimadas por el modelo para los niveles de factores y las interacciones de factores especicadas en el subcuadro de dilogo Modelo. Tambin se puede solicitar que se muestre la media de poblacin global.
Trmino. Se calculan las medias estimadas de los factores seleccionados y las interacciones

de los factores.
Contraste. El contraste determina como se conguran los contrastes de hiptesis para comparar

las medias estimadas.


Simple. Compara la media de cada nivel con la media de un nivel especicado. Este tipo de

contraste es til cuando existe un grupo control.


Desviacin. Compara la media de cada nivel (excepto la categora de referencia) con la media

de todos los niveles (la gran media). Los niveles del factor pueden encontrarse en cualquier orden.
Diferencia. Compara la media de cada nivel (excepto el primero) con la media de los niveles

precedentes. En ocasiones se les denomina contrastes de Helmert invertidos.


Helmert. Compara la media de cada nivel del factor (excepto el ltimo) con la media de los

niveles siguientes.
Repetido. Compara la media de cada nivel (excepto el ltimo) con la media del siguiente nivel. Polinmico. Compara el efecto lineal, el efecto cuadrtico, el efecto cbico y as

sucesivamente. El primer grado de libertad contiene el efecto lineal a travs de todas las categoras, el segundo grado de libertad el efecto cuadrtico y as sucesivamente. Estos contrastes se utilizan frecuentemente para estimar tendencias polinmicas.
Categora de referencia. Los contrastes simple y de desviacin requieren una categora de

frecuencia o un factor de nivel con que comparar los dems.

53 Modelo lineal general de muestras complejas

Modelo lineal general de muestras complejas: Guardar


Figura 9-6 Cuadro de dilogo Modelo lineal general de muestras complejas: Guardar

Guardar variables. Este grupo permite guardar los valores pronosticados para el modelo y los

residuos como nuevas variables en el archivo de trabajo.


Exportar modelo como datos de SPSS. Graba un archivo de datos de SPSS que contiene una matriz

de covarianzas (o correlacin, si se selecciona) de las estimaciones de los parmetros del modelo. Asimismo, para cada variable dependiente habr una la de estimaciones de los parmetros, una la de errores tpicos, una la de valores de signicacin para los estadsticos t correspondientes a las estimaciones de los parmetros y una la de grados de libertad en el diseo de muestra. Si lo desea, puede usar este archivo matricial en otros procedimientos que lean un archivo matricial de SPSS.
Exportar modelo como XML. Guarda las estimaciones de los parmetros y la matriz de covarianzas de los parmetros (si se selecciona) en formato XML (PMML). SmartScore y la versin de servidor de SPSS (un producto independiente) pueden utilizar este archivo del modelo para aplicar la informacin del modelo en otros archivos de datos con nes de puntuacin.

54 Captulo 9

Modelo lineal general de muestras complejas: Opciones


Figura 9-7 Cuadro de dilogo Modelo lineal general de muestras complejas: Opciones

Valores definidos como perdidos por el usuario. Todas las variables de diseo, as como la variable

dependiente y cualquier covariable, deben contener datos vlidos. Los casos con datos no vlidos de cualquiera de estas variables se excluyen del anlisis. Estos controles permiten decidir si los valores denidos como perdidos por el usuario se deben tratar como vlidos entre las variables de estraticacin, conglomeracin, subpoblacin y de factor.
Intervalo de confianza. Se trata del nivel de intervalo de conanza para las estimaciones de coeciente y las medias marginales estimadas. Especique un valor mayor o igual a 50 e inferior a 100.

Funciones adicionales del comando CSGLM


El lenguaje de comandos de SPSS tambin permite: Especicar contrastes personalizados de los efectos respecto a una combinacin lineal de efectos o un valor (utilizando el subcomando CUSTOM). Fijar covariables en valores distintos los de sus medias al calcular las medias marginales estimadas (utilizando el subcomando EMMEANS). Especicar una mtrica para los contrastes polinmicos (utilizando el subcomando EMMEANS). Especicar un valor de tolerancia para la comprobacin de la singularidad (utilizando el subcomando CRITERIA). Crear nombres especicados por el usuario para las variables almacenadas (utilizando el subcomando SAVE). Generar una tabla de funcin estimable general (utilizando el subcomando PRINT). Si desea informacin detallada sobre la sintaxis, consulte la referencia de sintaxis de comandos de SPSS (SPSS Command Syntax Reference).

Regresin logstica de muestras complejas

10

Captulo

El procedimiento Regresin logstica de muestras complejas lleva a cabo anlisis de regresin logstica sobre una variable binaria o una variable dependiente multinomial para muestras extradas mediante mtodos de muestreo complejo. Si lo desea, puede solicitar anlisis de una subpoblacin.
Ejemplo. Un encargado de prstamos ha recopilado registros antiguos de prstamos concedidos a

clientes en diversas ramas, de acuerdo con un diseo complejo. Al incorporar el diseo muestral, el encargado desea comprobar si la probabilidad con que las moras de un cliente se asocian a su edad, historial de empleo y cantidad de crdito adeudado; posteriormente.
Estadsticos. El procedimiento genera estimaciones, estimaciones exponenciadas, errores tpicos,

intervalos de conanza, pruebas t, efectos del diseo, raz cuadrada de los efectos del diseo para parmetros de modelo y las correlaciones y covarianzas entre las estimaciones de los parmetros. Tambin hay disponibles estadsticos pseudo R2, tablas de clasicacin y estadsticos descriptivos para las variables dependientes e independientes.
Datos. La variable dependiente es categrica. Los factores son categricos; pueden tener

valores numricos o valores de cadena de hasta ocho caracteres. Las covariables son variables cuantitativas que estn relacionadas con la variable dependiente. Las variables que denen las subpoblaciones pueden ser numricas o de cadena, pero siempre deben ser categricas.
Supuestos. Los casos del archivo de datos representan una muestra de un diseo complejo que se debe analizar segn las especicaciones del archivo seleccionado en el Cuadro de dilogo Plan de muestras complejas.

Obtencin de Regresin logstica de muestras complejas

Elija en los mens:


Analizar Muestras complejas Regresin logstica... E Seleccione un archivo de plan y, si lo desea, seleccione un archivo de probabilidades conjuntas

personalizado.
E Pulse en Continuar. 55

56 Captulo 10 Figura 10-1 Cuadro de dilogo Regresin logstica

E Seleccione una variable dependiente.

Si lo desea, puede: Seleccione variables para factores y covariables, segn corresponda a los datos. Especique una variable para denir una subpoblacin. El anlisis se lleva a cabo nicamente en la categora seleccionada de la variable de subpoblacin.

Regresin logstica de muestras complejas: Categora de referencia


Figura 10-2 Cuadro de dilogo Regresin logstica de muestras complejas: Categora de referencia

57 Regresin logstica de muestras complejas

Por defecto, el procedimiento Regresin logstica de muestras complejas hace de la categora con el valor ms alto la categora de referencia. Este cuadro de dilogo permite especicar la categora ms alta, la ms baja o una personalizada en la categora de referencia.

Regresin logstica de muestras complejas: Modelo


Figura 10-3 Cuadro de dilogo Regresin logstica de muestras complejas: Modelo

Especificar efectos del modelo. Por defecto, el procedimiento crea un modelo de efectos

principales utilizando los factores y las covariables especicadas en el cuadro de dilogo principal. Si lo desea, tambin puede crear un modelo personalizado que contenga los efectos de la interaccin y los trminos anidados.
Trminos no anidados

Para las covariables y los factores seleccionados:


Interaccin. Crea el trmino de interaccin de mayor nivel para todas las variables seleccionadas. Efectos principales. Crea un trmino de efectos principales para cada variable seleccionada. Todas de 2. Crea todas las interacciones dobles posibles de las variables seleccionadas. Todas de 3. Crea todas las interacciones triples posibles de las variables seleccionadas. Todas de 4. Crea todas las interacciones cudruples posibles de las variables seleccionadas.

58 Captulo 10

Todas de 5. Crea todas las interacciones quntuples posibles de las variables seleccionadas. Trminos anidados

En este procedimiento, puede construir trminos anidados para el modelo. Los trminos anidados resultan tiles para modelar el efecto de un factor o covariable cuyos valores no interactan con los niveles de otro factor. Por ejemplo, una cadena de tiendas de comestibles desea realizar un seguimiento de los hbitos de gasto de los clientes en las diversas ubicaciones de sus tiendas. Dado que cada cliente frecuenta tan slo una de estas ubicaciones, se puede decir que el efecto de Cliente est anidado dentro del efecto de Ubicacin de la tienda. Adems, puede incluir efectos de interaccin, como trminos polinmicos que implican a la misma covariable, o aadir varios niveles de anidacin al trmino anidado.
Limitaciones. Existen las siguientes restricciones para los trminos anidados:

Todos los factores incluidos en una interaccin deben ser exclusivos entre s. Por consiguiente, si A es un factor, no es vlido especicar A*A. Todos los factores incluidos en un efecto anidado deben ser exclusivos entre s. Por consiguiente, si A es un factor, no es vlido especicar A(A). No se puede anidar ningn efecto dentro de una covariable. Por consiguiente, si A es un factor y X es una covariable, no es vlido especicar A(X).
Interseccin. La interseccin se incluye normalmente en el modelo. Si asume que los datos pasan por el origen, puede excluir la interseccin. Incluso aunque incluya la interseccin en el modelo, puede suprimir los estadsticos relacionados con ella.

Regresin logstica de muestras complejas: Estadsticos


Figura 10-4 Cuadro de dilogo Regresin logstica: Estadsticos

59 Regresin logstica de muestras complejas

Ajuste del modelo. Controla la presentacin de estadsticos que miden el rendimiento global

del proceso.
Pseudo R cuadrado. El estadstico R2 de regresin lineal no cuenta con un anlogo exacto

entre los modelos de regresin logstica. En su lugar existen varias medidas que tratan de imitar las propiedades del estadstico R2.
Tabla de clasificacin. Muestra las clasicaciones conjuntas tabuladas de la categora

observada por la categora pronosticada por el modelo en la variable dependiente.


Parmetros. Este grupo permite controlar la presentacin de estadsticos relacionados con los parmetros del modelo. Estimacin. Muestra estimaciones de los coecientes. Estimacin exponenciada. Muestra la base del logaritmo natural elevada a la potencia de

las estimaciones de los coecientes. Mientras que las estimaciones tienen propiedades agradables para la comprobacin estadstica, la estimacin exponenciada (o exp[B]) es ms sencilla de interpretar.
Error tpico. Muestra el error tpico de cada estimacin de los coecientes. Intervalo de confianza. Muestra un intervalo de conanza para cada estimacin de los

coecientes. El nivel de conanza de los intervalos se congura en el cuadro de dilogo Opciones.


Prueba t. Muestra una prueba t de cada estimacin de coecientes. La hiptesis nula de cada

prueba es que el valor del coeciente sea 0.


Covarianzas de las estimaciones de los parmetros. Muestra una estimacin de la matriz de

covarianzas de los coecientes del modelo.


Correlaciones de las estimaciones de los parmetros. Muestra una estimacin de la matriz de

correlaciones de los coecientes del modelo.


Efecto del diseo. Cociente de la variacin de la estimacin entre la variacin obtenida

al suponer que la muestra es una muestra aleatoria simple. Es una medida del efecto de especicar un diseo complejo donde los valores ms distantes de 1 indican efectos mayores.
Raz cuadrada del efecto del diseo. Es una medida del efecto de especicar un diseo

complejo donde los valores ms distantes de 1 indican efectos mayores.


Estadsticos de resumen para las variables del modelo. Muestra informacin resumida acerca de

los factores, las covariables y las variables dependientes.


Informacin del diseo muestral. Muestra informacin resumida acerca de la muestra, incluidos un recuento no ponderado y el tamao de la poblacin.

60 Captulo 10

Muestras complejas: Contrastes de hiptesis


Figura 10-5 Cuadro de dilogo Contrastes de hiptesis

Estadstico de contraste. Este grupo le permite seleccionar el tipo de estadstico utilizado para

contrastar las hiptesis. Es posible elegir entre F, F corregida, chi-cuadrado y chi-cuadrado corregido.
Muestreo de grados de libertad. Este grupo permite controlar los grados de libertad en el diseo de

muestra usados para calcular los valores p de todos los estadsticos de contraste. Si se basa en el diseo muestral, el valor es la diferencia entre el nmero de unidades de muestra primarias y el nmero de estratos de la primera etapa del muestreo. Si lo desea, puede especicar los grados de libertad que desee introduciendo un nmero entero positivo.
Correccin para comparaciones mltiples. Al realizar contrastes de hiptesis con varios contrastes,

el nivel de signicacin global se puede ajustar utilizando los niveles de signicacin de los contrastes incluidos. Este grupo permite elegir el mtodo de ajuste.
Diferencia menos significativa. Este mtodo no controla la probabilidad general de rechazar

las hiptesis de que algunos contrastes lineales son diferentes a los valores de hiptesis nula.
Sidak secuencial. Este es un procedimiento de Sidak de rechazo secuencial decreciente que

es mucho menos conservador en trminos de rechazar las hiptesis individuales pero que mantiene el mismo nivel de signicacin global.
Bonferroni secuencial. Este es un procedimiento de Bonferroni de rechazo secuencial

decreciente que es mucho menos conservador en trminos de rechazar las hiptesis individuales pero que mantiene el mismo nivel de signicacin global.
Sidak. Este mtodo ofrece lmites ms estrechos que los de la aproximacin de Bonferroni. Bonferroni. Este mtodo corrige el nivel de signicacin observado por el hecho de que se

estn poniendo a prueba mltiples contrastes.

61 Regresin logstica de muestras complejas

Regresin logstica de muestras complejas: Razones de las ventajas


Figura 10-6 Cuadro de dilogo Regresin logstica de muestras complejas: Razones de las ventajas

El cuadro de dilogo Razones de las ventajas permite mostrar las razones de las ventajas estimadas por el modelo para los factores y las covariables que se especican. Se calcula un conjunto independiente de razones de las ventajas para cada categora de la variable dependiente excepto para el caso de la categora de referencia.
Factores. En cada factor seleccionado, muestra la razn de las ventajas de cada categora del

factor hasta las ventajas en la categora de referencia especicada.


Covariables. En cada covariable seleccionada, muestra la razn de las ventajas en el valor medio

de la covariable ms las unidades de cambio especicadas para las ventajas de la media. Al calcular las razones de las ventajas de un factor o una covariable, el procedimiento ja todos los dems factores en sus niveles ms altos y el resto de covariables, en sus niveles medios. Si un factor o una covariable interactan con otros predictores en el modelo, las razones de las ventajas dependern no slo de la modicacin en la variable especicada, sino tambin de los valores de las variables con las que interacte. Si una covariable especicada interacta consigo misma en el modelo (por ejemplo, edad*edad), las razones de las ventajas dependern entonces tanto del cambio en la covariable como del valor de sta.

62 Captulo 10

Regresin logstica de muestras complejas: Guardar


Figura 10-7 Cuadro de dilogo Regresin logstica de muestras complejas: Guardar

Guardar variables. Este grupo permite guardar la categora pronosticada para el modelo y las

probabilidades pronosticadas como nuevas variables en el conjunto de datos activo.


Exportar modelo como datos de SPSS. Graba un archivo de datos de SPSS que contiene una matriz

de covarianzas (o correlacin, si se selecciona) de las estimaciones de los parmetros del modelo. Asimismo, para cada variable dependiente habr una la de estimaciones de los parmetros, una la de errores tpicos, una la de valores de signicacin para los estadsticos t correspondientes a las estimaciones de los parmetros y una la de grados de libertad en el diseo de muestra. Si lo desea, puede usar este archivo matricial en otros procedimientos que lean un archivo matricial de SPSS.
Exportar modelo como XML. Guarda las estimaciones de los parmetros y la matriz de covarianzas de los parmetros (si se selecciona) en formato XML (PMML). SmartScore y la versin de servidor de SPSS (un producto independiente) pueden utilizar este archivo del modelo para aplicar la informacin del modelo en otros archivos de datos con nes de puntuacin.

63 Regresin logstica de muestras complejas

Regresin logstica de muestras complejas: Opciones


Figura 10-8 Cuadro de dilogo Regresin logstica: Opciones

Estimacin. Este grupo otorga el control sobre varios criterios utilizados en la estimacin del

modelo.
N mximo de iteraciones. Nmero mximo de iteraciones que se ejecutar el algoritmo.

Especique un nmero entero no negativo.


Mxima subdivisin por pasos. En cada iteracin, se reduce el tamao del paso mediante un

factor de 0,5 hasta que aumenta el logaritmo de la verosimilitud o se alcanza la mxima subdivisin por pasos. Especique un nmero entero positivo.
Limitar las iteraciones en funcin del cambio en las estimaciones de los parmetros. Si se

activa, el algoritmo se detiene tras una iteracin en la que las modicaciones absolutas o relativas en las estimaciones de los parmetros sean inferiores que el valor especicado, que debe ser no negativo.
Limitar las iteraciones en funcin del cambio en la log-verosimilitud. Si se activa, el algoritmo

se detiene tras una iteracin en la que las modicaciones absolutas o relativas en la funcin de log-verosimilitud sean inferiores que el valor especicado, que debe ser no negativo.

64 Captulo 10

Comprobar si hay separacin completa de los puntos de los datos. Si se activa, el algoritmo

realiza una prueba para garantizar que las estimaciones de los parmetros tienen valores exclusivos. Se produce una separacin cuando el procedimiento pueda generar un modelo que clasique cada caso de forma correcta.
Mostrar historial de iteraciones. Muestra los estadsticos y las estimaciones de los parmetros

cada n iteraciones, comenzando por la iteracin 0 (estimaciones iniciales). Si decide imprimir el historial de iteraciones, la ltima iteracin se imprimir siempre independientemente del valor de n.
Valores definidos como perdidos por el usuario. Todas las variables de diseo, as como la variable

dependiente y cualquier covariable, deben contener datos vlidos. Los casos con datos no vlidos de cualquiera de estas variables se excluyen del anlisis. Estos controles permiten decidir si los valores denidos como perdidos por el usuario se deben tratar como vlidos entre las variables de estraticacin, conglomeracin, subpoblacin y de factor.
Intervalo de confianza. Se trata del nivel de intervalo de conanza para las estimaciones de

coeciente, las estimaciones de coeciente exponenciadas y las razones de las ventajas. Especique un valor mayor o igual a 50 e inferior a 100.

Funciones adicionales del comando CSLOGISTIC


El lenguaje de comandos de SPSS tambin permite: Especicar contrastes personalizados de los efectos respecto a una combinacin lineal de efectos o un valor (utilizando el subcomando CUSTOM). Fijar valores de otras variables de modelo al calcular las razones de las ventajas para factores y covariables (utilizando el subcomando ODDSRATIOS). Especicar un valor de tolerancia para la comprobacin de la singularidad (utilizando el subcomando CRITERIA). Crear nombres especicados por el usuario para las variables almacenadas (utilizando el subcomando SAVE). Generar una tabla de funcin estimable general (utilizando el subcomando PRINT). Si desea informacin detallada sobre la sintaxis, consulte la referencia de sintaxis de comandos de SPSS (SPSS Command Syntax Reference).

Regresin ordinal de muestras complejas

11

Captulo

El procedimiento Regresin ordinal de muestras complejas realiza anlisis de regresin sobre una variable binaria o una variable dependiente ordinal para muestras extradas mediante mtodos de muestreo complejo. Si lo desea, puede solicitar anlisis de una subpoblacin.
Ejemplo. Los diputados que estudian un proyecto de ley antes de una asamblea legislativa se

interesan por conocer si la opinin pblica apoya dicho proyecto de ley y qu relacin guarda dicho apoyo con los datos demogrcos de los votantes. Los encuestadores disean entrevistas y las realizan siguiendo un diseo muestral complejo. Utilice la regresin ordinal de muestras complejas para ajustar un modelo acerca del nivel de apoyo a la ley de acuerdo en los datos demogrcos de los votantes.
Datos. La variable dependiente es ordinal. Los factores son categricos; pueden tener valores

numricos o valores de cadena de hasta ocho caracteres. Las covariables son variables cuantitativas que estn relacionadas con la variable dependiente. Las variables que denen las subpoblaciones pueden ser numricas o de cadena, pero siempre deben ser categricas.
Supuestos. Los casos del archivo de datos representan una muestra de un diseo complejo que

se debe analizar segn las especicaciones del archivo seleccionado en el Cuadro de dilogo Plan de muestras complejas.
Obtencin de regresin ordinal de muestras complejas

Elija en los mens:


Analizar Muestras complejas Regresin ordinal... E Seleccione un archivo de plan y, si lo desea, seleccione un archivo de probabilidades conjuntas

personalizado.
E Pulse en Continuar.

65

66 Captulo 11 Figura 11-1 Cuadro de dilogo Regresin ordinal de muestras complejas

E Seleccione una variable dependiente.

Si lo desea, puede: Seleccione variables para factores y covariables, segn corresponda a los datos. Especique una variable para denir una subpoblacin. El anlisis se realiza nicamente para la categora seleccionada de la variable de subpoblacin, aunque para la estimacin correcta de las varianzas sigue siendo necesario basarse en el conjunto de datos completo. Seleccione una funcin de enlace.
Funcin de enlace. La funcin de enlace es una transformacin de las probabilidades acumuladas que permiten la estimacin del modelo. Existen cinco funciones de enlace que se resumen en la siguiente tabla.
Funcin Logit Log-log complementario Log-log negativo Frmula log( / (1) ) log(log(1)) log(log()) Aplicacin tpica Categoras distribuidas de forma uniforme Categoras ms altas ms probables Categoras ms bajas ms probables

67 Regresin ordinal de muestras complejas

Funcin Probit Cauchit (Cauchy inversa)

Frmula
1()

Aplicacin tpica La variable latente sigue una distribucin normal La variable latente tiene muchos valores extremos

tan((0,5))

Regresin ordinal de muestras complejas: Probabilidades de respuesta


Figura 11-2 Cuadro de dilogo Regresin ordinal de muestras complejas: Probabilidades de respuesta

El cuadro de dilogo Probabilidades de respuesta permite especicar si la probabilidad acumulada de una respuesta (es decir, la probabilidad de pertenecer hasta una determinada categora, incluida la propia categora, de la variable dependiente) aumenta con valores de que aumentan o disminuyen de la variable dependiente.

68 Captulo 11

Regresin ordinal de muestras complejas: Modelo


Figura 11-3 Cuadro de dilogo Regresin ordinal de muestras complejas: Modelo

Especificar efectos del modelo. Por defecto, el procedimiento crea un modelo de efectos principales utilizando los factores y las covariables especicadas en el cuadro de dilogo principal. Si lo desea, tambin puede crear un modelo personalizado que contenga los efectos de la interaccin y los trminos anidados. Trminos no anidados

Para las covariables y los factores seleccionados:


Interaccin. Crea el trmino de interaccin de mayor nivel para todas las variables seleccionadas. Efectos principales. Crea un trmino de efectos principales para cada variable seleccionada. Todas de 2. Crea todas las interacciones dobles posibles de las variables seleccionadas. Todas de 3. Crea todas las interacciones triples posibles de las variables seleccionadas. Todas de 4. Crea todas las interacciones cudruples posibles de las variables seleccionadas. Todas de 5. Crea todas las interacciones quntuples posibles de las variables seleccionadas. Trminos anidados

En este procedimiento, puede construir trminos anidados para el modelo. Los trminos anidados resultan tiles para modelar el efecto de un factor o covariable cuyos valores no interactan con los niveles de otro factor. Por ejemplo, una cadena de tiendas de comestibles desea realizar un

69 Regresin ordinal de muestras complejas

seguimiento de los hbitos de gasto de los clientes en las diversas ubicaciones de sus tiendas. Dado que cada cliente frecuenta tan slo una de estas ubicaciones, se puede decir que el efecto de Cliente est anidado dentro del efecto de Ubicacin de la tienda. Adems, puede incluir efectos de interaccin, como trminos polinmicos que implican a la misma covariable, o aadir varios niveles de anidacin al trmino anidado.
Limitaciones. Existen las siguientes restricciones para los trminos anidados:

Todos los factores incluidos en una interaccin deben ser exclusivos entre s. Por consiguiente, si A es un factor, no es vlido especicar A*A. Todos los factores incluidos en un efecto anidado deben ser exclusivos entre s. Por consiguiente, si A es un factor, no es vlido especicar A(A). No se puede anidar ningn efecto dentro de una covariable. Por consiguiente, si A es un factor y X es una covariable, no es vlido especicar A(X).

Regresin ordinal de muestras complejas: Estadsticos


Figura 11-4 Cuadro de dilogo Regresin ordinal de muestras complejas: Estadsticos

Ajuste del modelo. Controla la presentacin de estadsticos que miden el rendimiento global

del proceso.

70 Captulo 11

Pseudo R cuadrado. El estadstico R2 de regresin lineal no cuenta con un anlogo exacto

entre los modelos de regresin ordinal. En su lugar existen varias medidas que tratan de imitar las propiedades del estadstico R2.
Tabla de clasificacin. Muestra las clasicaciones conjuntas tabuladas de la categora

observada por la categora pronosticada por el modelo en la variable dependiente.


Parmetros. Este grupo permite controlar la presentacin de estadsticos relacionados con los parmetros del modelo. Estimacin. Muestra estimaciones de los coecientes. Estimacin exponenciada. Muestra la base del logaritmo natural elevada a la potencia de

las estimaciones de los coecientes. Mientras que las estimaciones tienen propiedades agradables para la comprobacin estadstica, la estimacin exponenciada (o exp[B]) es ms sencilla de interpretar.
Error tpico. Muestra el error tpico de cada estimacin de los coecientes. Intervalo de confianza. Muestra un intervalo de conanza para cada estimacin de los

coecientes. El nivel de conanza de los intervalos se congura en el cuadro de dilogo Opciones.


Prueba t. Muestra una prueba t de cada estimacin de coecientes. La hiptesis nula de cada

prueba es que el valor del coeciente sea 0.


Covarianzas de las estimaciones de los parmetros. Muestra una estimacin de la matriz de

covarianzas de los coecientes del modelo.


Correlaciones de las estimaciones de los parmetros. Muestra una estimacin de la matriz de

correlaciones de los coecientes del modelo.


Efecto del diseo. Cociente de la variacin de la estimacin entre la variacin obtenida

al suponer que la muestra es una muestra aleatoria simple. Es una medida del efecto de especicar un diseo complejo donde los valores ms distantes de 1 indican efectos mayores.
Raz cuadrada del efecto del diseo. Es una medida, expresada en unidades y comparable a

las de los errores tpicos, resultado de especicar un diseo complejo, donde los valores ms distantes de 1 indican mayores efectos.
Lneas paralelas. Este grupo permite solicitar estadsticos asociados a un modelo con lneas no paralelas, donde se ajusta una lnea de regresin distinta para cada categora de respuesta (excepto la ltima). Prueba de Wald. Produce una prueba de la hiptesis nula de que los parmetros de regresin

son iguales para todas las respuestas acumuladas. Se estima el modelo con lneas no paralelas y se aplica la prueba de Wald de parmetros iguales.
Estimaciones de los parmetros. Muestra las estimaciones de los coecientes y errores tpicos

para el modelo con lneas no paralelas.


Covarianzas de las estimaciones de los parmetros. Muestra una estimacin de la matriz de

covarianza para los coecientes del modelo con lneas no paralelas.


Estadsticos de resumen para las variables del modelo. Muestra informacin resumida acerca de

los factores, las covariables y las variables dependientes.

71 Regresin ordinal de muestras complejas

Informacin del diseo muestral. Muestra informacin resumida acerca de la muestra, incluidos un recuento no ponderado y el tamao de la poblacin.

Muestras complejas: Contrastes de hiptesis


Figura 11-5 Cuadro de dilogo Contrastes de hiptesis

Estadstico de contraste. Este grupo le permite seleccionar el tipo de estadstico utilizado para

contrastar las hiptesis. Es posible elegir entre F, F corregida, chi-cuadrado y chi-cuadrado corregido.
Muestreo de grados de libertad. Este grupo permite controlar los grados de libertad en el diseo de

muestra usados para calcular los valores p de todos los estadsticos de contraste. Si se basa en el diseo muestral, el valor es la diferencia entre el nmero de unidades de muestra primarias y el nmero de estratos de la primera etapa del muestreo. Si lo desea, puede especicar los grados de libertad que desee introduciendo un nmero entero positivo.
Correccin para comparaciones mltiples. Al realizar contrastes de hiptesis con varios contrastes,

el nivel de signicacin global se puede ajustar utilizando los niveles de signicacin de los contrastes incluidos. Este grupo permite elegir el mtodo de ajuste.
Diferencia menos significativa. Este mtodo no controla la probabilidad general de rechazar

las hiptesis de que algunos contrastes lineales son diferentes a los valores de hiptesis nula.
Sidak secuencial. Este es un procedimiento de Sidak de rechazo secuencial decreciente que

es mucho menos conservador en trminos de rechazar las hiptesis individuales pero que mantiene el mismo nivel de signicacin global.
Bonferroni secuencial. Este es un procedimiento de Bonferroni de rechazo secuencial

decreciente que es mucho menos conservador en trminos de rechazar las hiptesis individuales pero que mantiene el mismo nivel de signicacin global.

72 Captulo 11

Sidak. Este mtodo ofrece lmites ms estrechos que los de la aproximacin de Bonferroni. Bonferroni. Este mtodo corrige el nivel de signicacin observado por el hecho de que se

estn poniendo a prueba mltiples contrastes.

Regresin ordinal de muestras complejas: Razones de las ventajas


Figura 11-6 Cuadro de dilogo Regresin ordinal de muestras complejas: Razones de las ventajas

El cuadro de dilogo Razones de las ventajas permite mostrar las razones de las ventajas acumuladas estimadas por el modelo para los factores y las covariables que se especican. Esta caracterstica est disponible nicamente para modelos que utilizan la funcin de enlace Logit. Se calcula una sola razn de ventajas acumuladas para todas las categoras de la variante dependiente, excepto la ltima; el modelo de razones proporcionales postula que son todas iguales.
Factores. En cada factor seleccionado, muestra la razn de las ventajas acumuladas de cada categora del factor hasta las ventajas en la categora de referencia especicada. Covariables. En cada covariable seleccionada, muestra la razn de las ventajas acumuladas en

el valor medio de la covariable ms las unidades de cambio especicadas para las ventajas de la media. Al calcular las razones de las ventajas de un factor o una covariable, el procedimiento ja todos los dems factores en sus niveles ms altos y el resto de covariables, en sus niveles medios. Si un factor o una covariable interactan con otros predictores en el modelo, las razones de las ventajas dependern no slo de la modicacin en la variable especicada, sino tambin de los valores de las variables con las que interacte. Si una covariable especicada interacta consigo misma en

73 Regresin ordinal de muestras complejas

el modelo (por ejemplo, edad*edad), las razones de las ventajas dependern entonces tanto del cambio en la covariable como del valor de sta.

Regresin ordinal de muestras complejas: Guardar


Figura 11-7 Cuadro de dilogo Regresin ordinal de muestras complejas: Guardar

Guardar variables. Este grupo permite guardar la categora pronosticada para el modelo,

la probabilidad de la categora pronosticada, la probabilidad de la categora observada, las probabilidades acumuladas y las probabilidades pronosticadas como nuevas variables en el conjunto de datos activo.
Exportar modelo como datos. Graba un archivo de datos de SPSS que contiene una matriz de

covarianzas (o correlacin, si se selecciona) de las estimaciones de los parmetros del modelo. Asimismo, para cada variable dependiente habr una la de estimaciones de los parmetros, una la de errores tpicos, una la de valores de signicacin para los estadsticos t correspondientes a las estimaciones de los parmetros y una la de grados de libertad en el diseo de muestra.

74 Captulo 11

Exportar modelo como XML. Guarda las estimaciones de los parmetros y la matriz de covarianzas de los parmetros (si se selecciona) en formato XML (PMML). SmartScore y la versin de servidor de SPSS (un producto independiente) pueden utilizar este archivo del modelo para aplicar la informacin del modelo en otros archivos de datos con nes de puntuacin.

Regresin ordinal de muestras complejas: Opciones


Figura 11-8 Cuadro de dilogo Regresin ordinal de muestras complejas: Opciones

Mtodo de estimacin. Puede seleccionar un mtodo de estimacin de parmetros. Los mtodos

disponibles son Newton-Raphson, Scoring de Fisher o un mtodo hbrido en el que las iteraciones de Scoring de Fisher se realizan antes de cambiar al mtodo de Newton-Raphson. Si se logra la convergencia durante la fase de Scoring de Fisher del mtodo hbrido antes de que se lleven a cabo el nmero mximo de iteraciones de Fisher, el algoritmo contina con el mtodo de Newton-Raphson.
Estimacin. Este grupo otorga el control sobre varios criterios utilizados en la estimacin del

modelo.
N mximo de iteraciones. Nmero mximo de iteraciones que se ejecutar el algoritmo.

Especique un nmero entero no negativo.


Mxima subdivisin por pasos. En cada iteracin, se reduce el tamao del paso mediante un

factor de 0,5 hasta que aumenta el logaritmo de la verosimilitud o se alcanza la mxima subdivisin por pasos. Especique un nmero entero positivo.

75 Regresin ordinal de muestras complejas

Limitar las iteraciones en funcin del cambio en las estimaciones de los parmetros. Si se

activa, el algoritmo se detiene tras una iteracin en la que las modicaciones absolutas o relativas en las estimaciones de los parmetros sean inferiores que el valor especicado, que debe ser no negativo.
Limitar las iteraciones en funcin del cambio en la log-verosimilitud. Si se activa, el algoritmo

se detiene tras una iteracin en la que las modicaciones absolutas o relativas en la funcin de log-verosimilitud sean inferiores que el valor especicado, que debe ser no negativo.
Comprobar si hay separacin completa de los puntos de los datos. Si se activa, el algoritmo

realiza una prueba para garantizar que las estimaciones de los parmetros tienen valores exclusivos. Se produce una separacin cuando el procedimiento pueda generar un modelo que clasique cada caso de forma correcta.
Mostrar historial de iteraciones. Muestra los estadsticos y las estimaciones de los parmetros

cada n iteraciones, comenzando por la iteracin 0 (estimaciones iniciales). Si decide imprimir el historial de iteraciones, la ltima iteracin se imprimir siempre independientemente del valor de n.
Valores definidos como perdidos por el usuario. Las variables de diseo de escala, as como la

variable dependiente y cualquier covariable, deben contener datos vlidos. Los casos con datos no vlidos de cualquiera de estas variables se excluyen del anlisis. Estos controles permiten decidir si los valores denidos como perdidos por el usuario se deben tratar como vlidos entre las variables de estraticacin, conglomeracin, subpoblacin y de factor.
Intervalo de confianza. Se trata del nivel de intervalo de conanza para las estimaciones de

coeciente, las estimaciones de coeciente exponenciadas y las razones de las ventajas. Especique un valor mayor o igual a 50 e inferior a 100.

Funciones adicionales del comando CSORDINAL


El lenguaje de comandos de SPSS tambin permite: Especicar contrastes personalizados de los efectos respecto a una combinacin lineal de efectos o un valor (utilizando el subcomando CUSTOM). Fijar valores de otras variables de modelo en valores distintos de sus medias al calcular las razones de las ventajas para factores y covariables (utilizando el subcomando ODDSRATIOS). Utilice valores sin etiquetar como categoras de referencia personalizadas para los factores cuando se soliciten razones de las ventajas (usando el subcomando ODDSRATIOS). Especicar un valor de tolerancia para la comprobacin de la singularidad (utilizando el subcomando CRITERIA). Generar una tabla de funcin estimable general (utilizando el subcomando PRINT). Guarde ms de 25 variables de probabilidad (usando el subcomando SAVE). Si desea informacin detallada sobre la sintaxis, consulte la referencia de sintaxis de comandos de SPSS (SPSS Command Syntax Reference).

Ejemplos

Asistente de muestreo de la opcin Muestras complejas

12

Captulo

El Asistente de muestreo le gua a travs de los pasos necesarios para crear, modicar o ejecutar un archivo de plan de muestreo. Antes de utilizar el asistente, debe tener en mente una poblacin objetivo bien denida, una lista de las unidades muestrales y un diseo muestral adecuado.

Obtencin de una muestra a partir de un marco de muestreo completo


A una agencia inmobiliaria se le asigna la tarea de asegurarse de que los impuestos sobre las propiedades se aplican de manera justa en todos los condados. Los impuestos se basan en el valor tasado de la propiedad, por lo que la agencia quiere realizar una encuesta a una muestra de propiedades de los condados para asegurarse de que los registros de todos los condados estn igualmente actualizados. Sin embargo, los recursos para obtener las tasaciones actuales son limitados, por lo que es importante que se utilicen prudentemente los recursos disponibles. La agencia decide utilizar una metodologa de muestreo complejo para seleccionar una muestra de propiedades. Se incluye una lista de propiedades en property_assess_cs.sav, que se encuentra en el subdirectorio \tutorial\sample_les\ del directorio en el que ha instalado SPSS. Utilice el Asistente de muestreo de la opcin Muestras complejas para seleccionar una muestra.

Uso del asistente


E Para ejecutar el Asistente de muestreo de la opcin de Muestras complejas, seleccione en los

mens:
Analizar Muestras complejas Seleccionar una muestra...

77

78 Captulo 12 Figura 12-1 Asistente de muestreo: paso Bienvenida

E Seleccione Disear una muestra y escriba c:\property_assess.csplan como nombre del archivo del

plan.
E Pulse en Siguiente.

79 Asistente de muestreo de la opcin Muestras complejas Figura 12-2 Asistente de muestreo: paso Variables del diseo (etapa 1)

E Seleccione Condado como variable de estraticacin. E Seleccione Poblacin como variable de conglomeracin. E Pulse en Siguiente y, a continuacin, pulse en Siguiente en el paso Mtodo.

Esta estructura de diseo indica que se extraen muestras independientes para cada condado. En esta etapa, se extraen las poblaciones como unidad muestral primaria mediante el mtodo por defecto: Muestreo aleatorio simple.

80 Captulo 12 Figura 12-3 Asistente de muestreo: paso Tamao muestral (etapa 1)

E Escriba 4 como el valor del nmero de los conglomerados que se van a seleccionar en esta etapa. E Pulse en Siguiente y, a continuacin, pulse en Siguiente en el paso Variables de resultado.

81 Asistente de muestreo de la opcin Muestras complejas Figura 12-4 Asistente de muestreo: paso Resumen del plan (etapa 1)

E Seleccione S, aadir la etapa 2 ahora. E Pulse en Siguiente.

82 Captulo 12 Figura 12-5 Asistente de muestreo: paso Variables del diseo (etapa 2)

E Seleccione Vecindario como variable de estraticacin. E Pulse en Siguiente y, a continuacin, pulse en Siguiente en el paso Mtodo.

Esta estructura de diseo indica que se extraen muestras independientes para cada vecindario de las poblaciones extradas en la etapa 1. En esta etapa, se extraen las propiedades como unidad muestral primaria utilizando el muestreo aleatorio simple.

83 Asistente de muestreo de la opcin Muestras complejas Figura 12-6 Asistente de muestreo: paso Tamao muestral (etapa 2)

E Seleccione Proporciones en la lista desplegable Unidades. E Escriba 0,2 como valor de la proporcin de unidades que se van a extraer como muestra de

cada estrato.
E Pulse en Siguiente y, a continuacin, pulse en Siguiente en el paso Variables de resultado.

84 Captulo 12 Figura 12-7 Asistente de muestreo: paso Resumen del plan (etapa 2)

E Revise el diseo muestral y, a continuacin, pulse en Siguiente.

85 Asistente de muestreo de la opcin Muestras complejas Figura 12-8 Asistente de muestreo: Extraer muestra: paso Opciones de seleccin

E Seleccione Valor personalizado como tipo de semilla aleatoria que se va a utilizar y escriba

241972 como valor.

Al utilizar un valor personalizado, es posible replicar los resultados de este ejemplo de manera exacta.
E Pulse en Siguiente y, a continuacin, pulse en Siguiente en Extraer muestra: paso Archivos de

resultados.

86 Captulo 12 Figura 12-9 Asistente de muestreo: paso Finalizar

E Pulse en Finalizar.

Estas selecciones generan el archivo de plan de muestreo property_assess.csplan y extraen una muestra de acuerdo con dicho plan.

87 Asistente de muestreo de la opcin Muestras complejas

Resumen del plan


Figura 12-10 Resumen del plan

La tabla de resumen muestra el plan de muestreo y resulta til para asegurarse de que el plan corresponde a sus intenciones.

Resumen de muestreo
Figura 12-11 Resumen de las etapas

Esta tabla de resumen muestra la primera etapa del muestreo y resulta til para comprobar que el muestreo se ha realizado de acuerdo con el plan. Tal como se solicit, se tomaron muestras de cuatro poblaciones de cada condado.

88 Captulo 12 Figura 12-12 Resumen de las etapas

Esta tabla de resumen (de la cual se muestra aqu la parte superior) muestra la segunda etapa del muestreo. Tambin resulta til para comprobar que el muestreo se ha realizado de acuerdo con el plan. Como se solicit, se muestre aproximadamente el 20% de las propiedades de cada vecindario de cada una de las poblaciones muestreadas en la primera etapa.

Resultados de la muestra
Figura 12-13 Editor de datos con los resultados de la muestra

89 Asistente de muestreo de la opcin Muestras complejas

Puede ver los resultados del muestreo en el Editor de datos. Se han guardado cinco nuevas variables en el archivo de trabajo, que representan las probabilidades de inclusin y las ponderaciones muestrales acumuladas para cada etapa, adems de las ponderaciones muestrales nales. Los casos con valores para estas variables se seleccionaron para la muestra. Los casos con valores perdidos del sistema para las variables no se seleccionaron. La agencia ahora utilizar sus recursos para reunir las tasaciones actuales de las propiedades seleccionadas en la muestra. Una vez que estas tasaciones estn disponibles, puede procesar la muestra con los procedimientos de anlisis de Muestras complejas, utilizando el plan de muestreo property_assess.csplan para proporcionar las especicaciones de muestreo.

Obtencin de una muestra a partir de un marco de muestreo parcial


Una compaa est interesada en recopilar y vender una base de datos con informacin de encuestas de alta calidad. La muestra de la encuesta debe ser representativa, pero ha de llevarse a cabo de manera eciente, por lo que se utilizan mtodos de muestreo complejo. El diseo de muestreo completo requiere la siguiente estructura:
Etapa 1 2 3 Estratos Regin Distrito Subdivisin Conglomerados Provincia Ciudad

En la tercera etapa, las unidades familiares son la unidad muestral primaria y se realizarn encuestas a las unidades familiares seleccionadas. Sin embargo, dado que slo se puede disponer con facilidad de la informacin de ciudad, la compaa tiene pensado llevar a cabo las dos primeras etapas del diseo ahora y, a continuacin, recopilar la informacin sobre el nmero de subdivisiones y unidades familiares de las ciudades muestreadas. La informacin disponible acerca de las ciudades se incluye en demo_cs_1.sav, que se encuentra en el subdirectorio \tutorial\samples_les\ del directorio en el que ha instalado SPSS. Tenga en cuenta que este archivo contiene una variable Subdivisin que slo contiene el valor 1. Es un marcador de posicin para la variable verdadera, cuyos valores se recopilan despus de ejecutar las dos primeras etapas del diseo, que permite especicar ahora el diseo de muestreo de tres etapas completo. Utilice el Asistente de muestreo de la opcin Muestras complejas para especicar el diseo de muestreo complejo completo y, a continuacin, extraiga las dos primeras etapas.

Uso del asistente para extraer la muestra del primer marco parcial
E Para ejecutar el Asistente de muestreo de la opcin de Muestras complejas, seleccione en los

mens:
Analizar Muestras complejas Seleccionar una muestra...

90 Captulo 12 Figura 12-14 Asistente de muestreo: paso Bienvenida

E Seleccione Disear una muestra y escriba c:\demo.csplan como nombre del archivo del plan. E Pulse en Siguiente.

91 Asistente de muestreo de la opcin Muestras complejas Figura 12-15 Asistente de muestreo: paso Variables del diseo (etapa 1)

E Seleccione Regin como variable de estraticacin. E Seleccione Provincia como variable de conglomeracin. E Pulse en Siguiente y, a continuacin, pulse en Siguiente en el paso Mtodo.

Esta estructura de diseo indica que se extraen muestras independientes para cada regin. En esta etapa, se extraen las provincias como unidad muestral primaria mediante el mtodo por defecto: Muestreo aleatorio simple.

92 Captulo 12 Figura 12-16 Asistente de muestreo: paso Tamao muestral (etapa 1)

E Seleccione Recuentos en la lista desplegable Unidades. E Escriba 3 como el valor del nmero de los conglomerados que se van a seleccionar en esta etapa. E Pulse en Siguiente y, a continuacin, pulse en Siguiente en el paso Variables de resultado.

93 Asistente de muestreo de la opcin Muestras complejas Figura 12-17 Asistente de muestreo: paso Resumen del plan (etapa 1)

E Seleccione S, aadir la etapa 2 ahora. E Pulse en Siguiente.

94 Captulo 12 Figura 12-18 Asistente de muestreo: paso Variables del diseo (etapa 2)

E Seleccione Distrito como variable de estraticacin. E Seleccione Ciudad como variable de conglomeracin. E Pulse en Siguiente y, a continuacin, pulse en Siguiente en el paso Mtodo.

Esta estructura de diseo indica que se extraen muestras independientes para cada distrito. En esta etapa, se extraen las ciudades como unidad muestral primaria mediante el mtodo por defecto: Muestreo aleatorio simple.

95 Asistente de muestreo de la opcin Muestras complejas Figura 12-19 Asistente de muestreo: paso Tamao muestral (etapa 2)

E Seleccione Proporciones en la lista desplegable Unidades. E Escriba 0,1 como valor de la proporcin de unidades que se van a extraer como muestra de

cada estrato.
E Pulse en Siguiente y, a continuacin, pulse en Siguiente en el paso Variables de resultado.

96 Captulo 12 Figura 12-20 Asistente de muestreo: paso Resumen del plan (etapa 2)

E Seleccione S, aadir la etapa 3 ahora. E Pulse en Siguiente.

97 Asistente de muestreo de la opcin Muestras complejas Figura 12-21 Asistente de muestreo: paso Variables del diseo (etapa 3)

E Seleccione Subdivisin como variable de estraticacin. E Pulse en Siguiente y, a continuacin, pulse en Siguiente en el paso Mtodo.

Esta estructura de diseo indica que se extraen muestras independientes para cada subdivisin. En esta etapa, se extraen las unidades familiares como unidad muestral primaria mediante el mtodo por defecto: Muestreo aleatorio simple.

98 Captulo 12 Figura 12-22 Asistente de muestreo: paso Tamao muestral (etapa 3)

E Seleccione Proporciones en la lista desplegable Unidades. E Escriba 0,2 como el valor de la proporcin de unidades que se van a seleccionar en esta etapa. E Pulse en Siguiente y, a continuacin, pulse en Siguiente en el paso Variables de resultado.

99 Asistente de muestreo de la opcin Muestras complejas Figura 12-23 Asistente de muestreo: paso Resumen del plan (etapa 3)

E Revise el diseo muestral y, a continuacin, pulse en Siguiente.

100 Captulo 12 Figura 12-24 Asistente de muestreo: Extraer muestra: paso Opciones de seleccin

E Seleccione 1, 2 como las etapas que se van a extraer como muestra ahora. E Seleccione Valor personalizado como tipo de semilla aleatoria que se va a utilizar y escriba

241972 como valor.

Al utilizar un valor personalizado, es posible replicar los resultados de este ejemplo de manera exacta.
E Pulse en Siguiente y, a continuacin, pulse en Siguiente en Extraer muestra: paso Archivos de

resultados.

101 Asistente de muestreo de la opcin Muestras complejas Figura 12-25 Asistente de muestreo: paso Finalizar

E Pulse en Finalizar.

Estas selecciones generan el archivo de plan de muestreo demo.csplan y extraen una muestra de acuerdo con las primeras dos etapas del plan.

102 Captulo 12

Resultados de la muestra
Figura 12-26 Editor de datos con los resultados de la muestra

Puede ver los resultados del muestreo en el Editor de datos. Se han guardado cinco nuevas variables en el archivo de trabajo, que representan las probabilidades de inclusin y las ponderaciones muestrales acumuladas para cada etapa, adems de las ponderaciones muestrales nales de las dos primeras etapas. Las ciudades con valores para estas variables se seleccionaron para la muestra. Las ciudades con valores perdidos del sistema para las variables no se seleccionaron. Para cada ciudad seleccionada, la compaa adquiri informacin sobre subdivisiones y unidades familiares y la coloc en demo_cs_2.sav. Utilice este archivo y el Asistente de muestreo para extraer la muestra de la tercera etapa de este diseo.

Uso del asistente para extraer la muestra del segundo marco parcial
E Para ejecutar el Asistente de muestreo de la opcin de Muestras complejas, seleccione en los

mens:
Analizar Muestras complejas Seleccionar una muestra...

103 Asistente de muestreo de la opcin Muestras complejas Figura 12-27 Asistente de muestreo: paso Bienvenida

E Seleccione Extraer una muestra y el archivo de plan c:\demo.csplan que ha creado. E Pulse en Siguiente.

104 Captulo 12 Figura 12-28 Asistente de muestreo: paso Resumen del plan (etapa 3)

E Seleccione 1, 2 como las etapas que ya se han muestreado. E Pulse en Siguiente.

105 Asistente de muestreo de la opcin Muestras complejas Figura 12-29 Asistente de muestreo: Extraer muestra: paso Opciones de seleccin

E Seleccione Valor personalizado como tipo de semilla aleatoria que se va a utilizar y escriba

4231946 como valor.


E Pulse en Siguiente y, a continuacin, pulse en Siguiente en Extraer muestra: paso Archivos de

resultados.

106 Captulo 12 Figura 12-30 Asistente de muestreo: paso Finalizar

E Seleccione Pegar la sintaxis generada por el Asistente en una ventana de sintaxis. E Pulse en Finalizar.

Se genera la siguiente sintaxis:


* Asistente de muestreo. CSSELECT /PLAN FILE='c:\demo.csplan' /CRITERIA STAGES = 3 SEED = 4231946 /CLASSMISSING EXCLUDE /DATA RENAMEVARS /PRINT SELECTION.

La impresin del resumen de muestreo en este caso produce una tabla confusa que provoca problemas en el Visor de resultados. Para desactivar la presentacin del resumen de muestreo, reemplace SELECTION por CPS en el subcomando PRINT. A continuacin, ejecute la sintaxis en la ventana de sintaxis. Estas selecciones extraen una muestra de acuerdo con la tercera etapa del plan de muestreo demo.csplan.

107 Asistente de muestreo de la opcin Muestras complejas

Resultados de la muestra
Figura 12-31 Editor de datos con los resultados de la muestra

Puede ver los resultados del muestreo en el Editor de datos. Se han guardado tres nuevas variables en el archivo de trabajo, que representan las probabilidades de inclusin y las ponderaciones muestrales acumuladas de la tercera etapa, adems de las ponderaciones muestrales nales. Estas nuevas ponderaciones tienen en cuenta los pesos calculados durante el muestreo de las dos primeras etapas. Las unidades con valores para estas variables se seleccionaron para la muestra. Las unidades con valores perdidos del sistema para estas variables no se seleccionaron. La compaa utilizar ahora sus recursos para obtener informacin mediante encuestas acerca de las unidades familiares seleccionadas en la muestra. Una vez que se recopilen estas encuestas, puede procesar la muestra con los procedimientos de anlisis de Muestras complejas, utilizando el plan de muestreo demo.csplan para proporcionar las especicaciones de muestreo.

Muestreo con probabilidad proporcional al tamao (PPS)


Los diputados que estudian un proyecto de ley antes de una asamblea legislativa se interesan por conocer si la opinin pblica apoya dicho proyecto de ley y qu relacin guarda dicho apoyo con los datos demogrcos de los votantes. Los encuestadores disean entrevistas y las realizan siguiendo un diseo muestral complejo.

108 Captulo 12

Se incluye una lista de votantes registrados en poll_cs.sav. Utilice el Asistente de muestreo de la opcin Muestras complejas para seleccionar una muestra y llevar a cabo su posterior anlisis.

Uso del asistente


E Para ejecutar el Asistente de muestreo de la opcin de Muestras complejas, seleccione en los

mens:
Analizar Muestras complejas Seleccionar una muestra... Figura 12-32 Asistente de muestreo: paso Bienvenida

E Seleccione Disear una muestra y escriba c:\poll.csplan como nombre del archivo del plan. E Pulse en Siguiente.

109 Asistente de muestreo de la opcin Muestras complejas Figura 12-33 Asistente de muestreo: paso Variables del diseo (etapa 1)

E Seleccione Condado como variable de estraticacin. E Seleccione Poblacin como variable de conglomeracin. E Pulse en Siguiente.

Esta estructura de diseo indica que se extraen muestras independientes para cada condado. En esta etapa, las poblaciones se extraen como la unidad muestral primaria.

110 Captulo 12 Figura 12-34 Asistente de muestreo: paso Mtodo (etapa 1)

E Seleccione PPS como mtodo de muestreo. E Seleccione Contar registros de datos como medida de tamao. E Pulse en Siguiente.

En cada condado, las poblaciones se extraen sin reposicin con una probabilidad proporcional al nmero de registros para cada poblacin. El mtodo PPS genera probabilidades de muestreo conjuntas para las poblaciones; el paso Archivos de resultado permite especicar dnde se van a guardar estos valores.

111 Asistente de muestreo de la opcin Muestras complejas Figura 12-35 Asistente de muestreo: paso Tamao muestral (etapa 1)

E Seleccione Proporciones en la lista desplegable Unidades. E Escriba 0,3 como el valor de la proporcin de poblaciones que se van a seleccionar por condado

en esta etapa. Los legisladores del condado del oeste sealan que hay menos poblaciones en su condado que en otros. Para asegurar una representacin adecuada, desean establecer un mnimo de 3 poblaciones muestreadas de cada condado.
E Escriba 3 como el nmero de poblaciones mnimo para seleccionar y 5 como el nmero mximo. E Pulse en Siguiente y, a continuacin, pulse en Siguiente en el paso Variables de resultado.

112 Captulo 12 Figura 12-36 Asistente de muestreo: paso Resumen del plan (etapa 1)

E Seleccione S, aadir la etapa 2 ahora. E Pulse en Siguiente.

113 Asistente de muestreo de la opcin Muestras complejas Figura 12-37 Asistente de muestreo: paso Variables del diseo (etapa 2)

E Seleccione Vecindario como variable de estraticacin. E Pulse en Siguiente y, a continuacin, pulse en Siguiente en el paso Mtodo.

Esta estructura de diseo indica que se extraen muestras independientes para cada vecindario de las poblaciones extradas en la etapa 1. En esta etapa, se extraen los votantes como unidad muestral primaria utilizando el muestreo aleatorio simple sin reposicin.

114 Captulo 12 Figura 12-38 Asistente de muestreo: paso Tamao muestral (etapa 2)

E Seleccione Proporciones en la lista desplegable Unidades. E Escriba 0,2 como valor de la proporcin de unidades que se van a extraer como muestra de

cada estrato.
E Pulse en Siguiente y, a continuacin, pulse en Siguiente en el paso Variables de resultado.

115 Asistente de muestreo de la opcin Muestras complejas Figura 12-39 Asistente de muestreo: paso Resumen del plan (etapa 2)

E Revise el diseo muestral y, a continuacin, pulse en Siguiente.

116 Captulo 12 Figura 12-40 Asistente de muestreo: Extraer muestra: paso Opciones de seleccin

E Seleccione Valor personalizado como tipo de semilla aleatoria que se va a utilizar y escriba

592004 como valor.

Al utilizar un valor personalizado, es posible replicar los resultados de este ejemplo de manera exacta.
E Pulse en Siguiente.

117 Asistente de muestreo de la opcin Muestras complejas Figura 12-41 Asistente de muestreo: Extraer muestra: paso Opciones de seleccin

E Seleccione guardar la muestra en un nuevo conjunto de datos y escriba c:\poll_cs_sample como

nombre del conjunto de datos.


E Escriba c:\poll_jointprob.sav como el nombre del archivo de probabilidades conjuntas. E Pulse en Siguiente.

118 Captulo 12 Figura 12-42 Asistente de muestreo: paso Finalizar

E Pulse en Finalizar.

Estas selecciones producen el archivo de plan de muestreo poll.csplan y extraen una muestra de acuerdo con dicho plan, guardan los resultados de la muestra en un nuevo conjunto de datos poll_cs_sample, y guardan el archivo de probabilidades conjuntas en el archivo de datos externo poll_jointprob.sav.

119 Asistente de muestreo de la opcin Muestras complejas

Resumen del plan


Figura 12-43 Resumen del plan

La tabla de resumen muestra el plan de muestreo y resulta til para asegurarse de que el plan corresponde a sus intenciones.

Resumen de muestreo
Figura 12-44 Resumen de las etapas

Esta tabla de resumen muestra la primera etapa del muestreo y resulta til para comprobar que el muestreo se ha realizado de acuerdo con el plan. Recuerde que solicit una muestra del 30% de las poblaciones por condado; las proporciones reales muestreadas son cercanas al 30%, excepto en los condados del oeste y del sur. Esto se debe a que cada uno de estos condados slo tiene seis poblaciones y se ha especicado que se debe seleccionar un mnimo de tres poblaciones por condado.

120 Captulo 12 Figura 12-45 Resumen de las etapas

Esta tabla de resumen (de la cual se muestra aqu la parte superior) muestra la segunda etapa del muestreo. Tambin resulta til para comprobar que el muestreo se ha realizado de acuerdo con el plan. Como se solicit, se muestre aproximadamente el 20% de los votantes de cada vecindario de cada una de las poblaciones muestreadas en la primera etapa.

121 Asistente de muestreo de la opcin Muestras complejas

Resultados de la muestra
Figura 12-46 Editor de datos con los resultados de la muestra

Puede ver los resultados del muestreo en el conjunto de datos recin creado. Se han guardado cinco nuevas variables en el archivo de trabajo, que representan las probabilidades de inclusin y las ponderaciones muestrales acumuladas para cada etapa, adems de las ponderaciones muestrales nales. Los votantes que no se han seleccionado para la muestra se excluyen de este conjunto de datos. Las ponderaciones muestrales nales son idnticas para los votantes de algunos vecindarios ya que estn seleccionados de acuerdo con un mtodo de muestreo aleatorio simple de los vecindarios. Sin embargo, son distintos entre vecindarios de la misma poblacin ya que las proporciones muestreadas no son exactamente el 20% en todos los vecindarios.

122 Captulo 12 Figura 12-47 Editor de datos con los resultados de la muestra

A diferencia de los votantes de la segunda etapa, las ponderaciones muestrales de la primera etapa no son idnticas para las poblaciones del mismo condado porque se han seleccionado con probabilidad proporcional al tamao.

123 Asistente de muestreo de la opcin Muestras complejas Figura 12-48 Archivo de probabilidades conjuntas

El archivo poll_jointprob.sav contiene las probabilidades conjuntas en la primera etapa para las poblaciones seleccionadas dentro de condados. Condado es una variable de estraticacin de primera etapa y Poblacin es una variable de aglomeracin. Las combinaciones de estas variables identican de forma nica todas las PSU de primera etapa. No_Unidad_ etiqueta las PSU dentro de cada estrato y se utiliza para que coincida con Prob_conj_1_, Prob_conj_2_, Prob_conj_3_, Prob_conj_4_ y Prob_conj_5_. Los dos primeros estratos tienen 4 PSU, por lo que las matrices de probabilidad de inclusin conjunta son 44 para estos estratos y la columna Prob_conj_5_ est vaca a la izquierda para estas las. Del mismo modo, los estratos 3 y 5 tienen matrices de probabilidad de inclusin conjunta 33 y el estrato 4 tiene una matriz de probabilidad de inclusin conjunta 55. Si se examinan los valores de las matrices de probabilidad de inclusin conjunta se puede determinar la necesidad de un archivo de probabilidades conjuntas. Cuando el mtodo de muestreo no es un mtodo PPS SR, la seleccin de una PSU es independiente de la seleccin de otra PSU y la probabilidad de inclusin conjunta es simplemente el producto de sus probabilidades de inclusin. Por el contrario, la probabilidad de inclusin conjunta de las poblaciones 9 y 10 del condado 1 es aproximadamente 0,11 (consulte el primer caso de Prob_conj_3_ o el tercer caso de Prob_conj_1_) o menor que el producto de sus probabilidades de inclusin individuales (el producto del primer caso de Prob_conj_1_ y el tercer caso de Prob_conj_3_ es 0,310,44=0,1364).

124 Captulo 12

Los encuestadores ahora llevarn a cabo entrevistas para la muestra seleccionada. Una vez que los resultados estn disponibles, puede procesar la muestra con procedimientos de anlisis de Muestras complejas mediante el plan de muestreo poll.csplan para proporcionar las especicaciones de muestreo y poll_jointprob.sav para proporcionar las probabilidades de inclusin conjunta necesarias.

Procedimientos relacionados
El procedimiento Asistente de muestreo de la opcin Muestras complejas es una herramienta til para crear un archivo de plan de muestreo y extraer una muestra. Para preparar una muestra para su anlisis cuando no puede acceder al archivo de plan de muestreo, utilice el Asistente de preparacin del anlisis.

Asistente de preparacin del anlisis de la opcin Muestras complejas

13

Captulo

El Asistente de preparacin del anlisis le gua a travs de los pasos para crear o modicar un plan de anlisis y utilizarlo con los distintos procedimientos de anlisis de Muestras complejas. Resulta especialmente til cuando no se puede acceder al archivo del plan de muestreo que se utiliz para extraer la muestra.

Uso del Asistente de preparacin del anlisis de la opcin Muestras complejas para preparar los datos de uso pblico de la NHIS
La National Health Interview Survey (NHIS, encuesta del Centro Nacional de Estadsticas de Salud de EE.UU.) es una encuesta muy detallada realizada entre la poblacin civil de Estados Unidos. Las encuestas se realizaron en persona a una muestra representativa de las unidades familiares del pas. Se recogi tanto la informacin demogrca como las observaciones acerca del estado y los hbitos de salud de los integrantes de cada unidad familiar. Un subconjunto de la encuesta de 2000 se incluye en nhis2000_subset.sav, que se encuentra en el subdirectorio \tutorial\samples_les\ del directorio en el que ha instalado SPSS. Utilice el Asistente de preparacin del anlisis de la opcin Muestras complejas para crear un plan de anlisis para este archivo de datos de manera que se pueda procesar mediante los procedimientos de anlisis de Muestras complejas.

Uso del asistente


E Para preparar una muestra mediante el Asistente de preparacin del anlisis de la opcin Muestras

complejas, seleccione en los mens:


Analizar Muestras complejas Preparar para el anlisis...

125

126 Captulo 13 Figura 13-1 Asistente de preparacin del anlisis: paso Bienvenida

E Escriba c:\nhis2000_subset.csaplan como nombre del archivo del plan del anlisis. E Pulse en Siguiente.

127 Asistente de preparacin del anlisis de la opcin Muestras complejas Figura 13-2 Asistente de preparacin del anlisis: paso Variables del diseo (etapa 1)

Los datos se obtuvieron utilizando una muestra compleja polietpica. No obstante, para los usuarios nales, las variables de diseo originales de la NHIS se transformaron en un conjunto simplicado de variables de diseo y de ponderacin cuyos resultados se aproximan a los de las estructuras de diseo originales.
E Seleccione Estrato para la estimacin de la varianza como variable de estrato. E Seleccione PSU para la estimacin de la varianza como variable de conglomerado. E Seleccione Peso - Final anual como variable de ponderacin muestral. E Pulse en Finalizar.

128 Captulo 13

Resumen
Figura 13-3 Resumen

La tabla de resumen permite revisar el plan de anlisis. El plan se compone de una etapa cuyo diseo se compone de una variable de estraticacin y una variable de conglomerado. Se utiliza estimacin con reposicin (CR) y el plan se almacena en el archivo c:/nhis2000_subset.csaplan. Ahora puede utilizar este archivo de plan para procesar nhis2000_subset.sav con los procedimientos de anlisis de Muestras complejas.

Preparacin del anlisis cuando las ponderaciones muestrales no se encuentran en el archivo de datos
Un encargado de prstamos tiene un conjunto de registros de clientes que se han realizado siguiendo un diseo complejo. Sin embargo, las ponderaciones muestrales no se incluyen en el archivo. Esta informacin se recoge en bankloan_cs_noweights.sav, que se encuentra en el subdirectorio \tutorial\samples_les\ del directorio en el que ha instalado SPSS. Basndose en sus conocimientos sobre el diseo muestral, el encargado desea utilizar el Asistente de preparacin del anlisis de la opcin Muestras complejas para crear un plan de anlisis para este archivo de datos con el n de procesarlo mediante los procedimientos de anlisis de Muestras complejas. El encargado de prstamos sabe que los registros se seleccionaron en dos etapas, con 15 sucursales bancarias seleccionadas de un total de 100, con probabilidad igual y sin reposicin en la primera etapa. Se seleccionaron cien clientes de cada una de esas sucursales con probabilidad igual y sin reposicin en la segunda etapa, incluyndose en el archivo de datos la informacin del nmero de clientes de cada sucursal. El primer paso para crear un plan de anlisis consiste en calcular las probabilidades de inclusin segn etapa y las ponderaciones muestrales nales.

Clculo de las probabilidades de inclusin y las ponderaciones muestrales


E Para calcular las probabilidades de inclusin de la primera etapa, seleccione en el men las

siguientes opciones:
Transformar Calcular variable...

129 Asistente de preparacin del anlisis de la opcin Muestras complejas Figura 13-4 Cuadro de dilogo Calcular variable

En la primera etapa se han seleccionado quince de las cien sucursales sin sustitucin. Por consiguiente, la probabilidad de que un banco determinado se seleccionara es de 15/100 = 0,15.
E Escriba inclprob_s1 como variable de destino. E Escriba 0,15 como expresin numrica. E Pulse en Aceptar.

130 Captulo 13 Figura 13-5 Cuadro de dilogo Calcular variable

En la segunda etapa se han seleccionado cien clientes de cada sucursal. Por consiguiente, la probabilidad de inclusin de la segunda etapa para un cliente determinado de una sucursal determinada es de 100/nmero de clientes de esa sucursal.
E Vuelva a abrir el cuadro de dilogo Calcular variable. E Escriba inclprob_s2 como variable de destino. E Escriba 100/ncust como expresin numrica. E Pulse en Aceptar.

131 Asistente de preparacin del anlisis de la opcin Muestras complejas Figura 13-6 Cuadro de dilogo Calcular variable

Ahora que ha obtenido las probabilidades de inclusin de cada etapa, es muy sencillo calcular las ponderaciones muestrales nales.
E Vuelva a abrir el cuadro de dilogo Calcular variable. E Escriba finalweight como variable de destino. E Escriba 1/(inclprob_s1 * inclprob_s2) como expresin numrica. E Pulse en Aceptar.

Ya puede crear el plan de anlisis.

Uso del asistente


E Para preparar una muestra mediante el Asistente de preparacin del anlisis de la opcin Muestras

complejas, seleccione en los mens:


Analizar Muestras complejas Preparar para el anlisis...

132 Captulo 13 Figura 13-7 Asistente de preparacin del anlisis: paso Bienvenida

E Escriba c:\bankloan.csaplan como nombre del archivo del plan de anlisis. E Pulse en Siguiente.

133 Asistente de preparacin del anlisis de la opcin Muestras complejas Figura 13-8 Asistente de preparacin del anlisis: paso Variables del diseo (etapa 1)

E Seleccione Rama como variable de aglomeracin. E Seleccione nalweight como variable de ponderacin muestral. E Pulse en Siguiente.

134 Captulo 13 Figura 13-9 Asistente de preparacin del anlisis: paso Mtodo de estimacin (etapa 1)

E Seleccione Igual SR como el mtodo de estimacin de la primera etapa. E Pulse en Siguiente.

135 Asistente de preparacin del anlisis de la opcin Muestras complejas Figura 13-10 Asistente de preparacin del anlisis: paso Tamao (etapa 1)

E Seleccione Leer valores de la variable y seleccione inclprob_s1 como la variable que contiene las

probabilidades de inclusin de la primera etapa.


E Pulse en Siguiente.

136 Captulo 13 Figura 13-11 Asistente de preparacin del anlisis: paso Resumen del plan (etapa 1)

E Seleccione S, aadir la etapa 2 ahora. E Pulse en Siguiente y, a continuacin, pulse en Siguiente en el paso Diseo.

137 Asistente de preparacin del anlisis de la opcin Muestras complejas Figura 13-12 Asistente de preparacin del anlisis: paso Mtodo de estimacin (etapa 2)

E Seleccione Igual SR como el mtodo de estimacin de la segunda etapa. E Pulse en Siguiente.

138 Captulo 13 Figura 13-13 Asistente de preparacin del anlisis: paso Tamao (etapa 2)

E Seleccione Leer valores de la variable y seleccione inclprob_s2 como la variable que contiene las

probabilidades de inclusin de la segunda etapa.


E Pulse en Finalizar.

139 Asistente de preparacin del anlisis de la opcin Muestras complejas

Resumen
Figura 13-14 Tabla de resumen

La tabla de resumen permite revisar el plan de anlisis. El plan est formado por dos etapas con un diseo de una variable de agrupacin. Se utiliza la estimacin de probabilidad igual sin reposicin (CR) y el plan se almacena en el archivo c:/bankloan.csaplan. Ya puede utilizar este archivo del plan para procesar bankloan_noweights.sav (con las probabilidades de inclusin y las ponderaciones muestrales que ha calculado) con los procedimientos de anlisis de Muestras complejas.

Procedimientos relacionados
El procedimiento del Asistente de preparacin del anlisis de la opcin Muestras complejas es una herramienta til para preparar una muestra para su anlisis cuando no puede acceder al archivo del plan de muestreo. Para crear un archivo del plan de muestreo y extraer una muestra, utilice el Asistente de muestreo.

Frecuencias de Muestras complejas

14

Captulo

El procedimiento Frecuencias de Muestras complejas genera tablas de frecuencias para las variables seleccionadas y muestra estadsticos univariantes. Si lo desea, puede solicitar estadsticos por subgrupos, denidos por una o ms variables categricas.

Uso de Frecuencias de muestras complejas para analizar el consumo de suplementos nutritivos


Un investigador desea estudiar el uso de suplementos nutritivos de los ciudadanos de EE.UU., utilizando los resultados de la National Health Interview Survey (NHIS, Centro Nacional de Estadsticas de Salud) y un plan de anlisis anteriormente creado. Si desea obtener ms informacin, consulte Uso del Asistente de preparacin del anlisis de la opcin Muestras complejas para preparar los datos de uso pblico de la NHIS en Captulo 13 en p. 125. Un subconjunto de la encuesta de 2000 se incluye en nhis2000_subset.sav, que se encuentra en el subdirectorio \tutorial\samples_les\ del directorio en el que ha instalado SPSS. El plan del anlisis se guarda en nhis2000_subset.csaplan. Uso de Frecuencias de muestras complejas para generar estadsticos acerca del consumo de suplementos nutritivos.

Ejecucin del anlisis


E Para ejecutar un anlisis de Frecuencias de muestras complejas, seleccione en los mens: Analizar Muestras complejas Frecuencias...

140

141 Frecuencias de Muestras complejas Figura 14-1 Cuadro de dilogo Plan de muestras complejas

E Busque el subdirectorio \tutorial\sample_les\ del directorio en el que ha instalado SPSS y

seleccione nhis2000_subset.csaplan.
E Pulse en Continuar. Figura 14-2 Cuadro de dilogo Frecuencias

E Seleccione Suplementos vitamnicos/minerales ltimos 12 m como variable de frecuencia.

142 Captulo 14 E Seleccione Categoras de edad como una variable de subpoblacin. E Pulse en Estadsticos. Figura 14-3 Cuadro de dilogo Frecuencias: Estadsticos

E Seleccione Porcentaje de tabla en el grupo Casillas. E Seleccione Intervalo de confianza en el grupo Estadsticos. E Pulse en Continuar. E Pulse en Aceptar en el cuadro de dilogo Frecuencias.

Tabla de frecuencia
Figura 14-4 Tabla de frecuencia para variable/situacin

Se calcula cada estadstico seleccionado para cada medida de casilla seleccionada. La primera columna contiene estimaciones del nmero y el porcentaje de la poblacin que toma o no toma suplementos vitamnicos/minerales. Los intervalos de conanza no se solapan; por tanto, se puede concluir que, en general, hay ms americanos que toman suplementos vitamnicos/minerales que los que no los toman.

143 Frecuencias de Muestras complejas

Frecuencia por subpoblacin


Figura 14-5 Tabla de frecuencia por subpoblacin

Al calcular los estadsticos por subpoblacin, se calcula cada estadstico seleccionado para cada una de las medidas de las casillas seleccionadas por el valor de Categoras de edad. La primera columna contiene estimaciones del nmero y el porcentaje de la poblacin de cada categora que toma o no toma suplementos vitamnicos/minerales. Los intervalos de conanza para los porcentajes de la tabla no se solapan; por lo tanto, se puede concluir que el uso de los suplementos vitamnicos/minerales aumenta con la edad.

Resumen
Mediante el procedimiento Frecuencias de muestras complejas, ha obtenido los estadsticos acerca del consumo de suplementos nutritivos de los ciudadanos de EE.UU. En general, hay ms americanos que toman suplementos vitamnicos/minerales que los que no los toman. Una vez desglosados por categora de edad, una mayor proporcin de americanos toman suplementos vitamnicos/minerales al aumentar la edad.

144 Captulo 14

Procedimientos relacionados
El procedimiento Frecuencias de muestras complejas es una herramienta til para obtener estadsticos descriptivos univariantes de variables categricas de las observaciones obtenidas mediante un diseo muestral complejo. El mdulo adicional Asistente de muestreo de la opcin Muestras complejas se utiliza para denir las especicaciones de diseo de las muestras complejas y obtener una muestra. El archivo del plan de muestreo creado por el Asistente de muestreo contiene un plan de anlisis por defecto que se puede especicar en el cuadro de dilogo Plan cuando se analiza la muestra obtenida de acuerdo con dicho plan. El mdulo adicional Asistente de preparacin del anlisis de la opcin Muestras complejas se utiliza para congurar las especicaciones de anlisis para una Muestra compleja existente. El archivo del plan de muestreo creado por el Asistente de muestreo se puede especicar en el cuadro de dilogo Plan cuando se analiza la muestra correspondiente a dicho plan. El mdulo adicional Tablas de contingencia de Muestras complejas proporciona estadsticos descriptivos de las tablas de contingencia de variables categricas. El mdulo adicional Descriptivos de Muestras complejas proporciona estadsticos descriptivos univariantes para variables de escala.

Descriptivos de Muestras complejas

15

Captulo

El procedimiento Descriptivos de Muestras complejas muestra estadsticos de resumen univariantes para distintas variables. Si lo desea, puede solicitar estadsticos por subgrupos, denidos por una o ms variables categricas.

Uso de los descriptivos de Muestras complejas para analizar los niveles de actividad
Un investigador desea estudiar los niveles de actividad de los ciudadanos de EE.UU., utilizando los resultados de la National Health Interview Survey (NHIS, Centro Nacional de Estadsticas de Salud) y un plan de anlisis anteriormente creado. Si desea obtener ms informacin, consulte Uso del Asistente de preparacin del anlisis de la opcin Muestras complejas para preparar los datos de uso pblico de la NHIS en Captulo 13 en p. 125. Un subconjunto de la encuesta de 2000 se incluye en nhis2000_subset.sav, que se encuentra en el subdirectorio \tutorial\samples_les\ del directorio en el que ha instalado SPSS. El plan del anlisis se guarda en nhis2000_subset.csaplan. Puede utilizar los descriptivos de Muestras complejas para generar estadsticos descriptivos univariantes para niveles de actividad.

Ejecucin del anlisis


E Para ejecutar un anlisis de Descriptivos de Muestras complejas, seleccione en los mens: Analizar Muestras complejas Descriptivos...

145

146 Captulo 15 Figura 15-1 Cuadro de dilogo Plan de muestras complejas

E Busque el subdirectorio \tutorial\sample_les\ del directorio en el que ha instalado SPSS y

seleccione nhis2000_subset.csaplan.
E Pulse en Continuar.

147 Descriptivos de Muestras complejas Figura 15-2 Cuadro de dilogo Descriptivos

E Seleccione desde Frecuencia de actividad vigorosa (veces por semana) hasta Frecuencia de

actividad de fuerza (veces por semana) como variables de medida.


E Seleccione Categoras de edad como una variable de subpoblacin. E Pulse en Estadsticos. Figura 15-3 Cuadro de dilogo Descriptivos: Estadsticos

E Seleccione Intervalo de confianza en el grupo Estadsticos. E Pulse en Continuar. E Pulse en Aceptar en el cuadro de dilogo Descriptivos de Muestras complejas.

148 Captulo 15

Estadsticos univariantes
Figura 15-4 Estadsticos univariantes

Cada estadstico seleccionado se calcula para cada variable de medida. La primera columna contiene estimaciones del nmero medio de veces a la semana que una persona realiza determinado tipo de actividad. Los intervalos de conanza para las medias no se solapan. Por lo tanto, se puede concluir que, globalmente, los americanos realizan actividades de fuerza con menos frecuencia que actividades vigorosas y que realizan actividades vigorosas con menos frecuencia que actividades moderadas.

149 Descriptivos de Muestras complejas

Estadsticos univariantes por subpoblacin


Figura 15-5 Estadsticos univariantes por subpoblacin

Cada estadstico seleccionado se calcula para cada variable de medida segn los valores de Categoras de edad. La primera columna contiene estimaciones del nmero medio de veces a la semana que las personas de cada categora realizan un determinado tipo de actividad. Los intervalos de conanza de las medias permiten extraer ciertas interesantes conclusiones. En lo que se reere a las actividades vigorosas y moderadas, las personas de 2544 aos son menos activos que las de 1824 y las de 4564, mientras que las personas de 4564 aos son menos activas que las de 65 o mayores. En lo que se reere a las actividades de fuerza, las personas de 2544 aos son menos activas que las de 4564, mientras que las personas de 1824 y 4564 aos son menos activas que las de 65 o mayores.

150 Captulo 15

Resumen
Mediante el procedimiento Descriptivos de Muestras complejas, ha obtenido los estadsticos de los niveles de actividad de los ciudadanos de EE.UU. En general, los americanos pasan diferentes intervalos de tiempo realizando diferentes tipos de actividades. Una vez desglosados por edades, los datos parecen indicar que los americanos que han nalizado sus estudios universitarios son en principio menos activos que cuando estaban estudiando, pero conforme envejecen vez ms pasan a ser ms conscientes de la necesidad de hacer ejercicio.

Procedimientos relacionados
El procedimiento Descriptivos de Muestras complejas es una herramienta til para obtener estadsticos descriptivos univariantes de las medidas de escala de las observaciones obtenidas mediante un diseo muestral complejo. El mdulo adicional Asistente de muestreo de la opcin Muestras complejas se utiliza para denir las especicaciones de diseo de las muestras complejas y obtener una muestra. El archivo del plan de muestreo creado por el Asistente de muestreo contiene un plan de anlisis por defecto que se puede especicar en el cuadro de dilogo Plan cuando se analiza la muestra obtenida de acuerdo con dicho plan. El mdulo adicional Asistente de preparacin del anlisis de la opcin Muestras complejas se utiliza para congurar las especicaciones de anlisis para una Muestra compleja existente. El archivo del plan de muestreo creado por el Asistente de muestreo se puede especicar en el cuadro de dilogo Plan cuando se analiza la muestra correspondiente a dicho plan. El mdulo adicional Razones de Muestras complejas proporciona estadsticos descriptivos para razones de medidas de escala. El mdulo adicional Frecuencias de Muestras complejas proporciona estadsticos descriptivos univariantes para variables categricas.

Tablas de contingencia de Muestras complejas

16

Captulo

El procedimiento Tablas de contingencia de Muestras complejas genera tablas de contingencia para los pares de variables seleccionadas y muestra estadsticos sobre la clasicacin bivariante. Si lo desea, puede solicitar estadsticos por subgrupos, denidos por una o ms variables categricas.

Uso de muestras complejas de tablas de contingencia para medir el riesgo relativo de un evento
Una compaa que vende suscripciones a revistas suele enviar todos los meses mailings a los nombres que aparecen en una base de datos que ha adquirido. La tasa de respuesta normalmente es muy baja, por lo que necesita encontrar una manera de dirigirse mejor a los posibles clientes. Una sugerencia consiste en concentrar el envo de mailings a aquellas personas que ya estn suscritas a peridicos, basndose en el supuesto de que las personas que leen peridicos tienen mayor propensin a suscribirse a revistas. Se puede utilizar el procedimiento Tablas de contingencia de Muestras complejas para probar esta teora construyendo una tabla de dos las por dos columnas de Suscrito a un peridico por Responde y calcular el riesgo relativo de que una persona que est suscrita a un peridico responda al mailing. Estos datos estn en demo_cs.sav y debern analizarse utilizando el archivo de plan de muestreo demo.csplan, que se encuentra en el subdirectorio \tutorial\sample_les\ del directorio en el que ha instalado SPSS.

Ejecucin del anlisis


E Para ejecutar un anlisis de tablas de contingencia de Muestras complejas, seleccione en los

mens:
Analizar Muestras complejas Tablas de contingencia...

151

152 Captulo 16 Figura 16-1 Cuadro de dilogo Plan de muestras complejas

E Busque el subdirectorio \tutorial\sample_les\ del directorio en el que ha instalado SPSS

y seleccione demo.csplan.
E Pulse en Continuar. Figura 16-2 Cuadro de dilogo Tablas de contingencia

E Seleccione Suscrito a un peridico como variable de la.

153 Tablas de contingencia de Muestras complejas E Seleccione Responde como una variable de columna. E Tambin resulta interesante ver los resultados desglosados por categoras de ingresos, as que

seleccione Categora de ingresos en miles como variable de subpoblacin.


E Pulse en Estadsticos. Figura 16-3 Cuadro de dilogo Tablas de contingencia: Estadsticos

E Anule la seleccin de Tamao de la poblacin y seleccione Porcentaje de fila en el grupo Casillas. E Seleccione Razn de las ventajas y Riesgo relativo en el grupo Resmenes para las tablas 2 por 2. E Pulse en Continuar. E Pulse en Aceptar en el cuadro de dilogo Tablas de contingencia de Muestras complejas.

Estas selecciones generarn una tabla de contingencia y una estimacin del riesgo de Suscrito a un peridico por Responde. Tambin se crean tablas diferentes con los resultados divididos por Categora de ingresos en miles.

154 Captulo 16

Tabla de contingencia
Figura 16-4 Tabla de contingencia de suscripcin a un peridico por respuesta

La tabla de contingencia muestra que, en general, pocas personas respondieron al mailing. No obstante, respondi una mayor proporcin de personas suscritas a peridicos.

Estimacin de riesgo
Figura 16-5 Estimacin del riesgo para la suscripcin a un peridico por respuesta

El riesgo relativo es una razn de probabilidades de eventos. El riesgo relativo de una respuesta al mailing es la razn de la probabilidad de que una persona suscrita a un peridico responda, respecto a la probabilidad de que una persona que no est suscrita lo haga. Por tanto, la estimacin el riesgo relativo es sencillamente 17.2%/10.3% = 1.673. Igualmente, el riesgo relativo de que no haya respuesta es la razn de la probabilidad de que una persona suscrita no responda, respecto a la probabilidad de que una persona no suscrita no responda. La estimacin de este riesgo relativo es 0.923. Con estos resultados, puede estimar que es 1.673 veces ms probable que una persona suscrita a un peridico responda al mailing que una persona que no lo est, o 0.923 veces tan probable que no responda como una persona que no est suscrita. La razn de las ventajas es la razn de las ventajas de los eventos. Las ventajas de un evento es la razn de la probabilidad de que ocurra el evento, respecto a la probabilidad de que no ocurra el evento. Por tanto, la estimacin de las ventajas de que una persona suscrita a un peridico responda al mailing es de 17.2%/82.8% = 0.208. Igualmente, la estimacin de las ventajas de que una persona no suscrita responda es de 10.3%/89.7% = 0.115. La estimacin de la ocurrencia del factor es por tanto 0.208/0.115 = 1.812 (tenga en cuenta que existe un error de redondeo en los pasos intercalados). La razn de las ventajas es la razn del riesgo relativo de responder, respecto al riesgo relativo de no responder, o sea 1.673/0.923 = 1.812.

155 Tablas de contingencia de Muestras complejas

Razn de las ventajas respecto al riesgo relativo


Ya que se trata de una razn de razones, la razn de las ventajas es muy difcil de interpretar. El riesgo relativo es ms fcil de interpretar, por lo que la razn de las ventajas por s sola no resulta muy til. Sin embargo, hay determinadas situaciones muy habituales en las que la estimacin del riesgo relativo no es muy buena y la razn de las ventajas se puede utilizar para calcular una aproximacin del riesgo relativo del evento de inters. La razn de las ventajas se puede utilizar como aproximacin del riesgo relativo del evento de inters cuando se cumplen las dos siguientes condiciones: La probabilidad del evento de inters es pequea (< 0,1). Esta condicin garantiza que la razn de las ventajas ser una buena aproximacin del riesgo relativo. En este ejemplo, el evento de inters es una respuesta al mailing. El diseo del estudio es un control de casos. Esta condicin indica que la estimacin habitual del riesgo relativo probablemente no sea buena. Un estudio de control de casos es retrospectivo, se utiliza sobre todo cuando el evento de inters es poco probable o cuando el diseo de un futuro experimento es poco prctico o poco tico. Ninguna de estas condiciones se cumple en este ejemplo, ya que la proporcin global de personas que respondieron fue del 12.8% y el diseo del estudio no fue un control de casos, por lo que resulta ms seguro tomar 1.673 como el riesgo relativo, en vez del valor de la razn de las ventajas.

Estimacin del riesgo por subpoblacin


Figura 16-6 Estimacin del riesgo para la suscripcin a un peridico por respuesta, con control de la categora de ingresos

156 Captulo 16

Las estimaciones del riesgo relativo se calculan por separado para cada categora de ingresos. Observe que el riesgo relativo de una respuesta positiva de las personas suscritas a un peridico parece disminuir gradualmente al aumentar los ingresos, lo que indica que es posible limitar an ms los destinatarios del mailing.

Resumen
Mediante las estimaciones del riesgo de las tablas de contingencia de Muestras complejas, ha descubierto que puede aumentar la tasa de respuesta a los mailings directos dirigindose a personas suscritas a peridicos. Adems, encuentra cierta evidencia de que las estimaciones de riesgo puede que no sean constantes dependiendo de la Categora de ingresos, por lo que puede aumentar an ms la tasa de respuesta si se dirige a las personas suscritas a peridicos que tienen menores ingresos.

Procedimientos relacionados
El procedimiento Tablas de contingencia de Muestras complejas es una herramienta til para obtener estadsticos descriptivos de las tablas de contingencia de variables categricas de observaciones obtenidas mediante un diseo muestral complejo. El mdulo adicional Asistente de muestreo de la opcin Muestras complejas se utiliza para denir las especicaciones de diseo de las muestras complejas y obtener una muestra. El archivo del plan de muestreo creado por el Asistente de muestreo contiene un plan de anlisis por defecto que se puede especicar en el cuadro de dilogo Plan cuando se analiza la muestra obtenida de acuerdo con dicho plan. El mdulo adicional Asistente de preparacin del anlisis de la opcin Muestras complejas se utiliza para congurar las especicaciones de anlisis para una Muestra compleja existente. El archivo del plan de muestreo creado por el Asistente de muestreo se puede especicar en el cuadro de dilogo Plan cuando se analiza la muestra correspondiente a dicho plan. El mdulo adicional Frecuencias de Muestras complejas proporciona estadsticos descriptivos univariantes para variables categricas.

Razones de Muestras complejas

17

Captulo

El procedimiento Razones de Muestras complejas muestra estadsticos de resumen univariantes para razones de variables. Si lo desea, puede solicitar estadsticos por subgrupos, denidos por una o ms variables categricas.

Uso de razones de Muestras complejas como ayuda en la evaluacin de los valores de las propiedades
Una agencia inmobiliaria se encarga que asegurar que los impuestos sobre las propiedades se evalan de la misma manera en los diferentes condados. Los impuestos se basan en el valor tasado de la propiedad, por lo que la agencia desea realizar un seguimiento de los valores de las propiedades en diferentes condados para asegurarse de que los registros de todos los condados estn igualmente actualizados. Ya que los recursos necesarios para obtener las tasaciones actuales son limitados, la agencia decide utilizar una metodologa de muestreo complejo para seleccionar las propiedades. La muestra de propiedades seleccionadas y su informacin de tasacin actual se recoge en property_assess_cs_sample.sav, que se encuentra en el subdirectorio \tutorial\samples_les\ del directorio en el que ha instalado SPSS. Uso de razones de Muestras complejas para evaluar el cambio de los valores de las propiedades desde la ltima tasacin en cinco condados.

Ejecucin del anlisis


E Para ejecutar un anlisis de razones de Muestras complejas, seleccione en los mens: Analizar Muestras complejas Razones...

157

158 Captulo 17 Figura 17-1 Cuadro de dilogo Plan de muestras complejas

E Busque el subdirectorio \tutorial\sample_les\ del directorio en el que ha instalado SPSS y

seleccione property_assess.csplan.
E Pulse en Continuar. Figura 17-2 Cuadro de dilogo Razones de Muestras complejas

E Seleccione Valor actual como variable de numerador.

159 Razones de Muestras complejas E Seleccione Valor de la ltima tasacin como la variable de denominador. E Seleccione Condado como variable de subpoblacin. E Pulse en Estadsticos. Figura 17-3 Cuadro de dilogo Estadsticos de la razn

E Seleccione Intervalo de confianza, Recuento no ponderado y Tamao de la poblacin en el grupo

Estadsticos.
E Seleccione Prueba t y escriba 1,3 como valor de prueba. E Pulse en Continuar. E Pulse en Aceptar en el cuadro de dilogo Razones de Muestras complejas.

Razones
Figura 17-4 Tabla de razones

La presentacin por defecto de la tabla es muy ancha, por lo que deber pivotarla para poder verla con mayor claridad.

160 Captulo 17

Pivotado de la tabla de razones


E Pulse dos veces en la tabla para activarla. E Seleccione en los mens del Visor: Pivotar Paneles de pivotado E Arrastre Numerador y, a continuacin, Denominador desde la la a la capa. E Arrastre Condado desde la la a la columna. E Arrastre Estadsticos desde la columna a la la. E Cierre la ventana Paneles de pivotado.

Tabla de razones pivotada


Figura 17-5 Tabla de razones pivotada

La tabla de razones ahora est pivotada de manera que resulta ms fcil comparar los estadsticos correspondientes a los diferentes condados. Las estimaciones de las razones varan desde un mnimo de 1,195 en el condado del sur hasta un mximo de 1,524 en el condado del oeste. Tambin hay bastante variacin en los errores tpicos, que oscilan desde un mnimo de 0,029 en el condado del sur hasta un mximo de 0,068 en el condado del este. Algunos de los intervalos de conanza no se solapan; por tanto, se puede concluir que las razones del condado del oeste son mayores que las razones de los condados del norte y del sur. Por ltimo, como medida ms objetiva, observe que los valores de signicacin de las pruebas t de los condados del oeste y del sur son menores de 0,05. Por tanto, se puede concluir que la razn del condado del oeste es mayor que 1,3 y la razn del condado del sur es menor que 1,3.

161 Razones de Muestras complejas

Resumen
Mediante el procedimiento Razones de Muestras complejas, hemos obtenido varios estadsticos para las razones del Valor actual respecto al Valor de la ltima tasacin. Los resultados sugieren que tal vez existan cierta falta de armonizacin en la evaluacin de los impuestos sobre las propiedades en los diferentes condados, concretamente: Las razones del condado del oeste son altas, lo que indica que sus registros no estn tan actualizados como los de otros condados en lo que se reere a la apreciacin de los valores de las propiedades. Los impuestos sobre las propiedades son probablemente demasiado bajos en este condado. Las razones del condado del sur son bajas, lo que indica que sus registros son ms actualizados que los de los otros condados en lo que se reere a la apreciacin de los valores de las propiedades. Los impuestos sobre las propiedades son probablemente demasiado altos en este condado. Las razones del condado del sur son inferiores que las del condado del oeste, pero se mantienen dentro del objetivo de 1,3. Los recursos utilizados para realizar el seguimiento de los valores en el condado del sur se asignarn al condado del sur para armonizar las razones de estos condados con los dems y con el objetivo de 1,3.

Procedimientos relacionados
El procedimiento Razones de Muestras complejas es una herramienta til para obtener estadsticos descriptivos univariantes de la razn de las medidas de escala de las observaciones obtenidas mediante un diseo muestral complejo. El mdulo adicional Asistente de muestreo de la opcin Muestras complejas se utiliza para denir las especicaciones de diseo de las muestras complejas y obtener una muestra. El archivo del plan de muestreo creado por el Asistente de muestreo contiene un plan de anlisis por defecto que se puede especicar en el cuadro de dilogo Plan cuando se analiza la muestra obtenida de acuerdo con dicho plan. El mdulo adicional Asistente de preparacin del anlisis de la opcin Muestras complejas se utiliza para congurar las especicaciones de anlisis para una Muestra compleja existente. El archivo del plan de muestreo creado por el Asistente de muestreo se puede especicar en el cuadro de dilogo Plan cuando se analiza la muestra correspondiente a dicho plan. El mdulo adicional Descriptivos de Muestras complejas proporciona estadsticos descriptivos univariantes para variables de escala.

Modelo lineal general de muestras complejas

18

Captulo

El procedimiento Modelo lineal general de muestras complejas (CSGLM) realiza anlisis de regresin lineal y anlisis de varianza y covarianza de muestras extradas mediante mtodos de muestreo complejo. Si lo desea, puede solicitar anlisis de una subpoblacin.

Uso del Modelo lineal general de muestras complejas para ajustar ANOVA de dos factores
Una cadena de tiendas de alimentacin realiza una encuesta sobre los hbitos de compra de una serie de clientes basndose en un diseo complejo. Una vez obtenidos los resultados de la encuesta y la cantidad que cada cliente gast el mes anterior, la cadena desea averiguar si la frecuencia con que los clientes hacen la compra est relacionada con la cantidad mensual que gastan, controlando el sexo del cliente e incorporando el diseo del muestreo. Estos datos estn en grocery_1month_sample.sav, que se encuentra en el subdirectorio \tutorial\samples_les\ del directorio en el que ha instalado SPSS. Utilice el procedimiento Modelo lineal general de muestras complejas para realizar un anlisis ANOVA de dos factores de las cantidades gastadas.

Ejecucin del anlisis


E Para ejecutar un anlisis de Modelo lineal general de muestras complejas, seleccione en los mens: Analizar Muestras complejas Modelo lineal general...

162

163 Modelo lineal general de muestras complejas Figura 18-1 Cuadro de dilogo Plan de muestras complejas

E Busque el subdirectorio \tutorial\sample_les\ del directorio en el que ha instalado SPSS y

seleccione grocery.csplan.
E Pulse en Continuar.

164 Captulo 18 Figura 18-2 Cuadro de dilogo Modelo lineal general de muestras complejas

E Seleccione Cantidad gastada como la variable dependiente. E Seleccione Para quin compra y Utiliza los cupones como factores. E Pulse en Modelo.

165 Modelo lineal general de muestras complejas Figura 18-3 Cuadro de dilogo Modelo

E Elija crear un modelo Personalizado. E Seleccione Efectos principales como tipo de trmino que se va a crear y seleccione compra y

usacup como trminos del modelo.


E Seleccione Interaccin como tipo de trmino que se va a crear y aada la interaccin

compra*usacup como un trmino del modelo.


E Pulse en Continuar. E En el Cuadro de dilogo Modelo lineal general de muestras complejas, pulse en Estadsticos.

166 Captulo 18 Figura 18-4 Cuadro de dilogo Modelo lineal general de muestras complejas: Estadsticos

E Seleccione Estimacin, Error tpico, Intervalo de confianza y Efecto del diseo en el grupo Parmetros

del modelo.
E Pulse en Continuar. E En el Cuadro de dilogo Modelo lineal general de muestras complejas, pulse en Medias estimadas. Figura 18-5 Cuadro de dilogo Modelo lineal general de muestras complejas: Medias estimadas

E Elija mostrar las medias para compra, usacup y la interaccin compra*usacup. E Seleccione un contraste Simple y 3 l mismo y familia como la categora de referencia para compra.

Observe que, una vez seleccionada, la categora aparece como 3 en el cuadro de dilogo.
E Seleccione un contraste Simple y 1 No como la categora de referencia para usacup. E Pulse en Continuar.

167 Modelo lineal general de muestras complejas E En el Cuadro de dilogo Modelo lineal general de muestras complejas, pulse en Aceptar.

Resumen del modelo


Figura 18-6 estadstico R cuadrado

R cuadrado, el coeciente de determinacin, es una medida de la fuerza del ajuste del modelo. Muestra que el modelo explica cerca del 60% de la variacin en Cantidad gastada, lo que ofrece una buena capacidad explicativa. Es posible que desee aadir otros predictores al modelo para mejorar an ms el ajuste.

Pruebas de efectos del modelo


Figura 18-7 Pruebas de los efectos inter-sujetos

Cada trmino del modelo, adems del propio modelo, se prueba para comprobar si el valor de su efecto es igual a 0. Los trminos con valores de signicacin inferiores a 0,05 tienen algn efecto perceptible. Por lo tanto, todos los trminos del modelo contribuyen a l.

168 Captulo 18

Estimaciones de los parmetros


Figura 18-8 Estimaciones de los parmetros

Las estimaciones de los parmetros muestran los efectos de cada predictor en Cantidad gastada. El valor 518,249 del trmino de interseccin indica que la cadena de productos alimenticios puede esperar que un comprador con familia que utiliza cupones de los peridicos y mailings dirigidos se gaste 518,25 dlares de media. Se puede decir que la interseccin est asociada con dichos niveles de factor porque esos son los niveles de factor cuyos parmetros son redundantes. Los coecientes de compra sugieren que, entre los clientes que utilizan tanto los cupones de los peridicos como los recibidos por mailing, aquellos que no tienen familia tienden a gastar menos que los clientes con cnyuge, quienes a su vez gastan menos que los clientes que vivan con personas a su cargo. Como las pruebas de los efectos del modelo demostraron que este trmino contribua al modelo, estas diferencias no se deben a la casualidad. Los coecientes usacup sugieren que el gasto entre los clientes con personas a su cargo desciende con el menor uso de cupones. Existe una moderada cantidad de incertidumbre en las estimaciones, pero los intervalos de conanza no incluyen el 0. Los coecientes de interaccin sugieren que los clientes que no usan cupones o slo recortes del peridico y no tienen personas a su cargo tienden a gastar ms de lo que se podra esperar. Si alguna parte de un parmetro de interaccin es redundante, el parmetro de interaccin ser redundante. La desviacin del 1 en los valores de los efectos del diseo indica que algunos de los errores tpicos calculados para estas estimaciones de parmetros son mayores que los que se obtendran si se supone que dichas observaciones proceden de una muestra aleatoria simple, mientras que los dems son ms pequeos. Es de vital importancia incorporar la informacin

169 Modelo lineal general de muestras complejas

sobre el diseo muestral al anlisis porque, en caso contrario, se podra inferir, por ejemplo, que el coeciente usacup=3 no es distinto de 0. Las estimaciones de los parmetros son tiles para cuanticar el efecto de cada uno de los trminos del modelo, pero las tablas de medias marginales estimadas pueden simplicar la interpretacin de los resultados del modelo.

Medias marginales estimadas


Figura 18-9 Medias marginales estimadas por niveles de Para quin compra

Esta tabla muestra las medias marginales estimadas por el modelo y los errores tpicos de Cantidad gastada en los niveles de factor de Para quin compra. Esta tabla es til para explorar las diferencias entre los niveles de este factor. En este ejemplo, un cliente que compra para s mismo se espera que gaste cerca de 308,53 dlares, mientras que un cliente casado se espera que gaste unos 370,33 dlares y un cliente con personas a su cargo gastar unos 459,44 dlares. Para comprobar si esto representa una diferencia real o puede deberse a una variacin debida al azar, examine los resultados de la prueba.
Figura 18-10 Resultados de las pruebas individuales para medias marginales estimadas de sexo

La tabla de las pruebas individuales muestra dos contrastes simples en el gasto. La estimacin del contraste es la diferencia en el gasto para los niveles de Para quin compra. El valor hipotetizado de 0,00 representa la creencia de que no hay diferencia en el gasto. El estadstico F de Wald, con los grados de libertad que se muestran, se utiliza para probar si la diferencia entre una estimacin de contraste y el valor hipotetizado es por una variacin debida al azar. Como los valores de signicacin son inferiores a 0,05, se puede concluir que existen diferencias en el gasto. Los valores de las estimaciones de los contrastes son distintos a los de las estimaciones de los parmetros. Esto se debe a que hay un trmino de interaccin que contiene el efecto de Para quin compra. Como resultado, la estimacin de los parmetros para compra=1 es un contraste

170 Captulo 18

simple entre los niveles l mismo y l mismo y familia en el nivel De ambos de la variable Utiliza los cupones. La estimacin del contraste en esta tabla se promedia sobre los niveles de Utiliza los cupones.
Figura 18-11 Resultados de las pruebas globales para medias marginales estimadas de sexo

La tabla de pruebas globales informa de los resultados de una prueba de todos los contrastes de la tabla de pruebas individuales. Su valor de signicacin menor que 0,05 conrma que existe una diferencia en el gasto entre los niveles de Para quin compra.
Figura 18-12 Medias marginales estimadas por niveles de estilo de compra

Esta tabla muestra las medias marginales estimadas por el modelo y los errores tpicos de Cantidad gastada en los niveles de factor de Utiliza los cupones. Esta tabla es til para explorar las diferencias entre los niveles de este factor. En este ejemplo, un cliente que no utiliza cupones se espera que se gaste unos 319,65 dlares, mientras que aquellos que s usan cupones se espera que gasten considerablemente ms.
Figura 18-13 Resultados de las pruebas individuales para medias marginales estimadas de estilo de compra

La tabla de pruebas individuales muestra tres contrastes simples, en los que se comparan los gastos de los clientes que no usan cupones frente a los que s los usan. Como los valores de signicacin de las pruebas son menores que 0,05, se puede concluir que los clientes que usan cupones tienden a gastar ms que los que no usan cupones.
Figura 18-14 Resultados de las pruebas globales para medias marginales estimadas de estilo de compra

171 Modelo lineal general de muestras complejas

La tabla de pruebas globales informa de los resultados de una prueba de todos los contrastes de la tabla de pruebas individuales. Su valor de signicacin menor que 0,05 conrma que existe una diferencia en el gasto entre los niveles de Utiliza los cupones. Observe que las pruebas globales para Utiliza los cupones y Para quin compra son equivalentes a las pruebas de los efectos del modelo ya que los valores de contraste hipotetizados son iguales a 0.
Figura 18-15 Medias marginales estimadas por niveles de sexo por estilo de compra

Esta tabla muestra las medias marginales estimadas por el modelo, los errores tpicos y los intervalos de conanza de Cantidad gastada en las combinaciones de factores de Para quin compra y Utiliza los cupones. Esta tabla es til para explorar el efecto de la interaccin entre estos dos factores detectada en las pruebas de los efectos del modelo.

Resumen
En este ejemplo, las medias marginales estimadas han revelado diferencias en el gasto entre clientes a distintos niveles de Para quin compra y Utiliza los cupones. Las pruebas de los efectos del modelo conrmaron la existencia de dicha diferencia, as como el hecho de que parece ser producto de un efecto de la interaccin Para quin compra*Utiliza los cupones. La tabla de resumen del modelo revel que el modelo actual explica algo ms de la mitad de la variacin hallada en los datos, y que se podra dicho modelo aadiendo ms predictores.

Procedimientos relacionados
El procedimiento Modelo lineal general de muestras complejas es una herramienta til para crear modelos de una variable de escala cuando los casos se han extrado siguiendo un esquema de muestreo complejo. El mdulo adicional Asistente de muestreo de la opcin Muestras complejas se utiliza para denir las especicaciones de diseo de las muestras complejas y obtener una muestra. El archivo del plan de muestreo creado por el Asistente de muestreo contiene un plan de

172 Captulo 18

anlisis por defecto que se puede especicar en el cuadro de dilogo Plan cuando se analiza la muestra obtenida de acuerdo con dicho plan. El mdulo adicional Asistente de preparacin del anlisis de la opcin Muestras complejas se utiliza para denir las especicaciones de anlisis de una muestra compleja existente. El archivo del plan de muestreo creado por el Asistente de muestreo se puede especicar en el cuadro de dilogo Plan cuando se analiza la muestra correspondiente a dicho plan. El mdulo adicional Regresin logstica de muestras complejas permite crear un modelo de una respuesta categrica. El mdulo adicional Regresin ordinal de muestras complejas permite crear un modelo de una respuesta ordinal.

Regresin logstica de muestras complejas

19

Captulo

El procedimiento Regresin logstica de muestras complejas lleva a cabo anlisis de regresin logstica sobre una variable binaria o una variable dependiente multinomial para muestras extradas mediante mtodos de muestreo complejo. Si lo desea, puede solicitar anlisis de una subpoblacin.

Uso del procedimiento Regresin logstica de muestras complejas para evaluar riesgos de crdito
Si es el encargado de prstamos en un banco, desear poder identicar caractersticas que sean indicativas de personas que puedan causar mora en los crditos y utilizar dichas caractersticas para identicar riesgos de crdito positivos y negativos. Suponga que un encargado de prstamos ha recopilado registros antiguos de prstamos concedidos a clientes en diversas ramas, de acuerdo con un diseo complejo. Esta informacin se recoge en bankloan_cs.sav, que se encuentra en el subdirectorio \tutorial\samples_les\ del directorio en el que ha instalado SPSS. El encargado desea comprobar si la probabilidad con que las moras de un cliente se asocian a su edad, historial de empleo y cantidad de crdito adeudado; posteriormente, incorporar el diseo muestral.

Ejecucin del anlisis


E

Para crear un modelo de regresin logstica, elija en los mens:


Analizar Muestras complejas Regresin logstica...

173

174 Captulo 19 Figura 19-1 Cuadro de dilogo Plan de muestras complejas

E Busque el subdirectorio \tutorial\sample_les\ del directorio en el que ha instalado SPSS y

seleccione bankloan.csaplan.
E Pulse en Continuar.

175 Regresin logstica de muestras complejas Figura 19-2 Cuadro de dilogo Regresin logstica

E Seleccione Impagos anteriores como la variable dependiente. E Seleccione Nivel de educacin como un factor. E Seleccione Edad en aos y Otras deudas en miles como covariables. E Seleccione Impagos anteriores y pulse en Categora de referencia.

176 Captulo 19 Figura 19-3 Cuadro de dilogo Regresin logstica de muestras complejas: Categora de referencia

E Seleccione Menor valor como la categora de referencia.

Esto denir la categora sin impagos anteriores como la categora de referencia; por lo tanto, las razones de las ventajas que aparecen en el resultado tendrn la propiedad de que cuanto mayores sean las razones de las ventajas mayor ser la probabilidad de mora.
E Pulse en Continuar. E En el cuadro de dilogo Regresin logstica, pulse en Estadsticos. Figura 19-4 Cuadro de dilogo Regresin logstica: Estadsticos

E Seleccione Tabla de clasificacin en el grupo Ajuste del modelo. E Seleccione Estimacin, Estimacin exponenciada, Error tpico, Intervalo de confianza y Efecto del diseo en el grupo Parmetros.

177 Regresin logstica de muestras complejas E Pulse en Continuar. E En el cuadro de dilogo Regresin logstica, pulse en Razones de las ventajas. Figura 19-5 Cuadro de dilogo Regresin logstica de muestras complejas: Razones de las ventajas

E Seleccione para crear las razones de las ventajas para el factor educ y las covariables empleo y

deudaingr.
E Pulse en Continuar. E En el cuadro de dilogo Regresin logstica, pulse en Aceptar.

Pseudo R cuadrado
Figura 19-6 Estadsticos pseudo R cuadrado

En el modelo de regresin lineal, el coeciente de determinacin, R2 resume la proporcin de la varianza de la variable dependiente asociada con las variables predictoras (independientes), con valores R2 mayores, indicando que el aumento de la variacin se explica por el modelo hasta un mximo de 1. Para los modelos de regresin con una variable dependiente categrica, no es posible calcular un nico estadstico R2 que tenga todas las caractersticas de R2 en el modelo de

178 Captulo 19

regresin lineal, por lo que en su lugar, se calculan estas aproximaciones. Los siguientes mtodos se utilizan para realizar una estimacin del coeciente de determinacin. R2(Cox y Snell, 1989) de Cox y Snell est basado en el logaritmo de verosimilitud del modelo comparado con el logaritmo de verosimilitud de un modelo de lnea base. Sin embargo tiene un valor mximo terico menor que 1 con resultados categricos, incluso para un modelo perfecto. R2(Nagelkerke, 1991) de Nagelkerke es una versin ajustada de R-cuadrado de Cox y Snell que ajusta la escala del estadstico para cubrir todo el rango de 0 a 1. R2(McFadden, 1974) de McFadden es otra versin basada en los kernel del logaritmo de verosimilitud para el modelo de slo interseccin y el modelo estimado completo. Los factores que constituyen un buen valor de R2 varan entre las distintas reas de aplicacin. Mientras que estos estadsticos pueden ser indicativos por s solos, son ms tiles para comparar modelos que compiten con los mismos datos. El modelo con el mayor R2 es el mejor segn esta medida.

Clasificacin
Figura 19-7 Tabla de clasificacin

La tabla de clasicacin muestra los resultados prcticos de la utilizacin del modelo de regresin logstica. Para cada caso, la respuesta pronosticada es S si el valor del logit pronosticado por el modelo de dicho caso es mayor que 0. Los casos se ponderan mediante nalweight, de manera que la tabla de clasicacin informa del rendimiento esperado del modelo en la poblacin. Las casillas de la diagonal son los pronsticos correctos. Las casillas fuera de la diagonal son los pronsticos incorrectos. En funcin de los casos utilizados para crear el modelo, se puede esperar, mediante la utilizacin de este modelo, clasicar correctamente el 85,5% de las personas que no causan mora en la poblacin. De igual manera, se puede esperar clasicar correctamente el 60,9% de las personas que puedan causar mora. En general, se puede esperar que la clasicacin del 76,5% de los casos se realice correctamente; sin embargo, debido a que esta tabla se cre con los casos utilizados para crear el modelo, es bastante probable que estas estimaciones sean excesivamente optimistas.

179 Regresin logstica de muestras complejas

Pruebas de efectos del modelo


Figura 19-8 Pruebas de los efectos inter-sujetos

Cada trmino del modelo, adems del propio modelo, se prueba para comprobar si su efecto es igual a 0. Los trminos con valores de signicacin inferiores a 0,05 tienen algn efecto perceptible. Por consiguiente, edad, empleo, deudaingr y deudacred contribuyen al modelo, mientras que los dems efectos principales no. En un anlisis ms detallado de los datos, es probable que se pudiera quitar educ, direccion, ingresos y deudaotro de la consideracin del modelo.

Estimaciones de los parmetros


Figura 19-9 Estimaciones de los parmetros

La tabla de estimaciones de los parmetros resume el efecto de cada predictor. Observe que los valores de los parmetros afectan a la verosimilitud de la categora did default relacionada con la categora sin impagos anteriores. Por consiguiente, los parmetros con coecientes positivos

180 Captulo 19

aumentan la verosimilitud de la mora, mientras que los parmetros con coecientes negativos disminuyen la verosimilitud de la mora. El signicado de un coeciente de una regresin logstica es ms complejo que el de un coeciente de una regresin lineal. Mientras que B es adecuado para probar los efectos del modelo, Exp(B) es ms fcil de interpretar. Exp(B) representa el cambio en las razones de las ventajas del evento de inters atribuible a un aumento de una unidad en el predictor, para predictores que no formen parte de trminos de interaccin. Por ejemplo, Exp(B) para empleo es igual a 0,798, lo que signica que las ventajas de la mora para personas cuya antigedad en la empresa actual sea de dos aos son 0,798 veces las ventajas de la mora de aquellas personas cuya antigedad en la empresa actual sea de un ao, siendo todo lo dems exactamente igual. Los efectos del diseo indican que algunos de los errores tpicos calculados para estas estimaciones de parmetros son mayores que los que se obtendran si se supone que dichas observaciones proceden de una muestra aleatoria simple, mientras que los dems son ms pequeos. Es de vital importancia incorporar la informacin sobre el diseo muestral al anlisis porque, en caso contrario, se podra inferir, por ejemplo, que el coeciente edad no es distinto de 0.

Razones de las ventajas


Figura 19-10 Razones de las ventajas para el nivel educativo

Esta tabla muestra las razones de las ventajas de Impagos anteriores en los niveles de factor de Nivel de educacin. Los valores indicados son las razones de las ventajas de mora para No complet el bachillerato hasta Ttulo Superior, comparadas a las razones de las ventajas para Ttulo de Post-grado. Por consiguiente, la razn de las ventajas de 2,054 en la primera la de la tabla signica que las ventajas de mora de una persona que no tiene estudios secundarios son 2,054 veces las ventajas de mora de una persona con una titulacin de postgraduado.

181 Regresin logstica de muestras complejas Figura 19-11 Razones de las ventajas para aos con la empresa actual

Esta tabla muestra la razn de las ventajas de Impagos anteriores para un cambio de unidad en la covariable Aos con la empresa actual. El valor indicado es la razn de las ventajas de mora de una persona con 7,99 aos en la empresa actual comparada con las ventajas de mora de una persona con 6,99 aos (la media).
Figura 19-12 Razones de las ventajas para la razn entre el endeudamiento y los ingresos

Esta tabla muestra la razn de las ventajas de Impagos anteriores para un cambio de unidad en la covariable Tasa de deuda sobre ingresos. El valor indicado es la razn de las ventajas de mora de una persona con una razn de endeudamiento/ingresos de 10,9341 comparada con las ventajas de mora de una persona con una razn de endeudamiento/ingresos de 9,9341 (la media). Observe que debido a que ninguno de estos predictores forman parte de los trminos de interaccin, los valores de las razones de las ventajas indicados en estas tablas son iguales a los valores de las estimaciones exponenciadas de los parmetros. Cuando un predictor forma parte de un trmino de interaccin, su razn de las ventajas en estas tablas tambin depender de los valores de los dems predictores que componen la interaccin.

Resumen
Mediante el procedimiento de Regresin logstica de muestras complejas, se ha construido un modelo para pronosticar la probabilidad de que un cliente dado cause mora en un crdito. Un problema crtico para los encargados de los crditos es el coste de los errores de Tipo I y Tipo II. Es decir, cul es el coste de clasicar una persona susceptible de causar mora como una persona que no va a causar mora (Tipo I)? Cul es el coste de clasicar una persona que no va a causar mora como una persona susceptible de causar mora (Tipo II)? Si la principal preocupacin es la concesin de mal crdito, entonces ser deseable reducir el error de Tipo I y maximizar la

182 Captulo 19

sensitivity. Si la prioridad es aumentar la base de clientes, entonces ser deseable reducir el error de Tipo II y maximizar la specicity. Normalmente, ambas son cuestiones importantes, as que se deber elegir una regla de decisin para clasicar los clientes que ofrezcan la mejor combinacin de susceptibilidad y especicidad.

Procedimientos relacionados
El procedimiento Regresin logstica de muestras complejas es una herramienta til para crear modelos de una variable categrica cuando los casos se han extrado siguiendo un esquema de muestreo complejo. El mdulo adicional Asistente de muestreo de la opcin Muestras complejas se utiliza para denir las especicaciones de diseo de las muestras complejas y obtener una muestra. El archivo del plan de muestreo creado por el Asistente de muestreo contiene un plan de anlisis por defecto que se puede especicar en el cuadro de dilogo Plan cuando se analiza la muestra obtenida de acuerdo con dicho plan. El mdulo adicional Asistente de preparacin del anlisis de la opcin Muestras complejas se utiliza para denir las especicaciones de anlisis de una muestra compleja existente. El archivo del plan de muestreo creado por el Asistente de muestreo se puede especicar en el cuadro de dilogo Plan cuando se analiza la muestra correspondiente a dicho plan. El mdulo adicional Modelo lineal general de muestras complejas permite crear un modelo de una respuesta de escala. El mdulo adicional Regresin ordinal de muestras complejas permite crear un modelo de una respuesta ordinal.

Regresin ordinal de muestras complejas

20

Captulo

El procedimiento Regresin ordinal de muestras complejas crea un modelo predictivo de una variable dependiente ordinal para muestras extradas mediante mtodos de muestreo complejo. Si lo desea, puede solicitar anlisis de una subpoblacin.

Uso de la regresin ordinal de muestras complejas para analizar los resultados de encuestas
Los diputados que estudian un proyecto de ley antes de una asamblea legislativa se interesan por conocer si la opinin pblica apoya dicho proyecto de ley y qu relacin guarda dicho apoyo con los datos demogrcos de los votantes. Los encuestadores disean entrevistas y las realizan siguiendo un diseo muestral complejo. Los resultados de las encuestas se recopilan en poll_cs_sample.sav. El plan de muestreo utilizado por los encuestadores se incluye en poll.csplan. Como utiliza un mtodo de probabilidad proporcional al tamao (PPS), tambin hay un archivo que contiene las probabilidades de seleccin conjunta (poll_jointprob.sav). Utilice la regresin ordinal de muestras complejas para ajustar un modelo acerca del nivel de apoyo a la ley de acuerdo con los datos demogrcos de los votantes.

Ejecucin del anlisis


E Para ejecutar un anlisis de Regresin ordinal de muestras complejas, seleccione en los mens: Analizar Muestras complejas Regresin ordinal...

183

184 Captulo 20 Figura 20-1 Cuadro de dilogo Plan de muestras complejas

E Busque el subdirectorio \tutorial\sample_les\ del directorio en el que ha instalado SPSS y

seleccione poll.csplan como archivo del plan.


E Seleccione poll_jointprob.sav como archivo de las probabilidades conjuntas. E Pulse en Continuar.

185 Regresin ordinal de muestras complejas Figura 20-2 Cuadro de dilogo principal Regresin ordinal de muestras complejas

E Seleccione La legilatura debera decretar un impuesto sobre la gasolina como la variable

dependiente.
E Seleccione desde Categora de edad hasta Frecuencia con la que conduce como factores. E Pulse en Estadsticos.

186 Captulo 20 Figura 20-3 Cuadro de dilogo Estadsticos

E Seleccione Tabla de clasificacin en el grupo Ajuste del modelo. E Seleccione Estimacin, Estimacin exponenciada, Error tpico, Intervalo de confianza y Efecto del diseo en el grupo Parmetros. E Seleccione Prueba de Wald de pendientes iguales y Estimaciones de los parmetros para modelo generalizado (pendientes desiguales). E Pulse en Continuar. E Pulse en Contrastes de hiptesis en el cuadro de dilogo Regresin ordinal de muestras complejas.

187 Regresin ordinal de muestras complejas Figura 20-4 Cuadro de dilogo Contrastes de hiptesis

Incluso para un nmero moderado de predictores y categoras de respuesta, el estadstico de contraste de la F de Wald es posible que no se pueda estimar para la prueba de lneas paralelas.
E Seleccione F corregida en el grupo Estadstico de contraste. E Seleccione Sidak secuencial como mtodo de ajuste para comparaciones mltiples. E Pulse en Continuar. E Pulse en Razones de las ventajas en el cuadro de dilogo Regresin ordinal de muestras complejas.

188 Captulo 20 Figura 20-5 Cuadro de dilogo Razones de las ventajas

E Seleccione generar razones de las ventajas acumulativas para Categora de edad y Frecuencia

con la que conduce.


E Seleccione 10-14.999 millas/ao, un kilometraje anual ms habitual que el mximo, como

categora de referencia de Frecuencia con la que conduce.


E Pulse en Continuar. E Pulse en Aceptar en el cuadro de dilogo Regresin ordinal de muestras complejas.

Pseudo R cuadrado
Figura 20-6 Pseudo R cuadrado

En el modelo de regresin lineal, el coeciente de determinacin, R2 resume la proporcin de la varianza de la variable dependiente asociada con las variables predictoras (independientes), con valores R2 mayores, indicando que el aumento de la variacin se explica por el modelo hasta un mximo de 1. Para los modelos de regresin con una variable dependiente categrica, no es

189 Regresin ordinal de muestras complejas

posible calcular un nico estadstico R2 que tenga todas las caractersticas de R2 en el modelo de regresin lineal, por lo que en su lugar, se calculan estas aproximaciones. Los siguientes mtodos se utilizan para realizar una estimacin del coeciente de determinacin. R2(Cox y Snell, 1989) de Cox y Snell est basado en el logaritmo de verosimilitud del modelo comparado con el logaritmo de verosimilitud de un modelo de lnea base. Sin embargo tiene un valor mximo terico menor que 1 con resultados categricos, incluso para un modelo perfecto. R2(Nagelkerke, 1991) de Nagelkerke es una versin ajustada de R-cuadrado de Cox y Snell que ajusta la escala del estadstico para cubrir todo el rango de 0 a 1. R2(McFadden, 1974) de McFadden es otra versin basada en los kernel del logaritmo de verosimilitud para el modelo de slo interseccin y el modelo estimado completo. Los factores que constituyen un buen valor de R2 varan entre las distintas reas de aplicacin. Mientras que estos estadsticos pueden ser indicativos por s solos, son ms tiles para comparar modelos que compiten con los mismos datos. El modelo con el mayor R2 es el mejor segn esta medida.

Pruebas de efectos del modelo


Figura 20-7 Contrastes de los efectos del modelo

Cada trmino del modelo se prueba para comprobar si el efecto es igual a 0. Los trminos con valores de signicacin inferiores a 0,05 tienen algn efecto perceptible. Por consiguiente, edadcat y freccond contribuyen al modelo, mientras que los dems efectos principales no. En los anlisis posteriores de los datos, puede considerar quitar genero y votoult del modelo.

Estimaciones de los parmetros


La tabla de estimaciones de los parmetros resume el efecto de cada predictor. Mientras que es difcil interpretar los coecientes de este modelo debido a la naturaleza de la funcin de enlace, los signos de los coecientes para las covariables y los valores relativos de los coecientes para los niveles de factores pueden proporcionar informacin relevante de los predictores del modelo.

190 Captulo 20

Para las covariables, los coecientes positivos (negativos) indican relaciones positivas (negativas) entre predictores y resultados. Un valor mayor de una covariable con un coeciente positivo corresponde a una mayor probabilidad de estar en una de las categoras de resultados acumulados superiores. Para los factores, un nivel de factor con un mayor coeciente indica una mayor probabilidad de ser una de las categoras de resultados acumulados superiores. El signo de un coeciente para un nivel de factor depende del efecto del nivel de factor relativo a la categora de referencia.
Figura 20-8 Estimaciones de los parmetros

Puede realizar las siguientes interpretaciones a partir de las estimaciones de los parmetros: Las personas incluidas en las categoras de edad inferiores muestran un mayor apoyo al proyecto de ley que las que se encuentran en la categora de edad superior. Las personas que conducen con menor frecuencia muestran un mayor apoyo al proyecto de ley que las que conducen con mayor frecuencia. Los coecientes de las variables genero y votoult, adems de no ser estadsticamente signicativos, parecen ser pequeos en comparacin con los otros coecientes. Los efectos del diseo indican que algunos de los errores tpicos calculados para estas estimaciones de los parmetros son mayores que los que se obtendran si se utilizara una muestra aleatoria simple, mientras que otros son ms pequeos. Es de vital importancia incorporar la informacin sobre el diseo muestral al anlisis porque, en caso contrario, se podra inferir, por ejemplo, que el coeciente del tercer nivel de Categora de edad, [edadcat=3], es signicativamente distinto de 0.

191 Regresin ordinal de muestras complejas

Clasificacin
Figura 20-9 Informacin sobre la variable categrica

Segn los datos observados, el modelo nulo (es decir, el que no incluye ningn predictor) clasicara a todos los clientes en el grupo modal, De acuerdo. Por tanto, el modelo nulo sera correcto 27,3% de las veces.
Figura 20-10 Tabla de clasificacin

La tabla de clasicacin muestra los resultados prcticos de la utilizacin del modelo. Para cada caso, la respuesta pronosticada es la categora de respuesta con la mayor probabilidad pronosticada por el modelo. Los casos se ponderan mediante Ponderaciones muestrales nales, de manera que la tabla de clasicacin informa del rendimiento del modelo esperado en la poblacin. Las casillas de la diagonal son los pronsticos correctos. Las casillas fuera de la diagonal son los pronsticos incorrectos.

192 Captulo 20

El modelo clasica correctamente un 9,9% ms, es decir, el 37,2% de los casos. En concreto, el modelo funciona considerablemente mejor al clasicar a las personas con De acuerdo o Muy en desacuerdo y ligeramente peor a las personas con En desacuerdo.

Razones de las ventajas


Las ventajas acumuladas se denen como la razn de la probabilidad de que la variable dependiente tome un valor menor o igual que una determinada categora de respuesta respecto a la probabilidad de que tome un valor mayor que la categora de respuesta. La razn de las ventajas acumuladas es la razn de las ventajas acumuladas para diferentes valores de los predictores y est estrechamente relacionada con las estimaciones exponenciadas de los parmetros. Curiosamente, la razn de las ventajas acumuladas propiamente no depende de la categora de respuesta.
Figura 20-11 Razones de las ventajas acumuladas para Categora de edad

Esta tabla muestra las razones de las ventajas acumuladas para los niveles de factor de Categora de edad. Los valores mostrados son las razones de las ventajas acumuladas para 1830 hasta 4660, comparadas con las ventajas acumuladas para >60. Por tanto, la razn de las ventajas de 1,383 de la primera la de la tabla indica que las ventajas acumuladas para una persona con una edad entre 18 y 30 aos son 1,383 veces las ventajas acumuladas para una persona con ms de 60 aos. Tenga en cuenta que como Categora de edad no gura en ningn trmino de interaccin, las razones de las ventajas son meramente las razones de las estimaciones exponenciadas de los parmetros. Por ejemplo, la razn de las ventajas acumuladas para 1830 respecto a >60 es 1,00 / 0,723 = 1,383.

193 Regresin ordinal de muestras complejas Figura 20-12 Razones de las ventajas para Frecuencia con la que conduce

Esta tabla muestra las razones de las ventajas acumuladas para los niveles de factor de Frecuencia con la que conduce, utilizando 1014.999 millas/ao como categora de referencia. Como Frecuencia con la que conduce no gura en ningn trmino de interaccin, las razones de las ventajas son meramente las razones de las estimaciones exponenciadas de los parmetros. Por ejemplo, la razn de las ventajas acumuladas para 2029.999 millas/ao respecto a 1014.999 millas/ao es 0,101 / 0,444 = 0,227.

Modelo acumulado generalizado


Figura 20-13 Prueba de lneas paralelas

La prueba de lneas paralelas puede ayudarle a evaluar si el supuesto de que los parmetros son los mismos para todas las categoras de respuesta es razonable. Esta prueba compara el modelo estimado con el mismo conjunto de coecientes para todas las categoras con un modelo generalizado con un conjunto diferente de coecientes para cada categora. El contraste de la F de Wald es un contraste mnibus de la matriz de contrastes para el supuesto de lneas paralelas que proporciona valores p asintticamente correctos. Para muestras de tamao pequeo a medio, el estadstico de la F de Wald corregida funciona bien. El valor de signicacin es cercano a 0,05, lo que sugiere que el modelo generalizado puede mejorar el ajuste del modelo. No obstante, el contraste corregido de Sidak secuencial indica un valor de signicacin sucientemente alto (0,392) por lo que, en general, no hay ninguna evidencia clara para rechazar el supuesto de lneas paralelas. El contraste de Sidak secuencial comienza con pruebas de Wald

194 Captulo 20

de contrastes individuales que proporcionan un valor p global. Estos resultados deben ser comparables con el resultado del contraste mnibus de Wald. El hecho de que sean tan diferentes en este ejemplo resulta un tanto sorprendente, pero puede deberse a la existencia de muchos contrastes en la prueba y un nmero relativamente pequeo de grados de libertad del diseo.
Figura 20-14 Estimaciones de los parmetros para el modelo acumulado generalizado (slo se muestra una parte)

Adems, los valores estimados de los coecientes del modelo generalizado no parecen ser muy diferentes de las estimaciones obtenidas con el supuesto de lneas paralelas.

Exclusin de los predictores no significativos


Las pruebas de los efectos del modelo han mostrado que los coecientes del modelo para Genero y Vot en las ltimas elecciones no son estadsticamente distintos de 0. Para generar un modelo reducido, vuelva al cuadro de dilogo Regresin ordinal de muestras complejas.

195 Regresin ordinal de muestras complejas E Pulse en Continuar en el cuadro de dilogo Plan. Figura 20-15 Cuadro de dilogo principal Regresin ordinal de muestras complejas

E Anule la seleccin de Genero y Vot en las ltimas elecciones como factores. E Pulse en Opciones.

196 Captulo 20 Figura 20-16 Cuadro de dilogo Opciones

E Seleccione Mostrar historial de iteraciones.

El historial de iteraciones es til para diagnosticar los problemas que encuentra el algoritmo de estimacin.
E Pulse en Continuar. E Pulse en Aceptar en el cuadro de dilogo Regresin ordinal de muestras complejas.

Advertencias
Figura 20-17 Advertencias para el modelo reducido

Las advertencias indican que la estimacin del modelo reducido naliz antes de que las estimaciones de los parmetros alcanzaran la convergencia, ya que la log-verosimilitud no pudo aumentarse con cada cambio (o paso) en los valores actuales de las estimaciones de los parmetros.

197 Regresin ordinal de muestras complejas Figura 20-18 Advertencias para el modelo reducido

Mirando el historial de iteraciones, los cambios de las estimaciones de los parmetros en las ltimas iteraciones son sucientemente pequeos como para no tener que preocuparse seriamente acerca del mensaje de advertencia.

Comparacin de los modelos


Figura 20-19 Pseudo R cuadrado para el modelo reducido

Los valores de R2 del modelo reducido son idnticos a los del modelo original, lo que constituye una evidencia a favor del modelo reducido.

198 Captulo 20 Figura 20-20 Tabla de clasificacin para el modelo reducido

La tabla de clasicacin complica un tanto las cosas. La tasa de clasicacin global de 37,0% para el modelo reducido es comparable a la del modelo original, lo que constituye una evidencia a favor del modelo reducido. No obstante, el modelo reducido cambia la respuesta pronosticada del 3,8% de los votantes de En desacuerdo a De acuerdo, ms de la mitad de los cuales se observ que respondan En desacuerdo o Muy en desacuerdo. Esta diferencia es muy importante y es necesario realizar un estudio cuidadoso antes de optar por el modelo reducido.

Resumen
Mediante el procedimiento Regresin ordinal de muestras complejas, ha generado varios posibles modelos del nivel de apoyo al proyecto de ley basados en los datos demogrcos de los votantes. La prueba de las lneas paralelas ha mostrado que no es necesario recurrir a un modelo acumulado generalizado. Las pruebas de los efectos del modelo sugieren que Genero y Vot en las ltimas elecciones pueden eliminarse del modelo y este modelo reducido funciona bien en lo que se reere al valor de pseudo R2 y la tasa de clasicacin global en comparacin con el modelo original. No obstante, el modelo reducido clasica incorrectamente ms votantes entre la divisin De acuerdo/En desacuerdo, por lo que los legisladores preeren seguir utilizando por ahora el modelo original.

Procedimientos relacionados
El procedimiento Regresin ordinal de muestras complejas es una herramienta til para crear modelos de una variable ordinal cuando los casos se han extrado siguiendo un esquema de muestreo complejo. El mdulo adicional Asistente de muestreo de la opcin Muestras complejas se utiliza para denir las especicaciones de diseo de las muestras complejas y obtener una muestra. El archivo del plan de muestreo creado por el Asistente de muestreo contiene un plan de anlisis por defecto que se puede especicar en el cuadro de dilogo Plan cuando se analiza la muestra obtenida de acuerdo con dicho plan.

199 Regresin ordinal de muestras complejas

El mdulo adicional Asistente de preparacin del anlisis de la opcin Muestras complejas se utiliza para denir las especicaciones de anlisis de una muestra compleja existente. El archivo del plan de muestreo creado por el Asistente de muestreo se puede especicar en el cuadro de dilogo Plan cuando se analiza la muestra correspondiente a dicho plan. El mdulo adicional Modelo lineal general de muestras complejas permite crear un modelo de una respuesta de escala. El mdulo adicional Regresin logstica de muestras complejas permite crear un modelo de una respuesta categrica.

Bibliografa
Cochran, W. G. 1977. Sampling Techniques, 3rd ed. Nueva York: John Wiley and Sons. Cox, D. R., y E. J. Snell. 1989. The Analysis of Binary Data, 2nd ed. Londres: Chapman and Hall. Kish, L. 1965. Survey Sampling. Nueva York: John Wiley and Sons. Kish, L. 1987. Statistical Design for Research. Nueva York: John Wiley and Sons. McFadden, D. 1974. Conditional logit analysis of qualitative choice behavior. In: Frontiers in Economics, P. Zarembka, ed. Nueva York: Academic Press. Murthy, M. N. 1967. Sampling Theory and Methods. Calcuta (India): Statistical Publishing Society. Nagelkerke, N. J. D. 1991. A note on the general denition of the coefcient of determination. Biometrika, 78:3, 691692. Srndal, C., B. Swensson, y J. Wretman. 1992. Model Assisted Survey Sampling. Nueva York: Springer-Verlag.

200

ndice
advertencias en la regresin ordinal de muestras complejas, 196 archivo de plan, 2 Asistente de muestreo de la opcin Muestras complejas, 77 marco de muestreo, completo, 77 marco de muestreo, parcial, 89 muestreo de PPS, 107 procedimientos relacionados, 124 resumen, 87, 119 Asistente de preparacin del anlisis de la opcin Muestras complejas, 125 datos de uso pblico, 125 ponderaciones muestrales no disponibles, 128 procedimientos relacionados, 139 resumen, 128, 139 Bonferroni en muestras complejas, 50, 60, 71 categora de referencia en Modelo lineal general de muestras complejas, 51 en Regresin logstica de muestras complejas, 56 categoras pronosticadas en la regresin ordinal de muestras complejas, 73 en Regresin logstica de muestras complejas, 62 chi-cuadrado en muestras complejas, 50, 60, 71 chi-cuadrado corregido en muestras complejas, 50, 60, 71 coeciente de variacin (CDV) en Descriptivos de Muestras complejas, 34 en Frecuencias de Muestras complejas, 30 en Razones de Muestras complejas, 43 en tablas de contingencia de Muestras complejas, 39 conglomerados en asistente de muestreo, 6 en asistente de preparacin del anlisis, 21 contrastes en Modelo lineal general de muestras complejas, 51 contrastes de desviacin en Modelo lineal general de muestras complejas, 51 contrastes de diferencia en Modelo lineal general de muestras complejas, 51 Contrastes de Helmert en Modelo lineal general de muestras complejas, 51 contrastes polinmicos en Modelo lineal general de muestras complejas, 51 contrastes repetidos en Modelo lineal general de muestras complejas, 51 contrastes simples en Modelo lineal general de muestras complejas, 51 Convergencia de la verosimilitud en la regresin ordinal de muestras complejas, 74 en Regresin logstica de muestras complejas, 63 convergencia de los parmetros en la regresin ordinal de muestras complejas, 74 en Regresin logstica de muestras complejas, 63 correccin de Bonferroni secuencial en muestras complejas, 50, 60, 71 correccin de Sidak en muestras complejas, 50, 60, 71 correccin de Sidak secuencial en muestras complejas, 50, 60, 71 correlaciones de estimaciones de parmetros en la regresin ordinal de muestras complejas, 69 en Modelo lineal general de muestras complejas, 49 en Regresin logstica de muestras complejas, 58 covarianzas de estimaciones de parmetros en la regresin ordinal de muestras complejas, 69 en Modelo lineal general de muestras complejas, 49 en Regresin logstica de muestras complejas, 58 datos de uso pblico en asistente de preparacin del anlisis, 125 en Descriptivos de Muestras complejas, 145 Descriptivos de Muestras complejas, 33, 145 datos de uso pblico, 145 estadsticos, 34, 148 estadsticos por subpoblacin, 149 procedimientos relacionados, 150 valores perdidos, 35 diferencia de riesgos en tablas de contingencia de Muestras complejas, 39 diferencia menos signicativa en muestras complejas, 50, 60, 71 efecto del diseo en Descriptivos de Muestras complejas, 34 en Frecuencias de Muestras complejas, 30 en la regresin ordinal de muestras complejas, 69 en Modelo lineal general de muestras complejas, 49 en Razones de Muestras complejas, 43 en Regresin logstica de muestras complejas, 58 en tablas de contingencia de Muestras complejas, 39 error tpico en Descriptivos de Muestras complejas, 34, 148149 en Frecuencias de Muestras complejas, 30, 142143 en la regresin ordinal de muestras complejas, 69

201

202 ndice

en Modelo lineal general de muestras complejas, 49 en Razones de Muestras complejas, 43 en Regresin logstica de muestras complejas, 58 en tablas de contingencia de Muestras complejas, 39 estadstico F en muestras complejas, 50, 60, 71 estadstico F corregido en muestras complejas, 50, 60, 71 estadstico R2 en Modelo lineal general de muestras complejas, 49, 167 estadsticos pseudo R2 en la regresin ordinal de muestras complejas, 69, 188, 197 en Regresin logstica de muestras complejas, 58, 177 estimacin de la muestra en asistente de preparacin del anlisis, 22 estimaciones de los parmetros en la regresin ordinal de muestras complejas, 69, 189 en Modelo lineal general de muestras complejas, 49, 168 en Regresin logstica de muestras complejas, 58, 179 estraticacin en asistente de muestreo, 6 en asistente de preparacin del anlisis, 21 Frecuencias de Muestras complejas, 29, 140 estadsticos, 30 procedimientos relacionados, 144 tabla de frecuencia, 142 tabla de frecuencia por subpoblacin, 143 grados de libertad en muestras complejas, 50, 60, 71 historial de iteraciones en la regresin ordinal de muestras complejas, 74 en Regresin logstica de muestras complejas, 63 intervalos de conanza en Descriptivos de Muestras complejas, 34, 148149 en Frecuencias de Muestras complejas, 30, 142143 en la regresin ordinal de muestras complejas, 69 en Modelo lineal general de muestras complejas, 49, 54 en Razones de Muestras complejas, 43 en Regresin logstica de muestras complejas, 58 en tablas de contingencia de Muestras complejas, 39 introducir ponderaciones muestrales en asistente de muestreo, 6 iteraciones en la regresin ordinal de muestras complejas, 74 en Regresin logstica de muestras complejas, 63 marco de muestreo, completo en asistente de muestreo, 77 marco de muestreo, parcial en asistente de muestreo, 89

media en Descriptivos de Muestras complejas, 34, 148149 medias marginales en MLG Univariante, 169 medias marginales estimadas en Modelo lineal general de muestras complejas, 51 medida del tamao en asistente de muestreo, 8 mtodo de muestreo en asistente de muestreo, 8 mtodo de muestreo de Brewer en asistente de muestreo, 8 mtodo de muestreo de Murthy en asistente de muestreo, 8 mtodo de muestreo de Sampford en asistente de muestreo, 8 mtodo de Newton-Raphson en la regresin ordinal de muestras complejas, 74 modelo acumulado generalizado en la regresin ordinal de muestras complejas, 193 Modelo lineal general de muestras complejas, 46, 162 almacenamiento de variables, 53 estadsticos, 49 estimaciones de los parmetros, 168 funciones adicionales del comando, 54 medias estimadas, 51 medias marginales, 169 modelo, 48 opciones, 54 procedimientos relacionados, 171 pruebas de efectos del modelo, 167 resumen del modelo, 167 Muestras complejas contrastes de hiptesis, 50, 60, 71 opciones, 32, 36, 41, 44 valores perdidos, 31, 40 muestreo diseo complejo, 4 muestreo aleatorio simple en asistente de muestreo, 8 muestreo complejo plan de anlisis, 19 plan de muestreo, 4 muestreo de PPS en asistente de muestreo, 8 muestreo secuencial en asistente de muestreo, 8 muestreo sistemtico en asistente de muestreo, 8 nivel de conanza en la regresin ordinal de muestras complejas, 74 en Regresin logstica de muestras complejas, 63 plan de anlisis, 19 plan de muestreo, 4

203 ndice

ponderaciones muestrales en asistente de muestreo, 12 en asistente de preparacin del anlisis, 21 porcentajes de la en tablas de contingencia de Muestras complejas, 39 porcentajes de la columna en tablas de contingencia de Muestras complejas, 39 porcentajes de tabla en Frecuencias de Muestras complejas, 30, 142143 en tablas de contingencia de Muestras complejas, 39 probabilidad pronosticada en la regresin ordinal de muestras complejas, 73 en Regresin logstica de muestras complejas, 62 probabilidades acumuladas en la regresin ordinal de muestras complejas, 73 probabilidades de inclusin en asistente de muestreo, 12 probabilidades de respuesta en la regresin ordinal de muestras complejas, 67 proporcin muestral en asistente de muestreo, 12 prueba de lneas paralelas en la regresin ordinal de muestras complejas, 69, 193 prueba t en Modelo lineal general de muestras complejas, 49 en Regresin logstica de muestras complejas, 58 Prueba t en la regresin ordinal de muestras complejas, 69 pruebas de efectos del modelo en la regresin ordinal de muestras complejas, 189 en Modelo lineal general de muestras complejas, 167 en Regresin logstica de muestras complejas, 179 puntuacin de Fisher en la regresin ordinal de muestras complejas, 74 raz cuadrada del efecto del diseo en Descriptivos de Muestras complejas, 34 en Frecuencias de Muestras complejas, 30 en la regresin ordinal de muestras complejas, 69 en Modelo lineal general de muestras complejas, 49 en Razones de Muestras complejas, 43 en Regresin logstica de muestras complejas, 58 en tablas de contingencia de Muestras complejas, 39 razn de ventajas en la regresin ordinal de muestras complejas, 72 razones en Razones de Muestras complejas, 159 razones de las ventajas en la regresin ordinal de muestras complejas, 192 en Regresin logstica de muestras complejas, 61, 180 en tablas de contingencia de Muestras complejas, 39, 151 Razones de Muestras complejas, 42, 157 estadsticos, 43 procedimientos relacionados, 161 razones, 159 valores perdidos, 44

recuento no ponderado en Descriptivos de Muestras complejas, 34 en Frecuencias de Muestras complejas, 30 en Razones de Muestras complejas, 43 en tablas de contingencia de Muestras complejas, 39 Regresin logstica de muestras complejas, 55, 173 almacenamiento de variables, 62 categora de referencia, 56 estadsticos, 58 estadsticos pseudo R2, 177 estimaciones de los parmetros, 179 funciones adicionales del comando, 64 modelo, 57 opciones, 63 procedimientos relacionados, 182 pruebas de efectos del modelo, 179 razones de las ventajas, 61, 180 tabla de clasicacin, 178 regresin ordinal de muestras complejas, 183 advertencias, 196 estadsticos pseudo R2, 188, 197 estimaciones de los parmetros, 189 modelo acumulado generalizado, 193 procedimientos relacionados, 198 pruebas de efectos del modelo, 189 razones de las ventajas, 192 tabla de clasicacin, 191 Regresin ordinal de muestras complejas, 65, 183 almacenamiento de variables, 73 estadsticos, 69 modelo, 68 opciones, 74 probabilidades de respuesta, 67 razn de ventajas, 72 residuos en Modelo lineal general de muestras complejas, 53 en tablas de contingencia de Muestras complejas, 39 residuos corregidos en tablas de contingencia de Muestras complejas, 39 resumen en asistente de muestreo, 87, 119 en asistente de preparacin del anlisis, 128, 139 riesgo relativo en tablas de contingencia de Muestras complejas, 39, 151, 154155 separacin en la regresin ordinal de muestras complejas, 74 en Regresin logstica de muestras complejas, 63 subdivisin por pasos en la regresin ordinal de muestras complejas, 74 en Regresin logstica de muestras complejas, 63 suma en Descriptivos de Muestras complejas, 34

204 ndice

tabla de clasicacin en la regresin ordinal de muestras complejas, 191 en Regresin logstica de muestras complejas, 178 tabla de contingencia en tablas de contingencia de Muestras complejas, 154 tablas de clasicacin en la regresin ordinal de muestras complejas, 69 en Regresin logstica de muestras complejas, 58 Tablas de contingencia de Muestras complejas, 37, 151 estadsticos, 39 procedimientos relacionados, 156 riesgo relativo, 151, 154155 tabla de contingencia, 154 tamao de la poblacin en asistente de muestreo, 12 en Descriptivos de Muestras complejas, 34 en Frecuencias de Muestras complejas, 30, 142143 en Razones de Muestras complejas, 43 en tablas de contingencia de Muestras complejas, 39 tamao muestral en asistente de muestreo, 10, 12 valores acumulados en Frecuencias de Muestras complejas, 30 valores esperados en tablas de contingencia de Muestras complejas, 39 valores perdidos en Descriptivos de Muestras complejas, 35 en la regresin ordinal de muestras complejas, 74 en Modelo lineal general de muestras complejas, 54 en muestras complejas, 31, 40 en Razones de Muestras complejas, 44 en Regresin logstica de muestras complejas, 63 valores pronosticados en Modelo lineal general de muestras complejas, 53

Anda mungkin juga menyukai