Anda di halaman 1dari 71

SPSS Modelos de regresin 12.

Si desea obtener ms informacin sobre los productos de software de SPSS, visite nuestra pgina Web en http://www.spss.com o pngase en contacto con SPSS Inc. 233 South Wacker Drive, 11th Floor Chicago, IL 60606-6412 Telfono: (312) 651-3000 Fax: (312) 651-3668 SPSS es una marca registrada; los dems nombres de productos son marcas comerciales de SPSS Inc. para los programas de software de su propiedad. El material descrito en este software no puede ser reproducido ni distribuido sin la autorizacin expresa por escrito por parte de los propietarios de la marca registrada y de los derechos de la licencia en el software y en los copyrights de los materiales publicados. El SOFTWARE y la documentacin se proporcionan con DERECHOS LIMITADOS. Su uso, duplicacin o revelacin por parte del Gobierno estn sujetos a las restricciones establecidas en la subdivisin (c)(1)(ii) de la clusula Rights in Technical Data and Computer Software en 52.227-7013. El fabricante es SPSS Inc., 233 South Wacker Drive, 11th Floor, Chicago, IL 60606-6412, EE.UU. Aviso general: El resto de los nombres de productos mencionados en este documento se utilizan slo con fines identificativos y pueden ser marcas comerciales de sus respectivas empresas. TableLook es una marca comercial de SPSS Inc. Windows es una marca comercial registrada de Microsoft Corporation. DataDirect, DataDirect Connect, INTERSOLV y SequeLink son marcas comerciales registradas de DataDirect Technologies. Algunas partes de este producto se han creado utilizando LEADTOOLS 1991-2000, LEAD Technologies, Inc. RESERVADOS TODOS LOS DERECHOS. LEAD, LEADTOOLS y LEADVIEW son marcas comerciales registradas de LEAD Technologies, Inc. Algunas partes de este producto estn basadas en el trabajo de FreeType Team (http://www.freetype.org). Una parte del software de SPSS contiene tecnologa zlib. Copyright 1995-2002 de Jean-loup Gailly y Mark Adler. El software de zlib se proporciona tal cual, sin ningn tipo de garanta implcita o explcita. Los autores de zlib no sern responsables en ningn caso de los daos que puedan producirse por la utilizacin de este software. Una parte del software de SPSS contiene bibliotecas de tiempo de ejecucin Java de Sun. Copyright 2003 de Sun Microsystems, Inc. Reservados todos los derechos. Las bibliotecas de tiempo de ejecucin Java de Sun incluyen cdigo con licencia de RSA Security, Inc. Algunas partes de las bibliotecas tienen licencia de IBM y estn disponibles en http://oss.software.ibm.com/icu4j/. Sun no ofrece ninguna garanta para el software. SPSS Modelos de regresin 12.0 Copyright 2003 de SPSS Inc. Todos los derechos reservados. Impreso en Irlanda. Queda prohibida la reproduccin, el almacenamiento en sistemas de recuperacin o la transmisin de cualquier parte de esta publicacin en cualquier forma y por cualquier medio (electrnico o mecnico, fotocopia, grabacin o cualquier otro) sin previa autorizacin expresa y por escrito de parte del editor. 1 2 3 4 5 6 7 8 9 0 06 05 04 03 ISBN 1-56827-964-7

Prefacio

SPSS 12.0 es un paquete de software potente para la gestin y anlisis de datos de microcomputadoras. La opcin Modelos de regresin es una mejora aadida que proporcionan tcnicas de anlisis adicionales. Los procedimientos de Modelos de regresin se deben utilizar con SPSS 12.0 Base y estn completamente integrados en dicho sistema. La opcin Modelos de regresin incluye procedimientos para:
! ! ! ! !

Regresin logstica Regresin logstica multinomial Regresin no lineal Regresin de mnimos cuadrados ponderados Regresin por mnimos cuadrados en dos fases

Instalacin

Para instalar Modelos de regresin, siga las indicaciones para aadir o eliminar funciones de las instrucciones de instalacin que se suministran con SPSS Base. (Para comenzar, pulse dos veces en el icono de instalacin de SPSS.)

iii

Compatibilidad

SPSS est diseado para ejecutarse en gran cantidad de sistemas de ordenadores. Consulte la documentacin entregada con su sistema para obtener la informacin especfica acerca de los requisitos mnimos y los recomendados.
Nmeros de serie

El nmero de serie es su nmero de identificacin con SPSS Inc. Necesitar este nmero cuando se ponga en contacto con SPSS Inc. para recibir informacin sobre asistencia, formas de pago o actualizacin del sistema. El nmero de serie se incluye en el sistema SPSS Base.
Servicio al cliente

Si tiene cualquier duda referente a la forma de envo o pago, pngase en contacto con su oficina local, que encontrar en la pgina Web de SPSS en http://www.spss.com/worldwide. Tenga preparado su nmero de serie para identificarse.
Cursos de preparacin

SPSS Inc. ofrece cursos de preparacin, tanto pblicos como in situ. En todos los cursos habr talleres prcticos. Estos cursos tendrn lugar peridicamente en las principales capitales. Si desea obtener ms informacin sobre estos cursos, pngase en contacto con su oficina local que encontrar en la pgina Web de SPSS en http://www.spss.com/worldwide.
Asistencia tcnica

El servicio de asistencia tcnica de SPSS est a disposicin de todos los clientes registrados. Los clientes pueden ponerse en contacto con el servicio tcnico si desean recibir asistencia para utilizar los productos de SPSS o ayuda sobre la instalacin en uno de los entornos de hardware admitidos. Para ponerse en contacto con el servicio de asistencia tcnica, consulte la pgina Web de SPSS en http://www.spss.com o pngase en contacto con la oficina ms cercana que encontrar en la pgina Web SPSS en http://www.spss.com/worldwide. Tenga preparada la informacin necesaria para identificarse personalmente, a su organizacin y el nmero de serie de su sistema.
iv

Publicaciones adicionales

Puede adquirir copias adicionales de los manuales de los productos de SPSS directamente de SPSS Inc. Visite nuestra pgina Web en http://www.spss.com/estore o pngase en contacto con su oficina de SPSS local que encontrar en el sitio Web de SPSS en http://www.spss.com/worldwide. Para pedidos telefnicos en Estados Unidos y Canad, llame a SPSS Inc. al 800-543-2185. Para pedidos telefnicos desde otros pases, pngase en contacto con la oficina ms cercana que encontrar en la pgina Web de SPSS. SPSS Statistical Procedures Companion, por Marija Norusis, ser publicado por Prentice Hall. Contiene los conceptos bsicos de los procedimientos de SPSS Base, adems de regresin logstica, modelos lineales generales y modelos lineales mixtos. Si desea obtener ms informacin, visite la pgina Web de SPSS en http://www.spss.com (pulse Store, seleccione su pas y pulse Books).
Dganos su opinin

Sus comentarios son importantes. Envenos una carta y cuntenos sus experiencias con los productos de SPSS. Nos interesa especialmente recibir noticias sobre aplicaciones nuevas e interesantes para el sistema SPSS. Envenos un correo electrnico a suggest@spss.com o escriba a SPSS Inc., Attn.: Director of Product Planning, 233 South Wacker Drive, 11th Floor, Chicago, IL 60606-6412, EE.UU.
Acerca de este manual

Este manual es la documentacin de la interfaz grfica del usuario para los procedimientos incluidos en el mdulo Modelos de regresin. Las ilustraciones de los cuadros de dilogo estn tomadas de SPSS para Windows. Los cuadros de dilogo de los dems sistemas operativos son similares. La sintaxis de comandos de Modelos de regresin se incluye en el manual SPSS 12.0 Command Syntax Reference, disponible en el CD-ROM del producto.

Cmo ponerse en contacto con SPSS

Si desea pertenecer a nuestra lista de correo, pngase en contacto con nuestras oficinas que encontrar en la pgina Web en http://www.spss.com/worldwide. Le remitiremos una copia de nuestro mensaje informativo y le enviaremos informacin sobre las actividades de SPSS Inc. que se lleven a cabo en su rea.

vi

Contenido
1 Seleccin de procedimientos para los modelos de regresin logstica binaria 1 Regresin logstica 3

Regresin logstica: Consideraciones sobre los datos. . . . . . . . . . . . . . . . . 4 Para obtener un anlisis de regresin logstica. . . . . . . . . . . . . . . . . . . . . . 5 Mtodos de seleccin de variables en el anlisis de regresin logstica . . . 6 Regresin logstica: Definir variables categricas . . . . . . . . . . . . . . . . . . . 8 Regresin logstica: Guardar nuevas variables . . . . . . . . . . . . . . . . . . . . . . 9 Regresin logstica: Opciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 Funciones adicionales del comando LOGISTIC REGRESSION . . . . . . . . . . . 12

Regresin logstica multinomial

13

Regresin logstica multinomial: Consideraciones sobre los datos . . . . . . . 14 Obtencin de una regresin logstica multinomial . . . . . . . . . . . . . . . . . . . . 14 Regresin logstica multinomial: Modelos. . . . . . . . . . . . . . . . . . . . . . . . . . 15 Categora de referencia de regresin logstica multinomial . . . . . . . . . . . . . 17 Regresin logstica multinomial: Estadsticos . . . . . . . . . . . . . . . . . . . . . . . 18 Regresin logstica multinomial: Criterios . . . . . . . . . . . . . . . . . . . . . . . . . . 20 Opciones de Regresin logstica multinomial . . . . . . . . . . . . . . . . . . . . . . . 21 Regresin logstica multinomial: Guardar . . . . . . . . . . . . . . . . . . . . . . . . . . 23 Funciones adicionales del comando NOMREG . . . . . . . . . . . . . . . . . . . . . . 24

vii

Anlisis probit

25

Anlisis probit: Consideraciones sobre los datos . . . . . . . . . . . . . . . . . . . . 26 Para obtener un anlisis probit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 Anlisis probit: Definir rango . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 Anlisis probit: Opciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 Funciones adicionales del comando PROBIT . . . . . . . . . . . . . . . . . . . . . . . 30

Regresin no lineal

31

Regresin no lineal: Consideraciones sobre los datos. . . . . . . . . . . . . . . . . 32 Para obtener un anlisis de regresin no lineal. . . . . . . . . . . . . . . . . . . . . . 32 Regresin no lineal: Parmetros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 Modelos comunes de regresin no lineal . . . . . . . . . . . . . . . . . . . . . . . . . . 35 Regresin no lineal: Funcin de prdida . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 Regresin no lineal: Restricciones para los parmetros . . . . . . . . . . . . . . . 38 Regresin no lineal: Guardar variables nuevas . . . . . . . . . . . . . . . . . . . . . . 39 Regresin no lineal: Opciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 Regresin no lineal: Interpretacin de los resultados . . . . . . . . . . . . . . . . . 41 Funciones adicionales del comando NLR . . . . . . . . . . . . . . . . . . . . . . . . . . 42

Estimacin ponderada

43

Estimacin ponderada: Consideraciones sobre los datos . . . . . . . . . . . . . . 44 Para obtener un anlisis de Estimacin ponderada . . . . . . . . . . . . . . . . . . . 44 Estimacin ponderada: Opciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 Funciones adicionales del comando WLS . . . . . . . . . . . . . . . . . . . . . . . . . . 46

viii

Regresin por mnimos cuadrados en dos fases 47


Regresin por mnimos cuadrados en dos fases: Consideraciones sobre los datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 Para obtener un anlisis de regresin de mnimos cuadrados en dos fases . 48 Regresin por mnimos cuadrados en dos fases: Opciones . . . . . . . . . . . . . 50 Funciones adicionales del comando 2SLS. . . . . . . . . . . . . . . . . . . . . . . . . . 50

Apndice A Esquemas de codificacin de variables categricas

51

Desviacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 Simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 Helmert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 Diferencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 Polinmico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 Repetido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 Especial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 Indicador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

ndice

59

ix

Captulo

Seleccin de procedimientos para los modelos de regresin logstica binaria

Los modelos de regresin logstica binaria pueden ajustarse mediante el uso del procedimiento de Regresin logstica o del procedimiento de Regresin logstica multinomial. Cada uno de estos dos procedimientos contiene opciones que no estn disponibles en el otro. Existe entre ambos una distincin terica importante: el procedimiento de Regresin logstica genera todas las predicciones, residuos, estadsticos de influencia y pruebas de bondad de ajuste utilizando los datos a nivel de los casos individuales, independientemente de la forma en que los datos hayan sido introducidos y de si el nmero de patrones en las covariables es o no menor que el nmero total de casos; el procedimiento de Regresin logstica multinomial, por su parte, agrega los casos de manera interna para formar subpoblaciones con patrones en las covariables idnticos para las variables predictoras, generando predicciones, residuos y pruebas de bondad de ajuste basadas en las citadas subpoblaciones. Si todas las variables predictoras son categricas, o si alguna variable predictora continua toma slo un nmero limitado de valores (de manera que haya varios casos para cada patrn en las covariables), la aproximacin mediante subpoblaciones puede generar pruebas de bondad de ajuste vlidas y residuos que sean informativos, mientras que la aproximacin a nivel de los casos individuales no lo permite.
Regresin logstica. Ofrece una serie de funciones nicas que se detallan a

continuacin:
! ! !

Prueba de bondad de ajuste del modelo de Hosmer-Lemeshow Anlisis por pasos Contrastes para definir la parametrizacin del modelo
1

2 Captulo 1 ! ! ! !

Puntos de corte alternativos para la clasificacin Grficos de clasificacin Aplicacin de un modelo ajustado mediante un conjunto de casos sobre otro conjunto de casos reservados Almacenamiento de pronsticos, residuos y estadsticos de influencia

Regresin logstica multinomial. Ofrece una serie de funciones nicas que se detallan a

continuacin:
! ! ! ! ! ! ! !

Pruebas chi-cuadrado de Pearson y de desviacin sobre la bondad de ajuste del modelo Especificacin de subpoblaciones para el agrupamiento de los datos, para las pruebas de bondad de ajuste Listado de las frecuencias, frecuencias pronosticadas y residuos por subpoblaciones Correccin de las estimaciones de la varianza por sobredispersin Matriz de covarianza para las estimaciones de los parmetros Contrastes sobre combinaciones lineales de los parmetros Especificacin explcita de modelos anidados Ajuste de modelos de regresin logstica condicional con emparejamiento 1-1 usando variables diferenciadas

Captulo

Regresin logstica

La regresin logstica resulta til para los casos en los que se desea predecir la presencia o ausencia de una caracterstica o resultado segn los valores de un conjunto de variables predictoras. Es similar a un modelo de regresin lineal pero est adaptado para modelos en los que la variable dependiente es dicotmica. Los coeficientes de regresin logstica pueden utilizarse para estimar la razn de las ventajas (odds ratio) de cada variable independiente del modelo. La regresin logstica se puede aplicar a un rango ms amplio de situaciones de investigacin que el anlisis discriminante.
Ejemplo. Qu caractersticas del estilo de vida son factores de riesgo de enfermedad

cardiovascular? Dada una muestra de pacientes a los que se mide la situacin de fumador, dieta, ejercicio, consumo de alcohol, y estado de enfermedad cardiovascular, se puede construir un modelo utilizando las cuatro variables de estilo de vida para predecir la presencia o ausencia de enfermedad cardiovascular en una muestra de pacientes. El modelo puede utilizarse posteriormente para derivar estimaciones de la razn de las ventajas para cada uno de los factores y as indicarle, por ejemplo, cunto ms probable es que los fumadores desarrollen una enfermedad cardiovascular frente a los no fumadores.
Estadsticos. Para cada anlisis: Casos totales, Casos seleccionados, Casos vlidos. Para cada variable categrica: codificacin de los parmetros. Para cada paso: variables introducidas o eliminadas, historial de iteraciones, 2 log de la verosimilitud, bondad de ajuste, estadstico de bondad de ajuste de Hosmer-Lemeshow, chi-cuadrado del modelo , chi-cuadrado de la mejora, tabla de clasificacin, correlaciones entre las variables, grfico de las probabilidades pronosticadas y los grupos observados, chi-cuadrado residual. Para cada variable de la ecuacin: coeficiente (B), error tpico de B, Estadstico de Wald, razn de las ventajas estimada (exp(B)), intervalo de confianza para exp(B), log de la verosimilitud si el trmino se ha eliminado del modelo. Para cada variable que no est en la ecuacin: estadstico de puntuacin.

4 Captulo 2

Para cada caso: grupo observado, probabilidad pronosticada, grupo pronosticado, residuo, residuo tipificado.
Mtodos. Puede estimar modelos utilizando la entrada en bloque de las variables o cualquiera de los siguientes mtodos por pasos: Condicional hacia adelante, LR hacia adelante, Wald hacia adelante, Condicional hacia atrs, LR hacia atrs o Wald hacia atrs.

Regresin logstica: Consideraciones sobre los datos


Datos. La variable dependiente debe ser dicotmica. Las variables independientes pueden estar a nivel de intervalo o ser categricas; si son categricas, deben ser variables dummy o estar codificadas como indicadores (existe una opcin en el procedimiento para recodificar automticamente las variables categricas). Supuestos. La regresin logstica no se basa en supuestos distribucionales en el mismo sentido en que lo hace el anlisis discriminante. Sin embargo, la solucin puede ser ms estable si los predictores tienen una distribucin normal multivariante. Adicionalmente, al igual que con otras formas de regresin, la multicolinealidad entre los predictores puede llevar a estimaciones sesgadas y a errores tpicos inflados. El procedimiento es ms eficaz cuando la pertenencia a grupos es una variable categrica autntica; si la pertenencia al grupo se basa en valores de una variable continua (por ejemplo CI alto en contraposicin a CI bajo), deber considerar el utilizar la regresin lineal para aprovechar la informacin mucho ms rica ofrecida por la propia variable continua. Procedimientos relacionados. Utilice el procedimiento Diagrama de dispersin para mostrar en pantalla sus datos para multicolinealidad. Si se cumplen los supuestos de normalidad multivariante y de matrices de varianza-covarianza iguales, puede obtener una solucin ms rpida utilizando el procedimiento Anlisis discriminante. Si todas las variables predictoras son categricas, puede adems utilizar el procedimiento Loglineal. Si la variable dependiente es continua, utilice el procedimiento Regresin lineal. Puede utilizar el procedimiento Curva COR para realizar grficos de las probabilidades guardadas con el procedimiento Regresin logstica.

5 Regresin logstica

Para obtener un anlisis de regresin logstica


E Elija en los mens: Analizar Regresin Logstica binaria... Figura 2-1 Cuadro de dilogo Regresin logstica

E Seleccione una variable dependiente dicotmica. Esta variable puede ser numrica o

de cadena corta.
E Seleccione una o varias covariables. Para incluir trminos de interaccin, seleccione todas las variables contenidas en la interaccin y seleccione >a*b>.

Para introducir variables por grupos (en bloques), seleccione las covariables para un bloque y pulse en Siguiente para especificar un nuevo bloque. Repita estos pasos hasta que haya especificado todos los bloques. Si lo desea, puede seleccionar casos para el anlisis. Elija una variable de seleccin y pulse Regla.

6 Captulo 2

Regresin logstica: Establecer regla


Figura 2-2 Cuadro de dilogo Regresin logstica: Establecer regla

Los casos definidos por la regla de seleccin se incluyen en la estimacin del modelo. Por ejemplo, si ha seleccionado una variable y la opcin igual que y ha especificado 5 como valor, slo se incluirn en el anlisis aquellos casos para los cuales la variable seleccionada tenga un valor igual a 5. Tanto para los casos seleccionados como para los no seleccionados se generan resultados de clasificaciones y estadsticos. De esta manera, se ofrece un mecanismo para clasificar los nuevos casos basndose en datos ya existentes; o tambin para realizar la particin de los datos en dos subconjuntos, uno de entrenamiento y otro de prueba, que permiten la validacin del modelo generado.

Mtodos de seleccin de variables en el anlisis de regresin logstica


La seleccin del mtodo permite especificar cmo se introducen las variables independientes en el anlisis. Utilizando distintos mtodos se pueden construir diversos modelos de regresin a partir del mismo conjunto de variables.
! !

Introducir. Procedimiento para la seleccin de variables en el que todas las

variables de un bloque se introducen en un solo paso.


Seleccin hacia adelante (Condicional). Mtodo de seleccin por pasos que

contrasta la entrada basndose en la significacin del estadstico de puntuacin y contrasta la eliminacin basndose en la probabilidad de un estadstico de la razn de verosimilitud que se basa en estimaciones condicionales de los parmetros.
!

Seleccin hacia adelante (Razn de verosimilitud). Mtodo de seleccin por

pasos que contrasta la entrada basndose en la significacin del estadstico de puntuacin y contrasta la eliminacin basndose en la probabilidad del

7 Regresin logstica

estadstico de la razn de verosimilitud, que se basa en estimaciones de la mxima verosimilitud parcial.


!

Seleccin hacia adelante (Wald). Mtodo de seleccin por pasos que contrasta la

entrada basndose en la significacin del estadstico de puntuacin y contrasta la eliminacin basndose en la probabilidad del estadstico de Wad.
!

Eliminacin hacia atrs (Condicional). Seleccin por pasos hacia atrs. El contraste

para la eliminacin se basa en la probabilidad del estadstico de la razn de verosimilitud, el cual se basa a su vez en las estimaciones condicionales de los parmetros.
!

Eliminacin hacia atrs (Razn de verosimilitud). Seleccin por pasos hacia atrs.

El contraste para la eliminacin se basa en la probabilidad del estadstico de la razn de verosimilitud, el cual se basa a su vez en las estimaciones de mxima verosimilitud parcial.
!

Eliminacin hacia atrs (Wald). Seleccin por pasos hacia atrs. El contraste para

la eliminacin se basa en la probabilidad del estadstico de Wald. Los valores de significacin de los resultados se basan en el ajuste de un nico modelo. Por ello, estos valores no suele ser vlidos cuando se emplea un mtodo por pasos. Todas las variables independientes seleccionadas se aaden a un mismo modelo de regresin. Sin embargo, puede especificar distintos mtodos de introduccin para diferentes subconjuntos de variables. Por ejemplo, puede introducir un bloque de variables en el modelo de regresin utilizando la seleccin por pasos y un segundo bloque utilizando la seleccin hacia delante. Para aadir un segundo bloque de variables al modelo de regresin, pulse en Siguiente.

8 Captulo 2

Regresin logstica: Definir variables categricas


Figura 2-3 Cuadro de dilogo Regresin logstica: Definir variables categricas

Puede especificar los detalles sobre cmo el procedimiento Regresin logstica manipular las variables categricas:
Covariables. Contiene una lista de todas las covariables especificadas en el cuadro de dilogo principal para cualquier capa, bien por ellas mismas o como parte de una interaccin. Si alguna de stas son variables de cadena o son categricas, slo puede utilizarlas como covariables categricas. Covariables categricas. Lista las variables identificadas como categricas. Cada

variable incluye una notacin entre parntesis indicando el esquema de codificacin de contraste que va a utilizarse. Las variables de cadena (sealadas con el smbolo < a continuacin del nombre) estarn presentes ya en la lista Covariables categricas. Seleccione cualquier otra covariable categrica de la lista Covariables y muvala a la lista Covariables categricas.
Cambiar el contraste. Le permite cambiar el mtodo de contraste. Los mtodos de

contraste disponibles son:


!

Indicador. Los contrastes indican la presencia o ausencia de la pertenencia a una

categora. La categora de referencia se representa en la matriz de contraste como una fila de ceros.
!

Simple. Cada categora de la variable predictora (excepto la misma categora de

referencia) se compara con la categora de referencia.

9 Regresin logstica !

Diferencia. Cada categora de la variable predictora, excepto la primera categora,

se compara con el efecto promedio de las categoras anteriores. Tambin se conoce como contrastes de Helmert inversos.
! ! !

Helmert. Cada categora de la variable predictora, excepto la ltima categora, se

compara con el efecto promedio de las categoras subsiguientes.


Repetidas. Cada categora de la variable predictora, excepto la primera categora,

se compara con la categora que la precede.


Polinmico. Contrastes polinmicos ortogonales. Se supone que las categoras

estn espaciadas equidistantemente. Los contrastes polinmicos slo estn disponibles para variables numricas.
!

Desviacin. Cada categora de la variable predictora, excepto la categora de

referencia, se compara con el efecto global. Si selecciona Desviacin, Simple o Indicador, elija Primera o ltima como categora de referencia. Observe que el mtodo no cambia realmente hasta que se pulsa en Cambiar. Las covariables de cadena deben ser covariables categricas. Para eliminar una variable de cadena de la lista Covariables categricas, debe eliminar de la lista Covariables del cuadro de dilogo principal todos los trminos que contengan la variable.

Regresin logstica: Guardar nuevas variables


Figura 2-4 Cuadro de dilogo Regresin logstica: Guardar nuevas variables

10 Captulo 2

Puede guardar los resultados de la regresin logstica como nuevas variables en el archivo de datos de trabajo:
Valores pronosticados. Guarda los valores pronosticados por el modelo. Las opciones disponibles son Probabilidades y Grupo de pertenencia.
!

Probabilidades. Para cada caso, se guarda la probabilidad pronosticada de

aparicin del evento. En los resultados, una tabla muestra el nombre y el contenido de cualquier nueva variable.
!

Grupo de pertenencia pronosticado. Grupo con una mayor probabilidad posterior

(a posteriori), basndose en las puntuaciones discriminantes. El grupo al cual pertenece el caso, segn pronostica el modelo.
Influencia. Guarda los valores de estadsticos que miden la influencia de los casos

sobre los valores pronosticados. Las opciones disponibles son De Cook, Valores de influencia y DfBeta(s).
! De Cook. El anlogo, en la regresin logstica, al estadstico de influencia de Cook.

Medida de cunto cambiaran los residuos de todos los casos si se excluyera un caso determinado del clculo de los coeficientes de regresin.
!

Valor de influencia. Influencia relativa de una observacin en el ajuste del modelo.

! DfBetas. La diferencia en el valor de beta es el cambio en el valor de un coeficiente

de regresin que resulta de la exclusin de un caso particular. Se calcula un valor para cada trmino del modelo, incluyendo la constante.
Residuos. Guarda los residuos. Las opciones disponibles son No tipificados, Logit, Mtodo de Student, Tipificados y Desviacin.
! Residuos no tipificados. Diferencia entre un valor observado y el valor pronosticado

por el modelo.
!

Residuo logit. Residuo para el caso si ste es pronosticado en la escala logit. El

residuo logit es el residuo dividido por la probabilidad pronosticada multiplicada por 1 menos la probabilidad pronosticada.
! !

Residuo estudentizado. Cambio en la desviacin del modelo si se excluye un caso. Residuos tipificados. Es el residuo dividido por una estimacin de su desviacin

tpica. Los residuos tipificados, que son conocidos tambin como los residuos de Pearson o residuos estandarizados, tienen una media de 0 y una desviacin tpica de 1.
!

Desviacin. Residuos basados en la desviacin del modelo.

11 Regresin logstica

Regresin logstica: Opciones


Figura 2-5 Cuadro de dilogo Regresin logstica: Opciones

Puede especificar estas opciones para el anlisis de regresin logstica:


Estadsticos y grficos. Le permite solicitar estadsticos y grficos. Las opciones disponibles son Grficos de clasificacin, Bondad de ajuste de Hosmer-Lemeshow, Listado de residuos por caso, Correlaciones de estimaciones, Historial de iteraciones e IC para exp(B). Seleccione una de las alternativas del grupo Mostrar para mostrar los estadsticos y los grficos En cada paso o bien slo para el modelo final, En el ltimo paso.
!

Estadstico de bondad de ajuste de Hosmer-Lemeshow. Este estadstico de bondad

de ajuste es ms robusto que el estadstico de bondad de ajuste tradicionalmente utilizado en la regresin logstica, especialmente para los modelos con covariables continuas y los estudios con tamaos de muestra pequeos. Se basa en agrupar los casos en deciles de riesgo y comparar la probabilidad observada con la probabilidad esperada dentro de cada decil.
Probabilidad para el mtodo por pasos. Le permite controlar los criterios por los cuales las variables se introducen y se eliminan de la ecuacin. Puede especificar criterios para la Entrada o para la Salida de variables.
!

Probabilidad para los pasos. Una variable se introduce en el modelo si la

probabilidad de su estadstico de puntuacin es menor que el valor de entrada, y se elimina si la probabilidad es mayor que el valor de salida. Para anular los

12 Captulo 2

valores por defecto, introduzca valores positivos en los cuadros Entrada y Salida. La entrada debe ser menor que la salida.
Punto de corte para la clasificacin. Le permite determinar el punto de corte para la clasificacin de los casos. Los casos con valores pronosticados que han sobrepasado el punto de corte para la clasificacin se clasifican como positivos, mientras que aquellos con valores pronosticados menores que el punto de corte se clasifican como negativos. Para cambiar los valores por defecto, introduzca un valor comprendido entre 0,01 y 0,99. N mximo de iteraciones. Le permite cambiar el nmero mximo de veces que el modelo itera antes de finalizar. Incluir constante en el modelo. Le permite indicar si el modelo debe incluir un trmino constante. Si se desactiva, el trmino constante ser igual a 0.

Funciones adicionales del comando LOGISTIC REGRESSION


El lenguaje de comandos de SPSS tambin permite:
! !

Identificar los resultados por casos mediante los valores o las etiquetas de variable de una variable. Controlar el espaciado de los informes de iteracin. En lugar de imprimir las estimaciones de los parmetros despus de cada iteracin, puede solicitar las estimaciones de los parmetros despus de cada nsima iteracin. Cambiar los criterios para finalizar la iteracin y para comprobar la redundancia. Especificar una lista de variables para los listados por casos. Ahorrar memoria manteniendo los datos para cada grupo de segmentacin del archivo en un archivo temporal externo durante el procesamiento.

! ! !

Captulo

Regresin logstica multinomial

La opcin Regresin logstica multinomial resulta til en aquellas situaciones en las que desee poder clasificar a los sujetos segn los valores de un conjunto de variables predictoras. Este tipo de regresin es similar a la regresin logstica, pero ms general, ya que la variable dependiente no est restringida a dos categoras.
Ejemplo. Para conseguir una produccin y distribucin de pelculas ms eficaz, los

estudios de cine necesitan predecir qu tipo de pelculas es ms probable que vayan a ver los aficionados. Mediante una regresin logstica multinomial, el estudio puede determinar la influencia que la edad, el sexo y las relaciones de pareja de cada persona tiene sobre el tipo de pelcula que prefieren. De esta manera, el estudio puede orientar la campaa publicitaria de una pelcula concreta al grupo de la poblacin que tenga ms probabilidades de ir a verla.
Estadsticos. Historial de iteraciones, coeficientes de los parmetros, covarianza

asinttica y matrices de correlacin, pruebas de la razn de verosimilitud para los efectos del modelo y los parciales, 2 log de la verosimilitud. Chi-cuadrado de la bondad de ajuste de Pearson y de la desviacin. R2 de Cox y Snell, de Nagelkerke y de McFadden. Clasificacin: frecuencias observadas respecto a las frecuencias pronosticadas, por cada categora de respuesta. Tablas de contingencia: frecuencias observadas y pronosticadas (con los residuos) y proporciones por patrn en las covariables y por categora de respuesta.
Mtodos. Se ajusta un modelo logit multinomial para el modelo factorial completo

o para un modelo especificado por el usuario. La estimacin de los parmetros se realiza a travs de un algoritmo iterativo de mxima verosimilitud.

13

14 Captulo 3

Regresin logstica multinomial: Consideraciones sobre los datos


Datos. La variable dependiente debe ser categrica. Las variables independientes pueden ser factores o covariables. En general, los factores deben ser variables categricas y las covariables deben ser variables continuas. Supuestos. Se asume que la razn de ventajas de cualquier par de categoras es

independiente de las dems categoras de respuesta. Segn esta suposicin, por ejemplo, si se introduce un nuevo producto en un mercado, la participacin en el mercado de todos los dems productos quedar afectada de manera igualmente proporcional. De igual manera, dado un patrn en las covariables, se asume que las respuestas son variables multinomiales independientes.

Obtencin de una regresin logstica multinomial


E Elija en los mens: Analizar Regresin Logstica multinomial ... Figura 3-1 Cuadro de dilogo Regresin logstica multinomial

15 Regresin logstica multinomial E Seleccione una variable dependiente. E Los factores son opcionales y pueden ser numricos o categricos. E Las covariables son opcionales, pero si se especifican deben ser numricas.

Regresin logstica multinomial: Modelos


Figura 3-2 Cuadro de dilogo Regresin logstica multinomial: Modelo

Por defecto, el procedimiento de Regresin logstica multinomial genera un modelo con los principales efectos que producen las covariables y los factores, pero puede especificar un modelo personalizado o solicitar la seleccin de un modelo por pasos con este cuadro de dilogo.
Especificar modelo. Un modelo de efectos principales contiene los efectos principales

de las covariables y los factores, pero no contiene efectos de interaccin. Un modelo factorial completo contiene todos los efectos principales y todas las interacciones factor por factor. No contiene interacciones de covariable. Puede crear un modelo

16 Captulo 3

personalizado para especificar subconjuntos de interacciones entre los factores o bien interacciones entre las covariables, o solicitar una seleccin por pasos de los trminos del modelo.
Factores y Covariables. Muestra una lista de los factores y las covariables, etiquetando con (F) los factores y con (C) las covariables. Trminos de entrada forzada. Los trminos aadidos a la lista de entrada forzada

siempre se incluyen en el modelo.


Trminos por pasos. Los trminos aadidos a la lista por pasos se incluyen en el

modelo segn uno de los mtodos seleccionados por el usuario siguientes:


!

Entrada hacia delante. Este mtodo se inicia sin trminos por pasos en el modelo.

En cada paso se aade al modelo el trmino ms significativo, hasta que ninguno de los trminos por pasos que quede fuera del modelo tenga una contribucin estadsticamente significativa si se aade al modelo.
!

Eliminacin hacia atrs. Este mtodo se inicia introduciendo en el modelo todos

los trminos especificados en la lista por pasos. En cada paso se elimina del modelo el trmino menos significativo, hasta que todos los trminos por pasos restantes representen una contribucin estadsticamente significativa para el modelo.
!

Pasos sucesivos hacia adelante. Este mtodo se inicia con el modelo que se

seleccionara mediante el mtodo de entrada hacia delante. A partir de ah, el algoritmo alterna entre la eliminacin hacia atrs de los trminos por pasos del modelo, y la entrada hacia delante de los trminos fuera del modelo. Se sigue as hasta que no queden trminos que cumplan con los criterios de entrada o exclusin.
!

Pasos sucesivos hacia atrs. Este mtodo se inicia con el modelo que se

seleccionara mediante el mtodo de eliminacin hacia atrs. A partir de ah, el algoritmo alterna entre la entrada hacia delante de los trminos fuera del modelo, y la eliminacin hacia atrs de los trminos por pasos del modelo. Se sigue as hasta que no queden trminos que cumplan con los criterios de entrada o exclusin.
Incluir la interseccin en el modelo. Le permite incluir o excluir del modelo un

trmino de interseccin.

17 Regresin logstica multinomial

Construir trminos
Para las covariables y los factores seleccionados:
Interaccin. Crea el trmino de interaccin de mayor nivel con todas las variables seleccionadas. Efectos principales. Crea un trmino de efectos principales para cada variable

seleccionada.
Todas de 2. Crea todas las interacciones dobles posibles de las variables seleccionadas. Todas de 3. Crea todas las interacciones triples posibles de las variables seleccionadas. Todas de 4. Crea todas las interacciones cudruples posibles de las variables

seleccionadas.
Todas de 5. Crea todas las interacciones quntuples posibles de las variables

seleccionadas.

Categora de referencia de regresin logstica multinomial


Figura 3-3 Cuadro de dilogo Regresin logstica multinomial: Categora de referencia

Por defecto, el procedimiento Regresin logstica multinomial hace de la ltima categora la categora de referencia. Este cuadro de dilogo le otorga el control sobre la categora de referencia y sobre la forma de ordenar las categoras.
Categora de referencia. Especifique la primera, la ltima o una categora

personalizada.

18 Captulo 3

Orden de categoras. En orden ascendente, el valor mnimo define la primera categora, y el valor ms alto la ltima. En orden descendente, el valor mximo define la primera categora y el valor inferior define la ltima.

Regresin logstica multinomial: Estadsticos


Figura 3-4 Cuadro de dilogo Regresin logstica multinomial: Estadsticos

Puede especificar los siguientes estadsticos para una regresin logstica multinomial:
Resumen de procesamiento de casos. Esta tabla contiene informacin sobre las

variables categricas especificadas.


Modelo. Estadsticos del modelo global.
!

Estadsticos de resumen. Imprime el estadstico de Cox y Snell, de Nagelkerke

y el R2 McFadden .

19 Regresin logstica multinomial !

Resumen de pasos. Esta tabla resume los efectos introducidos o eliminados en

cada paso, mediante un mtodo por pasos. No se genera si no se especifica un modelo por pasos en el cuadro de dilogo Modelo.
! !

Informacin de ajuste de los modelos. Esta tabla compara los modelos ajustado y

de slo interseccin o nulo.


Probabilidades de casilla. Imprime una tabla de las frecuencias observadas y

esperadas (con los residuos) y las proporciones por patrn en las covariables y por categora de respuesta.
! !

Tabla de clasificacin. Imprime una tabla de las respuestas observadas respecto a

las respuestas pronosticadas.


Estadsticos de bondad de ajuste de chi-cuadrado. Imprime los estadsticos de

chi-cuadrado de Pearson y de chi-cuadrado de la razn de verosimilitud. Los estadsticos se calculan para los patrones en las covariables determinados por todos los factores y las covariables o por un subconjunto de los factores y las covariables definido por el usuario.
Parmetros. Estadsticos relativos a los parmetros del modelo.
! !

Estimaciones. Imprime las estimaciones de los parmetros del modelo con un

nivel de confianza especificado por el usuario.


Contraste de la razn de verosimilitud. Imprime los contrastes de la razn de

verosimilitud para los efectos parciales del modelo. El contraste para el modelo global se imprime de manera automtica.
! !

Correlaciones asintticas. Imprime la matriz de las correlaciones entre las

estimaciones de los parmetros.


Covarianzas asintticas. Imprime la matriz de las covarianzas de las estimaciones

de los parmetros.
Definir subpoblaciones. Le permite seleccionar un subconjunto de factores y covariables de manera que pueda definir los patrones en las covariables utilizados por las probabilidades de casilla y las pruebas de bondad de ajuste.

20 Captulo 3

Regresin logstica multinomial: Criterios


Figura 3-5 Cuadro de dilogo Regresin logstica multinomial: Criterios de convergencia

Puede especificar los siguientes criterios para una regresin logstica multinomial:
Iteraciones. Le permite especificar el nmero mximo de veces que desea recorrer el

algoritmo, el nmero mximo de pasos en la subdivisin por pasos, las tolerancias de convergencia para los cambios en el log de la verosimilitud y los parmetros, la frecuencia con que se imprime el progreso del algoritmo iterativo y en qu iteracin el procedimiento debe comenzar a comprobar la separacin completa o casi completa de los datos.
!

Convergencia del logaritmo de la verosimilitud. Se asume la convergencia si

el cambio relativo en la funcin log-verosimilitud es menor que el valor especificado. El valor debe ser positivo.
!

Convergencia de parmetros. Se supone que el algoritmo ha alcanzado las

estimaciones correctas si el cambio absoluto o relativo del parmetro es inferior a este valor. Este criterio no se aplica si el valor es igual a 0.
Delta. Le permite especificar un valor no negativo inferior a 1. Este valor se aade a

cada casilla vaca de la tabla de contingencia de las categoras de respuesta por patrones de covariables. Se ayuda as a estabilizar el algoritmo y evitar sesgos en las estimaciones.
Tolerancia para la singularidad. Le permite especificar la tolerancia empleada en la

comprobacin de la singularidad.

21 Regresin logstica multinomial

Opciones de Regresin logstica multinomial


Figura 3-6 Cuadro de dilogo Regresin logstica multinominal

Puede especificar las siguientes opciones para una regresin logstica multinomial:
Escala de dispersin. Le permite especificar el valor de escalamiento de la dispersin que se va a utilizar para corregir la estimacin de la matriz de covarianzas de los parmetros. Desviacin estima el valor de escalamiento mediante el estadstico de la funcin de desviacin (chi-cuadrado de la razn de verosimilitud. Pearson estima el valor de escalamiento mediante el estadstico chi-cuadrado de Pearson. Tambin puede especificar su propio valor de escalamiento. Debe ser un valor numrico positivo. Opciones por pasos. Estas opciones le ofrecen el control de los criterios estadsticos cuando se utilizan mtodos por pasos para generar un modelo. Se ignoran si no se especifica un modelo por pasos en el cuadro de dilogo Modelo.
!

Probabilidad de entrada. Se trata de la probabilidad del estadstico de la razn

de verosimilitud para la entrada de variables. Cuanto mayor sea la probabilidad especificada, ms fcil resultar que una variable entre en el modelo. Este criterio se ignora a no ser que se seleccione el mtodo de entrada hacia delante, pasos sucesivos hacia adelante o pasos sucesivos hacia atrs.
!

Probabilidad de eliminacin. Se trata de la probabilidad del estadstico de la razn

22 Captulo 3

de verosimilitud para la eliminacin de variables. Cuanto mayor sea la probabilidad especificada, ms fcil resultar que una variable permanezca en el modelo. Este criterio se ignora a no ser que se seleccione el mtodo de eliminacin hacia atrs, pasos sucesivos hacia adelante o pasos sucesivos hacia atrs.
!

Efectos por pasos mnimos en el modelo. Al utilizar los mtodos de eliminacin

hacia atrs o pasos sucesivos hacia atrs, se especifica el mnimo nmero de trminos que puede incluirse en el modelo. La interseccin no se cuenta como trmino de modelo.
!

Efectos por pasos mximos en el modelo. Al utilizar los mtodos de entrada hacia

delante o pasos sucesivos hacia adelante, se especifica el mximo nmero de trminos que puede incluirse en el modelo. La interseccin no se cuenta como trmino de modelo.
!

Restringir jerrquicamente la entrada y la eliminacin de trminos. Esta opcin

permite elegir si se desea aplicar restricciones a la inclusin de trminos de modelo. La jerarqua precisa que para que se incluya un trmino, todos los inferiores que formen parte del que se desea incluir se encuentren antes en el modelo. Por ejemplo, si el requisito de jerarqua est activado, los factores Estado civil y Sexo deben estar en el modelo antes de poder aadir la interaccin Estado civil*Sexo. Las tres opciones en forma de botn radial determinan el papel de las covariables a la hora de determinar la jerarqua.

23 Regresin logstica multinomial

Regresin logstica multinomial: Guardar


Figura 3-7 Cuadro de dilogo Regresin logstica multinomial: Guardar

El cuadro de dilogo Guardar permite guardar las variables en el archivo de trabajo, as como exportar la informacin de modelo a un archivo externo.
Variables guardadas.
!

Probabilidades de respuesta estimadas. Son las probabilidades estimadas de la

clasificacin de un patrn de factor/covariable en las categoras de respuesta. Hay tantas probabilidades estimadas como categoras de la variable de respuesta; se guardarn hasta 25.
! !

Categora pronosticada. Es la categora de respuesta con la mayor probabilidad

esperada para un patrn de factor/covariable.


Probabilidades de la categora pronosticada. Mximo de las probabilidades de

respuesta estimadas.
! Probabilidad de la categora real. Es la probabilidad estimada de la clasificacin de

un patrn de factor/covariable en la categora observada.


Exportar informacin del modelo a un archivo XML. Las estimaciones de los parmetros

y (si lo desea) sus covarianzas se exportan al archivo especificado. SmartScore y las prximas versiones de WhatIf? podrn utilizar este archivo.

24 Captulo 3

Funciones adicionales del comando NOMREG


El lenguaje de comandos de SPSS tambin permite:
! ! !

Especifique la categora de referencia de la variable dependiente. Incluir los casos con valores perdidos definidos por el usuario. Personalizar los contrastes de hiptesis especificando las hiptesis nulas como combinaciones lineales de los parmetros.

Captulo

Anlisis probit

Este procedimiento mide la relacin entre la intensidad de un estmulo y la proporcin de casos que presentan una cierta respuesta a dicho estmulo. Es til para las situaciones en las que se dispone de una respuesta dicotmica que se piensa puede estar influenciada o causada por los niveles de alguna o algunas variables independientes, y es particularmente adecuada para datos experimentales. Este procedimiento le permitir estimar la intensidad necesaria para que un estmulo llegue a inducir una determinada proporcin de respuestas, como la dosis efectiva para la mediana.
Ejemplo. Qu efectividad tiene un nuevo pesticida para matar hormigas y cul es la concentracin adecuada que se debe utilizar? Podra llevar a cabo un experimento en el que se expongan muestras de hormigas a diferentes concentraciones del pesticida y despus registrar el nmero de hormigas muertas y el nmero de hormigas expuestas. Aplicando el anlisis probit a estos datos puede determinar la fuerza de la relacin entre concentracin y mortalidad, as como determinar la concentracin adecuada de pesticida si desea asegurar la exterminacin de, por ejemplo, el 95% de las hormigas expuestas. Estadsticos. Coeficientes de regresin y errores tpicos, interseccin y su error

tpico, chi-cuadrado de Pearson de la bondad de ajuste, frecuencias observadas y esperadas e intervalos de confianza para los niveles efectivos de la variable o variables independientes. Grficos: grficos de respuestas transformadas. Este procedimiento utiliza los algoritmos propuestos y aplicados en NPSOL por Gill, Murray, Saunders y Wright para la estimacin de los parmetros de modelo.

25

26 Captulo 4

Anlisis probit: Consideraciones sobre los datos


Datos. Para cada valor de la variable independiente (o para cada combinacin de valores para mltiples variables independientes), la variable de respuesta debe contener el recuento del nmero de casos que presenta la respuesta de inters y que toma dichos valores de la variable independiente, y la variable del total observado debe ser el recuento del nmero total de casos con dichos valores para la variable independiente. La variable de factor debe ser categrica, codificada como enteros. Supuestos. Las observaciones deben ser independientes. Si dispone de un gran

nmero de valores diferentes para las variables independientes respecto al nmero de observaciones, como es probable que suceda en un estudio observacional, puede que no sean vlidos los estadsticos de chi-cuadrado y de bondad de ajuste.
Procedimientos relacionados. El anlisis probit est estrechamente relacionado con la regresin logstica; de hecho, si elige la transformacin logit, este procedimiento calcular esencialmente una regresin logstica. En general, el anlisis probit es apropiado para los diseos experimentales, mientras que la regresin logstica es ms adecuada para los estudios observacionales. Las diferencias en los resultados reflejan estas diferencias de nfasis. El procedimiento Anlisis probit informa de las estimaciones de los valores efectivos para las diferentes tasas de respuesta (incluyendo la dosis efectiva para la mediana), mientras que la Regresin logstica informa de las estimaciones de las razones de las ventajas (odds ratios) para las variables independientes.

Para obtener un anlisis probit


E Elija en los mens: Analizar Regresin Probit...

27 Anlisis probit Figura 4-1 Cuadro de dilogo Anlisis probit

E Seleccione una variable para la frecuencia de respuesta. Esta variable indica el

nmero de casos que presentan una respuesta al estmulo de prueba. Los valores de esta variable no pueden ser negativos.
E Seleccione una variable para el total observado. Esta variable indica el nmero

de casos a los que se aplic el estmulo. Para cada caso, los valores de esta variable no pueden ser negativos ni menores que los valores de la variable de frecuencia de respuesta. Si se desea, puede seleccionarse una variable de factor. Si lo hace, pulse en Definir rango para definir los grupos.
E Seleccione una o ms covariables. La covariable contiene el nivel del estmulo

aplicado en cada observacin. Si desea transformar la covariable, seleccione una transformacin de la lista desplegable Transformar. Si no se aplica ninguna transformacin y hay un grupo de control, ste se incluir en el anlisis.
E Seleccione el modelo Probit o Logit. ! Modelo probit. Aplica la transformacin Probit (la inversa de la funcin acumulada

de la distribucin normal tpica) a las proporciones de respuesta.


!

Modelo logit. Aplica la transformacin logit (log de las ventajas) a

28 Captulo 4

las proporciones de respuesta.

Anlisis probit: Definir rango


Figura 4-2 Cuadro de dilogo Anlisis probit: Definir rango

Permite especificar los niveles de la variable de factor que sern analizados. Los niveles de factor deben codificarse como enteros consecutivos; se analizarn todos los niveles del rango que especifique.

Anlisis probit: Opciones


Figura 4-3 Cuadro de dilogo Anlisis probit: Opciones

29 Anlisis probit

Puede especificar opciones para el anlisis probit:


Estadsticos. Permite solicitar los siguientes estadsticos opcionales: Frecuencias, Potencia relativa de la mediana, Prueba de paralelismo e Intervalos de confianza fiduciaria.
!

Potencia relativa de la mediana. Muestra la razn de las potencias de las medianas

para cada pareja de los niveles del factor. Tambin muestra los lmites de confianza al 95% para cada potencia relativa de la mediana. Las potencias relativas de la mediana no estn disponibles si no dispone de una variable de factor, o si dispone de ms de una covariable.
! !

Prueba de paralelismo. Contraste sobre la hiptesis de que todos los niveles del

factor tienen una pendiente comn.


Intervalos de confianza fiduciaria. Intervalos de confianza para la dosis del agente

requerida para producir una cierta probabilidad de respuesta. Intervalos de confianza fiduciaria y Potencia relativa de la mediana no estn disponibles si se ha seleccionado ms de una covariable. Potencia relativa de la mediana y Prueba de paralelismo slo estn disponibles si se ha seleccionado una variable de factor.
Tasa de respuesta natural. Permite indicar una tasa de respuesta natural incluso en la

ausencia del estmulo. Ninguna, Calcular a partir de los datos o Valor.


!

Calcular a partir de los datos. Estima la tasa de respuesta natural a partir de los

datos de la muestra. Los datos deben contener un caso que represente el nivel de control, para el cual el valor de las covariables sea 0. Probit estima la tasa de respuesta natural utilizando como valor inicial la proporcin de respuestas para el nivel de control.
!

Valor. Establece la tasa de respuesta natural del modelo (seleccione este elemento

cuando conozca de antemano la tasa de respuesta natural). Introduzca la proporcin de respuesta natural (la proporcin debe ser menor que 1). Por ejemplo, si la respuesta ocurre el 10% de las veces cuando el estmulo es 0, introduzca 0,10.
Criterios. Permite controlar los parmetros del algoritmo iterativo de estimacin de

los parmetros. Puede anular las opciones predeterminadas para N mximo de iteraciones, Lmite para los pasos y Tolerancia de optimalidad.

30 Captulo 4

Funciones adicionales del comando PROBIT


El lenguaje de comandos de SPSS tambin permite:
! ! !

Solicitar simultneamente un anlisis con ambos modelos, probit y logit. Controlar el tratamiento de los valores perdidos. Transformar las covariables por bases diferentes de la base 10 o el logaritmo natural.

Captulo

Regresin no lineal

Regresin no lineal es un mtodo para encontrar un modelo no lineal para la relacin entre la variable dependiente y un conjunto de variables independientes. A diferencia de la regresin lineal tradicional, que est restringida a la estimacin de modelos lineales, la regresin no lineal puede estimar modelos con relaciones arbitrarias entre las variables independientes y las dependientes. Esto se lleva a cabo usando algoritmos de estimacin iterativos. Tenga en cuenta que este procedimiento no es necesario para los modelos polinmicos simples de la forma Y = A + BX**2. Definiendo W = X**2, obtenemos un modelo lineal simple, Y = A + BW, que se puede estimar usando mtodos tradicionales como el procedimiento Regresin lineal.
Ejemplo. Puede pronosticarse la poblacin basndose en el tiempo? Un diagrama de dispersin muestra que parece haber una estrecha relacin entre la poblacin y el tiempo, pero la relacin es no lineal y por eso exige la utilizacin de los mtodos de estimacin especiales del procedimiento Regresin no lineal. Creando una ecuacin adecuada, como la del modelo logstico de crecimiento poblacional, podemos obtener una buena estimacin del modelo, lo que nos permitir hacer predicciones sobre la poblacin para pocas que no se han sido medidas. Estadsticos. Para cada iteracin: estimaciones de los parmetros y suma de cuadrados residual. Para cada modelo: suma de cuadrados para regresin, residual, total corregido y no corregido, estimaciones de los parmetros, errores tpicos asintticos y matriz de correlaciones asintticas de estimaciones de los parmetros.

Nota: La regresin no lineal restringida utiliza los algoritmos propuestos y aplicados en NPSOL por Gill, Murray, Saunders y Wright para la estimacin de los parmetros de modelo.

31

32 Captulo 5

Regresin no lineal: Consideraciones sobre los datos


Datos. Las variables dependiente e independientes deben ser cuantitativas. Las

variables categricas, como la religin, la mayora de edad o el lugar de residencia, han de recodificarse como variables binarias (dummy) o como otro de los tipos de variables de contraste.
Supuestos. Los resultados son vlidos slo si se ha especificado una funcin

que describa con precisin la relacin entre las variables independientes y las dependientes. Adems, la eleccin de buenos valores iniciales es muy importante. Incluso si se ha especificado la forma funcional correcta para el modelo, si no utiliza valores iniciales adecuados, puede que su modelo no logre converger o puede que obtenga una solucin que sea ptima localmente en vez de una que sea ptima globalmente.
Procedimientos relacionados. Muchos modelos que en un principio parecen ser no

lineales pueden ser transformados en un modelo lineal, el cual pueda ser analizado usando el procedimiento Regresin lineal. Si no est seguro de cul es el modelo adecuado, el procedimiento Estimacin curvilnea puede ayudarle a identificar relaciones funcionales tiles que estn presentes en los datos.

Para obtener un anlisis de regresin no lineal


E Elija en los mens: Analizar Regresin No lineal...

33 Regresin no lineal Figura 5-1 Cuadro de dilogo Regresin no lineal

E Seleccione una variable numrica dependiente de la lista de variables del archivo de

datos de trabajo.
E Para construir una expresin para el modelo, introduzca la expresin en el campo

Expresin del modelo o bien pegue en el campo los componentes (variables, parmetros, funciones).
E Identifique los parmetros del modelo pulsando en Parmetros.

Un modelo segmentado (uno que adquiere diferentes formas en distintas partes de su dominio) se debe especificar usando la lgica condicional dentro de la declaracin nica del modelo.

Lgica condicional (Regresin no lineal)


Se puede especificar un modelo segmentado utilizando la lgica condicional. Para usar la lgica condicional dentro de la expresin del modelo o de la funcin de prdida, debe construir la suma de una serie de trminos, uno para cada condicin. Cada trmino se compone de una expresin lgica (entre parntesis) multiplicada por la expresin que resultar cuando esa expresin lgica es verdadera.

34 Captulo 5

Por ejemplo, considere un modelo segmentado que sea igual a 0 para X<=0, X para 0<X<1 y 1 para X>=1. La expresin para este ejemplo es: (X<=0)*0 + (X>0 & X < 1)*X + (X>=1)*1. Todas las expresiones lgicas entre parntesis deben ser evaluables como 1 (verdadero) o 0 (falso). As: Si X<=0, la anterior se reduce a 1*0 + 0*X + 0*1=0. Si 0<X<1, se reduce a 0*0 + 1*X +0*1 = X. Si X>=1, se reduce a 0*0 + 0*X + 1*1 = 1. Se pueden construir con facilidad ejemplos ms complicados reemplazando diferentes expresiones lgicas y expresiones de resultado. Recuerde que las desigualdades dobles, como 0<X<1, deben escribirse como expresiones compuestas, de la forma (X>0 & X < 1). Se pueden utilizar variables de cadena dentro de las expresiones lgicas: (ciudad='Madrid')*costliv + (ciudad='Guadalajara')*0.59*costliv Esto da lugar a una expresin (el valor de la variable costliv) para los madrileos y a otra (el 59% de ese valor) para los habitantes de Guadalajara. Las constantes de cadena deben ir entre comillas o apstrofos, como se muestra aqu.

Regresin no lineal: Parmetros


Figura 5-2 Cuadro de dilogo Regresin no lineal: Parmetros

35 Regresin no lineal

Los parmetros son las partes del modelo que son estimadas por el procedimiento Regresin no lineal. Los parmetros pueden ser constantes aditivas, coeficientes multiplicativos, exponentes o valores usados para evaluar funciones. Todos los parmetros que hayan sido definidos aparecern (con sus valores de inicio) en la lista Parmetros del cuadro de dilogo principal.
Nombre. Debe especificarse un nombre para cada parmetro. Debe ser un nombre de

variable de SPSS vlido y debe ser el nombre utilizado en la expresin del modelo del cuadro de dilogo principal.
Valor inicial. Permite especificar un valor de inicio para el parmetro, preferiblemente lo ms prximo posible a la solucin final esperada. Los valores iniciales no adecuados pueden dar como resultado un fallo de convergencia o una convergencia sobre una solucin local (en vez de global) o fsicamente imposible. Usar los valores iniciales del anlisis previo. Si ya se ha ejecutado una regresin no

lineal desde este cuadro de dilogo, puede seleccionar esta opcin para obtener los valores iniciales de los parmetros a partir de sus valores en la ejecucin previa. De esta forma podr continuar buscando cuando el algoritmo est convergiendo lentamente. Los primeros valores iniciales seguirn apareciendo en la lista Parmetros del cuadro de dilogo principal. Nota: Esta seleccin persistir en este cuadro de dilogo durante el resto de la sesin. Si cambia el modelo, asegrese de desactivarla.

Modelos comunes de regresin no lineal


La tabla que se muestra ms abajo proporciona ejemplos de la sintaxis del modelo para muchos modelos de regresin no lineal publicados. Es probable que los modelos seleccionados al azar no se ajusten bien a sus datos. Son necesarios valores iniciales adecuados para los parmetros; algunos modelos requieren restricciones para llegar a converger.
Tabla 5-1 Ejemplos de sintaxis de modelo

Nombre Regresin asinttica Regresin asinttica

Expresin del modelo b1 + b2 *exp( b3 * x ) b1 ( b2 *( b3 ** x ))

36 Captulo 5

Nombre Densidad Gauss Gompertz Johnson-Schumacher Log-modificado Log-logstico

Expresin del modelo ( b1 + b2 * x )**(1/ b3 ) b1 *(1 b3 *exp( b2 * x **2)) b1 *exp( b2 * exp( b3 * x )) b1 *exp( b2 / ( x + b3)) ( b1 + b3 * x ) ** b2 b1 ln(1+ b2 *exp( b3 * x ))

Ley de Metcherlich de devoluciones b1 + b2 *exp( b3 * x ) decrecientes Michaelis Menten b1* x /( x + b2 ) Morgan-Mercer-Florin Peal-Reed Razn de cbicas Razn de cuadrticas Richards Verhulst Von Bertalanffy Weibull Densidad de rendimiento ( b1 * b2 + b3 * x ** b4 )/( b2 + x ** b4 ) b1 /(1+ b2 *exp(( b3 * x + b4 * x **2+ b5 * x **3))) ( b1 + b2 * x + b3 * x **2+ b4 * x **3)/( b5 * x **3) ( b1 + b2 * x + b3 * x **2)/( b4 * x **2) b1 /((1+ b3 *exp( b2 * x ))**(1/ b4 )) b1 /(1 + b3 * exp( b2 * x )) ( b1 ** (1 b4 ) b2 * exp( b3 * x )) ** (1/(1 b4 )) b1 b2 *exp( b3 * x ** b4 ) (b1 + b2 * x + b3 * x **2)**(1)

37 Regresin no lineal

Regresin no lineal: Funcin de prdida


Figura 5-3 Cuadro de dilogo Regresin no lineal: Funcin de prdida

La funcin de prdida en regresin no lineal es la funcin que es minimizada por el algoritmo. Seleccione Suma de los residuos al cuadrado para minimizar la suma de los residuos al cuadrado o bien Funcin de prdida definida por el usuario para minimizar una funcin diferente. Si selecciona Funcin de prdida definida por el usuario, debe definir la funcin de prdida cuya suma (en todos los casos) deber minimizarse por la eleccin de los valores de los parmetros.
!

La mayora de las funciones de prdida incluyen la variable especial RESID_, que representa el residuo. La funcin de prdida por defecto Suma de los residuos al cuadrado se podra introducir explcitamente como RESID_**2. Si tiene que utilizar el valor pronosticado en la funcin de prdida, ste es igual a la variable dependiente menos el residuo. Se puede especificar una funcin de prdida condicional utilizando la lgica condicional.

Puede escribir una expresin en el campo Funcin de prdida definida por el usuario, o bien pegar en el campo los componentes de la expresin. Las constantes de cadena deben ir entre comillas o apstrofos y las constantes numricas deben escribirse en formato americano, con el punto como separador de la parte decimal.

38 Captulo 5

Regresin no lineal: Restricciones para los parmetros


Figura 5-4 Cuadro de dilogo Regresin no lineal: Restricciones para los parmetros

Una restriccin es una limitacin sobre los valores permitidos para un parmetro durante la bsqueda iterativa de una solucin. Las expresiones lineales se evalan antes de realizar un paso, de modo que se puedan utilizar restricciones lineales para omitir los pasos que pueden provocar desbordamientos. Las expresiones no lineales se evalan despus de realizar el paso. Cada ecuacin o desigualdad requiere los siguientes elementos:
!

Una expresin que incluya al menos un parmetro del modelo. Escriba la expresin o bien utilice el teclado, que le permita pegar nmeros, operadores o parntesis en la expresin. Puede escribir el parmetro o parmetros requeridos junto con el resto de la expresin o bien pegarlos de la lista de Parmetros situada a la izquierda. No se pueden usar variables ordinarias en una restriccin. Uno de los tres operadores lgicos <=, =, o bien >=. lgico. Escriba la constante. Las constantes numricas deben escribirse en formato americano, con el punto como separador de la parte decimal.

! Una constante numrica, con la que se compara la expresin utilizando el operador

39 Regresin no lineal

Regresin no lineal: Guardar variables nuevas


Figura 5-5 Cuadro de dilogo Regresin no lineal: Guardar variables nuevas

Puede guardar una serie de variables nuevas en el archivo de datos activo. Las opciones disponibles son: Valores pronosticados, Residuos, Derivadas y Valores de la funcin de prdida. Estas variables se pueden utilizar en anlisis subsiguientes para contrastar el ajuste del modelo o para identificar casos problemticos.
! ! !

Valores pronosticados. Guarda los valores pronosticados, con el nombre de

variable pred_.
Residuos. Guarda los residuos, con el nombre de variable resid. Derivadas. Se guarda una derivada para cada parmetro del modelo. Los nombres

de las derivadas se construyen aadiendo como prefijo una d. a los primeros seis caracteres de los nombres de los parmetros.
!

Valores de la funcin de prdida. Esta opcin est disponible si especifica su

propia funcin de prdida. Se asigna el nombre de variable loss_ a los valores de la funcin de prdida.

40 Captulo 5

Regresin no lineal: Opciones


Figura 5-6 Cuadro de dilogo Regresin no lineal: Opciones

Este cuadro de dilogo permite controlar diversos aspectos del anlisis de regresin no lineal:
Estimaciones bootstrap. Mtodo de estimacin del error tpico de un estadstico que

usa muestras repetidas del conjunto original de datos. Esto se lleva a cabo mediante muestreo (con reposicin) para obtener muchas muestras de tamao igual al conjunto de datos original. Se estima la ecuacin no lineal para cada una de estas muestras. A continuacin, se calcula el error tpico de cada estimacin del parmetro como la desviacin tpica de las estimaciones creadas por el mtodo bootstrap. Se utilizan los valores de los parmetros obtenidos a partir de los datos originales como los valores de inicio para cada muestra de bootstrap. Esto requiere la utilizacin del algoritmo de programacin cuadrtica secuencial.
Mtodo de estimacin. Permite seleccionar un mtodo de estimacin, si esto es

posible. (Determinadas opciones de ste y otros cuadros de dilogo requieren el algoritmo de programacin cuadrtica secuencial.) Entre las alternativas disponibles se encuentran Programacin cuadrtica secuencial y Levenberg-Marquardt.
!

Programacin cuadrtica secuencial. Est mtodo est disponible para

los modelos restringidos y los no restringidos. La programacin cuadrtica secuencial se utiliza automticamente si especifica un modelo restringido, una funcin de prdida definida por el usuario o el muestreo bootstrap. Si lo desea puede introducir nuevos valores para N mximo de iteraciones y Lmite para los

41 Regresin no lineal

pasos y puede cambiar la seleccin que se encuentra en las listas desplegables para Tolerancia de optimalidad, Precisin de la funcin y Tamao para pasos infinitos.
!

Levenberg-Marquardt. Algoritmo por defecto para los modelos no restringidos.

El mtodo de Levenberg-Marquardt no est disponible si especifica un modelo restringido, una funcin de prdida definida por el usuario, o el muestreo bootstrap (autodocimante). Puede introducir nuevos valores para N mximo de iteraciones y puede cambiar la seleccin que se encuentra en las listas desplegables para Convergencia de la suma de cuadrados y Convergencia en los parmetros.

Regresin no lineal: Interpretacin de los resultados


Los problemas de la regresin no lineal presentan con frecuencia dificultades de clculo:
!

La eleccin de valores iniciales para los parmetros influye en la convergencia. Intente elegir valores iniciales que sean razonables y, si es posible, prximos a la solucin final esperada. A veces, un algoritmo se ejecuta mejor que otro en un determinado problema. En el cuadro de dilogo Opciones, seleccione el otro algoritmo si est disponible. Si especifica una funcin de prdida o ciertos tipos de restricciones, no podr utilizar el algoritmo de Levenberg-Marquardt. Cuando la iteracin se detiene slo porque se ha dado el nmero mximo de iteraciones, el modelo final probablemente no sea una buena solucin. Seleccione Usar los valores iniciales del anlisis previo del cuadro de dilogo Parmetros para continuar la iteracin o, mejor an, elija otros valores iniciales. Los modelos que requieren la exponenciacin de o por valores de datos grandes pueden causar desbordamientos (nmeros demasiado grandes o demasiado pequeos para que su equipo los represente). A veces esto se puede evitar eligiendo los valores iniciales adecuados o imponiendo restricciones sobre los parmetros.

42 Captulo 5

Funciones adicionales del comando NLR


El lenguaje de comandos de SPSS tambin permite:
! ! ! ! !

Nombrar un archivo del cual leer valores iniciales para las estimaciones de los parmetros. Especificar ms de una instruccin de modelo y de funcin de prdida. Con ello se facilita la tarea de especificacin de un modelo segmentado. Suministrar sus propias derivadas en vez de utilizar las calculadas por el programa. Especificar el nmero de muestras bootstrap que se van a generar. Especificar criterios de iteracin adicionales, incluyendo el establecer un valor crtico para la comprobacin de las derivadas y definir un criterio de convergencia para la correlacin entre los residuos y las derivadas.

Los criterios adicionales para el comando CNLR (regresin no lineal restringida) permiten:
! ! ! !

Especificar el nmero mximo de iteraciones secundarias permitidas dentro de cada iteracin principal. Establecer un valor crtico para la comprobacin de las derivadas. Establecer un lmite para los pasos. Especificar una tolerancia de colapso para determinar si los valores iniciales estn dentro de los lmites especificados.

Captulo

Estimacin ponderada

Los modelos de regresin lineal tpicos asumen que la varianza es constante en la poblacin objeto de estudio. Cuando ste no es el caso (por ejemplo cuando los casos con puntuaciones mayores en un atributo muestran ms variabilidad que los casos con puntuaciones menores en ese atributo), la regresin lineal mediante mnimos cuadrados ordinarios (MCO, OLS) deja de proporcionar estimaciones ptimas para el modelo. Si las diferencias de variabilidad se pueden pronosticar a partir de otra variable, el procedimiento Estimacin ponderada permite calcular los coeficientes de un modelo de regresin lineal mediante mnimos cuadrados ponderados (MCP, WLS), de forma que se les d mayor ponderacin a las observaciones ms precisas (es decir, aqullas con menos variabilidad) al determinar los coeficientes de regresin. El procedimiento Estimacin ponderada contrasta un rango de transformaciones de ponderacin e indica cul se ajustar mejor a los datos.
Ejemplo. Cules son los efectos de la inflacin y el paro sobre los cambios en el

precio de las acciones? Debido a que los valores con mayor valor de cotizacin suelen mostrar ms variabilidad que aquellos con menor valor de cotizacin, la estimacin de mnimos cuadrados ordinarios no generar estimaciones que sean ptimas. El mtodo de Estimacin ponderada permite capturar el efecto del precio de cotizacin sobre la variabilidad de los cambios en el precio, al calcular el modelo lineal.
Estadsticos. Valores de la log-verosimilitud para cada potencia de la variable de

ponderacin puesta a prueba,R mltiple, R-cuadrado, R cuadrado corregida, tabla de ANOVA para el modelo MCP, estimaciones de los parmetros tipificados y no tipificados y log-verosimilitud para el modelo MCP.

43

44 Captulo 6

Estimacin ponderada: Consideraciones sobre los datos


Datos. Las variables dependiente e independientes deben ser cuantitativas. Las

variables categricas, como la religin, la mayora de edad o el lugar de residencia, han de recodificarse como variables binarias (dummy) o como otro de los tipos de variables de contraste. La variable de ponderacin deber ser cuantitativa y estar relacionada con la variabilidad de la variable dependiente.
Supuestos. Para cada valor de la variable independiente, la distribucin de la

variable dependiente debe ser normal. La relacin entre la variable dependiente y cada variable independiente debe ser lineal y todas las observaciones deben ser independientes. La varianza de la variable dependiente puede cambiar segn los niveles de la variable o variables independientes, pero las diferencias se deben poder pronosticar en funcin de la variable de ponderacin.
Procedimientos relacionados. El procedimiento Explorar se puede utilizar para

inspeccionar los datos. Este procedimiento proporciona pruebas de normalidad y homogeneidad de la varianza, as como representaciones grficas. Si la variable dependiente parece tener la misma varianza para todos los niveles de las variables independientes, puede utilizar el procedimiento Regresin lineal. Si los datos parecen violar un supuesto (como puede ser la normalidad), intente transformarlos. Si los datos no estn relacionados linealmente y una transformacin no ayuda, utilice un modelo alternativo en el procedimiento Estimacin curvilnea. Si la variable dependiente es dicotmica, por ejemplo si se lleva o no a cabo una determinada venta o si un artculo es o no defectuoso, utilice el procedimiento Regresin logstica. Si la variable dependiente est censurada (por ejemplo, el tiempo de supervivencia despus de una intervencin quirrgica), utilice los procedimientos Tablas de mortalidad, Kaplan-Meier o Regresin de Cox, disponibles en la opcin SPSS Estadsticas avanzadas. Si los datos no son independientes (por ejemplo, si observa a la misma persona en diversas condiciones), utilice el procedimiento Medidas repetidas, disponible en la opcin SPSS Estadsticas avanzadas.

Para obtener un anlisis de Estimacin ponderada


E Elija en los mens: Analizar Regresin Estimacin ponderada...

45 Estimacin ponderada Figura 6-1 Cuadro de dilogo Estimacin ponderada

E Seleccione una variable dependiente. E Seleccione una o ms variables independientes. E Seleccione la variable fuente de heterocedasticidad como variable de ponderacin. !

Variable de ponderacin. Los datos son ponderados por el inverso de esta variable

elevada a una potencia. La ecuacin de regresin se calcula para cada uno de los valores del rango especificado y se indica la potencia que maximiza la funcin log-verosimilitud.
!

Rango de potencias. Se utiliza en conjuncin con la variable de ponderacin para

calcular las ponderaciones. Se ajustarn varias ecuaciones de regresin, una para cada valor del rango de potencias. Los valores introducidos en el cuadro Rango de potencias y en el cuadro Hasta, deben encontrarse entre -6,5 y 7,5, ambos inclusive. Los valores de la potencia irn del valor menor al mayor, con el incremento determinado por el valor especificado. El nmero total de valores del rango de potencias est limitado a 150.

46 Captulo 6

Estimacin ponderada: Opciones


Figura 6-2 Cuadro de dilogo Estimacin ponderada: Opciones

Puede especificar las opciones para el anlisis de estimacin ponderada:


Guardar la mejor ponderacin como nueva variable. Aade la variable de ponderacin

al archivo activo. Esta variable se denomina WGT_n, siendo n un nmero elegido para proporcionar a la variable un nombre exclusivo.
Mostrar ANOVA y estimaciones. Permite controlar cmo se muestran los estadsticos

en los resultados. Las alternativas disponibles son Para la mejor potencia y Para cada valor de potencia.

Funciones adicionales del comando WLS


El lenguaje de comandos de SPSS tambin permite:
! !

Proporcionar un nico valor para la potencia. Especificar una lista de valores para la potencia o mezclar un rango de valores con una lista de valores para la potencia.

Captulo

Regresin por mnimos cuadrados en dos fases

Los modelos de regresin lineal tpica asumen que los errores de la variable dependiente no estn correlacionados con la variable o variables independientes. Cuando ste no es el caso (por ejemplo, cuando las relaciones entre las variables son bidireccionales), la regresin lineal mediante mnimos cuadrados ordinarios (OLS) deja de proporcionar estimaciones ptimas del modelo. La regresin por mnimos cuadrados en dos fases utiliza variables instrumentales que no estn correlacionadas con los trminos de error para calcular los valores estimados de los predictores problemticos (en la primera fase ) y despus utiliza dichos valores calculados para estimar un modelo de regresin lineal para la variable dependiente (la segunda fase). Dado que los valores calculados se basan en variables que no estn correlacionadas con los errores, los resultados del modelo en dos fases son ptimos.
Ejemplo. Est relacionada la demanda de un artculo con su precio y con los ingresos

del consumidor? La dificultad de este modelo radica en que el precio y la demanda tienen efectos recprocos el uno sobre el otro. Es decir, el precio puede influir en la demanda y la demanda tambin puede influir en el precio. Un modelo de regresin por mnimos cuadrados en dos fases permite utilizar los ingresos de los consumidores y el precio retardado para calcular un predictor sustituto del precio, el cual no est correlacionado con los errores de medida de la demanda. Se reemplaza el precio en el modelo especificado originariamente por este sustituto y despus se estima el nuevo modelo.
Estadsticos. Para cada modelo: coeficientes de regresin tipificados y no tipificados,

R mltiple, Rcuadrado, R cuadrado corregida, error tpico de la estimacin, tabla de anlisis de varianza, valores pronosticados y residuos. Adems, los intervalos de confianza al 95% para cada coeficiente de regresin y las matrices de correlacin y covarianza para las estimaciones de los parmetros.
47

48 Captulo 7

Regresin por mnimos cuadrados en dos fases: Consideraciones sobre los datos
Datos. Las variables dependiente e independientes deben ser cuantitativas. Las

variables categricas, como la religin, la mayora de edad o el lugar de residencia, han de recodificarse como variables binarias (dummy) o como otro de los tipos de variables de contraste. Las variables explicativas endgenas deben ser cuantitativas (no categricas).
Supuestos. Para cada valor de la variable independiente, la distribucin de la variable

dependiente debe ser normal. La varianza de distribucin de la variable dependiente debe ser constante para todos los valores de la variable independiente. La relacin entre la variable dependiente y cada variable independiente debe ser lineal.
Procedimientos relacionados. Si piensa que ninguna de las variables predictoras

est correlacionada con los errores de la variable dependiente, puede utilizar el procedimiento Regresin lineal. Si los datos parecen violar alguno de los supuestos (como la normalidad o la varianza constante), pruebe a transformarlos. Si los datos no estn relacionados linealmente y una transformacin no ayuda, utilice un modelo alternativo en el procedimiento Estimacin curvilnea. Si la variable dependiente es dicotmica, por ejemplo si se ha completado o no una determinada venta, utilice el procedimiento Regresin logstica. Si los datos no son independientes (por ejemplo, si observa a la misma persona en diversas condiciones), utilice el procedimiento Medidas repetidas, disponible en la opcin SPSS Estadsticas avanzadas.

Para obtener un anlisis de regresin de mnimos cuadrados en dos fases


E Elija en los mens: Analizar Regresin Mnimos cuadrados en dos fases...

49 Regresin por mnimos cuadrados en dos fases Figura 7-1 Cuadro de dilogo Mnimos cuadrados en dos fases

E Seleccione una variable dependiente. E Seleccione una o ms variables explicativas (predictoras). E Seleccione una o ms variables instrumentales. !

Instrumental. Estas son las variables utilizadas para calcular los valores

pronosticados de las variables endgenas en la primera etapa del anlisis de mnimos cuadrados en dos fases. Las listas de variables explicativas e instrumentales pueden contener las mismas variables. Debe haber al menos tantas variables instrumentales como explicativas. Si las variables explicativas e instrumentales coinciden, los resultados sern los mismos que los del procedimiento de Regresin lineal. Las variables explicativas no especificadas como instrumentales se consideran endgenas. Normalmente, todas las variables exgenas de la lista Explicativas se especifican tambin como variables instrumentales.

50 Captulo 7

Regresin por mnimos cuadrados en dos fases: Opciones


Figura 7-2 Cuadro de dilogo Mnimos cuadrados en dos fases: Opciones

Puede seleccionar las opciones siguientes para su anlisis:


Guardar variables nuevas. Permite aadir nuevas variables al archivo activo. Las opciones disponibles son Pronsticos y Residuos. Mostrar covarianza de parmetros. Permite imprimir la matriz de covarianza de las

estimaciones de los parmetros.

Funciones adicionales del comando 2SLS


El lenguaje de comandos de SPSS tambin permite estimar varias ecuaciones simultneamente.

Apndice

Esquemas de codificacin de variables categricas

En muchos procedimientos de SPSS, se puede solicitar la sustitucin automtica de una variable independiente categrica por un conjunto de variables de contraste, que se podrn introducir o eliminar de una ecuacin como un bloque. Puede especificar cmo se va a codificar el conjunto de variables de contraste, normalmente en el subcomando CONTRAST. Ese apndice explica e ilustra el funcionamiento real de los distintos tipos de contrastes solicitados en CONTRAST.

Desviacin
Desviacin desde la media global. En trminos matriciales, estos contrastes tiene la

forma:
media gl(1) gl(2) . . gl(k1) ( 1/k ( 1/k ( 11/k ( 1/k 1/k 1/k 11/k . . 1/k ... 11/k 1/k ) ... ... ... 1/k 1/k 1/k 1/k ) 1/k ) 1/k )

donde k es el nmero de categoras para la variable independiente y, por defecto, se omite la ltima categora. Por ejemplo, los contrastes de desviacin para una variable independiente con tres categoras son los siguientes:

51

52 Apndice A

( 1/3 ( 2/3 ( 1/3

1/3 1/3 2/3

1/3 ) 1/3 ) 1/3 )

Para omitir una categora distinta de la ltima, especifique el nmero de la categora omitida entre el parntesis que sucede a la palabra clave DEVIATION. Por ejemplo, el siguiente subcomando obtiene las desviaciones para la primera y tercera categoras y omite la segunda:
/CONTRAST(FACTOR)=DEVIATION(2)

Suponga que factor tiene tres categoras. La matriz de contraste resultante ser
( 1/3 ( 2/3 ( 1/3 1/3 1/3 1/3 1/3 ) 1/3 ) 2/3 )

Simple
Contrastes simples. Compara cada nivel de un factor con el ltimo. La forma de la

matriz general es
media gl(1) gl(2) . . gl(k1) (0 ( 1/k (1 (0 1/k 0 1 . . 0 ... 1 1 ) ... ... ... 1/k 0 0 1/k ) 1 ) 1 )

donde k es el nmero de categoras para la variable independiente. Por ejemplo, los contrastes simples para una variable independiente con cuatro categoras son los siguientes:
( 1/4 (1 1/4 0 1/4 0 1/4 ) 1 )

53 Esquemas de codificacin de variables categricas

(0 (0

1 0

0 1

1 ) 1 )

Para utilizar otra categora en lugar de la ltima como categora de referencia, especifique entre parntesis tras la palabra clave SIMPLE el nmero de secuencia de la categora de referencia, que no es necesariamente el valor asociado con dicha categora. Por ejemplo, el siguiente subcomando CONTRAST obtiene una matriz de contraste que omite la segunda categora:
/CONTRAST(FACTOR)=DEVIATION(2)

Suponga que factor tiene cuatro categoras. La matriz de contraste resultante ser
( 1/4 (1 (0 (0 1/4 1 1 1 1/4 0 1 0 1/4 ) 0) 0) 1)

Helmert
Contrastes de Helmert. Compara categoras de una variable independiente con la media de las categoras subsiguientes. La forma de la matriz general es
media gl(1) gl(2) . . gl(k2) gl(k1) (0 (0 ( 1/k (1 (0 1/k 1/(k1) 1 . . 0 0 1 ... 1/2 1 1/2 1 ) ... ... ... 1/k 1/(k1) 1/(k2) 1/k ) 1/(k1) ) 1/(k2) )

donde k es el nmero de categoras de la variable independiente. Por ejemplo, una variable independiente con cuatro categoras tiene una matriz de contraste de Helmert con la siguiente forma:

54 Apndice A

( 1/4 (1 (0 (0

1/4 1/3 1 0

1/4 1/3 1/2 1

1/4 ) 1/3 ) 1/2 ) 1 )

Diferencia
Diferencia o contrastes de Helmert inversos. Compara categoras de una variable

independiente con la media de las categoras anteriores de la variable. La forma de la matriz general es
media gl(1) gl(2) . . gl(k1) ( 1/(k1) ( 1/k ( 1 ( 1/2 1/k 1 1/2 . . 1/(k1) 1/(k1) ... 1) 1/k 0 1 ... ... ... 1/k ) 0) 0)

donde k es el nmero de categoras para la variable independiente. Por ejemplo, los contrastes de diferencia para una variable independiente con cuatro categoras son los siguientes:
( 1/4 ( 1 ( 1/2 ( 1/3 1/4 1 1/2 1/3 1/4 0 1 1/3 1/4 ) 0) 0) 1)

Polinmico
Contrastes polinmicos ortogonales. El primer grado de libertad contiene el efecto

lineal a travs de todas las categoras; el segundo grado de libertad, el efecto cuadrtico, el tercer grado de libertad, el cbico; y as sucesivamente hasta los efectos de orden superior.

55 Esquemas de codificacin de variables categricas

Se puede especificar el espaciado entre niveles del tratamiento medido por la variable categrica dada. Se puede especificar un espaciado igual, que es el valor por defecto si se omite la mtrica, como enteros consecutivos desde 1 hasta k, donde k es el nmero de categoras. Si la variable frmaco tiene tres categoras, el subcomando
/CONTRAST(DRUG)=POLYNOMIAL

es idntico a
/CONTRAST(DRUG)=POLYNOMIAL(1,2,3)

De todas maneras, el espaciado igual no es siempre necesario. Por ejemplo, supongamos que frmaco representa las diferentes dosis de un frmaco administrado a tres grupos. Si la dosis administrada al segundo grupo es el doble que la administrada al primer grupo y la dosis administrada al tercer grupo es el triple que la del primer grupo, las categoras del tratamiento estn espaciadas por igual y una mtrica adecuada para esta situacin se compone de enteros consecutivos:
/CONTRAST(DRUG)=POLYNOMIAL(1,2,3)

No obstante, si la dosis administrada al segundo grupo es cuatro veces la administrada al primer grupo, y la dosis del tercer grupo es siete veces la del primer grupo, una mtrica adecuada sera
/CONTRAST(DRUG)=POLYNOMIAL(1,4,7)

En cualquier caso, el resultado de la especificacin de contrastes es que el primer grado de libertad para frmaco contiene el efecto lineal de los niveles de dosificacin y el segundo grado de libertad contiene el efecto cuadrtico. Los contrastes polinmicos son especialmente tiles en contrastes de tendencias y para investigar la naturaleza de superficies de respuestas. Tambin se pueden utilizar contrastes polinmicos para realizar ajustes de curvas no lineales, como una regresin curvilnea.

Repetido
Compara niveles adyacentes de una variable independiente. La forma de la matriz

general es

56 Apndice A

media gl(1) gl(2) . . gl(k1)

( 1/k (1 (0

1/k 1 1 . . 0

1/k 0 1

... ... ...

1/k 0 0

1/k ) 0) 0)

(0

...

1 )

donde k es el nmero de categoras para la variable independiente. Por ejemplo, los contrastes repetidos para una variable independiente con cuatro categoras son los siguientes:
( 1/4 (1 (0 (0 1/4 1 1 0 1/4 0 1 1 1/4 ) 0) 0) 1 )

Estos contrastes son tiles en el anlisis de perfiles y siempre que sean necesarias puntuaciones de diferencia.

Especial
Un contraste definido por el usuario. Permite la introduccin de contrastes especiales

en forma de matrices cuadradas con tantas filas y columnas como categoras haya de la variable independiente. Para MANOVA y LOGLINEAR, la primera fila introducida es siempre el efecto promedio, o constante, y representa el conjunto de ponderaciones que indican cmo promediar las dems variables independientes, si las hay, sobre la variable dada. Generalmente, este contraste es un vector de contrastes. Las restantes filas de la matriz contienen los contrastes especiales que indican las comparaciones deseadas entre categoras de la variable. Normalmente, los contrastes ortogonales son los ms tiles. Este tipo de contrastes son estadsticamente independientes y son no redundantes. Los contrastes son ortogonales si:
! !

Para cada fila, la suma de los coeficientes de contrastes es igual a cero. Los productos de los correspondientes coeficientes para todos los pares de filas disjuntas tambin suman cero.

57 Esquemas de codificacin de variables categricas

Por ejemplo, supongamos que el tratamiento tiene cuatro niveles y que deseamos comparar los diversos niveles del tratamiento entre s. Un contraste especial adecuado sera
(1 (3 (0 (0 1 1 2 0 1 1 1 1 1) 1 ) 1 ) 1 ) ponderaciones para el clculo de la media compare 1 con 2 hasta 4 compare 2 con 3 y 4 compare 3 con 4

todo lo cual se especifica mediante el siguiente subcomando CONTRAST para MANOVA, LOGISTICREGRESSION y COXREG:
/CONTRAST(TREATMNT)=SPECIAL( 1 1 1 1 3 -1 -1 -1 0 2 -1 -1 0 0 1 -1 )

Para LOGLINEAR, es necesario especificar:


/CONTRAST(TREATMNT)=BASIS SPECIAL( 1 1 1 1 3 -1 -1 -1 0 2 -1 -1 0 0 1 -1 )

Cada fila, excepto la fila de las medias suman cero. Los productos de cada par de filas disjuntas tambin suman cero:
Filas 2 y 3: Filas 2 y 4: Filas 3 y 4: (3)(0) + (1)(2) + (1)(1) + (1)(1) = 0 (3)(0) + (1)(0) + (1)(1) + (1)(1) = 0 (0)(0) + (2)(0) + (1)(1) + (1)(1) = 0

No es necesario que los contrastes especiales sean ortogonales. No obstante, no deben ser combinaciones lineales de unos con otros. Si lo son, el procedimiento informar de la dependencia lineal y detendr el procesamiento. Los contrastes de Helmert, de diferencia y polinmicos son todos contrastes ortogonales.

58 Apndice A

Indicador
Codificacin de la variable indicadora. Tambin conocida como variable auxiliara o dummy, no est disponible en LOGLINEAR ni MANOVA. El nmero de variables nuevas codificadas es k1. Los casos que pertenezcan a la categora de referencia se codificarn como 0 para las kvariables 1. Un caso en la categora isima se codificar como 0 para todas las variables indicadoras excepto la isima, que se codificar como 1.

ndice
Anlisis probit, 25 consideraciones sobre los datos, 26 criterios, 28 definicin de rango, 28 ejemplo, 25 estadsticos, 25, 28 funciones adicionales del comando, 30 intervalos de confianza fiduciaria, 28 iteraciones, 28 potencia relativa de la mediana, 28 procedimientos relacionados, 26 prueba de paralelismo, 28 supuestos, 26 tasa de respuesta natural, 28 bondad de ajuste, 18 en Regresin logstica multinomial, 18 casillas con 0 observaciones, 20 en Regresin logstica multinomial, 20 categora de referencia en Regresin logstica multinomial, 17 chi-cuadrado de Pearson, 18, 21 bondad de ajuste, 18 estimacin del valor del escalamiento para la dispersin, 21 clasificacin, 13 en Regresin logstica multinomial, 13 contrastes, 8 en Regresin logstica, 8 covariables en Regresin logstica, 8 covariables categricas, 8 covariables de cadena, 8 en Regresin logstica, 8 criterio de convergencia, 20 en Regresin logstica multinomial, 20 D de Cook, 9 en Regresin logstica, 9 delta, 20 correccin para casillas con 0 observaciones, 20 DfBeta, 9 en Regresin logstica, 9 eliminacin hacia atrs, 6 en Regresin logstica, 6 estadstico de bondad de ajuste de Hosmer-Lemeshow, 11 en Regresin logstica, 11 estimaciones de los parmetros, 18 en Regresin logstica multinomial, 18 Estimacin ponderada, 43 almacenamiento de la mejor ponderacin como una variable nueva, 46 consideraciones sobre los datos, 44 ejemplo, 43 estadsticos, 43 funciones adicionales del comando, 46 historial de iteraciones, 46 log de la verosimilitud, 43 mostrar ANOVA y estimaciones, 46 procedimientos relacionados, 44 supuestos, 44 funcin de desviacin, 21 estimacin del valor del escalamiento para la dispersin, 21 historial de iteraciones, 20 en Regresin logstica multinomial, 20 interseccin, 15 incluir o excluir, 15 intervalos de confianza, 18 en Regresin logstica multinomial, 18 intervalos de confianza fiduciaria, 28 en el anlisis probit, 28 iteraciones, 11, 20, 28 en el anlisis probit, 28 en Regresin logstica, 11 en Regresin logstica multinomial, 20 ley de Metcherlich de devoluciones decrecientes, 35 en Regresin no lineal, 35 log de la verosimilitud, 18, 43 en Estimacin ponderada, 43 en Regresin logstica multinomial, 18 matriz de correlaciones, 18 en Regresin logstica multinomial, 18
59

60 ndice

matriz de covarianzas, 18 en Regresin logstica multinomial, 18 modelo de densidad, 35 en Regresin no lineal, 35 modelo de densidad de rendimiento, 35 en Regresin no lineal, 35 modelo de Gauss, 35 en Regresin no lineal, 35 modelo de Gompertz, 35 en Regresin no lineal, 35 modelo de Johnson-Schumacher, 35 en Regresin no lineal, 35 modelo de Michaelis Menten, 35 en Regresin no lineal, 35 modelo de Morgan-Mercer-Florin, 35 en Regresin no lineal, 35 modelo de Peal-Reed, 35 en Regresin no lineal, 35 modelo de razn de cuadrticas, 35 en Regresin no lineal, 35 modelo de razn de cbicas, 35 en Regresin no lineal, 35 modelo de Richards, 35 en Regresin no lineal, 35 modelo de Verhulst, 35 en Regresin no lineal, 35 modelo de Von Bertalanffy, 35 en Regresin no lineal, 35 modelo de Weibull, 35 en Regresin no lineal, 35 modelo log-modificado, 35 en Regresin no lineal, 35 modelos de efectos principales, 15 en Regresin logstica multinomial, 15 modelos factoriales completos, 15 en Regresin logstica multinomial, 15 modelos no lineales, 35 en Regresin no lineal, 35 modelos personalizados, 15 en Regresin logstica multinomial, 15 potencia relativa de la mediana, 28 en el anlisis probit, 28 prueba de paralelismo, 28 en el anlisis probit, 28

razn de verosimilitud, 18, 21 bondad de ajuste, 18 estimacin del valor del escalamiento para la dispersin, 21 R-cuadrado de Cox y Snell, 18 en Regresin logstica multinomial, 18 R cuadrado de McFadden, 18 en Regresin logstica multinomial, 18 R-cuadrado de Nagelkerke, 18 en Regresin logstica multinomial, 18 regresin asinttica, 35 en Regresin no lineal, 35 Regresin lineal, 43, 47 estimacin ponderada, 43 Regresin por mnimos cuadrados en dos fases, 47 regresin logstica, 1 binaria, 1 Regresin logstica, 3 , 6 almacenamiento de nuevas variables, 9 coeficientes, 3 consideraciones sobre los datos, 4 contrastes, 8 covariables categricas, 8 covariables de cadena, 8 definicin de la regla de seleccin, 6 ejemplo, 3 establecimiento de reglas, 6 estadstico de bondad de ajuste de Hosmer-Lemeshow, 11 estadsticos, 3 estadsticos y grficos, 11 funciones adicionales del comando, 12 iteraciones, 11 medidas de influencia, 9 mtodos de seleccin de variables, 6 opciones de presentacin, 11 probabilidad para el mtodo por pasos, 11 procedimientos relacionados, 4 punto de corte para la clasificacin, 11 residuos, 9 supuestos, 4 trmino constante, 11 valores pronosticados, 9 variable dependiente, 4 regresin logstica binaria, 1

61 ndice

Regresin logstica multinomial, 13, 14, 15, 18, 20, 23, 24 categora de referencia, 17 criterios, 20 estadsticos, 18 exportacin de informacin del modelo, 23 funciones adicionales del comando, 24 guardar, 23 modelos, 15 supuestos, 14 Regresin no lineal, 31, 35 algoritmo de Levenberg-Marquardt, 40 almacenamiento de variables nuevas, 39 consideraciones sobre los datos, 32 derivadas, 39 ejemplo, 31 estadsticos, 31 estimaciones bootstrap, 40 funcin de prdida, 37 funciones adicionales del comando, 42 interpretacin de resultados, 41 lgica condicional, 33 mtodos de estimacin, 40 modelo segmentado, 33 modelos no lineales comunes, 35 parmetros, 34 procedimientos relacionados, 32 programacin cuadrtica secuencial, 40 residuos, 39 restricciones para los parmetros, 38 supuestos, 32 valores iniciales, 32, 34 valores pronosticados, 39 Regresin por mnimos cuadrados en dos fases, 47, 48, 50, 50 almacenamiento de nuevas variables, 50 consideraciones sobre los datos, 48

covarianzas de los parmetros, 50 ejemplo, 47 estadsticos, 47 funciones adicionales del comando, 50 procedimientos relacionados, 48 supuestos, 48 variables instrumentales, 47 regresin restringida en Regresin no lineal, 38 restricciones para los parmetros en Regresin no lineal, 38 seleccin hacia delante, 6 en Regresin logstica, 6 seleccin por pasos, 6 , 15 en Regresin logstica, 6 en Regresin logstica multinomial, 15 separacin, 20 en Regresin logstica multinomial, 20 singularidad, 20 en Regresin logstica multinomial, 20 subdivisin por pasos, 20 en Regresin logstica multinomial, 20 tablas de clasificacin, 18 en Regresin logstica multinomial, 18 tablas de probabilidades de casilla, 18 en Regresin logstica multinomial, 18 trmino constante, 11 en Regresin lineal, 11 valor del escalamiento para la dispersin, 21 en Regresin logstica multinomial, 21 valores de influencia, 9 en Regresin logstica, 9

Anda mungkin juga menyukai