Anda di halaman 1dari 20

Anlisis de datos con SPSS 10 Mara Dolores Paz Caballero

Tema 10: ANLISIS MULTIVARIADO DE LA VARIANZA (MANOVA) Y


ANLISIS DISCRIMINANTE

Cuando interese comparar dos o ms grupos en un conjunto de variables


cuantitativas podemos utilizar una de estas tcnicas multivariadas:

- El Anlisis multivariado de la varianza (MANOVA) de un factor.


- El Anlisis discriminante.

Las dos tcnicas son muy similares en el sentido de que las dos analizan las relaciones
entre una variable categrica y un conjunto de variables cuantitativas. La diferencia entre
ellas se da en el sentido en que establecen esa relacin:

- En el MANOVA se analiza el efecto de la variable categrica sobre el conjunto de


variables cuantitativas.
- En el AD, sin embargo, las variables cuantitativas son las independientes o
predictoras y la categrica es el criterio o la variable dependiente que se intenta
predecir.

Por ejemplo, si queremos ver si fumadores y no fumadores varan en una serie de variable
(que pueden entenderse como consecuencia del tabaco) tendremos que utilizar un
MANOVA. Si, por el contrario, queremos ver qu variables predicen la conducta de fumar,
la tcnica estadstica apropiada es el AD. Hay que aclarar, sin embargo, que la diferencia
entre ambos casos, as como en los resultados que nos den las dos tcnicas, es ms
conceptual que estadstica.

MANOVA AD

Variable categrica Variable categrica

Variables cuantitativas Variables cuantitativas

10.1. Anlisis multivariado de la varianza (MANOVA)

El anlisis multivariado de la varianza (MANOVA) es una tcnica de anlisis


multivariado que analiza el efecto de una o ms variables independientes, que pueden ser
inter o intra, sobre dos o ms variables dependientes. Existen tantos tipos de MANOVA
como de ANOVA, as, podemos hablar de MANOVA con factores inter, intra o mixtos. En

Anlisis Multivariado 262


Anlisis de datos con SPSS 10 Mara Dolores Paz Caballero

este captulo, sin embargo, vamos a referirnos al caso ms frecuente: al MANOVA con un
factor inter. El caso de dos o ms factores inter es slo una generalizacin del anterior,
mientras que el MANOVA con variables intra es de mucho menos frecuente aplicacin.
La nica diferencia entre el ANOVA y el MANOVA es que la segunda tcnica
considera ms de una variable dependiente. Por ejemplo, si queremos estudiar el efecto
del mtodo de aprendizaje en la nota de una asignatura, aplicamos un ANOVA. Si nos
interesa estudiar ese efecto en las notas de cada una de las asignaturas de un curso,
aplicaramos el MANOVA.

Existen razones estadsticas para preferir el MANOVA a los ANOVAs individuales


cuando las variables dependientes tienen sentido como grupo, es decir, cuando miden
distintos aspectos de un mismo fenmeno. En el ejemplo que acabamos de poner,
podramos plantearnos realizar un ANOVA para cada asignatura o un MANOVA para el
conjunto de las mismas. La segunda solucin es la correcta por las razones que pasamos a
exponer:

La primera de ellas es que el MANOVA tiene en cuenta el aumento de error tipo


I que se produce al realizar mltiples ANOVAs. Supongamos, por ejemplo, que
queremos comparar dos grupos (cada uno asignado a un mtodo distinto de
aprendizaje) en 5 variables (la nota de 5 asignaturas) y realizamos 5 ANOVAs (o
5 pruebas t). Supongamos tambin que una de las diferencias lleva asociada una
p=0.02. Si nosotros damos esta diferencia como significativa, la probabilidad de
equivocarnos al hacerlo no sera 0.02 ; puesto que estamos realizando 5
comparaciones podra llegar a ser 0.10. El MANOVA, por el contrario,
nicamente realizara una comparacin referida a la combinacin de las 5
variables dependientes y slo si la diferencia entre los grupos en esta
combinacin de variables resulta significativa tendra sentido realizar los
ANOVAs individuales para determinar a qu variables concretamente puede
deberse la diferencia. Si el MANOVA no ofreciera resultados significativos no
estara justificado considerar individualmente las variables y dar una diferencia
como significativa.
La segunda razn se refiere justamente al caso opuesto : podra ocurrir que el
MANOVA reflejara diferencias significativas entre los grupos o entre los
tratamientos mientras que los ANOVAs no fueran significativos para ninguna de
las variables dependientes. Es decir, pequeas diferencias en varias variables
pueden combinarse para dar lugar a una diferencia fiable entre los grupos. En
este caso, el MANOVA tendra mayor potencia de prueba que los ANOVAs.

10.1.1. Supuestos paramtricos que exige la aplicacin del MANOVA de un factor

Adems del supuesto de asignacin aleatoria de sujetos a grupos y de distribucin


normal de las variables dependientes, la aplicacin del MANOVA exige que las varianzas
de los grupos sean iguales para cada una de las variables dependientes (homoscedasticidad

Anlisis Multivariado 263


Anlisis de datos con SPSS 10 Mara Dolores Paz Caballero

univariable) y que la matriz de varianzas covarianzas entre variables dependientes no


vare de un grupo a otro (homoscedasticidad multivariable).
La homoscedasticidad univariable se evala con la prueba de Levene, mientras que
para evaluar la homoscedasticidad multivariable se utiliza la prueba de Box. Como en el
caso del ANOVA, el supuesto de homoscedasticidad no tiene tanta importancia si los
grupos son del mismo tamao. Lo que s conviene comprobar, sin embargo, es si la no
igualdad de varianzas se debe a la presencia de casos extremos.

10.1.2. Un ejemplo de aplicacin del MANOVA

Supongamos que queremos ver la influencia de un determinado frmaco


psicoestimulante sobre algunas variables de tipo sensorial, perceptivo y cognitivo,
concretamente sobre:

- Agudeza visual
- Discriminacin
- Rendimiento en una situacin de doble tarea
- Flexibilidad de la atencin

Para ello contamos con una muestra de 45 sujetos, que son divididos
aleatoriamente en 3 grupos de 15 sujetos cada uno:
- Grupo control
- Administracin de 10 mg de la sustancia (frmaco10)
- Administracin de 20 mg de la sustancia (frmaco20)

Puesto que tenemos una variable independiente (dosis de psicoestimulante) y 4


variables dependientes, la tcnica adecuada es el MANOVA. Los pasos para aplicarlo son
los siguientes :

En la opcin Modelo lineal General elegimos Multivariante.

Anlisis Multivariado 264


Anlisis de datos con SPSS 10 Mara Dolores Paz Caballero

Especificamos las variables dependientes y el factor.

En Opciones pedimos descriptivos y pruebas de homogeneidad.

Anlisis Multivariado 265


Anlisis de datos con SPSS 10 Mara Dolores Paz Caballero

Pedimos algn contraste para comparar los grupos. Podemos elegir entre varios:
- Si nos interesa ver cmo cambia el efecto al aumentar la dosis ( de 0 a 20 mg)
pedimos el contraste Repetido.
- El contraste Simple nos comparara cada dosis con el grupo control.
- El contraste Ortogonal (polinmico) nos indicara si al ir aumentando la dosis mejora
linealmente la puntuacin en las variables dependientes o si, por el contrario, la
tendencia es curvilnea (por encima de una dosis el efecto es perjudicial)

Elegir uno u otro depende de la hiptesis que queramos comprobar. Supongamos que, en
este caso, lo que nos interesa es comprobar que basta con una dosis mnima de la
sustancia y que aumentos de la misma no produciran ningn efecto. Qu contraste
elegimos? Podra ser el repetido. As, esperaramos que hubiera diferencias entre
control y 10 mg y que no las hubiera ya entre 10 y 20 mg.

Por ltimo, podemos pedir un grfico de medias.

Anlisis Multivariado 266


Anlisis de datos con SPSS 10 Mara Dolores Paz Caballero

Los RESULTADOS son los siguientes:

Factores inter-sujetos

Etiqueta del
valor N
GRUPO 1,00 Control 15
2,00 frmaco10 15
3,00 frmaco20 15

Prueba de Box sobre la igualdad


a
de las matrices de covarianza
M de Box 26,262
F 1,130
gl1 20
gl2 6331,980
Significacin ,310
Contrasta la hiptesis nula de que las matrices
de covarianza observadas de las variables
dependientes son iguales en todos los grupos.
a. Diseo: Intercept+GRUPO

Por el resultado de la prueba de Box vemos que se cumple el supuesto de


homoscedasticidad multivariable.

La tabla siguiente (Resultados del contraste multivariado) pone a prueba las


diferencias producidas por el factor inter (dosis de psicoestimulante) en todas las
variables dependientes tomadas en conjunto. Para ello se realizan distintos contrastes :
Traza de Pillai, Lambda de Wilks, Traza de Hotelling y Raz mayor de Roy. Aunque el valor
que se utiliza con mayor frecuencia es el de la Lambda de Wilks, algunos autores
recomiendan considerar el resultado de la Traza de Pillai , que es el que tiene mayor
robustez (es decir, es menos sensible que los otros contrastes al incumplimiento de los
supuestos paramtricos). Si utilizamos el criterio ms habitual, diremos que la dosis de
psicoestimulante produce diferencias en el conjunto de variables dependientes (F8,78=
2.269, p= 0.031). En caso de que los contrastes multivariados no fueran significativos, aqu
acabara el anlisis.

Anlisis Multivariado 267


Anlisis de datos con SPSS 10 Mara Dolores Paz Caballero

Resultados del contraste multivariado

Gl de la
Valor F hiptesis Gl del error Significacin
Traza de Pillai ,351 2,131 8,000 80,000 ,042
Lambda de Wilks ,658 2,269a 8,000 78,000 ,031
Traza de Hotelling ,505 2,401 8,000 76,000 ,023
Raz mayor de Roy ,475 4,754b 4,000 40,000 ,003
a. Estadstico exacto
b. El estadstico es un lmite superior para la F el cual ofrece un lmite inferior para
el nivel de significacin.

A continuacin, y puesto que el MANOVA ha puesto de manifiesto un efecto


significativo del factor inter, se pasa a considerar los resultados de los ANOVAs
individuales (uno para cada una de las variables dependientes).
- Empezamos viendo los resultados de las pruebas de Levene, para ver si se cumple
o no la homoscedasticidad univariada. Vemos que se cumple en todos los casos menos para
la variable "Agudeza visual".

a
Contraste de Levene sobre la igualdad de las varianzas error

F gl1 gl2 Significacin


Agudeza visual 3,696 2 42 ,033
Discriminacin ,282 2 42 ,756
Rendimiento en una
,453 2 42 ,639
situacin de doble tarea
Flexibilidad de la atencin ,394 2 42 ,677
Contrasta la hiptesis nula de que la varianza error de la variable dependiente es
igual a lo largo de todos los grupos.
a. Diseo: Intercept+GRUPO

A continuacin se dan los resultados de los ANOVAs univariados. Podemos observar que la
dosis de psicoestimulante solamente produce efectos significativos en la discriminacin
(F2,42= 9.602, p<0.001).
Resultados de la pruebas univariadas

Suma de Media
Fuente Variable dependiente cuadrados gl cuadrtica F Significacin
Contraste Agudeza visual 6,488 2 3,244 2,750 ,075
Discriminacin 459,511 2 229,756 9,602 ,000
Rendimiento en una
1,225 2 ,613 2,411 ,102
situacin de doble tarea
Flexibilidad de la atencin 80,915 2 40,458 ,603 ,552
Error Agudeza visual 49,536 42 1,179
Discriminacin 1004,933 42 23,927
Rendimiento en una
10,675 42 ,254
situacin de doble tarea
Flexibilidad de la atencin 2818,057 42 67,097

Anlisis Multivariado 268


Anlisis de datos con SPSS 10 Mara Dolores Paz Caballero

Veamos en la tabla siguiente, donde se dan los resultados del contraste repetido,
entre qu niveles del factor dosis se dan diferencias en discriminacin.

Resultados del contraste (matriz K)

Variable dependiente
Rendimie
nto en una
situacin Flexibilid
Contraste Agudeza Discrimi de doble ad de la
repetido GRUPO visual nacin tarea atencin
Nivel 1 - Nivel 2 Estimacin del contraste
-,145 -,467 -6,667E-03 -3,133

Valor hipotetizado
0 0 0 0

Diferencia (Estimado - Hipotetizado)


-,145 -,467 -6,667E-03 -3,133

Error tp. ,397 1,786 ,184 2,991


Significacin ,717 ,795 ,971 ,301
Intervalo de confianza al Lmite inferior -,945 -4,071 -,378 -9,169
95 % para diferencia Lmite superior ,656 3,138 ,365 2,903
Nivel 2 - Nivel 3 Estimacin del contraste
,868 7,000 ,353 2,420

Valor hipotetizado
0 0 0 0

Diferencia (Estimado - Hipotetizado)


,868 7,000 ,353 2,420

Error tp. ,397 1,786 ,184 2,991


Significacin ,034 ,000 ,062 ,423
Intervalo de confianza al Lmite inferior 6,8E-02 3,395 -1,817E-02 -3,616
95 % para diferencia Lmite superior 1,668 10,605 ,725 8,456

Podemos ver que las diferencias en discriminacin slo se dan entre los niveles 2 y
3 del factor dosis. Por el grfico de medias, vemos que la discriminacin no mejora del
grupo control al grupo que recibe una dosis de 10 mg. An ms, el grupo que recibe una
dosis de 20 mg tiene una discriminacin significativamente peor que el control. As,
podramos concluir que el psicoestimulante que estamos probando, no slo no mejora la
capacidad perceptiva y cognitiva de los sujetos sino que, en dosis de 20 mg lo perjudica.

Anlisis Multivariado 269


Anlisis de datos con SPSS 10 Mara Dolores Paz Caballero

Medias marginales estimadas de Discriminacin


44

42

Medias marginales estimadas


40

38

36
Control frmaco10 frmaco20

GRUPO

Como antes se indic, si los resultados de los contrastes multivariados no fueran


significativos no estara justificado realizar ANOVAs individuales, mejor dicho,
considerar los resultados de stos, pues el SPSS los realiza siempre, por defecto, al pedir
el MANOVA.
Finalmente, hay que tener en cuenta que podra darse el caso de que los contrastes
multivariados fueran significativos y no lo fuera ninguna de las F de los ANOVAs
individuales. En esta situacin, habra que concluir que el efecto del factor se da en el
conjunto de variables dependientes, aunque no al considerarlas por separado.

10.2. Anlisis Discriminante

El anlisis discriminante (AD) es una tcnica de anlisis multivariado que se utiliza


para distinguir entre dos o ms grupos a partir de una serie de variables, denominadas
variables discriminantes. El AD, al igual que la regresin mltiple, se puede aplicar con dos
objetivos:

Determinar cual es la combinacin de variables que discrimina de forma ptima entre


los grupos. Esta combinacin es la denominada funcin discriminante y es equivalente
a la ecuacin de regresin mltiple. En caso de dos grupos slo se obtendra una funcin
discriminante, en caso de ms de dos grupos el nmero de funciones que podemos
obtener es el mnimo de estos dos valores : n de grupos menos uno o n de variables. A
partir de la funcin discriminante podemos determinar qu porcentaje de las
diferencias entre los grupos est asociado a diferencias en las variables discriminantes
y cul es la importancia relativa de cada una de ellas para discriminar entre los grupos.

Asignar cualquier sujeto de la poblacin a uno de los grupos. Del mismo modo que la
ecuacin de regresin se utiliza para predecir las puntuaciones en un criterio continuo,
el AD proporciona la ecuacin (o ecuaciones ) que permiten predecir la pertenencia de
cualquier sujeto de la poblacin a uno de los grupos.

Anlisis Multivariado 270


Anlisis de datos con SPSS 10 Mara Dolores Paz Caballero

10.2.1. Condiciones necesarias para poder aplicar la tcnica

En lo que respecta al tamao de la muestra, se recomienda, como en la mayora de


las tcnicas multivariadas consideradas hasta aqu, que el nmero de sujetos no sea menor
que el nmero de variables multiplicado por 10.
Adems, el AD, como tcnica paramtrica que es, exige para su aplicacin el
cumplimiento de una serie de supuestos paramtricos. Concretamente se requiere: 1) que
las variables discriminantes tengan una distribucin normal en la poblacin y 2) que la
matriz de varianzas covarianzas entre las variables discriminantes sea igual en los grupos
comparados (homocedasticidad multivariable). Para que se cumplan estas dos condiciones
es necesario (aunque no suficiente) que las variables discriminantes estn medidas al
menos a nivel de intervalo, en otro caso habra que utilizar la regresin logstica. El AD,
sin embargo, es bastante robusto a ligeras violaciones de la homoscedasticidad, sobre
todo si el tamao muestral es grande y los grupos son aproximadamente del mismo tamao.
Tampoco es demasiado sensible a violaciones de la normalidad, sobre todo cuando stas se
deben a la asimetra de la distribucin y no a la presencia de outliers.

10.2.2. Pasos en la aplicacin del anlisis discriminante

Vamos a describir las distintas etapas en la realizacin de un anlisis discriminante


a partir del ejemplo incluido en el archivo discri.sav.
Lo que nos planteamos es determinar las variables que influyen en que los sujetos
tengan mayor o menor facilidad para encontrar trabajo cuando terminan la carrera de
Psicologa. Para alcanzar este objetivo hemos seleccionado aleatoriamente, de la poblacin
que termin sus estudios en el curso 98-99, dos muestras de sujetos: 15 sujetos en activo
(grupo 1) y 15 en paro (grupo 2).
Una vez planteado el objetivo del anlisis y seleccionada la muestra, el siguiente
paso es determinar cules van a ser las variables discriminantes. La eleccin de stas se
hace a partir de la teora en la que se enmarca la investigacin o, en su ausencia, a partir
de las hiptesis formuladas por el investigador. En nuestro caso hemos pensado que el
expediente acadmico, la inteligencia general y las habilidades sociales son variables que
pueden influir a la hora de encontrar colocacin. Adems, al tener 30 sujetos, se cumple la
razn 10 sujetos por variable.

Para comprobar si existen outliers en alguno de los grupos para cualquiera de las
variables pedimos grficos de cajas.

Anlisis Multivariado 271


Anlisis de datos con SPSS 10 Mara Dolores Paz Caballero

EXPEDIEN
3,5

3,0

2,5

2,0

EXPEDIEN 1,5

1,0

,5
N= 15 15

1,00 2,00

GRUPO

HABILSOC
28

26

24

22

20

18

16
HABILSOC

14

12
N= 15 15

1,00 2,00

GRUPO

INTELIG
50

40

30

20
INTELIG

10
N= 15 15

1,00 2,00

GRUPO

A continuacin, pedimos el anlisis discriminante que se encuentra dentro de las


tcnicas de clasificacin.

Anlisis Multivariado 272


Anlisis de datos con SPSS 10 Mara Dolores Paz Caballero

Especificamos la variable de agrupacin (grupo) y las variables discriminantes. Por


defecto el AD introduce todas las variables discriminantes en la funcin. Sin embargo,
igual que en la regresin mltiple, conviene utilizar algn mtodo que seleccione las
variables, de forma que aqullas que no hagan contribuciones significativas a la
discriminacin de los grupos no entren en la funcin. Para ello elegimos el mtodo inclusin
por pasos .

En Estadsticos conviene pedir medias de los grupos, ANOVAS univariados y M


de Box. Si la probabilidad asociada a esta ltima es menor que 0.05 tendramos que
plantearnos si continuar o no con el AD puesto que no se cumplira el supuesto de igualdad
de matrices de varianzas-covarianzas. En esta opcin se pueden pedir tambin los

Anlisis Multivariado 273


Anlisis de datos con SPSS 10 Mara Dolores Paz Caballero

coeficientes de Fisher. Estos coeficientes son especialmente importantes si utilizamos


el AD con fines de clasificacin, puesto que pueden usarse para asignar cualquier sujeto
de la poblacin a uno de los grupos.

La opcin Clasificar nos permite determinar las probabilidades a priori de


pertenencia a los grupos. Por defecto, la probabilidad asignada en caso de dos grupos es
0,5 (en caso de k grupos sera 1/k), pero podemos elegir la opcin de calcular la
probabilidad segn el tamao de los grupos en el caso de conocer las probabilidades
poblacionales y haber seleccionado la muestra en funcin de las mismas. Tambin aqu
podemos pedir que nos muestre la tabla resumen (matriz de clasificacin).

El SPSS ofrece, en primer lugar, las medias y desviaciones tpicas de cada uno de
los grupos en cada variable. Como podemos observar, los sujetos del grupo 1 (en activo)
tienen puntuaciones ms altas en las tres variables consideradas.

Anlisis Multivariado 274


Anlisis de datos con SPSS 10 Mara Dolores Paz Caballero

Estadsticos del grupo


N vlido (segn lista)
No
VAR00004 Media Desv. tp. ponderados Ponderados
1,00 EXPEDIEN 2,4667 ,5802 15 15,000
HABILSOC 22,0667 3,6736 15 15,000
INTELIG 33,3333 3,9940 15 15,000
2,00 EXPEDIEN 1,6733 ,6386 15 15,000
HABILSOC 19,0667 4,4636 15 15,000
INTELIG 28,6000 4,0497 15 15,000
Total EXPEDIEN 2,0700 ,7226 30 30,000
HABILSOC 20,5667 4,2966 30 30,000
INTELIG 30,9667 4,6274 30 30,000

A continuacin, en la tabla "Pruebas de igualdad de las medias de los grupos", se


ofrece la F del ANOVA (con 2 grupos el valor de F es el cuadrado de la t de Student) para
ver si dichas diferencias son o no significativas. Se comprueba que lo son en dos variables,
expediente e inteligencia general. Tambin se da el valor de la lambda de Wilks, que
se calcula a partir del valor de la F con la siguiente frmula :

Lambda = c / (c+F)

donde
c = (n-k) / (k-1)
siendo n el nmero total de sujetos y k el nmero de grupos.

El valor de lambda puede oscilar entre 0 y 1, cuanto menor sea lambda mayores son las
diferencias entre los grupos.

Pruebas de igualdad de las medias de los grupos


Lambda
de Wilks F gl1 gl2 Sig.
EXPEDIEN ,688 12,681 1 28 ,001
HABILSOC ,874 4,040 1 28 ,054
INTELIG ,729 10,388 1 28 ,003

Seguidamente se dan los resultados de la prueba de Box para someter a prueba la


Ho de igualdad de las matrices de varianzas-covarianzas obtenidas en ambos grupos. Como
la probabilidad asociada a dicho estadstico es superior a 0.05 aceptamos dicha hiptesis.

Anlisis Multivariado 275


Anlisis de datos con SPSS 10 Mara Dolores Paz Caballero

Resultados de la prueba de Box

M de Box 3,004
F Aprox. ,924
gl1 3
gl2 141120,0
Sig. ,428
Contrasta la hiptesis nula de que
las matrices de covarianza
poblacionales son iguales.

Comienza ahora lo que es el anlisis discriminante propiamente dicho. La tabla Variables


introducidas/eliminadas nos informa de qu variables han entrado en la funcin
discriminante (recurdese que se utiliz un procedimiento de seleccin) y en qu orden lo
han hecho.
Paso 1- En un primer paso se introduce en la funcin discriminante la variable que ms
contribuye a diferenciar entre los grupos : el expediente. Se dan, para dicha variable, los
valores de la lambda de Wilks y de la F del ANOVA, as como la significacin estadstica
de esta ltima.
Paso 2- En un segundo paso se introduce la variable Habilidades sociales. Los valores de
lambda y F se obtienen ahora tras la aplicacin de un MANOVA que compara los grupos en
las dos variables. Puede observarse que el valor de lambda disminuye (de .688 a .386), lo
que quiere decir que aumentan las diferencias entre los grupos.

a,b,c,d
Variables introducidas/eliminadas
Lambda de Wilks
F exacta
Paso Introducidas Estadstico gl1 gl2 gl3 Estadstico gl1 gl2 Sig.
1 EXPEDIEN ,688 1 1 28,000 12,681 1 28,000 ,001
2 HABILSOC ,386 2 1 28,000 21,512 2 27,000 ,000
En cada paso se introduce la variable que minimiza la lambda de Wilks global.
a. El nmero mximo de pasos es 6.
b. La F parcial mnima para entrar es 3.84.
c. Maximum partial F to remove is 2.71.
d. El nivel de F, la tolerancia o el VIN son insuficientes para continuar los clculos.

A continuacin, en la tabla Variables en el anlisis, se da el valor F correspondiente


a cada variable si se eliminara de la misma lo que tiene en comn con las otras variables
incluidas en la funcin discriminante (F que eliminar). As, por ejemplo, 34.195 es la F que
se obtiene al comparar las medias de los dos grupos en la variable Expediente, eliminando,
mediante Anlisis de Covarianza (ANCOVA) lo que tiene en comn el expediente con las
Habilidades sociales. Si alguna de estas F fuera menor que 2,71 (que es el criterio que
utiliza por defecto el SPSS), la variable se eliminara de la funcin discriminante.

Anlisis Multivariado 276


Anlisis de datos con SPSS 10 Mara Dolores Paz Caballero

Variables en el anlisis
F que Lambda
Paso Tolerancia eliminar de Wilks
1 EXPEDIEN 1,000 12,681
2 EXPEDIEN ,582 34,195 ,874
HABILSOC ,582 21,196 ,688

En la siguiente tabla, Variables no incluidas en el anlisis, se da un resumen de los


pasos seguidos en el anlisis.
- En el paso 0 se muestran los estadsticos univariados (F de los ANOVAS) para las
tres variables, as como el correspondiente valor de lambda. Puesto que la lambda
menor es la correspondiente a la variable Expediente (y la F es mayor que 3,84)
sta es la primera variable incluida en la funcin.
- As pues, en el primer paso del anlisis, las variables no incluidas son Habilidades
sociales e Inteligencia. Los valores de F y lambda corresponden ahora a los que se
obtendran si de cada variable se eliminara, mediante el ANCOVA, lo que tiene en
comn con el Expediente. Puede observarse que el valor de lambda es menor para la
variable Habilidades sociales, a pesar de que las diferencias entre los grupos en
dicha variable eran menores que las que se daban en Inteligencia.
- Teniendo en cuenta que el menor valor lambda era el correspondiente a las
Habilidades sociales, en el paso 2 del anlisis quedan incluidas en la funcin
discriminante las variables Expediente y Habilidades sociales. Para la variable no
incluida (Inteligencia) se dan los valores F y lambda resultantes del ANCOVA, que
en este caso toma como covariables (variables cuya influencia eliminar) las dos ya
incluidas en la funcin. Puesto que la F es menor que 3,84 (lmite considerado para
incluir una variable en la funcin), se da por terminado el AD.

Otra informacin que nos da esta tabla son los valores de tolerancia para cada
variable. La tolerancia, como ya se vio en el anlisis de regresin mltiple, se define como
uno menos el cuadrado de la correlacin entre la variable y el resto de variables que ya
han sido seleccionadas. As, en el paso 0 la tolerancia de todas las variables es perfecta
(1) puesto que no se ha seleccionado ninguna. En el paso 1 se dan los valores de tolerancia
para las variables an no seleccionadas teniendo en cuenta su correlacin con la variable
expediente. As, 0.582 es la tolerancia para la variable Habilidades sociales, lo que indica
que la R2 entre esta variable y el expediente (lo que tienen en comn) es 1-0.582 = 0.418.

Variables no incluidas en el anlisis


Tolerancia F que Lambda
Paso Tolerancia mn. introducir de Wilks
0 EXPEDIEN 1,000 1,000 12,681 ,688
HABILSOC 1,000 1,000 4,040 ,874
INTELIG 1,000 1,000 10,388 ,729
1 HABILSOC ,582 ,582 21,196 ,386
INTELIG ,722 ,722 1,666 ,648
2 INTELIG ,720 ,461 ,558 ,377

Anlisis Multivariado 277


Anlisis de datos con SPSS 10 Mara Dolores Paz Caballero

Las tablas siguientes (Autovalores y Lambda de Wilks) nos dan idea de la


importancia que tiene la funcin discriminante para discriminar entre los grupos. Esta ser
tanto mayor cuanto menor sea lambda y mayor el coeficiente de correlacin cannica. El
valor de lambda indica en qu proporcin la pertenencia a un grupo no se explica a partir
de la funcin discriminante (0.386). La correlacin cannica es la correlacin entre las
puntuaciones discriminantes y los grupos y el cuadrado de esta correlacin (el
complementario de lambda) expresa la proporcin en que la pertenencia a un grupo viene
explicada por la funcin discriminante (0.7842 = 0.614).
La interpretacin de los autovalores y porcentaje de varianza slo tiene sentido
cuando tenemos ms de dos grupos y obtenemos ms de una funcin discriminante. En ese
caso nos dara informacin sobre la importancia relativa de cada una de las funciones para
discriminar entre los grupos.

Autovalores
% de % Correlacin
Funcin Autovalor varianza acumulado cannica
1 a
1,593 100,0 100,0 ,784
a. Se han empleado las 1 primeras funciones
discriminantes cannicas en el anlisis.

Lambda de Wilks
Contraste Lambda
de las de Wilks Chi-cuadrado gl Sig.
funciones
1 ,386 25,731 2 ,000

Una vez examinada la importancia de la funcin discriminante es necesario


interpretarla. Para ello contamos con los Coeficientes estandarizados de las funciones
discriminantes cannicas y la Matriz estructura, que seran equivalentes a los pesos de
regresin mltiple y a los coeficientes de validez de cada variable. Los primeros nos
indican la importancia relativa que tiene cada una de las variables para discriminar entre
los grupos. La matriz estructura nos da las correlaciones de cada variable, considerada
individualmente, con la funcin discriminante. Ntese que la variable con mayor
correlacin es el expediente, que es tambin la que mejor discrimina entre los grupos (la
que tiene un mayor coeficiente en la funcin discriminante). Sin embargo, vemos aqu que
la correlacin con la funcin discriminante es mayor para la inteligencia que para las
habilidades sociales, aunque la ltima discrimina mejor entre los sujetos en paro y en
activo una vez considerada la variable expediente. Ello se debe a que buena parte de la
capacidad discriminativa de la inteligencia es la misma que tiene el expediente. Es decir,
se tratara de una variable redundante. As pues, podemos decir que los grupos difieren
por este orden en expediente acadmico, inteligencia y habilidades sociales. Sin embargo,
una vez que consideramos la variable expediente, la inteligencia no contribuye apenas a
discriminar entre los grupos puesto que, al estar muy correlacionada con la anterior, su
importancia relativa es muy pequea.

Anlisis Multivariado 278


Anlisis de datos con SPSS 10 Mara Dolores Paz Caballero

Coeficientes estandarizados
las funciones discriminantes
cannicas

Funcin
1
EXPEDIEN 1,250
HABILSOC 1,109

M a triz d e e s tru c tu ra
F u n c i n
1
E X P E D IE N ,5 3 3
I N T E L I Ga ,3 2 4
H A B IL S O C ,3 0 1
C o r r e la c io n e s
in t r a - g r u p o c o m b in a d a s
e n t r e l a s v a r i a b le s
d is c r i m i n a n t e s y l a s
f u n c io n e s d is c r im in a n t e s
c a n n ic a s tip if ic a d a s
V a r ia b le s o r d e n a d a s p o r
e l t a m a o d e la
c o r r e la c i n c o n la
f u n c i n .
a . E s ta v a r ia b le n o
s e e m p le a e n e l
a n l is i s .

La siguiente tabla nos da los coeficientes de la funcin de clasificacin que se


utilizan para predecir a cualquier sujeto de la poblacin una puntuacin en cada uno de los
grupos. Por ejemplo, para un sujeto con una puntuacin de 2 en el Expediente y una
puntuacin de 25 en el test de Habilidades sociales, la puntuacin que se le asignara en el
grupo 1 sera : -63.996 + 21,208 (2) + 3,367 (25) = 62.595. Del mismo modo, su puntuacin
en el grupo 2 sera : -40.045 + 16,21 (2) + 2,705 (25) = 60. El criterio que se utiliza es
asignar el sujeto al grupo en el que se le predice mayor puntuacin, en este caso, al grupo
1.

C o e f ic ie n t e s d e la f u n c i n d e
c la s if ic a c i n
VAR 00004
1 ,0 0 2 ,0 0
E X P E D IE N 2 1 ,2 0 8 1 6 ,2 1 1
H A B IL S O C 3 ,3 6 7 2 ,7 0 5
(C o n s ta n te ) -6 3 ,9 9 6 -4 0 ,0 4 5
F u n c io n e s d is c r im in a n t e s lin e a le s d e
F is h e r

Anlisis Multivariado 279


Anlisis de datos con SPSS 10 Mara Dolores Paz Caballero

Por ltimo, el SPSS nos ofrece los resultados de la clasificacin (la denominada
matriz de clasificacin o de confusin). En las filas de dicha matriz aparece el grupo de
pertenencia del sujeto y en las columnas el grupo al que se le asigna mediante la funcin
discriminante. Observamos que, de los 15 sujetos pertenecientes al grupo 1, 14 de ellos (el
93,3%) son asignados correctamente a ese grupo al utilizar la funcin discriminante. En el
grupo 2 se comenten ms errores, slo 11 de los 15 sujetos (el 73,3%) son correctamente
asignados. El porcentaje total de clasificaciones correctas es, por tanto, el 83,3%.

a
Resultados de la clasificacin
Grupo de pertenencia
pronosticado
VAR00004 1,00 2,00 Total
Original Recuento 1,00 14 1 15
2,00 4 11 15
% 1,00 93,3 6,7 100,0
2,00 26,7 73,3 100,0
a. Clasificados correctamente el 83,3% de los casos agrupados
originales.

Anlisis Multivariado 280


Anlisis de datos con SPSS 10 Mara Dolores Paz Caballero

RESUMEN

El Anlisis multivariado de la varianza (MANOVA) de un factor y el Anlisis Discriminante


(AD) tienen en comn que analizan las relaciones de dependencia entre una variable
categrica y varias variables cuantitativas. Ahora bien, mientras que la variable
categrica es el factor o variable independiente en el caso del MANOVA, en el AD
constituye la variable dependiente o variable que se intenta predecir.

El Anlisis multivariado de la varianza (MANOVA) de un factor analiza el efecto de una


variable independiente sobre varias variables dependientes. Cuando no podemos hablar de
diseo experimental, el MANOVA se utiliza para comparar dos o ms grupos de sujetos en
un conjunto de variables cuantitativas.
Las ventajas estadsticas que tiene realizar un MANOVA, en lugar de varios ANOVAs,
cuando tenemos varias variables dependientes son fundamentalmente dos:
- El MANOVA controla el aumento de error tipo I que se dara en caso de realizar varios
ANOVAs. Slo si el MANOVA pone de manifiesto un efecto significativo tiene sentido
pasar a los ANOVAs individuales.
- El MANOVA tiene una mayor potencia de prueba que los ANOVAs individuales cuando las
variables dependientes guardan relacin entre s. As, puede ocurrir que el MANOVA
ponga de manifiesto un efecto del factor en el conjunto de variables dependientes, efecto
que no se aprecia al considerarlas de una en una.

El Anlisis Discriminante (AD) es muy similar a la Regresin mltiple, la nica diferencia es


que la variable dependiente o criterio no es ahora una variable cuantitativa sino
categrica: el grupo de pertenencia. Como la regresin mltiple, se puede aplicar con un
doble objetivo:
- Ver qu variables, o qu combinacin de variables, es la que mejor discrimina entre dos
(o ms) grupos. A esta ecuacin se la denomina "funcin discriminante".
- Predecir para cualquier sujeto de la poblacin la pertenencia a uno de los grupos a partir
de sus puntuaciones en las variables discriminantes (o variables predictoras).
Igual que la regresin mltiple, el AD nos ofrece el valor de la correlacin cannica, cuyo
cuadrado indica el porcentaje de las diferencias entre los grupos que estn asociadas a las
variables discriminantes.

Anlisis Multivariado 281