Anda di halaman 1dari 17

Cap tulo 1 T 2 DE HOTELLING

El estudio multivariante de la t2 de Hotelling, mediante SPSS, requiere del estudio previo de algunos mens. u

1.1.

Descriptivos

El procedimiento Descriptivos calcula estad sticos de resumen univariantes para varias variables en una unica tabla y calcula sus valores tipicados (puntuaciones z). Las variables se pueden ordenar por el tamao de sus medias (en orden ascendente o n descendente), alfabticamente o por el orden en el que se seleccionen las variables (el e valor por defecto). Cuando guardamos las puntuaciones z, stas se aaden a los datos del Editor de e n datos, quedando disponibles para los grcos, el listado de los datos y los anlisis. a a Cuando las variables estn tomadas en unidades diferentes (por ejemplo, producto a interno bruto per capita y porcentaje de alfabetizacin), una transformacin de puno o tuacin z pondr las variables en una escala comn para una comparacin visual ms o a u o a fcil. a Este men proporciona el tamao de muestra, la media, el m u n nimo, el mximo, la a desviacin t o pica, la varianza, el rango, la suma, el error t pico de la media, la cyrtosis y la asimetr y sus errores t a picos.

1.2.

Correlaciones

El procedimiento Correlaciones bivariadas calcula el coeciente de correlacin de o Pearson, la rho de Spearman y la tau-b de Kendall con sus niveles de signicacin. o Las correlaciones las utilizaremos para medir cmo estn relacionadas las variables o o a los rdenes de los rangos. Antes de calcular un coeciente de correlacin, hemos de o o inspeccionar los datos para detectar valores at picos (que pueden producir resultados equ vocos) y evidencias de una relacin lineal. El coeciente de correlacin de Pearson o o es una medida de asociacin lineal, de tal manera que dos variables pueden estar o 1

Contrastes de la T 2 de Hotelling

perfectamente relacionadas, pero si la relacin no es lineal, el coeciente de correlacin o o de Pearson no ser un estad a stico adecuado para medir su asociacin. o Este procedimiento ser utilizado para calcular las matrices de varianzas-covarianzas a y la matriz de correlaciones.

1.2.1.

Para obtener Correlaciones

- Elegir en los mens: u Analizar Correlaciones Bivariadas.

Figura 1.1: correlaciones

- Seleccionar dos o ms variables numricas. a e Figura 1.2: men correlaciones u

- Tambin se encuentran disponibles las siguientes opciones: e a) Coecientes de correlacin. Para las variables cuantitativas normales, o seleccionaremos el coeciente de correlacin de Pearson. Si los datos no o ANALISIS ESTAD ISTICO MULTIVARIANTE CON SPSS. Curso Bsico. a

Prcticas de Anlisis Multivariante con SPSS a a

estn distribuidos segn una normal o tienen categor ordenadas, seleca u as cionaremos la tau-b de Kendall o de Spearman, que miden la asociacin o entre rdenes de rangos. Los coecientes de correlacin pueden estar entre o o 1 (una relacin negativa perfecta) y +1 (una relacin positiva perfecta). Un o o valor 0 indica que no existe una relacin lineal. Al interpretar los resultao dos, debemos evitar extraer conclusiones de causa-efecto a partir de una correlacin signicativa. o b) Prueba de signicacin. Podemos seleccionar las probabilidades bilaterao les o las unilaterales. Si conocemos de antemano la direccin de la asociacin, o o seleccionaremos Unilateral, si no es as Bilateral. , c) Marcar las correlaciones signicativas. Los coecientes de correlacin o signicativos al nivel 0,05 se identican por medio de un solo asterisco y los signicativos al nivel 0,01 se identican con dos asteriscos. d ) En opciones, podemos obtener: 1) Estad sticos. Para las correlaciones de Pearson, podemos elegir una o ambas de estas opciones: * Medias y desviaciones tpicas. Las calcula para cada variable ; tam bin nos proporciona el nmero de casos que no tienen valores pere u didos. Los valores perdidos se consideran segn cada variable indiu vidual, sin tener en cuenta la opcin elegida para la manipulacin o o de los valores perdidos. * Productos cruzados diferenciales y covarianzas. Los muestra para cada pareja de variables. Cada producto cruzado de las desviaciones es igual a la suma de los productos de las variables corregidas respecto a la media. Este es el numerador del coeciente de correlacin de Pearson. La covarianza es una medida no tipicada de la o relacin entre dos variables, igual al producto cruzado diferencial o dividido por N-1. Figura 1.3: estad sticos de correlaciones

2) Valores perdidos. Podemos elegir uno de los siguientes: ANALISIS ESTAD ISTICO MULTIVARIANTE CON SPSS. Curso Bsico. a

Contrastes de la T 2 de Hotelling * Excluir casos segn pareja. Con esta opcin se excluyen del anlisis u o a los casos con valores perdidos para una o ambas variables de la pareja que forma un coeciente de correlacin. Debido a que cada o coeciente est basado en todos los casos que tienen cdigos vlidos a o a para esa pareja concreta de variables, en cada clculo se utiliza la a mayor cantidad de informacin disponible. Esto puede dar como o resultado un grupo de coecientes basados en un nmero de casos u variable . * Excluir casos segn lista. Excluye de todas las correlaciones los casos u con valores perdidos para cualquier variable.

1.3.

Pruebas t

1. El procedimiento Prueba T para una muestra contrasta si la media de una sola variable diere de una constante especicada. Para cada variable a contrastar tenemos la media, la desviacin t o pica y el error t pico de la media. Tambin devuelve la diferencia promedio entre cada valor de e los datos y el valor del contraste de hiptesis, una prueba t que contrasta que o esta diferencia es 0 y un intervalo de conanza para la diferencia promedio (para el que puede especicarse el nivel de conanza). 2. El procedimiento Prueba T para muestras independientes compara las medias de dos grupos de casos. Para esta prueba, idealmente los sujetos deben asignarse aleatoriamente a dos grupos, de forma que cualquier diferencia en la respuesta sea debida al tratamiento (o falta de tratamiento) y no a otros factores. Este caso no ocurre si se comparan los ingresos medios para hombres y mujeres. El sexo de una persona no se asigna aleatoriamente. En estas situaciones, debemos asegurarnos de que las diferencias en otros factores no enmascaren o resalten una diferencia signicativa entre las medias. Las diferencias de ingresos medios pueden estar sometidas a la inuencia de factores como los estudios y no solamente el sexo. Para cada variable el procedimiento proporcionar el tamao de la muestra, la a n media, la desviacin t o pica y el error t pico de la media. Para la diferencia entre las medias calcula la media, el error t pico y el intervalo de conanza (puede especicar el nivel de conanza). Tambin realiza la prueba de Levene sobre la e igualdad de varianzas y las pruebas t de varianzas combinadas y separadas sobre la igualdad de las medias. 3. El procedimiento Prueba T para muestras relacionadas compara las medias de dos variables de un solo grupo. Calcula las diferencias entre los valores de las dos variables de cada caso y contrasta si la media diere de 0. Para cada variable dar la media, el tamao de la muestra, la desviacin t a n o pica y el error t pico de la media. Para cada pareja de variables la correlacin, la o ANALISIS ESTAD ISTICO MULTIVARIANTE CON SPSS. Curso Bsico. a

Prcticas de Anlisis Multivariante con SPSS a a

diferencia promedio entre las medias, la prueba t y el intervalo de conanza para la diferencia entre las medias (puede especicarse el nivel de conanza), as como la desviacin t o pica y el error t pico de la diferencia entre las medias.

1.4.

Modelo lineal general

El procedimiento MLG Multivariante proporciona un anlisis de regresin y un a o anlisis de varianza para variables dependientes mltiples por una o ms covariables o a u a variables de factor (las variables de factor dividen la poblacin en grupos). Utilizando o este procedimiento del modelo lineal general, es posible contrastar hiptesis nulas sobre o los efectos de las variables de factor sobre las medias de varias agrupaciones de una distribucin conjunta de variables dependientes. Asimismo podemos investigar las inteo racciones entre los factores y tambin los efectos individuales de los factores . Adems, e a se pueden incluir los efectos de las covariables y las interacciones de covariables con los factores. Para el anlisis de regresin, las variables independientes (predictoras) se a o especican como covariables.

1.4.1.

Para obtener un modelo lineal general

- Elegir en los mens: u Analizar Modelo Lineal General Multivariante Figura 1.4: modelo lineal general multivariante

- Seleccionar al menos dos variables dependientes. Las opciones disponibles son: a) Modelo. Si se especica ms de una variable dependiente, se proporciona a el anlisis multivariante de varianzas usando la traza de Pillai, la lambda a de Wilks, la traza de Hotelling y el criterio de mayor ra de Roy con el z ANALISIS ESTAD ISTICO MULTIVARIANTE CON SPSS. Curso Bsico. a

Contrastes de la T 2 de Hotelling estad stico F aproximado, as como el anlisis univariado de varianza para a cada variable dependiente. Adems de contratar hiptesis, MLG Multivaa o riante genera estimaciones de los parmetros. a Figura 1.5: men MLG u

b) Comparaciones m ltiples post hoc. Una vez que se ha determinado que u existen diferencias entre las medias, las pruebas de rango post hoc y las comparaciones mltiples por parejas permiten determinar qu medias dieren. u e Las comparaciones las realiza sobre valores sin corregir. Estas pruebas slo o se utilizan para los factores inter-sujetos jos. Para MLG Multivariante, las pruebas post hoc se realizan por separado para cada variable dependiente. Las pruebas que se muestran son: comparaciones por parejas para DMS, Sidak, Bonferroni, Games y Howell, T2 y T3 de Tamhane, C y T3 de Dunnett. Tambin se facilitan subconjuntos homogneos para las pruebas de e e rango para S-N-K, Tukey-b, Duncan, R-E-G-W F, R-E-G-W Q y Waller. La prueba de la diferencia honestamente signicativamente de Tukey, GT2 de Hochberg, la prueba de Gabriel y la prueba de Sche son tanto pruebas e de comparaciones mltiples como de rango. u c) Guardar. Es posible almacenar los valores pronosticados por el modelo, los residuos y las medidas relacionadas como variables nuevas en el Editor de datos. Muchas de estas variables se pueden utilizar para examinar supuestos sobre los datos. Figura 1.6: guardar MLG

ANALISIS ESTAD ISTICO MULTIVARIANTE CON SPSS. Curso Bsico. a

Prcticas de Anlisis Multivariante con SPSS a a

1) Valores pronosticados. Son los valores que predice el modelo para cada caso. Estn disponibles los valores pronosticados no tipicados y a los errores tipicados de los valores pronosticados. Si hemos seleccionado una variable MCP (WLS), dispondremos de la opcin de valores o pronosticados no tipicados ponderados. 2) Diagnsticos. Son medidas para identicar casos con combinaciones poo co usuales de valores para las variables independientes y casos que puedan tener un gran impacto en el modelo. Las opciones disponibles incluyen la distancia de Cook y los valores de inuencia no centrados. Tambin proporcionar los Residuos, un residuo no tipicado es el vae a lor real de la variable dependiente menos el valor pronosticado por el modelo, dentro de los residuos tambin obtenemos los residuos elimie nados, estudentizados y tipicados. Si hemos seleccionado una variable MCP, contaremos adems con residuos no tipicados ponderados. a d ) Opciones. Este cuadro de dilogo contiene estad a sticos adicionales. Los estad sticos se calculan utilizando un modelo de efectos jos. 1) Medias marginales estimadas. Seleccionaremos los factores e interacciones para los que deseemos obtener estimaciones de las medias marginales de la poblacin en las casillas. Estas medias se corrigen respecto a las o covariables, si las hay. Las interacciones slo estn disponibles si hemos o a especicado un modelo personalizado. * Comparar los efectos principales. Proporciona comparaciones por parejas no corregidas entre las medias marginales estimadas para cualquier efecto principal del modelo, tanto para los factores intersujetos como para los intra-sujetos. Estos elementos slo se encueno tra disponibles si los efectos principales estn seleccionados en la a lista Mostrar las medias para. * Ajuste del intervalo de conanza. Seleccionaremos un ajuste de diferencia menor signicativa (DMS), Bonferroni o Sidak para los intervalos de conanza y la signicacin. Este elemento slo estar diso o a ponible si se selecciona Comparar los efectos principales. Figura 1.7: opciones MLG

ANALISIS ESTAD ISTICO MULTIVARIANTE CON SPSS. Curso Bsico. a

Contrastes de la T 2 de Hotelling 2) Mostrar. * Estad sticos descriptivos. Para obtener las medias observadas, desviaciones t picas y frecuencias para cada variable dependiente en todas las celdas. * Estimaciones del tamao del efecto. Ofrece un valor parcial de etan cuadrado para cada efecto y cada estimacin de parmetros. El o a estad stico eta cuadrado describe la proporcin de variabilidad total o atribuible a un factor. * Potencia observada. Obtiene la potencia de la prueba cuando la hiptesis alternativa se ha establecido basndose en el valor obsero a vado. * Estimaciones de los parmetros. Genera las estimaciones de los a parmetros, los errores t a picos, las pruebas t, los intervalos de conanza y la potencia observada para cada prueba. Se pueden mostrar Matrices SCPC de error y de hiptesis y la Matriz SCPC residual o ms la prueba de esfericidad de Bartlett de la matriz de covarianza a residual. * Pruebas de homogeneidad. Calcula la prueba de homogeneidad de varianzas de Levene para cada variable dependiente en todas las combinaciones de nivel de los factores inter-sujetos slo para factoo res inter-sujetos. Asimismo, las pruebas de homogeneidad incluyen la prueba M de Box sobre la homogeneidad de las matrices de covarianzas de las variables dependientes a lo largo de todas las combinaciones de niveles de los factores inter-sujetos. Las opciones de diagramas de dispersin por nivel y grco de los residuos son utiles o a para comprobar los supuestos sobre los datos. Estos elementos no estarn activado si no hay factores. a * Grcos de los residuos. Producen un grco de los residuos obsera a vados respecto a los pronosticados respecto a los tipicados para cada variable dependiente. Estos grcos son utiles para investigar a el supuesto de varianzas iguales. * Prueba de falta de ajuste Utilizada para comprobar si el modelo puede describir de forma adecuada la relacin entre la variable o dependiente y las variables independientes. La Funcin estimable o general permite construir pruebas de hiptesis personales basadas o en la funcin estimable general. o 3) Nivel de signicacin. Para corregir el nivel de signicacin usado en o o las pruebas post hoc y el nivel de conanza empleado para construir intervalos de conanza. El valor especicado tambin se utiliza para e calcular la potencia observada para la prueba. Si especicamos un nivel de signicacin, el cuadro de dilogo mostrar el nivel asociado de los o a a intervalos de conanza. ANALISIS ESTAD ISTICO MULTIVARIANTE CON SPSS. Curso Bsico. a

Prcticas de Anlisis Multivariante con SPSS a a

1.5.

Contrastes basados T 2 de Hotelling

Los contrastes de la T 2 son utilizados para el contraste de vectores media en poblaciones normales Np (; ). Para ello tendremos en cuenta que: Sea X y S = A (con n=N-1) los estimadores mximoverosimiles de y de una a n 1 2 Np (; ) y sean T = N X S X, entonces, para N>p: T2 n p + 1 n p Fp;np+1 () = N 1 . Wp (n; ) independientes

En general, se dice que si X Np (; ), A = nS y A y np, entonces, siendo T 2 = X A1 X tal que: T2 n p + 1 n p

Fp;np+1 () = 1

1.5.1.
Sea X

Contrastes para una muestra


Np (; ) y X1 , . . . , XN m.a.s. Si deseramos realizar el contraste: a H 0 : = 0 H 1 : = 0

Sabiendo que: X Np (; N ) N (X ) Np (0; ) y que A Wp (n, ), ambas independientes. 2 Aplicando el teorema anterior; para T = N (X 0 ) S 1 (X 0 ) se cumple: T2 n p + 1 n p Fp;np+1 () = N ( 0 ) 1 ( 0 )

y bajo la hiptesis nula = 0, podemos realizar los contrastes unidimensionales. o Tambin se puede calcular el elipsoide de conanza de la forma: e
(X ) S 1 (X ) F1 siendo F1 = np F . N (np+1) p,np+1;1

1.5.2.

Contrastes para dos muestras independientes

Sea X Np (1 ; ) e Y Np (2 ; ) y X1 , . . . , XN1 y Y1 , . . . , YN2 muestras independientes. Realizamos el siguiente contraste: H 0 : 1 = 2 ANALISIS ESTAD ISTICO MULTIVARIANTE CON SPSS. Curso Bsico. a

10 H 1 : 1 = 2

Contrastes de la T 2 de Hotelling

Para ello partimos de X Np (1 ; N2 ) y Y Np (2 ; N1 ); AX AY W (n2 ; ) todas ellas independientes, quedando:


1 2 Np [1 2 ; (NN+N2 ) ] 1N

W (n1 ; );

A = AX + A Y

W (n1 + n2 ; ) y X Y
1/2

N1 N2 N 1 + N2

(X Y )

Np

N1 N2 N1 + N2

1/2

(1 2 );

T2 =

N1 N2 (X Y ) S 1 (X Y ) N 1 + N2

T 2 n1 + n2 p + 1 n1 + n2 p Bajo la hiptesis nula = 0 o

Fp;n1 +n2 p+1 () =

N1 N2 (1 2 ) 1 (1 2 ) N 1 + N2

Siendo el elipsoide de conanza al 95 %


(X 1 Y 2 ) S 1 (X 1 Y 2 ) F1

con
F1 =

(n1 + n2 )p N1 + N2 Fp,n1 +n2 p+1;1 N1 N2 (n1 + n2 p + 1)

1.6.

Ejemplo

a Como ejemplo de T 2 de Hotelling realizaremos el ejemplo clsico de Fisher sobre tres variedades de ores. ANALISIS ESTAD ISTICO MULTIVARIANTE CON SPSS. Curso Bsico. a

Prcticas de Anlisis Multivariante con SPSS a a LS1 AS1 LP1 AS1 LS2 AS2 LP2 AS2 LS3 AS3 LP3 AS3 5.1 3.5 1.4 0.2 7 3.2 4.7 1.4 6.3 3.3 6 2.5 4.9 3 1.4 0.2 6.4 3.2 4.5 1.5 5.8 2.7 5.1 1.9 4.7 3.2 1.3 0.2 6.9 3.1 4.9 1.5 7.1 3 5.9 2.1 4.6 3.1 1.5 0.2 5.5 2.3 4 1.3 6.3 2.9 5.6 1.8 5 3.6 1.4 0.2 6.5 2.8 4.6 1.5 6.5 3 5.8 2.2 5.4 3.9 1.7 0.4 5.7 2.8 4.5 1.3 7.6 3 6.6 2.1 4.6 3.4 1.4 0.3 6.3 3.3 4.7 1.6 4.9 2.5 4.5 1.7 5 3.4 1.5 0.2 4.9 2.4 3.3 1 7.3 2.9 6.3 1.8 4.4 2.9 1.4 0.2 6.6 2.9 4.6 1.3 6.7 2.5 5.8 1.8 4.9 3.1 1.5 0.1 5.2 2.7 3.9 1.4 7.2 3.6 6.1 2.5 5.4 3.7 1.5 0.2 5 2 3.5 1 6.5 3.2 5.1 2 4.8 3.4 1.6 0.2 5.9 3 4.2 1.5 6.4 2.7 5.3 1.9 4.8 3 1.4 0.1 6 2.2 4 1 5.8 3 5.5 2.1 4.3 3 1.1 0.1 6.1 2.9 4.7 1.4 5.7 2.5 5 2 5.8 4 1.2 0.2 5.6 2.9 3.6 1.3 5.8 2.8 5.1 2.4 5.7 4.4 1.5 0.4 6.7 3.1 4.4 1.4 6.4 3.2 5.3 2.3 5.4 3.9 1.3 0.4 5.6 3 4.5 1.5 6.5 3 5.5 1.8 5.1 3.5 1.4 0.3 5.8 2.7 4.1 1 7.7 3.8 6.7 2.2 5.7 3.8 1.7 0.3 6.2 2.2 4.5 1.5 7.7 2.6 6.9 2.3 5.1 3.8 1.5 0.3 5.6 2.5 3.9 1.1 6 2.2 5 1.5 5.4 3.4 1.7 0.2 5.9 3.2 4.8 1.8 6.9 3.2 5.7 2.3 5.1 3.7 1.5 0.4 6.1 2.8 4 1.3 5.6 2.8 4.9 2 4.6 3.6 1 0.2 6.3 2.5 4.9 1.5 7.7 2.8 6.7 2 5.1 3.3 1.7 0.5 6.1 2.8 4.7 1.2 6.3 2.7 4.9 1.8 4.8 3.5 1.9 0.2 6.4 2.9 4.3 1.3 6.7 3.3 5.7 2.1 5 3 1.6 0.2 6.6 3 4.4 1.4 7.2 3.2 6 1.8 5 3.4 1.6 0.4 6.8 2.8 4.8 1.4 6.2 2.8 4.8 1.8 5.2 3.5 1.5 0.2 6.7 3 5 1.7 6.1 3 4.9 1.8 5.2 3.4 1.4 0.2 6 2.9 4.5 1.5 6.4 2.8 5.6 2.1 4.7 3.2 1.6 0.2 5.7 2.6 3.5 1 7.2 3 5.8 1.6 4.8 3.1 1.6 0.2 5.5 2.4 3.8 1.1 7.4 2.8 6.1 1.9 5.4 3.4 1.5 0.4 5.5 2.4 3.7 1 7.9 3.8 6.4 2 5.2 4.1 1.5 0.1 5.8 2.7 3.9 1.2 6.4 2.8 5.6 2.2 5.5 4.2 1.4 0.2 6 2.7 5.1 1.6 6.3 2.8 5.1 1.5 4.9 3.1 1.5 0.2 5.4 3 4.5 1.5 6.1 2.6 5.6 1.4 5 3.2 1.2 0.2 6 3.4 4.5 1.6 7.7 3 6.1 2.3 5.5 3.5 1.3 0.2 6.7 3.1 4.7 1.5 6.3 3.4 5.6 2.4 4.9 3.6 1.4 0.1 6.3 2.3 4.4 1.3 6.4 3.1 5.5 1.8 4.4 3 1.3 0.2 5.6 3 4.1 1.3 6 3 4.8 1.8 5.1 3.4 1.5 0.2 5.5 2.5 4 1.3 6.9 3.1 5.4 2.1 sigue en la pgina siguiente a

11

ANALISIS ESTAD ISTICO MULTIVARIANTE CON SPSS. Curso Bsico. a

12 5 4.5 4.4 5 5.1 4.8 5.1 4.6 5.3 5 3.5 2.3 3.2 3.5 3.8 3 3.8 3.2 3.7 3.3 1.3 1.3 1.3 1.6 1.9 1.4 1.6 1.4 1.5 1.4 0.3 0.3 0.2 0.6 0.4 0.3 0.2 0.2 0.2 0.2 5.5 6.1 5.8 5 5.6 5.7 5.7 6.2 5.1 5.7 2.6 3 2.6 2.3 2.7 3 2.9 2.9 2.5 2.8 4.4 4.6 4 3.3 4.2 4.2 4.2 4.3 3 4.1 1.2 1.4 1.2 1 1.3 1.2 1.3 1.3 1.1 1.3

Contrastes de la T 2 de Hotelling 6.7 6.9 5.8 6.8 6.7 6.7 6.3 6.5 6.2 5.9 3.1 3.1 2.7 3.2 3.3 3 2.5 3 3.4 3 5.6 5.1 5.1 5.9 5.7 5.2 5 5.2 5.4 5.1 2.4 2.3 1.9 2.3 2.5 2.3 1.9 2 2.3 1.8

Donde el tamao muestral es 50 y las variedades son: n 1. Iris Setosa (1) 2. Iris Versicolor (2) 3. Iris Virg nica (3) y las variables medidas son: 1. Longitud de spalos (LS) e 2. Anchura de spalos (AS) e 3. Longitud de ptalos (LP) e 4. Anchura de ptalos (AP) e Para introducir los datos, crearemos las cuatro variables que se miden (LS, AS, LP y AP) y otra variable que identique la variedad (1, 2 o 3).

1.6.1.

Resumen descriptivo

En primer lugar vamos a realizar un resumen descriptivo de la muestra conjunta de las cuatro variables. Obtendremos estad sticos descriptivos unidimensionales para cada variable (rango, m nimo, mximo, media, error t a pico, varianza y coecientes de curtosis y asimetr y adems el centroide, la matriz de varianzas-covarianzas y la a) a de correlaciones. Utilizaremos los mens de DESCRIPTIVOS y CORRELACIONES u BIVARIADAS. Estos mismos resultados se pueden obtener para cada variedad sin ms que ir a seleccionado cada una de los distintos valores de la variable variedad. Para ello seleccionaremos los mens: u Datos Seleccionar casos Si satisface la condicin o ANALISIS ESTAD ISTICO MULTIVARIANTE CON SPSS. Curso Bsico. a

Prcticas de Anlisis Multivariante con SPSS a a

13

No tenemos ms que en condicin ir seleccionando cada una de las diferentes modalia o dades de variedad, en primer lugar haremos variedad=1, es decir, que la variedad sea la Iris Setosa. Una vez seleccionada una variedad en el editor de datos se marcarn los a Figura 1.8: seleccin de variedad o

casos no validos y repetiremos el procedimiento anterior para el clculo de descriptivos a y matrices. Por ejemplo, para el caso de Iris Setosa, quedar: a

1.6.2.

Contrastes multivariantes

Resolvemos ahora el problema de una muestra multivariante,es decir, sea 0 = (5,75, 3, 4, 2) nos planteamos: H 0 : = 0 H 1 : = 0 Este tipo de contrastes hay que realizarlo mediante el mdulo del Modelo Lineal o General (sin factores). Lo que hacemos es una reformulacin del problema en tales o ANALISIS ESTAD ISTICO MULTIVARIANTE CON SPSS. Curso Bsico. a

14

Contrastes de la T 2 de Hotelling

trminos, tambin hay que tener en cuenta que hay que transformar las variables de e e la forma: LS1 = LS - 5.75 AS1 = AS - 3 LP1 = LP - 4 AP1 = AP - 2 Debido a que la unica hiptesis que podemos plantear es la nulidad del vector de o medias. Seleccionaremos los mens: u Analizar Modelo General Lineal Multivariante Introduciendo como variables dependientes las cuatro variables que acabamos de crear. Figura 1.9: MLG

En los resultados podemos ver que existen varios criterios distintos para resolver el problema (criterios asociados a las ra caracter ces sticas de ciertas matrices) pero que en el caso de dos poblaciones coinciden, aunque el valor del estad stico de contraste no lo hace, si lo hace en la signicacin alcanzada por los mismos. o El valor de estad stico de contraste es 12.715, que en este caso equivale a T 2 /N , con un valor transformado en trminos de F de 464.095 y un p-valor asociado inferior e o a 103 lo cual nos hace rechazar la hiptesis nula. En la tabla de pruebas de los efectos inter-sujetos, el programa proporciona tambin los contrastes individuales para cada una de las variables, resultando todas con e un p-valor superior a nuestro nivel de signicacin (0.170,0.104 y 0.095) salvo para o ANALISIS ESTAD ISTICO MULTIVARIANTE CON SPSS. Curso Bsico. a

Prcticas de Anlisis Multivariante con SPSS a a

15

la cuarta variable (inferior a 103 ), de donde podr amos concluir que el rechazo de la hiptesis nula puede ser debido a la cuarta variable. Se deber repetir el estudio o a eliminando esta variable, si resultar que se aceptara la hiptesis nula llegar a o amos a la conclusin de que ese era el motivo del rechazo. o El elipsoide de conanza al 95 % ser: a (X ) S 1 (X )F 0,95 = 10,321 6,733 7,369 5,584 6,733 11,081 6,527 6,256 = (5,558431 ; 3,0572 ; 3,37583 ; 1,1994 ) 7,369 5,527 10,147 14,719 5,859 6,253 14,719 25,037 5,55843 1 3,057 2 3,3758 3 F0,95 1,199 4
donde F0,95 = 0,066231.

1.6.3.

Contrastes sobre dos muestras

Tratamos ahora el problema de comparar, para cada dos grupos, las medias de las variables. Hay que tener muy en cuenta que el vericarse la igualdad dos a dos, no implica necesariamente la igualdad entre los tres grupos, para lo cual habr que a estudiarse le tcnica MANOVA. Para este anlisis utilizaremos las pruebas T para e a muestras relacionadas y en variable de agrupacin denir los grupos que queremos o a comparar, que en este primer caso ser Iris Setosa con Iris Versicolor a Figura 1.10: contrates sobre dos muestras

El contraste lo resuelve mediante el estad stico t de Student en el caso de homocedasticidad y por el contraste de Welch si existe heterocedasticidad. Aparece as mismo el intervalo de conanza para la diferencia de medias. ANALISIS ESTAD ISTICO MULTIVARIANTE CON SPSS. Curso Bsico. a

16

Contrastes de la T 2 de Hotelling

Vemos que antes de realizar el contraste deseado realiza un contraste de igualdad de varianzas (Levene) robusto a la ausencia de normalidad. En este caso habr amos contrastando que la media de cada variable para el caso de Iris Setosa sea igual a la media para la variedad Iris Versicolor. Sin embargo podemos contrastar que el vector de medias de las cuatro variables para Iris Setosa, sea igual al vector de medias para Iris Versicolor. Para realizar este contraste tendr amos que seleccionar las dos variedades en el editor de datos y luego realizar el MLG. Realizando ambos mtodos resulta: e 1. Contraste de homogeneidad de varianzas: el contraste de Levene proporciona los siguientes resultados: LS AS LP AP F p-valor 8.435 0.005 0.578 0.449 35.42 < 103 15.385 < 103

Concluyendo que la hiptesis de homedasticidad en la varianza solo puede ser asuo mida en las dos primeras variables. Esto conlleva que en los contrastes de medias posteriores habr que ver los contrastes homocedsticos y el Welch dependiendo a a del caso. 2. Contrastes individuales: en los contrastes de medias habr que ver los contrastes a homocedsticos y el Welch dependiendo del caso. a LS AS LP AP t var.iguales -10.521 var. distintas -10.521 var.igual 9.455 var.distintas 9.455 var.iguales -39.493 var.distintas -39.393 var.iguales -34.080 var.distintas -34.080 gl 98 86.538 98 84.698 98 62.140 98 14.755 p-valor < 103 < 103 < 103 < 103 < 103 < 103 < 103 < 103 intervalo (-1.105;-0.755) (-1.106;-0.754) (0.520;0.796) (0.520;0.796) (-2.939;-2.657) (-2.940;-2.656) (-1.143;-1.017) (-1.143;-1.017)

Para cualquiera de las variables seleccionadas (independientemente de la hiptesis o homocedasticidad) no puede admitirse la hiptesis de igualdad de medias. o 3. Contraste multivariante: realizamos el Modelo Lineal General Multivariante (un factor con dos niveles). Si usamos el estad stico T 2 de hotelling en la forma 2 T El valor del estad stico de contraste es 26.335 y en trminos de la F de e N1 +N2 2 3 Sneedecor 625.458, con un p-valor asociado inferior a 10 lo que conlleva la no aceptacin conjunta de la igualdad de medias. o ANALISIS ESTAD ISTICO MULTIVARIANTE CON SPSS. Curso Bsico. a

Prcticas de Anlisis Multivariante con SPSS a a

17

A partir de los estad sticos descriptivos para cada una de las variedades, tenemos: Donde adems X 1 X 2 = (0,93; 0,658; 2,798; 1,08) , con lo que a T2 = N1 N 2 (X 1 X 2 ) S 1 (X 1 X 2 ) = 26,35 N 1 + N2

El elipsoide de conanza de nivel 95 % para el vector diferencia de medias (con F4,95;0,95 ) viene dado por: (0,93 m1 0,658 m2 (0,93 m1 ; 0,658 m2 ; 2,798 m3 ; 1,08 m4 )S 1 2,798 m3 0,40729 1,08 m4 Los contrastes individuales mediante el estad stico F de Sneedecor son: Sum. Cuadra. GL LS contraste 21.623 1 error 19.143 98 AS contraste 10.824 1 error 11.866 98 LP contraste 195.72 1 error 12.298 98 AP contraste 29.160 1 error 2.460 98 Med. Cuadra. F Sig 21.623 110.691 < 103 0.195 10.824 89.397 < 103 0.121 195.72 1559.675 < 103 0.125 29.160 1661.470 < 103 0.02511

ANALISIS ESTAD ISTICO MULTIVARIANTE CON SPSS. Curso Bsico. a