Anda di halaman 1dari 10

Anlisis de Datos

UNIVERSIDAD CENTRAL DEL ECUADOR


FACULTAD DE INGENIERIA CIENCIAS FISICAS Y MATEMATICA
NOMBRE: KLEVER SIMALIZA CHIMBO
Tema: Anlisis de Correspondencias Mltiple(ACM)
El Anlisis de Correspondencias (AC) es una tcnica estadstica que se aplica al anlisis de tablas de
contingencia y construye un diagrama cartesiano basado en la asociacin entre las variables analizadas. En
dicho grfico se representan conjuntamente las distintas modalidades de la tabla de contingencia, de forma
que la proximidad entre los puntos representados est relacionada con el nivel de asociacin entre dichas
modalidades.
Sean X1,X2,X3 variables categricas con sus respectivos valores. Se observan dichas variables de una
poblacin obtenindose los siguientes resultados:
X1
X2
X3
1
2
2
4
2
2
1
3
3
3
1
2
4
1
2
4
5
1
2
3
6
2
2
3
7
3
2
4
8
1
1
1
9
2
1
2
10
2
2
3
11
3
2
2
12
1
1
4
Para este caso, en el Anlisis de Correspondencia Mltiple Se tienen n=12 individuos y por columnas s=3
variables categricas con pi ; i=1,...,s categoras mutuamente excluyentes y exhaustivas. La tabla de datos
tiene, por lo tanto, la forma: Z = [Z1, Z2 ,..., Zs]
Transformamos los datos para obtener una matriz binaria, donde 1 representa la presencia en la categora y
0 la ausencia en la categora.
zij = 0 1, individuo i con categora j
Obteniendo como resultado:
X1

Mat: Jaime Andrade

X2

X3

10

11

12

4 36

Anlisis de Datos

A Z la denominamos tabla disjunta completa. Una vez que tenemos Z, el Anlisis de Correspondencias
T
Mltiples se basa en realizar un Anlisis de Correspondencias sobre la matriz B=Z Z (Matrz de Burt) dando
como resultado:
T

B=Z Z
4

1 0

0 1

0 2

1 2

0 1

1 0

0 3

0 0

0 0

Que representa el HIPERCUBO formado por la tabla disjunta completa. La matriz de Burt contiene en la
diagonal principal las distribuciones marginales de cada una de las variables y por bloques las tablas de
frecuencias cruzadas para cada posible par de ellas.
Procedemos con el anlisis de los perfiles fila.
PERFILES FILA
En este grfico estudiaremos la dependencia entre todas las variables. Para eso nos valemos de:
 

1

ns

0,0278

0,0278

0,0278

0,0834

0,0278

0,0278

0,0278

0,0834

0,0278

0,0278

0,0278

0,0834

0,0278

0,0278

0,0278

0,0834

0,0278

0,0278

0,0278

0,0834

0,0278

0,0278

0,0278

0,0834

0,0278

0,0278

0,0278

0,0834

0,0278

0,0278

0,0278

0,0834

0,0278

0,0278

0,0278

0,0834

0,0278

0,0278

0,0278

0,0834

0,0278

0,0278

0,0278

0,0834

0,0278

0,0278

0,0278

0,0834

0,1112

0,139

0,0834

0,139

0,1946

0,0278

0,0834

0,1112

0,1112

A continuacin formamos la matrz D con los elementos z.j en la diagonal principal, sabiendo que:

z.
 z



Mat: Jaime Andrade

Anlisis de Datos
Y obtenemos como resultado:

D
4 0 0 0 0 0 0 0 0
0 5 0 0 0 0 0 0 0
0 0 3 0 0 0 0 0 0
0 0 0 5 0 0 0 0 0
0 0 0 0 7 0 0 0 0
0 0 0 0 0 1 0 0 0
0 0 0 0 0 0 3 0 0
0 0 0 0 0 0 0 4 0
0 0 0 0 0 0 0 0 4

Ahora formamos la matriz Dp mediante:


 

1

ns

0,1111

0,1389

0,0833

0,1389

0,1944

0,0278

0,0833

0,1111

0
0
0
Conformamos la matriz Dn usando:

0,1111

1
  
n
0,0834

0,0834

0,0834

0,0834

0,0834

0,0834

0,0834

0,0834

0,0834

0,0834

0
0

0
0

Mat: Jaime Andrade

0
0,0834
0
0,0834

Anlisis de Datos
Procedemos a formar la matriz de perfiles fila (perfiles de las modalidades de la variable X):
-1

X = Dn F

0,3333

0,3333

0,3333

0,3333

0,3333

0,3333

0,3333

0,3333

0,3333

0,3333

0,3333

0,3333

0,3333

0,3333

0,3333

0,3333

0,3333

0,3333

0,3333

0,3333

0,3333

0,3333

0,3333

0,3333

0,3333

0,3333

0,3333

0,3333

0,3333

0,3333

0,3333

0,3333

0,3333

0,3333

0,3333

0,3333

CLCULO DE COORDENADAS
Procedemos con el clculo de:
-1

S = (1/s)BD
0,3333

0,1333

0,0952

0,3333

0,0833

0,1667

0
0

0,3333

0,1333

0,1429

0,1111

0,25

0,0833

0,3333

0,0667

0,0952

0,2222

0,0833

0,1667

0,1333

0,1111

0,3333

0,3333

0,2222

0,0833

0,0833

0,1667

0,2

0,2222

0,3333

0,1111

0,25

0,25

0,0833

0,0667

0,3333

0,0667

0,2222

0,1333

0,0476

0,3333

0,0833

0,2

0,0667

0,1429

0,3333

0,1667

0,0667

0,1111

0,0667

0,1429

0,3333

Procedemos con el clculo de valores y vectores propios para posteriormente calcular las coordenadas:
-1*

1*

Y = Dn F*Dp- U
Valores y vectores Propios

Obtenemos la matrz con los vectores propios asociados a cada uno de los valores propios:
1= 0.5494
2= 0.5440

Mat: Jaime Andrade

Anlisis de Datos
U1

U2

0,3894

-0,4289

-0,435

-0,1259

0,0457

0,5548

0,4458

0,0895

-0,4458

-0,0895

0,2877

-0,1414

0,0895

0,582

-0,4096

-0,3216

0,0324

-0,119

Procedemos a comprobar que los vectores estn normalizados para esto se debe verificar que:
 
   1
De donde observamos que:
 
   9.7981
 
   11.4081
Por lo tanto, dividimos cada vector propio para la raz cuadrada de sus valores de comprobacin y tenemos
los vectores propios a utilizarse:
U1n
0.0397
-0.0444
0.0047
0.0455
-0.0455
0.0294
0.0091
-0.0418
0.0033

Un2
-0.0376
-0.0110
0.0486
0.0078
-0.0078
-0.0124
0.0510
-0.0282
-0.0104

Las proyecciones estn dadas por:


-1*

Y1 = Dn F*Dp*
U1n

Mat: Jaime Andrade

-1*

Y2 = Dn F*Dp*
U2n

-0,1746

-0,0712

-0,1228

-0,0922

0,1644

0,4176

0,0512

-0,1576

-0,0842

-0,2109

-0,3100

-0,1245

Anlisis de Datos
-0,0494

0,1499

0,5805

-0,2426

0,0392

0,1965

Lo que nos genera la grfica:


PROYECCION 1

Observamos como para 1 se forman 4 grupos de los cuales observamos que el conformado por individuos
1,5,7,6 es el que capta mayor cantidad de individuos, compartiendo similares caractersticas entre ellos ,
adems observamos como existe una dependencia entre todos los individuos que conforman dichos grupos
puesto que se encuentran en similares posiciones pero con signo contrario.
PROYECCION 2

Observamos como se forman 4 grupos, los cuales no estn muy distantes entre s, por lo que notamos que
existe caractersticas similares entre ellos, hacindolos dependientes entre s.

Grafica en 2d

Interpretacin:

Mat: Jaime Andrade

Anlisis de Datos
Para la representacin conjunta notamos de manera ms eficaz la formacin de los grupos de individuos
segn caractersticas en comn que comparten unos con otros, adems notamos como ciertos individuos
tienen ciertas propiedades que les asemeja a otros individuos pero con signo contrario.
PERFILES COLUMNA
Procedemos a realizar el clculo de los perfiles columna, iniciamos con:
1* T

T = F*Dp- F * Dn

-1

0,1978

0,0667

0,1311

0,0477

0,1144

0,1311

0,0667

0,1144

0,0477

0,0834

0,0667

0,2168

0,0667

0,0834

0,1501

0,0667

0,1334

0,1501

0,0667

0,0667

0,2892

0,1112

0,0667

0,178

0,2225

0,0667

0,1311

0,2145

0,1311

0,0477

0,1311

0,0834

0,0477

0,0477

0,1668

0,0477

0,0834

0,1311

0,2145

0,1311

0,0477

0,0834

0,1311

0,0477

0,0834

0,1144

0,1501

0,0477

0,1311

0,1978

0,0477

0,0667

0,1978

0,0477

0,1311

0,1112

0,1311

0,0477

0,0477

0,2423

0,0477

0,1589

0,0834

0,0667

0,0667

0,0834

0,0834

0,4835

0,0667

0,1501

0,0667

0,1334

0,178

0,0667

0,0667

0,2447

0,0667

0,1112

0,0667

0,1144

0,1501

0,0477

0,1311

0,1978

0,0477

0,0667

0,1978

0,0477

0,0477

0,2225

0,0477

0,0477

0,0477

0,1589

0,1112

0,0477

0,2702

0,0834

0,0667

0,0667

0,1668

0,0834

0,0834

0,1501

0,0667

0,2335

Ahora procedemos con el clculo de valores y vectores propios:


1= 0.5497
2= 0.5445

U2

U1

0.1852

-0.2188

0.1357

-0.5447

-0.3531

0.1686

-0.0376

-0.3803

-0.4397

0.2508

0.4018

0.2076

0.3152

0.2897

-0.5758

0.0071

-0.1267

-0.4449

0.1394
0.3073
Verificamos que los vectores propios estn normalizados esto es:

Mat: Jaime Andrade

Anlisis de Datos
 
   
Calculando obtenemos:
 
   . 
 
   . 
Por lo tanto, dividimos cada vector propio para la raz cuadrada de sus valores de comprobacin y tenemos
los vectores propios a utilizarse:
V1n

V2n

-0,0179

-0,0076

-0,0126

-0,01

0,0173

0,0458

0,005

-0,0175

-0,0089

-0,0231

-0,0317

-0,0133

-0,0048

0,0166

0,0587

-0,0276

0,0043

0,0216

-0,0317

-0,0133

-0,0017

0,0425

0,0241

-0,0142

Las proyecciones estn dadas por:


-1* T

Lo que nos genera la grfica:

Mat: Jaime Andrade

1*

-1* T

1*

O1 = Dp F *Dn- V1n

O2 = Dp F *Dn- V2n

-2,9613

2,8352

-0,6499

-2,5764

5,0303

0,5183

0,4521

2,6406

-0,3243

-1,8852

-3,9616

8,4344

5,2733

0,9553

-2,148

-3,0528

-0,8166

0,2287

Anlisis de Datos

Interpretacin:
Para la representacin conjunta notamos de manera ms eficaz la formacin de los grupos de variables
segn caractersticas en comn que comparten unos con otros, adems notamos como ciertos individuos
tienen ciertas propiedades que les asemeja a otros individuos pero con signo contrario.

Mat: Jaime Andrade