Variabilele sunt considerate a fi omogene atunci când clasifică obiectele din aceeaşi
categorie în aceleaşi subgrupe.
Analiza corespondenţelor multiple mai poartă denumirea de analiza omogenităţii sau dual
scaling. Ea conduce la rezultate comparabile, dar nu identice celor de la analiza
corespondenţelor cu două variabile. Analiza corespondenţelor determină un output unic
care reproduce conformitatea şi calitatea reprezantării soluţiei. O altă diferenţă între cele
două proceduri este aceea că datele de intrare pentru analiza corespondenţelor multiple
sunt sub forma unei matrici în care rândurile reprezintă obiecte, iar coloanele sunt
variabile; în cazul analizei corespondenţelor datele de intrare pot să fie sub forma
aceleiaşi matrici, a unei matrici de proximitate sau a unui tabel de contingenţă, care este o
matrice agregată în care rândurile şi coloanele reprezintă categorii ale variabilelor.
Prezumţii. Datele trebuie să conţină cel puţin trei cazuri valide. Analiza se bazează pe
date întregi pozitive. Opţiunea de discretizare va acţiona automat asupra unei variabile cu
valori fracţionale grupându-le în categorii cu o distribuţie apropiată de cea normală şi va
converti valorile nominale în numere întregi pozitive. Se pot însă specifica şi alte scheme
de discretizare.
1
ANALIZA CORESPONDENTELOR MULTIPLE
Pentru exemplificare am aplicat analiza corepondentelor multiple asupra unui set de date
care contine informatii despre tigari. Urmatorul tabel cuprinde variabilele analizate:
Analiza omogenităţii poate să determine câte o soluţie pentru mai multe dimensiuni.
Numărul maxim de dimensiuni este egal fie cu numărul categoriilor minus numărul
variabilelor fără date missing, fie cu numărul observaţiilor minus unu (se alege valoarea
cea mai mică). Totuşi, rar se utilizează numărul maxim de dimensiuni. Un număr mai mic
de dimensiuni este mai uşor de interpretat, iar după un anumit număr de dimensiuni
volumul asociaţiilor suplimentare devine neglijabil. De obicei se utilizează soluţii cel
mult tri-dimensionale.
2
ANALIZA CORESPONDENTELOR MULTIPLE
Model Summary
Soluţia explică aproape toata varianţa din date astfel: 50.1% în prima dimensiune,
respectiv 48.1% în cea de-a doua.
Pentru fiecare variabilă în parte s-a realizat câte un grafic în care etichetele reprezintă
valorile variabilei.
3
ANALIZA CORESPONDENTELOR MULTIPLE
A B
0 D D
B C
D
Dimension 2
-5 C
-10
C C
-2 0 2 4 6 8 10
Dimension 1
Analizand graficul de mai sus se poate observa ca prima dimensiune separa brandurile A,
B si C de brandul D. Cea de-a doua dimensiune nu discrimineaza atat de bine brandurile.
Asadar, prima dimensiune se gaseste in legatura cu variabila flavor, iar cea de-a doua
dimensiune se afla in legatura cu variabila category. Variabilele length si pack type au
valori mari pentru ambele dimensiuni => indica o buna discriminare in ambele cazuri.
Variabilele menthol si price sunt situate aproape de origine, deci nu au deloc putere de
discriminare.
4
ANALIZA CORESPONDENTELOR MULTIPLE
Discrimination Measures
1.0
CATEGORY LENGTH
PACK TYPE
Dimension 2 0.8
0.6
0.4
0.2
PRICE
MENTHOL FLAVOR
0.0
0.0 0.2 0.4 0.6 0.8 1.0
Dimension 1
5
ANALIZA CORESPONDENTELOR MULTIPLE
De asemenea, o variabila ale carei categorii sunt mai indepartate are o putere de
discriminare mai mare decat o variabila cu categorii apropiate.
2
CATEGORY
LOW
85 MEDIUM
100 MENTHOL
KING SIZE
HINGE
LIGHTSLID BOX FLAVOR
0 ULTRA LIGHTS 84
LENGTH
FULL SOFT
100'S FLAVOR
NO PACK
MENTHOL
PREMIUM
ROUND CORNER BOXSUPER LIGHTS MENTHOL
-2 PACK TYPE
PRICE
-4
Dimension 2
72
-6
-8
-10
REGULAR SIZE
-12 73
Z-LIGHTER PACK
-14
-2 0 2 4 6 8 10
Dimension 1
Variable Principal Normalization.
6
ANALIZA CORESPONDENTELOR MULTIPLE
Graficul privind variabila length arata ca dimensiunea 2 separa obiectele cu lungime mica
de cele cu lungime mare.
85 85
0 84 84
85 85
84
Dimension 2
-5 72
-10
73 73
73
-2 0 2 4 6 8 10
Dimension 1
7
ANALIZA CORESPONDENTELOR MULTIPLE
KING SIZE
0 KING SIZE KING SIZE
KING
KING SIZE
SIZE
KING SIZE
Dimension 2
-5 REGULAR SIZE
-10
REGULAR SIZE
REGULAR SIZE
-2 0 2 4 6 8 10
Dimension 1
8
ANALIZA CORESPONDENTELOR MULTIPLE
-10
Z-LIGHTER PACK
Z-LIGHTER PACK
-2 0 2 4 6 8 10
Dimension 1
9
ANALIZA CORESPONDENTELOR MULTIPLE
FULL FLAVOR
0 ULTRA LIGHTS ULTRA LIGHTS
FULL
FULL FLAVOR
FLAVOR
ULTRA LIGHTS
Dimension 2
-5 LIGHTS
-10
FULL FLAVOR
FULL FLAVOR
-2 0 2 4 6 8 10
Dimension 1
10
ANALIZA CORESPONDENTELOR MULTIPLE
Asa cum am precizat deja, variabila price nu reuseste sa separe prea bine obiectele pe
niciuna dintre dimensiuni.
LOW LOW
MEDIUM
0 PREMIUM PREMIUM
PREMIUM
PREMIUM
Dimension 2
-5 PREMIUM
-10
PREMIUM
PREMIUM
-2 0 2 4 6 8 10
Dimension 1
11
ANALIZA CORESPONDENTELOR MULTIPLE
NO MENTHOL
0 NO MENTHOL NO MENTHOL
NO MENTHOL
NO MENTHOL
Dimension 2
-5 NO MENTHOL
-10
NO MENTHOL
NO MENTHOL
-2 0 2 4 6 8 10
Dimension 1
12