Vor fi supuse procesului de clusterizare toate cele 27 de state membre UE, variabilele pe
baza crora se va face mprirea lor n clase fiind:
Rata inflaiei;
Deficitul bugetar;
Rata omajului;
Migraia net;
Selectai toate variabile, iar la label cases punei variabila n funcie de care s e eticheteze.
Tab-ul statistics:
Pentru a msura distana am ales distana euclidian simpla, iar metodele pentru care
am optat sunt metoda celor mai apropiai vecini1 i metoda lui Ward2, pentru a determina care
dintre cele dou duc la rezultate mai bune n cazul de fa. n ambele cazuri s-au folosit
variabile standardizate, unitatea de msur a variabilor fiind diferit.
1 Distana dintre dou clustere este msurat ca distan ntre cele mai apropiate 2 obiecte din
cele dou clustere.
2 Se bazeaz pe maximizarea gradului de omogenitate al clusterului, (minimizarea
variabilitii intra cluster) i maximizarea variabilitii intrercluster.
Rezultatele analizei cluster sunt diferite n funcie de metoda aplicat, astfel, dup cum
se poate va putea observa din cele dou dendograme precum i din schemele de agregare,
orinea n care are loc gruparea obiectelor este diferit.
Tabel 1. Schema de grupare cei mai apropiai vecini
Agglomeration Schedule
Stage
Cluster Combined
Cluster 1
Coefficients
Cluster 2
Next Stage
Cluster 2
.681
13
1.242
14
15
1.247
1.265
12
1.267
1.690
10
18
2.186
2.250
10
14
2.273
11
10
2.457
11
11
2.939
10
12
12
2.991
11
14
13
16
17
3.155
17
14
3.583
12
15
15
10
5.111
14
17
16
19
20
5.174
20
17
16
5.414
15
13
19
18
21
27
5.722
19
19
21
5.874
17
18
20
20
19
6.384
19
16
21
21
25
6.497
20
22
22
26
6.516
21
23
23
22
6.580
22
24
24
24
6.874
23
25
25
11
10.166
24
26
26
23
17.687
25
n primul pas, se grupeaza trile 3 i 5 (clusterd combined), ntre acestea existnd cea mai
mic distan. Acestora li se adauga n etapa 4 (coloana Next Stage) o nou ar (daca va
uitai la pasul 4 vedei c se grupeaz 3 cu 8). Logica gruprii este aceea i i pentru pa ii
urmtori.
Mai jos avei dendograma:
Metoda celor mai apropiai vecini nu ilustreaz foarte clar clustere de tri, motiv pentru care
metoda lui Ward este cea care va furniza numrul de clustere n care vom mprii cele 27 de
state. Dendograma sugereaz un numr de 3 mari grupe. Schema de grupare (tabelul 2) este
diferit fat de cea din cazu predecent.
Tabel 2. Schema de grupare metoda lui Ward
Agglomeration Schedule
Stage
Cluster Combined
Cluster 1
Coefficients
Cluster 2
Next Stage
Cluster 2
.341
13
.962
14
15
1.585
2.430
16
18
3.555
12
4.722
10
14
6.129
19
16
17
7.706
18
9.792
13
10
12.167
15
11
19
20
14.754
22
12
21
27
17.615
18
13
21.024
16
14
24
26
24.461
23
15
10
28.828
10
19
16
33.278
13
20
17
22
25
38.213
20
18
16
21
44.229
12
24
19
51.192
15
21
20
22
58.658
16
17
22
21
11
68.949
19
23
22
19
86.115
20
11
25
23
24
104.098
21
14
26
24
16
23
128.637
18
25
25
16
159.335
22
24
26
26
208.000
25
23
Cluster 1: Cipru, Malta, Cehia, Lituania, Grecia, Ungaria, Portugalia, Germania, Italia,
Polonia, Slovacia
Cluster 2: Estonia, Letonia, Bulgaria, Romania, Spania
Cluster 3: Franta, Marea Britanie, Finlanda, Suedia, Danemarca, Belgium, Austria, Olanda,
Slovenia, Irlanda, Luxemburg
n cazul de fa, metioda lui Ward a dus la obinerea unor rezultate mai bune,
permind o diferenier mai clar a clusterelor. Folosind principiul minimizrii varianei n
cadrul grupurilor, ilustreaz mai bine profilul trilor. Pe de alt parte, metoda celor mai
apropiai vecini, duce uneori la constituirea de grupuri eterogene, variana din cadrul
grupurilor putnd nregistra valori mai ridicate. n analiza de fa, metoda celor mai apropiai
vecini duce la izolarea unui stat (Spania).