1. PENDAHULUAN
Secara umum analisis kelompok dibagi menjadi dua metode yaitu metode hirarki dan metode
nonhirarki. Metode hirarki jumlah kelompok yang akan dibentuk belum ditentukan. Prosedur
kelompok hirarki terdiri atas dua bagian, yaitu metode (penggabungan) agglomerative dan metode
(pemisah) divisive. Metode penggabungan yang sering digunakan adalah single linkage, average
linkage, dan complete linkage. Selain itu ada juga metode centroid dan wards. Single linkage
menggabungkan kelompok menggunakan jarak terdekat, complete linkage menggabungkan kelompok
menurut jarak paling jauh, average linkage menggabungkan kelompok menurut jarak rata-rata antara
setiap pasangan objek yang mungkin dari semua objek pada satu kelompok dengan seluruh objek pada
kelompok lain, sedangkan metode Wards mengelompokkan objek dengan memaksimalkan
kehomogenan dalam kelompok. Pada penelitian ini dikaji lebih khusus mengenai pengelompokan
dengan 4 metode pautan, yaitu Single linkage, Complete linkage, Average linkage dan Wards dengan
2 ukuran jarak kedekatan, yaitu jarak Euclidean dan jarak Square Euclidean dengan asumsi bahwa
antar peubah tidak saling berkorelasi.
2. TINJAUAN TEORI
2.1 Analisis Kelompok
Analisis kelompok merupakan metode analisis untuk mengelompokkan objek-objek
pengamatan menjadi beberapa kelompok, sehingga akan diperoleh kelompok dimana objek-objek
dalam satu kelompok memiliki banyak persamaan sedangkan dengan anggota kelompok lain memiliki
banyak perbedaan (Johnson dan Winchern, 2007). Pada dasarnya ada dua prosedur pengelompokan,
yaitu pengelompokan dengan prosedur hirarki dan non hirarki. Pada penelitian ini metode yang
digunakan adalah prosedur hirarki dimana jumlah kelompok yang akan dibentuk belum ditentukan.
Asumsi yang harus dipenuhi dalam analisis kelompok adalah tidak terdapat korelasi antar
peubah. Sehingga untuk mengetahui apakah terdapat korelasi antar peubah dilakukan pengujian yaitu
analisis korelasi.
Analisis kelompok tidak dapat dilakukan jika terdapat korelasi antar peubah, oleh karena itu
dilakukan analisis komponen utama. Analisis komponen utama bertujuan menghilangkan korelasi
antar peubah dengan membentuk peubah-peubah baru yang tidak saling berkorelasi.
Setelah dilakukan analisis komponen utama, maka analisis kelompok dapat dilakukan. Dalam
analisis kelompok, ukuran kemiripan (ukuran jarak) diperlukan pada tahap awal dalam penggabungan
2 kelompok.
457
d ij
2
( X im X jm)
(1)
m 1
di mana, dij = jarak antar objek ke-i dengan objek ke- j; i, j =1,2,,n; i j; m = 1,2,.,p; Xim = nilai
pengamatan objek ke-i peubah ke-m; Xjm = nilai pengamatan objek ke-j peubah ke-m; p = banyaknya
peubah.
Pada jarak Square Euclidean merupakan ukuran kesamaan jumlah kuadrat perbedaan tanpa akar
kuadrat. Formulanya sebagai berikut (Hair et al, 1998):
p
2
d ij2 ( X im X jm)
(2)
m 1
(5)
di mana,
adalah jarak antara objek i pada kelompok (UV) dan objek j pada kelompok W; n(UV) =
jumlah objek dalam kelompok W;
= jumlah dari objek-objek pada kelompok (UV) dan W.
Metode wards adalah metode cluster hirarki dari penggabungan 2 group untuk meminimalkan
ESS. Rumus metode wards adalah
n
(6)
di mana, Xi = vektor objek ke-i berukuran (px1); X = vektor rata-rata semua objek berukuran (px1);
n = banyaknya objek (Johnson dan Winchern, 2007).
2.4 Pemilihan Metode Terbaik
Pemilihan metode terbaik dalam pengelompokkan dapat dilihat dari keragaman yang terbentuk.
Semakin kecil nilai keragamannya, maka hasil pengelompokkan semakin baik. Jika CTM bernilai nol,
artinya semua data berada pada pusat kelompok.
458
1 k 1 p S tm
CTM
k t 1 p m1 S m
(7)
dimana:
= simpangan baku pada kelompok ke-t untuk peubah ke-m; = simpangan baku peubah
ke-m; t =1,.,k; m= 1,.,p; = banyaknya peubah; k = banyaknya kelompok.
3. METODE PENELITIAN
Data yang digunakan pada penelitian ini adalah 10 data sekunder dengan berbagai macam
jumlah pengamatan dan peubah. Langkah-langkah analisis pada penelitian ini adalah
1. Melakukan pembakuan untuk menyeimbangkan satuan
2. Melakukan analisis korelasi untuk mengetahui ada tidaknya korelasi antar peubah
3. Mengukur kesamaan objek menggunakan metode jarak kedekatan yaitu Euclidean dan Square
Euclidean menggunakan persamaan 1 dan 2
4. Menjelaskan setiap anggota kelompok yang terbentuk pada masing-masing kombinasi metode
pengelompokan single linkage menggunakan persamaan 3, complete linkage menggunakan persamaan
4, average linkage menggunakan persamaan 5 dan wards menggunakan persamaan 6.
5. Melakukan pemilihan metode terbaik menggunakan nilai CTM menggunakan persamaan 7.
4. HASIL DAN PEMBAHASAN
Penelitian ini, menggunakan 4 metode penggabungan dan 2 ukuran jarak kedekatan yaitu Single
linakge, Complete linkage, Average linkage dan Wards Methods jarak yang digunakan Euclidean
dan Square Euclidean. Semua data mengandung korelasi sehingga dilakukan analisis komponen utama
untuk mendapatkan skor komponen sebagai masukan pada analisis kelompok.
Penentuan hasil metode terbaik menggunakan nilai Cluster Tightness Measure (CTM). Semakin
kecil nilai keragamannya, maka hasil pengelompokkan semakin baik, jika CTM bernilai nol, artinya
semua data berada pada pusat kelompok. Hasil perbandingan metode Single linkge, Complete linkage,
Average linkage dan Wards Method menggunakan jarak Euclidean disajikan di Tabel 1, sedangkan
untuk jarak Square Euclidean disajikan di Tabel 2.
Tabel.1 Nilai CTM Metode Average Linkage, Single Linkage, Complete Linkage dan Wards Method
Menggunakan Jarak Euclidean
CTM
Sample
No
Metode Terbaik
Average
Single
Complete
Size
Wards
Linkage
Linkage
Linkage
Average, Single dan
1
27
0,898
0,433
0,433
0,433
Complete
2
31
0,506
0,837
Single
0,279
0,279
3
35
0,574
0,711
0,711
Single
0,311
4
24
0,756
0,756
0,754
Single
0,274
Average dan
5
19
0,115
0,686
0,090
0,090
Single
6
21
0,731
0,637
0,476
Single
0,472
Average, Single,
7
14
0,326
0,326
0,326
0,326
Complete dan Wards
8
33
0,305
0,314
0,881
Average
0,277
9
8
0,416
0,695
0,842
Single
0,373
10
15
0,413
0,879
0,841
Average
0,249
Berdasarkan Tabel 1 metode yang lebih baik adalah metode single linkage , karena dari 10 data
yang diteliti metode single linkage yang paling banyak memiliki nilai CTM lebih kecil dibandingkan
metode lainnya. Jadi, pada jarak Euclidean metode single linkage merupakan metode yang lebih baik.
459
Tabel.2 Nilai CTM Metode Average Linkage, Single Linkage, Complete Linkage dan Wards Method
Menggunakan Jarak Square Euclidean
CTM
Sample
No
Metode Terbaik
Average
Single
Complete
Size
Wards
Linkage
Linkage
Linkage
Average, Single dan
1
27
0,831
0,433
0,433
0,433
Complete
Average dan
2
31
0,408
0,739
0,278
0,278
Single
3
35
0,574
0,712
0,712
Single
0,311
4
24
0,756
0,765
0,752
Single
0,274
5
19
0,171
0,976
0,918
Single
0,090
6
21
0,731
0,637
0,818
Single
0,472
Average, Single,
7
14
Complete dan
0,325
0,325
0,325
0,325
Wards
8
33
0,416
0,314
0,886
Single
0,305
9
8
0,416
0,842
0,842
Single
0,373
Single dan
10
15
0,826
0,841
0,413
0,413
Average
Berdasarkan Tabel 2 metode yang lebih baik adalah metode single linkage. Jadi pada jarak
Square Euclidean metode single linkage juga merupakan metode yang lebih baik. Dengan
menggunakan jarak Euclidean dan Suqare Euclidean metode single linkage menjadi metode yang
lebih baik dibandingkan dengan metode lainnya.
5.
KESIMPULAN
Berdasarkan nilai CTM menunjukkan bahwa metode pautan single linkage dengan jarak
Euclidean dan Square Euclidean merupakan metode pautan terbaik dibandingkan metode-metode
pautan yang lain. Saran untuk penelitian selanjutnya bisa menggunakan metode pemilihan terbaik
yang lain selain CTM, untuk membuktikan metode single linkage yang terbaik.
DAFTAR PUSTAKA
Hair, J.F., Black, W.C., Babin, B.J. dan Anderson, R.E., (1998), Multivariate Data Analysis, Fifth
Edition, Pearson Prentice Hall, New Jersey.
Johnson, R.A., dan Winchern, D.W., (2007), Applied Multivariate Statistical Analysis, Pearson
Education International, USA.
Walpole, R. E., (1995), Pengantar Statistika, Edisi ke-3, Gramedia, Jakarta.
460