Anda di halaman 1dari 4

BEBERAPA METODE PAUTAN PADA ANALISIS KELOMPOK

MENGGUNAKAN JARAK EUCLIDEAN DAN SQUARE EUCLIDEAN


Rizky Linda Maylana
Jurusan Matematika, F.MIPA, Universitas Brawijaya
Email : lindunmaylana@ymail.com
Abstrak. Analisis kelompok digunakan untuk mengelompokkan objek pengamatan menjadi beberapa kelompok sehingga
diperoleh kelompok dimana objek-objek dalam satu kelompok memiliki banyak persamaan, sedangkan dengan anggota
kelompok lainnya memiliki banyak perbedaan. Dalam analisis kelompok, ukuran kemiripan (ukuran jarak) diperlukan pada
tahap awal dalam penggabungan 2 kelompok. Ukuran jarak yang digunakan yaitu jarak Euclidean dan Square Euclidean.
Setelah antar peubah diukur dengan matriks jarak, langkah selanjutnya adalah melalukan proses pengelompokan. Proses
pengelompokan menggunakan metode hairarki dengan pautan single linkage, average linkage, complete linkage, dan wards.
Penelitian ini bertujuan mengetahui 4 metode pautan tersebut, manakah yang lebih baik dari hasil pengelompokan dengan
menggunakan ukuran jarak kedekatan Euclidean dan Square Euclidean. Proses pengelompokan menggunakan 10 data
sekunder dengan berbagai macam jumlah pengamatan dan peubah . Pemilihan metode pengelompokan terbaik menggunakan
nilai Cluster Tightness Measure (CTM) terkecil dimana nilai CTM didasarkan pada simpangan baku dari beberapa kelompok
dengan beberapa peubah. Berdasarkan nilai CTM, menunjukkan pengelompokan metode single linkage merupakan metode
yang lebih baik daripada metode lainnya dengan menggunakan jarak Euclidean dan Square Euclidean.
Kata Kunci: Average linkage, Single linkage, Complete linkage, Ward method

1. PENDAHULUAN
Secara umum analisis kelompok dibagi menjadi dua metode yaitu metode hirarki dan metode
nonhirarki. Metode hirarki jumlah kelompok yang akan dibentuk belum ditentukan. Prosedur
kelompok hirarki terdiri atas dua bagian, yaitu metode (penggabungan) agglomerative dan metode
(pemisah) divisive. Metode penggabungan yang sering digunakan adalah single linkage, average
linkage, dan complete linkage. Selain itu ada juga metode centroid dan wards. Single linkage
menggabungkan kelompok menggunakan jarak terdekat, complete linkage menggabungkan kelompok
menurut jarak paling jauh, average linkage menggabungkan kelompok menurut jarak rata-rata antara
setiap pasangan objek yang mungkin dari semua objek pada satu kelompok dengan seluruh objek pada
kelompok lain, sedangkan metode Wards mengelompokkan objek dengan memaksimalkan
kehomogenan dalam kelompok. Pada penelitian ini dikaji lebih khusus mengenai pengelompokan
dengan 4 metode pautan, yaitu Single linkage, Complete linkage, Average linkage dan Wards dengan
2 ukuran jarak kedekatan, yaitu jarak Euclidean dan jarak Square Euclidean dengan asumsi bahwa
antar peubah tidak saling berkorelasi.
2. TINJAUAN TEORI
2.1 Analisis Kelompok
Analisis kelompok merupakan metode analisis untuk mengelompokkan objek-objek
pengamatan menjadi beberapa kelompok, sehingga akan diperoleh kelompok dimana objek-objek
dalam satu kelompok memiliki banyak persamaan sedangkan dengan anggota kelompok lain memiliki
banyak perbedaan (Johnson dan Winchern, 2007). Pada dasarnya ada dua prosedur pengelompokan,
yaitu pengelompokan dengan prosedur hirarki dan non hirarki. Pada penelitian ini metode yang
digunakan adalah prosedur hirarki dimana jumlah kelompok yang akan dibentuk belum ditentukan.
Asumsi yang harus dipenuhi dalam analisis kelompok adalah tidak terdapat korelasi antar
peubah. Sehingga untuk mengetahui apakah terdapat korelasi antar peubah dilakukan pengujian yaitu
analisis korelasi.
Analisis kelompok tidak dapat dilakukan jika terdapat korelasi antar peubah, oleh karena itu
dilakukan analisis komponen utama. Analisis komponen utama bertujuan menghilangkan korelasi
antar peubah dengan membentuk peubah-peubah baru yang tidak saling berkorelasi.
Setelah dilakukan analisis komponen utama, maka analisis kelompok dapat dilakukan. Dalam
analisis kelompok, ukuran kemiripan (ukuran jarak) diperlukan pada tahap awal dalam penggabungan
2 kelompok.

457

2.2 Jarak Kedekatan


Observasi mempunyai sifat yang lebih dekat dengan observasi tertentu daripada dengan
observasi yang lain, digunakan ukuran (distance). Pada penelitian ini lebih difokuskan pada 2 jarak
kedekatan yaitu, jarak Euclidean dan jarak Square Euclidean.
Pada jarak Euclidean mempunyai asumsi bahwa antar peubah tidak saling berkorelasi, memiliki
satuan pengukuran yang sama dan pengukuran pembakuan mempunyai rata-rata nol dan standar
deviasi satu. Jarak Euclidean merupakan jarak antar objek, misalkan dua objek ke- dan ke- yang
berada pada dimensi di mana formulanya sebagai berikut (Johnson dan Winchen, 2007) :
p

d ij

2
( X im X jm)

(1)

m 1

di mana, dij = jarak antar objek ke-i dengan objek ke- j; i, j =1,2,,n; i j; m = 1,2,.,p; Xim = nilai
pengamatan objek ke-i peubah ke-m; Xjm = nilai pengamatan objek ke-j peubah ke-m; p = banyaknya
peubah.
Pada jarak Square Euclidean merupakan ukuran kesamaan jumlah kuadrat perbedaan tanpa akar
kuadrat. Formulanya sebagai berikut (Hair et al, 1998):
p

2
d ij2 ( X im X jm)

(2)

m 1

2.3 Metode Pengelompokan Hirarki


Analisis Kelompok hirarki adalah analisis hasil pengelompokan yang hasil pengelompokannya
disajikan secara berjenjang dari n, (n-1) sampai terdapat satu kelompok. Terdapat beberapa teknik
metode agglomerative diantaranya, metode single linkage, complete linkage, average linkage, dan
wards.
Metode Single linkage adalah kelompok yang dibentuk dari kesatuan individu dengan
menggabungkan tetangga terdekat.
(3)
( )
di mana,
adalah jarak antara tetangga terdekat dari kelompok U dan W juga kelompok V
dan W, begitu sebaliknya.
Metode Complete linkage merupakan metode dengan menggunakan prinsip jarak terjauh antar
objek.
(4)
( )
di mana,
adalah jarak terjauh antar anggota kelompok U dan W juga kelompok V dan W,
begitu sebaliknya.
Metode Average linkage menggunakan prinsip ukuran jarak rata-rata antara setiap pasangan
objek yang mungkin dari semua objek pada satu kelompok dengan seluruh objek pada kelompok lain.
(

(5)

di mana,
adalah jarak antara objek i pada kelompok (UV) dan objek j pada kelompok W; n(UV) =
jumlah objek dalam kelompok W;
= jumlah dari objek-objek pada kelompok (UV) dan W.
Metode wards adalah metode cluster hirarki dari penggabungan 2 group untuk meminimalkan
ESS. Rumus metode wards adalah
n

EES(Error of Sum Square)= ( Xi X) ' ( Xi X)


i 1

(6)

di mana, Xi = vektor objek ke-i berukuran (px1); X = vektor rata-rata semua objek berukuran (px1);
n = banyaknya objek (Johnson dan Winchern, 2007).
2.4 Pemilihan Metode Terbaik
Pemilihan metode terbaik dalam pengelompokkan dapat dilihat dari keragaman yang terbentuk.
Semakin kecil nilai keragamannya, maka hasil pengelompokkan semakin baik. Jika CTM bernilai nol,
artinya semua data berada pada pusat kelompok.

458

1 k 1 p S tm
CTM

k t 1 p m1 S m

(7)

dimana:
= simpangan baku pada kelompok ke-t untuk peubah ke-m; = simpangan baku peubah
ke-m; t =1,.,k; m= 1,.,p; = banyaknya peubah; k = banyaknya kelompok.
3. METODE PENELITIAN
Data yang digunakan pada penelitian ini adalah 10 data sekunder dengan berbagai macam
jumlah pengamatan dan peubah. Langkah-langkah analisis pada penelitian ini adalah
1. Melakukan pembakuan untuk menyeimbangkan satuan
2. Melakukan analisis korelasi untuk mengetahui ada tidaknya korelasi antar peubah
3. Mengukur kesamaan objek menggunakan metode jarak kedekatan yaitu Euclidean dan Square
Euclidean menggunakan persamaan 1 dan 2
4. Menjelaskan setiap anggota kelompok yang terbentuk pada masing-masing kombinasi metode
pengelompokan single linkage menggunakan persamaan 3, complete linkage menggunakan persamaan
4, average linkage menggunakan persamaan 5 dan wards menggunakan persamaan 6.
5. Melakukan pemilihan metode terbaik menggunakan nilai CTM menggunakan persamaan 7.
4. HASIL DAN PEMBAHASAN
Penelitian ini, menggunakan 4 metode penggabungan dan 2 ukuran jarak kedekatan yaitu Single
linakge, Complete linkage, Average linkage dan Wards Methods jarak yang digunakan Euclidean
dan Square Euclidean. Semua data mengandung korelasi sehingga dilakukan analisis komponen utama
untuk mendapatkan skor komponen sebagai masukan pada analisis kelompok.
Penentuan hasil metode terbaik menggunakan nilai Cluster Tightness Measure (CTM). Semakin
kecil nilai keragamannya, maka hasil pengelompokkan semakin baik, jika CTM bernilai nol, artinya
semua data berada pada pusat kelompok. Hasil perbandingan metode Single linkge, Complete linkage,
Average linkage dan Wards Method menggunakan jarak Euclidean disajikan di Tabel 1, sedangkan
untuk jarak Square Euclidean disajikan di Tabel 2.
Tabel.1 Nilai CTM Metode Average Linkage, Single Linkage, Complete Linkage dan Wards Method
Menggunakan Jarak Euclidean
CTM
Sample
No
Metode Terbaik
Average
Single
Complete
Size
Wards
Linkage
Linkage
Linkage
Average, Single dan
1
27
0,898
0,433
0,433
0,433
Complete
2
31
0,506
0,837
Single
0,279
0,279
3
35
0,574
0,711
0,711
Single
0,311
4
24
0,756
0,756
0,754
Single
0,274
Average dan
5
19
0,115
0,686
0,090
0,090
Single
6
21
0,731
0,637
0,476
Single
0,472
Average, Single,
7
14
0,326
0,326
0,326
0,326
Complete dan Wards
8
33
0,305
0,314
0,881
Average
0,277
9
8
0,416
0,695
0,842
Single
0,373
10
15
0,413
0,879
0,841
Average
0,249
Berdasarkan Tabel 1 metode yang lebih baik adalah metode single linkage , karena dari 10 data
yang diteliti metode single linkage yang paling banyak memiliki nilai CTM lebih kecil dibandingkan
metode lainnya. Jadi, pada jarak Euclidean metode single linkage merupakan metode yang lebih baik.

459

Tabel.2 Nilai CTM Metode Average Linkage, Single Linkage, Complete Linkage dan Wards Method
Menggunakan Jarak Square Euclidean
CTM
Sample
No
Metode Terbaik
Average
Single
Complete
Size
Wards
Linkage
Linkage
Linkage
Average, Single dan
1
27
0,831
0,433
0,433
0,433
Complete
Average dan
2
31
0,408
0,739
0,278
0,278
Single
3
35
0,574
0,712
0,712
Single
0,311
4
24
0,756
0,765
0,752
Single
0,274
5
19
0,171
0,976
0,918
Single
0,090
6
21
0,731
0,637
0,818
Single
0,472
Average, Single,
7
14
Complete dan
0,325
0,325
0,325
0,325
Wards
8
33
0,416
0,314
0,886
Single
0,305
9
8
0,416
0,842
0,842
Single
0,373
Single dan
10
15
0,826
0,841
0,413
0,413
Average
Berdasarkan Tabel 2 metode yang lebih baik adalah metode single linkage. Jadi pada jarak
Square Euclidean metode single linkage juga merupakan metode yang lebih baik. Dengan
menggunakan jarak Euclidean dan Suqare Euclidean metode single linkage menjadi metode yang
lebih baik dibandingkan dengan metode lainnya.
5.

KESIMPULAN

Berdasarkan nilai CTM menunjukkan bahwa metode pautan single linkage dengan jarak
Euclidean dan Square Euclidean merupakan metode pautan terbaik dibandingkan metode-metode
pautan yang lain. Saran untuk penelitian selanjutnya bisa menggunakan metode pemilihan terbaik
yang lain selain CTM, untuk membuktikan metode single linkage yang terbaik.
DAFTAR PUSTAKA
Hair, J.F., Black, W.C., Babin, B.J. dan Anderson, R.E., (1998), Multivariate Data Analysis, Fifth
Edition, Pearson Prentice Hall, New Jersey.
Johnson, R.A., dan Winchern, D.W., (2007), Applied Multivariate Statistical Analysis, Pearson
Education International, USA.
Walpole, R. E., (1995), Pengantar Statistika, Edisi ke-3, Gramedia, Jakarta.

460

Anda mungkin juga menyukai