Anda di halaman 1dari 5

Contoh Kasus Analisis Cluster dengan Menggunakan K-Means

A. Contoh Kasus dengan Algoritma K-Means :


Dari banyak siswa diambil 12 siswa sebagai contoh untuk penerapan algoritma k-means dalam
penjurusan siswa. Percobaan dilakukan dengan menggunakan parameter-parameter berikut:
Jumlah cluster :2
Jumlah data : 12
Jumlah atribut :8
Berikut merupakan data yang digunakan untuk melakukan percobaan perhitungan manual :
Iterasi ke-1

NIS Nama Matematika Fisika Kimia Biologi Sejarah Akuntansi Sosiologi Geografi

2012173 Afgansyah 79 75 75 85 76 78 76 80
Denny
2012174 Sumargo 84 76 79 77 76 77 75 81

Lina Nur
2012175 Aini 77 84 78 85 92 89 77 82

Ananda
2012176 Anugrah 78 86 84 77 78 77 75 75

Putri
2012177 Khadijah 82 82 81 91 90 82 79 91

2012178 Ika Inayah 75 75 70 82 75 75 79 75


Wa Ode
2012179 Sofia Z. 77 75 75 89 80 80 75 75

Budy
2012180 Santoso 77 76 70 77 77 80 75 80

Andi Eka
2012181 Murti 79 76 75 84 77 81 76 77

Ahsan
2012182 Muhajir 80 75 75 75 75 78 77 79

Siswan
2012183 Sumargo 76 71 75 75 77 81 79 84

Anis
2012184 Fadilah 80 77 75 78 78 77 77 80

1. Penentuan pusat awal cluster


Untuk penentuan awal di asumsikan:
Diambil data ke- 2 sebagai pusat Cluster Ke-1: (84, 76, 79, 77, 76, 77, 75, 81).
Diambil data ke- 5 sebagai pusat Cluster Ke-2: (82, 82, 81, 91, 90, 82, 79, 91).

2. Perhitungan jarak pusat cluster


Untuk mengukur jarak antara data dengan pusat cluster digunakan Euclidian distance,
kemudian akan didapatkan matrik jarak yaitu C1 dan C2 sebagai berikut:

Rumus Euclidian distance :

Jarak
Matematika Fisika Kimia Biologi Sejarah Akuntansi Sosiologi Geografi C1 C2
Terpendek

79 75 75 85 76 78 76 80 10.44 21.726 10.44030651

84 76 79 77 76 77 75 81 0 24.021 0

77 84 78 85 92 89 77 82 24.145 14.56 14.56021978

78 86 84 77 78 77 75 75 14.177 26.038 14.17744688

82 82 81 91 90 82 79 91 24.021 0 0

75 75 70 82 75 75 79 75 15.652 28.81 15.65247584

77 75 75 89 80 80 75 75 16.462 22.136 16.46207763

77 76 70 77 77 80 75 80 11.874 26.23 11.87434209

79 76 75 84 77 81 76 77 11.136 22.472 11.13552873

80 75 75 75 75 78 77 79 6.8557 27.092 6.8556546

76 71 75 75 77 81 79 84 12.288 25.846 12.28820573

80 77 75 78 78 77 77 80 6.5574 22.978 6.557438524

3. Pengelompokkan data
Jarak hasil perhitungan akan dilakukan perbandingan dan dipilih jarak terdekat antara data
dengan pusat cluster, jarak ini menunjukkan bahwa data tersebut berada dalam satu kelompok
dengan pusat cluster terdekat.
Berikut ini akan ditampilkan data matriks pengelompokkan group, nilai 1 berarti data tersebut
berada dalam group :
G1
No C1 C2
1 1 0

2 1 0

3 0 1

4 1 0

5 0 1

6 1 0

7 1 0

8 1 0

9 1 0

10 1 0

11 1 0

12 1 0

4. Penentuan pusat cluster baru


Setelah diketahui anggota tiap-tiap cluster kemudian pusat cluster baru dihitung berdasarkan
data anggota tiap-tiap cluster sesuai dengan rumus pusat anggota cluster. Sehingga didapatkan
perhitungan sebagai berikut:
Iterasi Ke-2
Cluster
Nama Matematika Fisika Kimia Biologi Sejarah Akuntansi Sosiologi Geografi
baru

Afgansyah 79 75 75 85 76 78 76 80 78.5 79.5


Denny 84 76 79 77 76 77 75 81 76.2 83
Sumargo
Lina Nur 77 84 78 85 92 89 77 82 75.3 79.5
Aini
Ananda 78 86 84 77 78 77 75 75 79.9 88
Anugrah
Putri 82 82 81 91 90 82 79 91 76.9 91
Khadijah
Ika Inayah 75 75 70 82 75 75 79 75 78.4 85.5
Wa Ode 77 75 75 89 80 80 75 75 76.4 78
Sofia Z.
Budy 77 76 70 77 77 80 75 80 78.6 86.5
Santoso
Andi Eka
79 76 75 84 77 81 76 77
Murti
Ahsan
80 75 75 75 75 78 77 79
Muhajir
Siswan 76 71 75 75 77 81 79 84
Sumargo
Anis 80 77 75 78 78 77 77 80
Fadilah

5. Ulangi langkah ke 2 (kedua) hingga posisi data tidak mengalami perubahan.

Cluster baru yang ke-1 78.5 76.2 75.3 79.9 76.9 78.4 76.4 78.6
Cluster baru yang ke-2 79.5 83 79.5 88 91 85.5 78 86.5

Jarak
Matematika Fisika Kimia Biologi Sejarah Akuntansi Sosiologi Geografi C1 C2
Terpendek

79 75 75 85 76 78 76 80 5.557 20.518 5.556977596

84 76 79 77 76 77 75 81 7.9297 22.956 7.929691041

77 84 78 85 92 89 77 82 21.182 7.2801 7.280109889

78 86 84 77 78 77 75 75 14.088 23.13 14.08829301

82 82 81 91 90 82 79 91 23.381 7.2801 7.280109889

75 75 70 82 75 75 79 75 9.0044 26.646 9.004443348

77 75 75 89 80 80 75 75 10.662 19.596 10.66208235

77 76 70 77 77 80 75 80 6.729 23.324 6.729041537

79 76 75 84 77 81 76 77 5.1653 19.9 5.165268628

80 75 75 75 75 78 77 79 5.6639 24.96 5.663920903

76 71 75 75 77 81 79 84 10.004 23.854 10.0039992

80 77 75 78 78 77 77 80 3.4756 21 3.475629439

Langkah selanjutnya sama dengan langkah pada nomor 3 jarak hasil perhitungan akan
dilakukan perbandingan dan dipilih jarak terdekat antara data dengan pusat cluster, jarak ini
menunjukkan bahwa data tersebut berada dalam satu kelompok dengan pusat cluster terdekat.
G2
No C1 C2
1 1 0

2 1 0

3 0 1

4 1 0

5 0 1

6 1 0

7 1 0

8 1 0

9 1 0

10 1 0

11 1 0

12 1 0

Karena G2 = G1 memiliki anggota yang sama maka tidak perlu dilakukan iterasi/perulangan
lagi. Hasil clustering telah mencapai stabil dan konvergen.

Anda mungkin juga menyukai