Anda di halaman 1dari 53

UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

DAFTAR ISI

DAFTAR ISI 2
GLOSARIUM 3
TUJUAN PRAKTIKUM 4
KNOWLEDGE DISCOVERY IN DATABASE (KDD) 4
1. Definisi 4
2. Proses KDD 4
ANALISIS CLUSTER 5
1. Definisi 5
2. Penerapan Analisis Cluster 6
TAHAPAN 6
CONTOH KASUS 17
PENYELESAIAN DENGAN METODE HIRARKI 19
PENYELESAIAN DENGAN METODE NON HIRARKI 42
DAFTAR PUSTAKA 52

2
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

GLOSARIUM
Taksonomi = Pengelompokkan atau penggolongan
Undersampling = Proses membuang sebagian data dari kelas mayor agar
diperoleh data yang seimbang
Multikolinearitas = Korelasi atau hubungan kuat antara dua variabel bebas atau
lebih dalam sebuah model regresi berganda

3
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

TUJUAN PRAKTIKUM
Tujuan dari praktikum ini adalah:
1. Mahasiswa mempunyai pengetahuan dasar mengenai Knowledge Discovery of
Database (KDD).
2. Mahasiswa mempunyai pengetahuan dan kemampuan dasar dalam melakukan dan
menerapkan analisis Cluster.
3. Mahasiswa dapat mengetahui dan memahami arti dan garis besar dari analisis Cluster
dalam data mining, mulai dari pengambilan data, pengolahan data sampai dengan tahap
pengelompokan, serta mengaplikasikannya dalam kasus yang dihadapi.

KNOWLEDGE DISCOVERY IN DATABASE (KDD)


1. Definisi
Knowledge Discovery in Database (KDD) adalah keseluruhan proses non-trivial untuk
mencari dan mengidentifikasi pola (pattern) dalam data, dimana pola yang ditemukan
bersifat sah, baru, dapat bermanfaat dan dapat dimengerti (Gilchrist & Mooers, 2012).
Istilah data mining dan Knowledge Discovery in Database (KDD) sering kali
digunakan secara bergantian untuk menjelaskan proses penggalian informasi
tersembunyi dalam suatu basis data yang besar. Sebenarnya kedua istilah tersebut
memiliki konsep yang berbeda, tetapi berkaitan satu sama lain karena salah satu tahapan
dalam keseluruhan proses KDD adalah data mining.
2. Proses KDD
Menurut (Rikhi, 2015) proses KDD secara garis besar dapat dijelaskan sebagai berikut:
1) Data Selection
Pemilihan (seleksi) data dari sekumpulan data operasional perlu dilakukan sebelum
tahap penggalian informasi dalam KDD dimulai. Data hasil seleksi yang akan
digunakan untuk proses data mining, disimpan dalam suatu berkas, terpisah dari
basis data operasional.
2) Pre-processing
Sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses cleaning
pada data yang menjadi fokus KDD. Proses cleaning mencakup antara lain

4
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

membuang duplikasi data, memeriksa data yang inkonsisten, dan memperbaiki


kesalahan pada data, seperti kesalahan cetak (tipografi). Juga dilakukan proses
enrichment, yaitu proses “memperkaya” data yang sudah ada dengan data atau
informasi lain yang relevan dan diperlukan untuk KDD, seperti data atau informasi
eksternal.
3) Transformation
Coding adalah proses transformasi pada data yang telah dipilih, sehingga data
tersebut sesuai untuk proses data mining. Proses coding dalam KDD merupakan
proses kreatif dan sangat tergantung pada jenis atau pola informasi yang akan dicari
dalam basis data.
4) Data Mining
Data mining adalah proses mencari pola atau informasi menarik dalam data terpilih
dengan menggunakan teknik atau metode tertentu. Teknik, metode, atau algoritma
dalam data mining sangat bervariasi. Pemilihan metode dan algoritma yang tepat
sangat bergantung pada tujuan dan proses KDD secara keseluruhan. Dalam modul
ini kita menggunakan salah satu teknik data mining yaitu cluster.
5) Interpretation/Evaluation
Pola informasi yang dihasilkan dari proses data mining perlu ditampilkan dalam
bentuk yang mudah dimengerti oleh pihak yang berkepentingan. Tahap ini
merupakan bagian dari proses KDD yang disebut interpretation. Tahap ini
mencakup pemeriksaan apakah pola atau informasi yang ditemukan bertentangan
dengan fakta atau hipotesis yang ada sebelumnya.

ANALISIS CLUSTER
1. Definisi
Cluster merupakan sebuah proses pembagian atau pengelompokan sebuah populasi ke
dalam subgrup atau gugus yang lebih kecil dan lebih homogen (Berry & Linoff, 2004).
Menurut (Everitt, et al., 2011), teknik analisis cluster berkaitan dengan eksplorasi dan
menilai kumpulan data untuk dapat diringkas secara bermakna ke dalam sejumlah
kelompok yang relatif sedikit dengan ketentuan bahwa kumpulan objek atau individual

5
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

yang mirip satu sama lain berada dalam kelompok yang sama dan individu yang
berbeda dimasukkan dalam kelompok lain. Dalam konteks memahami data, cluster
mampu mengelompokkan data dan analisis cluster merupakan ilmu yang secara teknis
dapat mengelompokkan data secara otomatis. Sebagai contoh, anak-anak dapat dengan
cepat mengelompokkan jenis gambar seperti gambar bangunan, tumbuhan, hewan, dan
lainnya (Michael et al, 2006).
2. Penerapan Analisis Cluster
Penerapan analisis cluster didalam pemasaran adalah sebagai berikut:
1. Identifikasi objek (Recognition)
Dalam bidang Image Processing, Computer Vision atau Robot Vision
2. Decision Support System dan Data Mining
● Membuat segmen pasar (segmenting the market)
● Memahami perilaku pembeli
● Mengenali peluang produk baru

TAHAPAN
Tahapan dalam Analisis Cluster adalah sebagai berikut :
1. Tujuan Analisis Cluster
Tujuan utama analisis cluster adalah memisahkan suatu himpunan objek menjadi dua
kelompok atau lebih berdasarkan kesamaan karakteristik khusus yang dimilikinya.
Sedangkan tujuan analisis cluster secara khusus, antara lain:
● Penyederhanaan Data
Penyederhanaan data merupakan bagian dari suatu taksonomi. Dengan struktur
yang terbatas observasi/objek dapat dikelompokkan untuk analisis selanjutnya.
● Identifikasi Hubungan (Relationship Identification)
Hubungan antar objek diidentifikasi secara empiris. Struktur analisis cluster yang
sederhana dapat menggambarkan adanya hubungan atau kesamaan dan perbedaan
yang tidak dinyatakan sebelumnya.

6
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

● Pemilihan pada Pengelompokan Variabel


Tujuan analisis cluster tidak dapat dipisahkan dengan pemilihan variabel yang
digunakan untuk menggolongkan objek ke dalam cluster-cluster. Cluster yang
terbentuk merefleksikan struktur yang melekat pada data seperti yang didefinisikan
oleh variabel-variabel. Pemilihan variabel harus sesuai dengan teori dan konsep
yang umum digunakan dan harus rasional. Rasionalitas ini didasarkan pada teori-
teori eksplisit atau penelitian sebelumnya. Variabel-variabel yang dipilih hanyalah
variabel yang dapat mencirikan objek yang akan dikelompokkan dan secara spesifik
harus sesuai dengan tujuan analisis cluster.
2. Desain Penelitian dalam Analisis Cluster
Pada desain penelitian terdapat 2 hal yang dilakukan yaitu:
● Pendeteksian Outliers
Outlier adalah suatu objek yang sangat berbeda dengan objek lainnya. Outliers
dapat terjadi karena:
a. Observasi ‘menyimpang’ yang tidak mewakili populasi
b. Suatu undersampling kelompok-kelompok dalam populasi yang menyebabkan
underrepresentation kelompok-kelompok dalam sampel
Dalam kedua kasus tersebut, outliers dapat mengubah struktur sebenarnya dalam
populasi sehingga kita akan memperoleh cluster-cluster yang tidak sesuai dengan
struktur sebenarnya dari populasi tersebut dan tidak representatif.
● Mengukur Kesamaan antar Objek
Konsep kesamaan adalah hal yang sangat penting dalam analisis cluster. Kesamaan
antar objek merupakan ukuran kedekatan antar objek. Kesamaan dapat diketahui
dengan melakukan pengukuran jarak antar setiap individu. Ukuran jarak merupakan
ukuran ketidakmiripan, dimana jarak yang besar menunjukkan sedikit kesamaan
sebaliknya jarak yang pendek/kecil menunjukkan bahwa suatu objek makin mirip
dengan objek lain.

7
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

Gambar 1. Ilustrasi Pengukuran jarak


Metode untuk mengukur kesamaan objek antara lain:
1) Euclidean Distance
Jarak euclidean antara dua titik i dan j merupakan sisi miring (sisi terpanjang)
dari segitiga ABC.

𝐷(𝑖, 𝑗) = √𝐴2 + 𝐵 2 = √∑(𝑋𝑖 − 𝑌𝑖 )2 = √(𝑋1𝑖 − 𝑋1𝑗 )2 +(𝑋2𝑖 − 𝑋2𝑗 )2


2) Squared Euclidean Distance
Merupakan pengukuran kuadrat jarak euclidean antara dua titik i dan j.

𝐷(𝑖, 𝑗) = 𝐴2 + 𝐵 2 = ∑(𝑋𝑖 − 𝑌𝑖 )2 = (𝑋1𝑖 − 𝑋1𝑗 )2 +(𝑋2𝑖 − 𝑋2𝑗 )2


3) Chebychev
D (X, Y)= 𝑚𝑎𝑥𝑖 |𝑋𝑖 − 𝑌𝑖 |
4) City Block Distance
D (X, Y)= ∑|𝑋𝑖 − 𝑌𝑖 |
D (i, j) = |𝐴| + |𝐵| = ∑|𝑋𝑖 − 𝑌𝑖 | = |𝑋1𝑖 − 𝑋1𝑗 | + |𝑋2𝑖 − 𝑋2𝑗 |
3. Asumsi-asumsi dalam Analisis Cluster
Seperti hal teknik analisis lain, analisis cluster juga menetapkan adanya suatu asumsi.
Ada dua asumsi dalam analisis cluster yaitu:
a. Kecukupan Sampel untuk Mewakili Populasi
Biasanya suatu penelitian dilakukan terhadap populasi diwakili oleh sekelompok
sampel. Sampel yang digunakan dalam analisis cluster harus dapat mewakili
populasi yang ingin dijelaskan, karena analisis ini baik jika sampel representatif.
Jumlah sampel yang diambil tergantung penelitinya, seorang peneliti harus yakin
bahwa sampel yang diambil representatif terhadap populasi.

8
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

b. Pengaruh Multikolinearitas
Ada atau tidaknya multikolinearitas antar variabel sangat diperhatikan dalam
analisis cluster karena hal itu berpengaruh, sehingga variabel-variabel yang bersifat
multikolinearitas secara eksplisit dipertimbangkan dengan lebih seksama.
4. Proses Mendapatkan Cluster dan Menilai Kelayakan secara Keseluruhan (Overall Fit)
Adapun metode pengelompokan dalam analisis cluster meliputi:
1) Metode Non-Hirarkis.
Dimulai dengan menentukan terlebih dahulu jumlah cluster yang diinginkan (dua, tiga,
atau yang lain). Setelah jumlah cluster ditentukan, maka proses cluster dilakukan
dengan tanpa mengikuti proses hirarki. Metode ini biasa disebut “K-Means Cluster”.
Berbeda dengan metode hirarki, prosedur non hirarki (K-means Clustering) dimulai
dengan memilih sejumlah nilai cluster awal sesuai dengan jumlah yang diinginkan dan
kemudian objek digabungkan ke dalam cluster-cluster tersebut.
a. Sequential Threshold Procedure
Metode ini melakukan pengelompokan dengan terlebih dahulu memilih satu objek
dasar yang akan dijadikan nilai awal cluster, kemudian semua objek yang ada didalam
jarak terdekat dengan cluster ini akan bergabung lalu dipilih cluster kedua dan semua
objek yang mempunyai kemiripan dimasukkan dalam cluster ini. Demikian seterusnya
hingga terbentuk beberapa cluster dengan keseluruhan objek di dalamnya.
b. Parallel Threshold Procedure
Secara prinsip sama dengan prosedur sequential threshold, hanya saja dilakukan
pemilihan terhadap beberapa objek awal cluster sekaligus dan kemudian melakukan
penggabungan objek ke dalamnya secara bersamaan.
c. Optimizing
Merupakan pengembangan dari kedua metode diatas dengan melakukan optimasi pada
penempatan objek yang ditukar untuk cluster lainnya dengan pertimbangan kriteria
optimasi.
2) Metode Hirarkis.
Memulai pengelompokan dengan dua atau lebih objek yang mempunyai kesamaan
paling dekat. Kemudian dilanjutkan pada objek yang lain dan seterusnya hingga cluster

9
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

akan membentuk semacam ‘pohon’ dimana terdapat tingkatan (hirarki) yang jelas antar
objek, dari yang paling mirip hingga yang paling tidak mirip. Teknik hirarki
(hierarchical methods) adalah teknik clustering membentuk kontruksi hirarki atau
berdasarkan tingkatan tertentu seperti struktur pohon (struktur pertandingan). Alat yang
membantu untuk memperjelas proses hirarki ini disebut “dendogram”.
Teknik hirarki (hierarchical methods) adalah teknik clustering membentuk
kontruksi hirarki atau berdasarkan tingkatan tertentu seperti struktur pohon (struktur
pertandingan). Dengan demikian proses pengelompokkannya dilakukan secara
bertingkat atau bertahap. Hasil dari pengelompokan ini dapat disajikan dalam bentuk
dendogram. Metode-metode yang digunakan dalam teknik hirarki:
a. Agglomerative Methods
Metode ini dimulai dengan kenyataan bahwa setiap objek membentuk clusternya
masing-masing. Kemudian dua objek dengan jarak terdekat bergabung. Selanjutnya
objek ketiga akan bergabung dengan cluster yang ada atau bersama objek lain dan
membentuk cluster baru. Hal ini tetap memperhitungkan jarak kedekatan antar objek.
Proses akan berlanjut hingga akhirnya terbentuk satu cluster yang terdiri dari
keseluruhan objek. Ada beberapa teknik dalam agglomerative methods yaitu:
● Single Linkage (Nearest Neighbor Methods)
Metode ini menggunakan prinsip jarak minimum yang diawali dengan mencari dua
objek terdekat dan keduanya membentuk cluster yang pertama. Pada langkah
selanjutnya terdapat dua kemungkinan, yaitu :
a. Objek ketiga akan bergabung dengan cluster yang telah terbentuk, atau
b. Dua objek lainnya akan membentuk cluster baru.
Proses ini akan berlanjut sampai akhirnya terbentuk cluster tunggal. Pada metode
ini jarak antar cluster didefinisikan sebagai jarak terdekat antar anggotanya.

10
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

Contoh : Terdapat matriks jarak antara 5 buah objek, yaitu :


A B C D E
A 0.0 1.0 5.0 6.0 8.0
B 1.0 0.0 3.0 8.0 7.0
C 5.0 3.0 0.0 4.0 6.0
D 6.0 8.0 4.0 0.0 2.0
E 8.0 7.0 6.0 2.0 0.0

Gambar 2. Matriks Antara 5 Buah Objek.


Langkah penyelesaiannya:
a). Mencari objek dengan jarak minimum
Menghitung jarak antara cluster AB dengan objek lainnya.
D(AB)C = min {dAC, dBC}= dBC = 3.0
D(AB)D = min {dAD, dBD}= dAD = 6.0
D(AB)E = min {dAE, dBE}= dBE = 7.0
Dengan demikian terbentuk matriks jarak yang baru
AB C D E
AB 0.0 5.0 8.0 8.0
C 5.0 0.0 4.0 6.0
D 8.0 4.0 6.0 2.0
E 8.0 6.0 2.0 0.0

Gambar 3. Matriks 5 Buah Objek Dengan Jarak Baru


b). Mencari objek dengan jarak terdekat.
D dan E mempunyai jarak terdekat, yaitu 2,0 maka objek D dan E bergabung
menjadi satu cluster.
c). Menghitung jarak antara cluster dengan objek lainnya.
D(AB)C = 3.0
D(AB)(DE) = min {dAD, dAE, dBD, dBE} = dAD = 6.0
D(DE)C = min {dCD, dCE} = dCD = 4.0
d). Mencari jarak terdekat antara cluster dengan objek dan diperoleh objek C
bergabung dengan cluster AB

11
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

e). Pada langkah yang terakhir, cluster ABC bergabung dengan DE sehingga
terbentuk cluster tunggal.

● Complete Linkage (Furthest Neighbor Methods)


Metode ini merupakan kebalikan dari pendekatan yang digunakan pada single
linkage. Prinsip jarak yang digunakan adalah jarak terjauh antar objek.
Contoh: Terdapat matriks jarak antara lima buah objek yaitu :
A B C D E
A 0.0 1.0 5.0 6.0 8.0
B 1.0 0.0 3.0 8.0 7.0
C 5.0 3.0 0.0 4.0 6.0
D 6.0 8.0 4.0 0.0 2.0
E 8.0 7.0 6.0 2.0 0.0

Gambar 4. Matriks Antara 5 Buah Objek.


Langkah penyelesaiannya:
a) Mencari objek dengan jarak minimum
A dan B mempunyai jarak terdekat yaitu 1.0 maka objek A dan B bergabung
menjadi satu cluster.
b) Menghitung jarak antara cluster AB dengan objek lainnya
d(AB)C = max {dAC, dBC} = dAC = 5,0
d(AB)D = max {dAD, dBD} = dBD = 8,0
d(AB)E = max {dAE, dBE} = dAE = 8,0
Dengan demikian terbentuk matriks jarak yang baru :
AB C D E
AB 0.0 5.0 8.0 8.0
C 5.0 0.0 4.0 6.0
D 8.0 4.0 6.0 2.0
E 8.0 6.0 2.0 0.0

Gambar 5. Matriks 5 Buah Objek Dengan Jarak Baru

12
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

c) Mencari objek dengan jarak terdekat.


D dan E mempunyai jarak terdekat yaitu 2.0 maka objek D dan E bergabung
menjadi satu cluster.
d) Menghitung jarak antara cluster dengan objek lainnya.
d(AB)C = 4,0
d(AB)(DE) = 1/2{dAD, dAE, dBD, dBE} = 7,25
d(DE)C = 1/2{dCD, dCE,} = dCE = 5,00
Maka terbentuklah matriks jarak yang baru, yaitu :
AB C DE
AB 0.0 4.0 7.25
C 4.0 0.0 5.0
DE 7.25 5.0 0.0

Gambar 6. Matriks Akhir


e) Mencari jarak terdekat antara cluster dengan objek dan diperoleh objek C
bergabung dengan cluster AB.
f) Pada langkah yang terakhir, cluster ABC bergabung dengan DE sehingga
terbentuk cluster tunggal.

● Ward’s error sum of squares methods


Ward mengajukan suatu metode pembentukan cluster yang didasari oleh hilangnya
informasi akibat penggabungan objek menjadi cluster. Hal ini diukur dengan
jumlah total dari deviasi kuadrat pada mean cluster untuk tiap observasi.
Error sum of squares (ESS) digunakan sebagai fungsi objektif. Dua objek akan
digabungkan apabila mempunyai fungsi objektif terkecil diantara kemungkinan
yang ada.
∑ 2
𝑋𝑖𝑗 −1
ESS= ∑ 2
𝑛𝑗 (∑ 𝑋𝑖𝑗 )

Dengan Xij adalah nilai untuk objek ke-i pada cluster ke-j.

b. Divisive Methods

13
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

Metode divisive berlawanan dengan metode agglomerative. Metode ini pertama-tama


diawali dengan satu cluster besar yang mencakup semua observasi (objek). Selanjutnya
objek yang mempunyai ketidakmiripan yang cukup besar akan dipisahkan sehingga
membentuk cluster yang lebih kecil. Pemisahan ini dilanjutkan sehingga mencapai
sejumlah cluster yang diinginkan.
● Splinter average distance methods
Metode ini didasarkan pada perhitungan jarak rata-rata masing-masing objek
dengan objek pada grup splinter dan jarak rata-rata objek tersebut dengan objek lain
pada grupnya. Proses tersebut dimulai dengan memisahkan objek dengan jarak
terjauh sehingga terbentuklah dua grup. Kemudian dibandingkan dengan jarak rata-
rata masing-masing objek dengan grup splinter dengan grupnya sendiri. Apabila
suatu objek mempunyai jarak yang lebih dekat ke grup splinter daripada ke grupnya
sendiri, maka objek tersebut haruslah dikeluarkan dari grupnya dan dipisahkan ke
grup splinter. Apabila komposisinya sudah stabil, yaitu jarak suatu objek ke
grupnya selalu lebih kecil daripada jarak objek itu ke grup splinter, maka proses
berhenti dan dilanjutkan dengan tahap pemisahan dalam grup.
Contoh: Terdapat matriks jarak antara 5 buah objek, yaitu :
A B C D E
A 0 12 9 32 31
B 12 0 9 25 27
C 9 9 0 23 24
D 32 25 23 0 9
E 31 27 24 9 0

Gambar 7. Matriks Perbandingan 5 buah Objek


Perhitungan :
a) Menghitung jarak rata-rata antar objek
A = ¼ (12+9+32+31) = 21 D = ¼ (32+25+23+9) = 22.25
B = ¼ (12+9+25+27) = 18.25 E = ¼ (31+27+24+9) = 22.75
C = ¼ (9+9+23+24) = 16.25

14
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

Terlihat bahwa E mempunyai nilai jarak terjauh, yaitu 22.75, maka E dipisahkan
dari grup utama dan membentuk grup splinter.
b) Menghitung jarak rata-rata objek dengan grup utama dengan grup splinter
Jarak Rata-rata dengan Jarak Rata-rata dengan
Object x-y
Group Splinter (x) Group Utama (y)
A 31 17.67 -13.33
B 27 15.33 -11.67
C 24 13.67 -10.33
D 9 26.67 17.67
Gambar 8. Perhitungan Rata-Rata Grup Utama Dengan Grup Splinter
Pada D, jarak rata-rata dengan grup splinter lebih dekat daripada dengan grup
utama. Dengan demikian D harus dikeluarkan dari grup utama dan masuk ke
grup splinter.
c) Perhitungan jarak rata-rata
Jarak Rata-rata dengan Jarak Rata-rata dengan
Object x-y
Group Splinter (x) Group Utama (y)
A 31.5 10.5 -21.0
B 26.0 10.5 -15.5
C 23.5 9.0 -14.5
Gambar 9. Perhitungan Rata-Rata Grup Utama Dengan Grup Splinter
Karena jarak semua objek ke grup utama sudah lebih besar daripada jaraknya ke grup
splinter, maka komposisinya sudah stabil.
5. Interpretasi terhadap Cluster
Tahap interpretasi meliputi pengujian tiap cluster dalam term untuk menamai dan
menandai dengan suatu label yang secara akurat dapat menjelaskan kealamian cluster.
Membuat profil dan interpretasi cluster tidak hanya untuk memperoleh suatu gambaran
saja melainkan pertama, menyediakan suatu rata-rata untuk menilai korespondensi pada
cluster yang terbentuk, kedua, profil cluster memberikan arahan bagi penilaian
terhadap signifikansi praktis. Namun demikian, yang perlu diperhatikan pada tahapan
interpretasi adalah karakteristik yang membedakan masing-masing cluster sehingga
kita dapat memberikan label pada masing-masing cluster tersebut.
6. Proses Validasi dan Pembuatan Profil Cluster

15
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

1) Proses validasi solusi cluster


Proses validasi bertujuan menjamin bahwa solusi yang dihasilkan dari analisis
cluster dapat mewakili populasi dan dapat digeneralisasi untuk objek lain.
Pendekatan ini membandingkan solusi cluster dan menilai korespondensi hasil.
Terkadang tidak dapat dipraktekkan karena adanya kendala waktu dan biaya atau
ketidaktersediaan objek untuk analisis cluster ganda.
2) Pembuatan profil (profiling) solusi cluster
Tahap ini menggambarkan karakteristik tiap cluster untuk menjelaskan cluster-
cluster tersebut dapat dapat berbeda pada dimensi yang relevan. Titik beratnya pada
karakteristik yang secara signifikan berbeda antar cluster dan memprediksi anggota
dalam suatu cluster khusus.

16
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

CONTOH KASUS

Bank XYZ merupakan sebuah perbankan yang bergerak dalam perkreditan rakyat.
Bank tersebut berencana untuk mengetahui risiko peminjaman yang dilakukan nasabah selama
satu tahun terakhir. Salah satu strategi bank yang digunakan untuk mengetahui tujuan tersebut
adalah dengan melakukan penelusuran nasabah yang melakukan peminjaman di bank.
Penentuan pengelompokan nasabah didasarkan oleh beberapa faktor di antaranya Usia, Jumlah
Pinjaman, Jumlah Pendapatan Debitur, dan Jangka Waktu Pinjaman yang diambil nasabah
untuk melunasinya. Dalam studi kasus ini, bank menggunakan analisis clustering untuk
mengelompokkan nasabah serta menentukan strategi untuk mencegah adanya risiko
peminjaman yang dapat diterapkan pada nasabah. Berikut merupakan data historis yang telah
diperoleh dari 40 nasabah:
Jumlah Jangka
Usia Pendapatan
No. Responden Pinjaman Waktu
(tahun) Debitur (juta)
(juta) (bulan)
1 Agung 35 85 70 16
2 Astri 20 10 60 15
3 Amalia 55 8 50 12
4 Ari 31 8 70 15
5 Achmad 20 8 60 15
6 Ferdy 22 6 50 15
7 Khoiry 33 9 70 14
8 Kiki 35 8 75 16
9 Mayang 37 6 50 14
10 Abdi 24 7 65 14
11 Nahroni 42 4 30 15
12 Muharudin 38 5 45 13
13 Ryan 36 6 55 12
14 Rini 24 65 645 16

17
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

15 Rizki 22 5 35 16
16 Santi 31 65 60 12
17 Saiful 25 7 60 17
18 Sandi 37 5 50 14
19 Sutra 40 8 70 18
20 Syfa 35 7 65 16
21 Ambarini 23 45 40 14
22 Tina 60 8 75 13
23 Tika 33 4 30 14
24 Usman 28 85 60 15
25 Azalia 43 6 50 11
26 Dwi 36 8 70 15
27 Andri 28 20 150 14
28 Mugiono 30 25 100 12
29 Sulika 41 20 150 15
30 Purnomo 52 12 100 13
31 Murti 38 12 40 12
32 Ibrahim 24 35 50 16
33 Hartati 31 30 180 15
34 Wendi 33 2 10 12
35 Minar 28 20 150 15
36 Wahyudi 23 5 5 14
37 Muhdi 36 15 100 11
38 Wahid 30 10 30 15
39 Widya 29 15 50 14
40 Hasyim 42 20 50 12

18
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

PENYELESAIAN DENGAN METODE HIRARKI

1. Tahap Standardisasi Data


- Masukkan data variabel pada Variable View

- Mengganti type dari variabel responden menjadi “String”

- Mengisi Data View dari dataset seperti gambar di bawah ini

- Pada Data View Pilih descriptive statistics , kemudian pilih descriptives

19
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

- Pindahkan semua variabel ke kolom variable (S)


- Centang pada save standardized values as variables
- Kemudian klik OK

- Output normalisasi data

Dari hasil Output di atas merupakan tampilan pertama hasil proses nomalisasi data.
Dari tabel menunjukkan hasil nilai N, Minimum, Maximum, Mean, dan Standar
Deviation dari masing-masing kriteria. Jika sudah tampil output seperti gambar di

20
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

atas, maka Anda memastikan tampilan Data View Anda sebelumnya sudah seperti
gambar di bawah ini.

Terdapat tambahan variabel “Z” hasil dari normalisasi data kuesioner dari masing-
masing kriteria. Data "Z score” inilah yang kemudian akan diolah untuk tahap
pengelompokkan (clustering) berikutnya.

2. Tahap Pengelompokan (clustering)

- Pilih Analyze → Classify → Hierarchical Cluster


- Memindahkan semua variabel Z Score pada kotak variable (s)
- Memindahkan variabel nama (responden) pada label cases by
- Pilih Statistics

21
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

- Pada kotak dialog statistics centang Agglomerative Schedule dan Proxy Matrix
- Pilih range of solution , kemudian isi minimum number menjadi 2, dan maximum
number menjadi 5. Kemudian klik continue.

- Pada kotak dialog Plots mencentang Dendogram, All Cluster, dan Vertical

22
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

- Pada kotak dialog Method gantilah cluster Method menjadi Nearest Neighboor, dan
centang Interval kemudian mengganti pilihannya menjadi Squared Euqlidean
Distance
- Klik continue

- Maka akan terlihat output spss seperti beberapa tabel di bawah ini

23
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

OUTPUT 1 Agglomeration Schedule

Agglomeration Schedule
Cluster Combined Stage Cluster First Appears
Stage Coefficients Next Stage
Cluster 1 Cluster 2 Cluster 1 Cluster 2
1 9 18 .002 0 0 8
2 2 5 .009 0 0 4
3 8 20 .012 0 0 15
4 2 6 .067 2 0 16
5 13 31 .149 0 0 11
6 4 38 .185 0 0 9
7 7 23 .219 0 0 8
8 7 9 .234 7 1 10
9 4 26 .298 6 0 15
10 7 39 .310 8 0 14
11 13 40 .340 5 0 12
12 13 34 .350 11 0 20
13 27 35 .362 0 0 19
14 7 12 .376 10 0 18
15 4 8 .376 9 3 18
16 2 15 .387 4 0 21
17 10 36 .390 0 0 21
18 4 7 .412 15 14 20
19 27 33 .418 13 0 31
20 4 13 .422 18 12 22
21 2 10 .435 16 17 22
22 2 4 .460 21 20 23
23 2 17 .542 22 0 24
24 2 11 .628 23 0 26
25 3 22 .724 0 0 28
26 2 37 .746 24 0 27
27 2 25 .748 26 0 30
28 3 30 .760 25 0 36
29 1 24 .956 0 0 38
30 2 28 1.009 27 0 31
31 2 27 1.077 30 19 32
32 2 29 1.268 31 0 34
33 21 32 1.688 0 0 35

24
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

34 2 19 1.748 32 0 35
35 2 21 1.926 34 33 36
36 2 3 1.948 35 28 37
37 2 16 3.123 36 0 38
38 1 2 4.190 29 37 39
39 1 14 25.784 38 0 0

Hasil output tabel pertama memberikan penjelasan mengenai penggabungan antara


setiap anggota 1 dengan anggota lainnya. Seperti contoh pembacaan tabel
agglomeration schedule :
a) Pada stage 1 responden 9 bergabung dengan responden 18 pada jarak yang
terdekat pertama yaitu (lihat pada kolom coefficients) 0,002. Dimana responden
9 dan responden 18 belum pernah bergabung sebelumnya (nilai 0) dengan
anggota manapun (lihat pada kolom stage cluster first appears). Untuk melihat
penggabungan anggota yang terlibat pada stage berikutnya lihat pada kolom
next stage 8.
b) Pada stage 2 responden 2 bergabung dengan responden 5 pada jarak yaitu (lihat
pada kolom coefficients) 0,009. Dimana responden 2 dan responden 5 belum
pernah bergabung sebelumnya (nilai 0) dengan anggota manapun (lihat pada
kolom stage cluster first appears). Untuk melihat penggabungan anggota yang
terlibat pada stage berikutnya lihat pada kolom next stage 4.
c) Dan seterusnya.

25
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

OUTPUT 2 Cluster Membership

Cluster Membership
Case 5 Clusters 4 Clusters 3 Clusters 2 Clusters
1:Agung 1 1 1 1
2:Astri 2 2 2 1
3:Amalia 3 2 2 1
4:Ari 2 2 2 1
5:Achmad 2 2 2 1
6:Ferdy 2 2 2 1
7:Khoiry 2 2 2 1
8:Kiki 2 2 2 1
9:Mayang 2 2 2 1
10:Abdi 2 2 2 1
11:Nahroni 2 2 2 1
12:Muharudin 2 2 2 1
13:Ryan 2 2 2 1
14:Rini 4 3 3 2
15:Rizki 2 2 2 1
16:Santi 5 4 2 1
17:Saiful 2 2 2 1
18:Sandi 2 2 2 1
19:Sutra 2 2 2 1
20:Syfa 2 2 2 1
21:Ambarini 2 2 2 1
22:Tina 3 2 2 1
23:Tika 2 2 2 1
24:Usman 1 1 1 1
25:Azalia 2 2 2 1
26:Dwi 2 2 2 1
27:Andri 2 2 2 1
28:Mugiono 2 2 2 1
29:Sulika 2 2 2 1
30:Purnomo 3 2 2 1
31:Murti 2 2 2 1
32:Ibrahim 2 2 2 1
33:Hartati 2 2 2 1
34:Wendi 2 2 2 1

26
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

35:Minar 2 2 2 1
36:Wahyudi 2 2 2 1
37:Muhdi 2 2 2 1
38:Wahid 2 2 2 1
39:Widya 2 2 2 1
40:Hasyim 2 2 2 1

Output di atas menunjukkan bahwa setiap terbentuknya n kelompok, maka terdaftarlah


anggota-anggota setiap kelompoknya seperti yang sudah tertera pada tabel di atas. Ketika
menentukan banyaknya kelompok (cluster) tidak semua anggota berada pada cluster yang
sama ketika peneliti ingin membuat kelompok menjadi 2, 3, 4, atau 5. Contohnya:
Anggota ke 16 (Santi) menjadi anggota cluster 5 ketika kelompok yang dibentuk sebanyak 5
kelompok, dan menjadi anggota cluster 4 ketika kelompok yang dibentuk sebanyak 4
kelompok, dan menjadi anggota cluster 2 ketika kelompok yang dibentuk sebanyak 3
kelompok, dan menjadi anggota cluster 1 ketika kelompok yang dibentuk sebanyak 2
kelompok. Hasil ini membantu anda dalam menentukan cluster berdasarkan metode cut off
pada hasil dendogram.

27
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

OUTPUT 3 Dendogram

Hasil dendogram menunjukkan bahwa penggabungan setip anggota berdasarkan jarak yang
paling dekat, sehingga membentuk satu cluster yang sangat besar. Hasil dendogram ini akan
mudah dibaca jika pembacaannya dibantu oleh hasil Agglomerative Schedule. Pembentukan
jumlah cluster dapat dibentuk dengan metode cut off pada hasil dendogram. Sebagai contoh:
a) Melakukan cut off pada angka 2,5.
b) Akan terlihat cluster yang terbentuk sebanyak 2 cluster dengan 2 Outlier.

28
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

Untuk melihat anggota masing-masing cluster dapat dilihat dari gambar berikut ini:

Cut-off line pada 2.5

3 1 4
Cluster 3 dan 4 merupakan outlier.

Cluster yang terbentuk jika menggunakan metode Cut Off, sebagai berikut:
Cluster yang Outlier yang
Jarak Cut Off
terbentuk terbentuk
2,5 2 2
4 2 1
7 1 1

29
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

3. Tahap pengujian crosstab


- Pada Variabel View menambah variabel baru yaitu variabel Cluster.
- Kemudian pada variabel cluster, mengganti measure-nya menjadi nominal

- Mengganti label value variabel cluster seperti gambar di bawah ini:

- Pada Data View mengisi data untuk variabel cluster berdasarkan masing-masing
anggota pada setiap kelompok seperti gambar di bawah.

30
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

- Pilih Analyze → Descriptive Statistics → Crosstab

- Memindahkan seluruh variabel Z score pada kotak dialog Row(s)


- Memindahkan variabel cluster pada kotak dialog Coloumn (s).

- Pada menu Statistics beri tanda centang pada Correlations


- Klik Continue

31
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

- Pada menu cell display beri centang pada Observed dan Total
- Klik Continue

- Klik OK, maka Output SPSS akan muncul.

32
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

a) Output Crosstab yang ke 1 (Usia)

Crosstab
Cluster
Cluster Cluster Cluster Cluster Cluster Total
1 2 3 4 5
Zscore(Usia) - Count 0 2 0 0 0 2
1.44580 % of 0.0% 5.0% 0.0% 0.0% 0.0% 5.0%
Total
- Count 0 2 0 0 0 2
1.22757 % of 0.0% 5.0% 0.0% 0.0% 0.0% 5.0%
Total
- Count 0 2 0 0 0 2
1.11845 % of 0.0% 5.0% 0.0% 0.0% 0.0% 5.0%
Total
- Count 0 2 0 1 0 3
1.00933 % of 0.0% 5.0% 0.0% 2.5% 0.0% 7.5%
Total
-.90022 Count 0 1 0 0 0 1
% of 0.0% 2.5% 0.0% 0.0% 0.0% 2.5%
Total
-.57287 Count 1 2 0 0 0 3
% of 2.5% 5.0% 0.0% 0.0% 0.0% 7.5%
Total
-.46375 Count 0 1 0 0 0 1
% of 0.0% 2.5% 0.0% 0.0% 0.0% 2.5%
Total
-.35463 Count 0 2 0 0 0 2
% of 0.0% 5.0% 0.0% 0.0% 0.0% 5.0%
Total
-.24551 Count 0 2 0 0 1 3
% of 0.0% 5.0% 0.0% 0.0% 2.5% 7.5%
Total
-.02728 Count 0 3 0 0 0 3
% of 0.0% 7.5% 0.0% 0.0% 0.0% 7.5%
Total
.19096 Count 1 2 0 0 0 3

33
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

% of 2.5% 5.0% 0.0% 0.0% 0.0% 7.5%


Total
.30007 Count 0 3 0 0 0 3
% of 0.0% 7.5% 0.0% 0.0% 0.0% 7.5%
Total
.40919 Count 0 2 0 0 0 2
% of 0.0% 5.0% 0.0% 0.0% 0.0% 5.0%
Total
.51831 Count 0 2 0 0 0 2
% of 0.0% 5.0% 0.0% 0.0% 0.0% 5.0%
Total
.73654 Count 0 1 0 0 0 1
% of 0.0% 2.5% 0.0% 0.0% 0.0% 2.5%
Total
.84566 Count 0 1 0 0 0 1
% of 0.0% 2.5% 0.0% 0.0% 0.0% 2.5%
Total
.95478 Count 0 2 0 0 0 2
% of 0.0% 5.0% 0.0% 0.0% 0.0% 5.0%
Total
1.06389 Count 0 1 0 0 0 1
% of 0.0% 2.5% 0.0% 0.0% 0.0% 2.5%
Total
2.04595 Count 0 0 1 0 0 1
% of 0.0% 0.0% 2.5% 0.0% 0.0% 2.5%
Total
2.37330 Count 0 0 1 0 0 1
% of 0.0% 0.0% 2.5% 0.0% 0.0% 2.5%
Total
2.91889 Count 0 0 1 0 0 1
% of 0.0% 0.0% 2.5% 0.0% 0.0% 2.5%
Total
Total Count 2 33 3 1 1 40
% of 5.0% 82.5% 7.5% 2.5% 2.5% 100.0%
Total

34
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

b) Output Crosstab yang ke 2 (Jumlah Pinjaman)

Crosstab
Cluster
Cluster Cluster Cluster Cluster Cluster
1 2 3 4 5 Total
Zscore -.75770 Count 0 1 0 0 0 1
(Jumlah_Pinjaman) % of 0.0% 2.5% 0.0% 0.0% 0.0% 2.5%
Total
-.66430 Count 0 2 0 0 0 2
% of 0.0% 5.0% 0.0% 0.0% 0.0% 5.0%
Total
-.61760 Count 0 4 0 0 0 4
% of 0.0% 10.0% 0.0% 0.0% 0.0% 10.0%
Total
-.57090 Count 0 4 0 0 0 4
% of 0.0% 10.0% 0.0% 0.0% 0.0% 10.0%
Total
-.52420 Count 0 3 0 0 0 3
% of 0.0% 7.5% 0.0% 0.0% 0.0% 7.5%
Total
-.47750 Count 0 5 2 0 0 7
% of 0.0% 12.5% 5.0% 0.0% 0.0% 17.5%
Total
-.43080 Count 0 1 0 0 0 1
% of 0.0% 2.5% 0.0% 0.0% 0.0% 2.5%
Total
-.38410 Count 0 2 0 0 0 2
% of 0.0% 5.0% 0.0% 0.0% 0.0% 5.0%
Total
-.29070 Count 0 1 1 0 0 2
% of 0.0% 2.5% 2.5% 0.0% 0.0% 5.0%
Total
-.15061 Count 0 2 0 0 0 2
% of 0.0% 5.0% 0.0% 0.0% 0.0% 5.0%
Total
.08289 Count 0 4 0 0 0 4

35
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

% of 0.0% 10.0% 0.0% 0.0% 0.0% 10.0%


Total
.31639 Count 0 1 0 0 0 1
% of 0.0% 2.5% 0.0% 0.0% 0.0% 2.5%
Total
.54989 Count 0 1 0 0 0 1
% of 0.0% 2.5% 0.0% 0.0% 0.0% 2.5%
Total
.78338 Count 0 1 0 0 0 1
% of 0.0% 2.5% 0.0% 0.0% 0.0% 2.5%
Total
1.25038 Count 0 1 0 0 0 1
% of 0.0% 2.5% 0.0% 0.0% 0.0% 2.5%
Total
2.18437 Count 0 0 0 1 1 2
% of 0.0% 0.0% 0.0% 2.5% 2.5% 5.0%
Total
3.11836 Count 2 0 0 0 0 2
% of 5.0% 0.0% 0.0% 0.0% 0.0% 5.0%
Total
Total Count 2 33 3 1 1 40
% of 5.0% 82.5% 7.5% 2.5% 2.5% 100.0%
Total

36
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

c) Output Crosstab yang ke 3 (Pendapatan Debitur)

Crosstab
Cluster
Cluster Cluster Cluster Cluster Cluster Total
1 2 3 4 5
Zscore -.76572 Count 0 1 0 0 0 1
(Pendapatan_Debitur) % of 0.0% 2.5% 0.0% 0.0% 0.0% 2.5%
Total
-.71510 Count 0 1 0 0 0 1
% of 0.0% 2.5% 0.0% 0.0% 0.0% 2.5%
Total
-.51259 Count 0 3 0 0 0 3
% of 0.0% 7.5% 0.0% 0.0% 0.0% 7.5%
Total
-.46197 Count 0 1 0 0 0 1
% of 0.0% 2.5% 0.0% 0.0% 0.0% 2.5%
Total
-.41134 Count 0 2 0 0 0 2
% of 0.0% 5.0% 0.0% 0.0% 0.0% 5.0%
Total
-.36071 Count 0 1 0 0 0 1
% of 0.0% 2.5% 0.0% 0.0% 0.0% 2.5%
Total
-.31009 Count 0 7 1 0 0 8
% of 0.0% 17.5% 2.5% 0.0% 0.0% 20.0%
Total
-.25946 Count 0 1 0 0 0 1
% of 0.0% 2.5% 0.0% 0.0% 0.0% 2.5%
Total
-.20883 Count 1 3 0 0 1 5
% of 2.5% 7.5% 0.0% 0.0% 2.5% 12.5%
Total
-.15821 Count 0 2 0 0 0 2
% of 0.0% 5.0% 0.0% 0.0% 0.0% 5.0%
Total
-.10758 Count 1 4 0 0 0 5

37
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

% of 2.5% 10.0% 0.0% 0.0% 0.0% 12.5%


Total
-.05695 Count 0 1 1 0 0 2
% of 0.0% 2.5% 2.5% 0.0% 0.0% 5.0%
Total
.19618 Count 0 2 1 0 0 3
% of 0.0% 5.0% 2.5% 0.0% 0.0% 7.5%
Total
.70244 Count 0 3 0 0 0 3
% of 0.0% 7.5% 0.0% 0.0% 0.0% 7.5%
Total
1.00620 Count 0 1 0 0 0 1
% of 0.0% 2.5% 0.0% 0.0% 0.0% 2.5%
Total
5.71445 Count 0 0 0 1 0 1
% of 0.0% 0.0% 0.0% 2.5% 0.0% 2.5%
Total
Total Count 2 33 3 1 1 40
% of 5.0% 82.5% 7.5% 2.5% 2.5% 100.0%
Total

38
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

d) Output Crosstab yang ke 4 (Jangka Waktu Pinjaman)

Crosstab
Cluster
Cluster Cluster Cluster Cluster Cluster
1 2 3 4 5 Total
Zscore - Count 0 2 0 0 0 2
(Jangka_Waktu_ 1.90993 % of 0.0% 5.0% 0.0% 0.0% 0.0% 5.0%
Pinjaman) Total
- Count 0 5 1 0 1 7
1.30838 % of 0.0% 12.5% 2.5% 0.0% 2.5% 17.5%
Total
-.70682 Count 0 1 2 0 0 3
% of 0.0% 2.5% 5.0% 0.0% 0.0% 7.5%
Total
-.10527 Count 0 9 0 0 0 9
% of 0.0% 22.5% 0.0% 0.0% 0.0% 22.5%
Total
.49628 Count 1 10 0 0 0 11
% of 2.5% 25.0% 0.0% 0.0% 0.0% 27.5%
Total
1.09783 Count 1 4 0 1 0 6
% of 2.5% 10.0% 0.0% 2.5% 0.0% 15.0%
Total
1.69938 Count 0 1 0 0 0 1
% of 0.0% 2.5% 0.0% 0.0% 0.0% 2.5%
Total
2.30094 Count 0 1 0 0 0 1
% of 0.0% 2.5% 0.0% 0.0% 0.0% 2.5%
Total
Total Count 2 33 3 1 1 40
% of 5.0% 82.5% 7.5% 2.5% 2.5% 100.0%
Total

Berikut ini merupakan pedoman ketentuan untuk menafsirkan tabel hasil analisis
pada hasil crosstab:
1. Jika terdapat kriteria yang angkanya menunjukkan angka negatif, berarti cluster yang

39
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

bersangkutan ada di bawah rata-rata total.


2. Jika terdapat kriteria yang angkanya menunjukkan angka positif, berarti cluster yang
bersangkutan ada di atas rata-rata total.

Dari seluruh hasil crosstab di atas, dapat diketahui karakteristik masing-masing cluster
berdasarkan karakteristik anggota cluster yang dominan, dapat dilihat dari tabel berikut ini:
Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5
0,19096 2,91889 -1,00933 -0,24551
Usia (↑) 0,30007 (7,5%)
(2,5%) (2.5%) (2,5%) (2,5%)
Untuk kriteria jumlah
Jumlah 3,11836 pinjaman pada cluster 2 -0,47750 2,18437 2,18437
Pinjaman (↓) (5%) dominan di bawah rata- (5%) (2,5%) (2,5%)
rata total
Untuk kriteria pendapatan
Pendapatan 0,10758 debitur pada cluster 2 0,19618 5,71445 -0,20833
Debitur (↑) (2,5%) dominan di bawah rata- (2,5%) (2,5%) (2,5%)
rata total
Untuk kriteria jangka
Jangka Waktu 1,09783 waktu pinjaman pada -0,70682 1,09783 -1,30838
Pinjaman (↓) (2,5%) cluster 2 dominan di atas (5%) (2,5%) (2,5%)
rata-rata total

Dari tabel rekapitulasi di atas, maka dapat dilihat masing-masing cluster sebagai berikut:
1. Dalam cluster-1 terdiri dari responden dengan karakteristik usia dominan di atas rata-rata
total, jumlah pinjaman dominan di atas rata-rata total, pendapatan debitur dominan di atas
rata-rata total, dan jangka waktu pinjaman dominan di atas rata-rata total.
Sehingga, cluster-1 termasuk kelompok responden (nasabah) yang kurang potensial
untuk diterapkan strategi pencegahan risiko peminjaman.
2. Dalam cluster-2 terdiri dari responden dengan karakteristik usia dominan di atas rata-rata
total, jumlah pinjaman di bawah rata-rata total, pendapatan debitur dominan di bawah rata-
rata total, dan jangka waktu pinjaman dominan di atas rata-rata total.
Sehingga cluster-2 termasuk kelompok responden (nasabah) yang cukup potensial
untuk diterapkan strategi pencegahan risiko peminjaman berupa restrukturisasi kredit

40
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

penambahan jangka waktu pinjaman dan penurunan bunga kredit.


3. Dalam cluster-3 terdiri dari responden dengan karakteristik usia dominan di atas rata-rata
total, jumlah pinjaman dominan di bawah rata-rata total, pendapatan debitur dominan di
atas rata-rata total, dan jangka waktu pinjaman dominan di bawah rata-rata total.
Sehingga cluster-3 termasuk kelompok responden (nasabah) yang paling potensial
untuk diterapkan strategi pencegahan risiko peminjaman berupa restrukturisasi kredit
seperti memberikan penambahan fasilitas kredit.

Sedangkan cluster 4 dan 5 merupakan outlier, dikarenakan pada studi kasus ini perusahaan
bank ingin mengelompokkan nasabah (responden) untuk menentukan strategi demi
menghindari risiko peminjaman. Sehingga 2 outlier dapat dimasukan pada kelompok
responden dengan strategi pencegahan risiko peminjaman yang tepat berdasarkan pada
karakteristik outlier tersebut, seperti penjelasan berikut:
4. Cluster-4 merupakan outlier, yaitu responden (nasabah) dengan karakteristik usia dominan
di bawah rata-rata total, jumlah pinjaman dominan di atas rata-rata total, pendapatan debitur
dominan di atas rata-rata total, dan jangka waktu pinjaman dominan di atas rata-rata total.
Sehingga, cluster-4 termasuk kelompok responden (nasabah) yang kurang potensial
untuk diterapkan strategi pencegahan risiko peminjaman berupa kesempatan pembayaran
kewajiban bunga hingga penghapusbukuan kredit macet.
5. Cluster-5 merupakan outlier, yaitu responden (nasabah) dengan karakteristik usia dominan
di bawah rata-rata total, jumlah pinjaman dominan di atas rata-rata total, pendapatan debitur
dominan di bawah rata-rata total, dan jangka waktu pinjaman dominan di bawah rata-rata
total.
Sehingga, cluster-5 termasuk kelompok responden (nasabah) yang kurang potensial
untuk diterapkan strategi pencegahan risiko berupa restrukturisasi kredit yaitu pengurangan
tunggakan bunga atau penalty hingga penghapusbukuan kredit macet.

41
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

PENYELESAIAN DENGAN METODE NON HIRARKI

1. Tahap Standardisasi Data


- Masukkan Data pada Variable View

- Mengganti type dari variabel responden menjadi “String”

- Mengisi data view dari dataset seperti gambar di bawah ini

- Pada Data View Pilih descriptive statistics , kemudian pilih descriptives

42
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

- Pindahkan semua variabel ke kolom variable (S)


- Centang pada save standardized values as variables
- Kemudian klik OK

- Output normalisasi data

Dari hasil Output di atas merupakan tampilan pertama hasil proses nomalisasi data.
Dari tabel menunjukkan hasil nilai N, Minimum, Maximum, Mean, dan Standar
Deviation dari masing-masing kriteria. Jika sudah tampil output seperti gambar di

43
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

atas, maka anda memastikan tampilan Data View anda sebelumnya sudah seperti
gambar di bawah ini.

Terdapat tambahan variabel “Z” hasil dari normalisasi data kuesioner dari masing-
masing kriteria. Data "Z score” inilah yang kemudian akan diolah untuk tahap
pengelompokkan (clustering) berikutnya.

2. Tahap Pengelompokkan (clustering)


a. Pada Analyze → Classify → K-Means Cluster

b. Pindahkan Variabel yang berawalan “Z” ke kolom Variable (s). Selanjutnya tentukan
jumlah Cluster dengan mengisikan angka 3 pada Number of Cluster

44
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

c. Pilih Save dan aktifkan Cluster Membership dan Distance from Cluster center, kemudian
Continue

d. Pilih Option, aktifkan Initial Cluster center dan Anova Table

e. Klik OK. Langkah tersebut akan menghasilkan tabel Initial Cluster.

45
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

Tabel Initial Cluster Centers menunjukkan hasil proses sementara pengelompokkan data
yang di lakukan.

Tabel di atas merupakan tampilan pertama proses clustering data sebelum dilakukan
iterasi. Untuk mendeteksi berapa kali proses iterasi dilakukan dalam proses clustering
menggunakan 40 data objek dapat dilihat tampilan output berikut:

Ternyata proses clustering dilakukan melalui 8 iterasi untuk menentukan cluster yang
tepat. Dari tabel di atas disebutkan bahwa jarak minimum antar pusat cluster yang terjadi dari
hasil iterasi adalah 5.157.

46
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

Cluster Membership

Cluster Membership

Responden QCL_1 QCL_2 Responden QCL_1 QCL_2

Agung 2 3.10745 Ambarini 2 1.46145


Astri 2 1.12589 Tina 3 2.05948
Amalia 3 1.53149 Tika 2 1.16720
Ari 2 0.65114 Usman 2 2.98384
Achmad 2 1.17220 Azalia 3 0.97944
Ferdy 2 1.07047 Dwi 2 0.97481
Khoiry 2 0.93248 Andri 2 1.00932
Kiki 2 1.07739 Mugiono 3 1.53565
Mayang 3 0.99906 Sulika 2 1.52798
Abdi 2 1.05478 Purnomo 3 1.27011
Nahroni 3 1.51143 Murti 3 0.54462
Muharudin 3 0.51210 Ibrahim 2 1.06286
Ryan 3 0.69880 Hartati 2 1.19617
Rini 1 0.00000 Wendi 3 1.14283
Rizki 2 1.28993 Minar 2 0.81047
Santi 2 2.73805 Wahyudi 2 1.34942
Saiful 2 1.44838 Muhdi 3 1.21850
Sandi 3 1.00791 Wahid 2 0.67526
Sutra 2 2.24871 Widya 2 0.70070

47
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

Responden QCL_1 QCL_2 Responden QCL_1 QCL_2

Syfa 2 1.10571 Hasyim 3 0.60500

Terlihat dari tabel di atas menunjukkan tiap responden masuk ke dalam masing-masing cluster
yang dibentuk. Seperti responden bernama Agung masuk dalam cluster 2, nilai distance
sebesar 3,10745.

Tabel Final Cluster Centers menunjukkan hasil analisisnya untuk masing-masing kriteria dan
cluster yang dibentuk.
Berikut ini merupakan pedoman ketentuan untuk menafsirkan tabel hasil analisis
pada Final Cluster Centers:
1. Jika hasil perhitungan ditemukan negatif, berarti cluster yang bersangkutan ada di
bawah rata-rata total.
2. Jika hasil perhitungan ditemukan positif, berarti cluster yang bersangkutan ada di atas
rata-rata total.

48
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

Tabel Number of cases in each cluster menunjukkan jumlah responden yang masuk ke dalam
tiap cluster. Cluster 1 (1 responden), cluster 2 (25 responden) dan cluster 3 (14 responden).

Dari tabel output Final Cluster Centers, dengan ketentuan yang telah dijabarkan di atas pula,
dapat didefinisikan sebagai berikut :
1. Cluster 1
Dalam cluster-1 terdiri dari responden (nasabah) dengan karakteristik usia dominan di
bawah rata-rata total, jumlah pinjaman dominan di atas rata-rata total, pendapatan debitur
dominan di atas rata-rata total, dan jangka waktu peminjaman dominan di atas rata-rata
total.
Sehingga, cluster-1 termasuk kelompok responden (nasabah) yang kurang potensial
untuk diterapkan strategi pencegahan risiko peminjaman.
2. Cluster 2
Dalam cluster-2 terdiri dari responden (nasabah) dengan karakteristik usia dominan di
bawah rata-rata total, jumlah pinjaman dominan di atas rata-rata total, pendapatan debitur
dominan di bawah rata-rata total, dan jangka waktu peminjaman dominan di atas rata-
rata total.
Sehingga, cluster-2 termasuk kelompok responden (nasabah) yang paling potensial
untuk diterapkan strategi pencegahan risiko peminjaman berupa restrukturisasi kredit
seperti penurunan suku bunga kredit, penambahan fasilitas kredit hingga
penghapusbukuan kredit macet.
3. Cluster 3
Dalam cluster-3 terdiri dari responden (nasabah) dengan karakteristik usia dominan di
atas rata-rata total, jumlah pinjaman dominan di bawah rata-rata total, pendapatan debitur
dominan di bawah rata-rata total, dan jangka waktu peminjaman dominan di bawah rata-
rata total.
Sehingga, cluster-3 termasuk kelompok responden (nasabah) yang cukup potensial
untuk diterapkan strategi pencegahan risiko peminjaman berupa pengurangan tunggakan
pokok kredit dan perpanjangan jangka waktu kredit.
Dalam menghitung nilai rata-rata setiap faktor pada masing-masing cluster, rumus umum yang

49
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

digunakan yaitu:
𝑥 = µ + 𝑧 .𝜎
Dimana:
x : rata-rata sampel (variabel dalam cluster)
µ : rata-rata populasi
z : nilai standardisasi
𝜎 : standar deviasi
Sebagai contoh, apabila ingin mengetahui rata-rata usia pada cluster 1 yaitu :
𝑥 = µ + 𝑧. 𝜎
𝑥 = 33,2500 + (−1,00933). (9,16445)
𝑥 = 24,000045
Jadi rata-rata usia pada cluster 1 adalah 24,00.
Rata-rata setiap kriteria cluster dapat diketahui berdasarkan hasil SPSS seperti pada tabel
berikut:

Informasi nilai rata-rata setiap cluster dapat dilihat pada tabel berikut:
Cluster
1 2 3
Usia 24,00 29,08 41,36
Jumlah Pinjaman 65,00 21,20 9,57
Pendapatan Debitur 645,00 71,00 57,50
Jangka Waktu Pinjaman 16,00 15,00 12,57
Nilai tersebut menunjukkan nilai rata-rata pada setiap cluster berdasarkan masing-masing
faktor. Misalnya:
Cluster-1 terdiri dari responden (nasabah) dengan karakteristik usia sebesar 24,00 dimana di
bawah rata-rata total, jumlah pinjaman sebesar 6,5 juta dimana di atas rata-rata total,

50
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

Pendapatan debitur sebesar 64,5 juta dimana di atas rata-rata total, dan jangka waktu pinjaman
selama 16 bulan dimana di atas rata-rata total. Sehingga, cluster-1 termasuk kelompok
responden (nasabah) yang kurang potensial untuk diterapkan strategi pencegahan risiko
peminjaman.

51
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

DAFTAR PUSTAKA

Bertalya. 2009. Konsep Data Mining. Universitas Gunadarma.


Fayyad, Usama. 1996. Advances in Knowledge Discovery and Data Mining. MIT Press.
Susanto, Hery Tri. 2009. Cluster Analysis. Seminar Nasional Matematika dan Pendidikan
Matematika. Yogyakarta: Universitas Negeri Yogyakarta.
Turban, Efraim et al. 2005. Decision Support Systems and Intelligent Systems. Yogyakarta:
Andi Offset
Walpole, Ronald E. dan Myers, Raymond H. 1986. Ilmu Peluang dan Statistik Untuk Insinyur
Dan Ilmuwan. Bandung: ITB Press.

52
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3
Jurusan/Program Studi : Teknik Industri Modul ke : 3
Kode Mata Kuliah : 52224603 Jumlah Halaman : 52
Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2022

53

Anda mungkin juga menyukai