FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas
Jurusan/Program Studi
Kode Mata Kuliah
Nama Mata Kuliah
: Teknologi Industri
: Teknik Industri
: 52224603
: Analisis Keputusan dan Data Mining
Pertemuan ke
:3
Modul ke
:3
Jumlah Halaman : 26
Mulai berlaku
: 2014
PRAKTIKUM 3
ANALISA CLUSTER
Definisi Cluster
Analisa Cluster adalah pengorganisasian kumpulan pola ke dalam kelompok-kelompok (Cluster)
berdasar atas kesamaanya. Pola-pola dalam suatu Cluster akan memiliki kesamaan ciri/sifat
daripada pola-pola dalam Cluster yang lainnya. Metodologi Clustering lebih cocok digunakan
untuk eksplorasi hubungan antar data untuk membuat suatu penilaian terhadap strukturnya.
Konsep Cluster
Analisis Cluster merupakan salah satu teknik multivariat yang digunakan dalam data
mining yang bertujuan untuk mengidentifikasi sekelompok obyek yang mempunyai kemiripan
karakteristik tertentu yang dapat dipisahkan dengan kelompok obyek lainnya, sehingga obyek
yang berada dalam kelompok yang sama relatif lebih homogen (sama) daripada obyek yang
berada pada kelompok yang berbeda. Ada beberapa tahapan dalam malekukan Analisis Cluster,
diantaranya yaitu:
1.
2.
3.
FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas
Jurusan/Program Studi
Kode Mata Kuliah
Nama Mata Kuliah
: Teknologi Industri
: Teknik Industri
: 52224603
: Analisis Keputusan dan Data Mining
Pertemuan ke
:3
Modul ke
:3
Jumlah Halaman : 26
Mulai berlaku
: 2014
4.
Proses Mendapatkan Cluster dan Menilai kelayakan secara keseluruhan (overall fit)
5.
6.
Penyederhanaan Data
Penyederhanaan data merupakan bagian dari suatu taksonomi. Dengan struktur yang terbatas
observasi/objek dapat dikelompokkan untuk analisis selanjutnya.
FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas
Jurusan/Program Studi
Kode Mata Kuliah
Nama Mata Kuliah
: Teknologi Industri
: Teknik Industri
: 52224603
: Analisis Keputusan dan Data Mining
Pertemuan ke
:3
Modul ke
:3
Jumlah Halaman : 26
Mulai berlaku
: 2014
Pendeteksian Outliers
Outlier adalah suatu objek yang sangat berbeda dengan objek lainnya. Outliers dapat terjadi
karena:
a. Observasi menyimpang yang tidak mewakili populasi
b. Suatu
undersampling
kelompok-kelompok
dalam
populasi
yang
menyebabkan
FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas
Jurusan/Program Studi
Kode Mata Kuliah
Nama Mata Kuliah
: Teknologi Industri
: Teknik Industri
: 52224603
: Analisis Keputusan dan Data Mining
Pertemuan ke
:3
Modul ke
:3
Jumlah Halaman : 26
Mulai berlaku
: 2014
3). Chebychev
D(X,Y)= | |
D(X,Y)= | |
D(I,j) = || + || = | | = 1 1 + 2 2
FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas
Jurusan/Program Studi
Kode Mata Kuliah
Nama Mata Kuliah
: Teknologi Industri
: Teknik Industri
: 52224603
: Analisis Keputusan dan Data Mining
Pertemuan ke
:3
Modul ke
:3
Jumlah Halaman : 26
Mulai berlaku
: 2014
Tahap Keempat : Proses Mendapatkan Cluster dan Menilai kelayakan secara keseluruhan
(overall fit)
Ada dua proses penting yaitu algoritma Cluster dalam pembentukan Clusterdan
menentukan jumlah Cluster yang akan dibentuk. Keduanya mempunyai implikasi substansial
tidak hanya pada hasil yang diperoleh tetapi juga pada interpretasi yang akan dilakukan terhadap
hasil tersebut.
FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas
Jurusan/Program Studi
Kode Mata Kuliah
Nama Mata Kuliah
: Teknologi Industri
: Teknik Industri
: 52224603
: Analisis Keputusan dan Data Mining
Pertemuan ke
:3
Modul ke
:3
Jumlah Halaman : 26
Mulai berlaku
: 2014
FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas
Jurusan/Program Studi
Kode Mata Kuliah
Nama Mata Kuliah
a.
: Teknologi Industri
: Teknik Industri
: 52224603
: Analisis Keputusan dan Data Mining
Pertemuan ke
:3
Modul ke
:3
Jumlah Halaman : 26
Mulai berlaku
: 2014
b.
c.
Optimizing
Merupakan pengembangan dari kedua metode diatas dengan melakukan optimasi pada
penempatan obyek yang ditukar untuk Cluster lainnya dengan pertimbangan krteria
optimasi.
2. Metode Hirarkis.
Memulai pengelompokan dengan dua atau lebih obyek yang mempunyai kesamaan
paling dekat. Kemudian dilanjutkan pada obyek yang lain danseterusnya hingga Cluster
akan membentuk semacampohon dimana terdapat tingkatan (hirarki) yangjelas antar
obyek, dari yang paling mirip hinggayang paling tidak mirip. Teknik hirarki (hierarchical
methods) adalah teknik Clustering membentuk kontruksi hirarki atau berdasarkan tingkatan
tertentu
seperti
struktur
pohon
(struktur
pertandingan).
Alat
yang
membantu
FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas
Jurusan/Program Studi
Kode Mata Kuliah
Nama Mata Kuliah
: Teknologi Industri
: Teknik Industri
: 52224603
: Analisis Keputusan dan Data Mining
Pertemuan ke
:3
Modul ke
:3
Jumlah Halaman : 26
Mulai berlaku
: 2014
Agglomerative Methods
Metode ini dimulai dengan kenyatan bahwa setiap obyek membentuk Clusternya
masing-masing. Kemudian dua obyek dengan jarak terdekat bergabung. Selanjutnya
obyek ketiga akan bergabung dengan Cluster yang ada atau bersama obyek lain dan
membentuk Cluster baru. Hal ini tetap memperhitungkan jarak kedekatan antar obyek.
Proses akan berlanjut hingga akhirnya terbentuk satu Cluster yang terdiri dari
keseluruhan obyek. Ada beberapa teknik dalam Agglomerative methods yaitu:
Single linkage (nearest neighbor methods)
Metode ini menggunakan prinsip jarak minimum yang diawali dengan mencari dua
obyek terdekat dan keduanya membentuk Cluster yang pertama. Pada langkah
selanjutnya terdapat dua kemungkinan, yaitu :
a. Obyek ketiga akan bergabung dengan Cluster yang telah terbentuk, atau
b. Dua obyek lainnya akan membentu Cluster baru.
Proses ini akan berlanjut sampai akhirnya terbentuk Cluster tunggal. Pada metode
ini jarak antar Cluster didefinisikan sebagai jarak terdekat antar anggotanya.
FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas
Jurusan/Program Studi
Kode Mata Kuliah
Nama Mata Kuliah
: Teknologi Industri
: Teknik Industri
: 52224603
: Analisis Keputusan dan Data Mining
Pertemuan ke
:3
Modul ke
:3
Jumlah Halaman : 26
Mulai berlaku
: 2014
FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas
Jurusan/Program Studi
Kode Mata Kuliah
Nama Mata Kuliah
: Teknologi Industri
: Teknik Industri
: 52224603
: Analisis Keputusan dan Data Mining
Pertemuan ke
:3
Modul ke
:3
Jumlah Halaman : 26
Mulai berlaku
: 2014
satu Cluster.
FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas
Jurusan/Program Studi
Kode Mata Kuliah
Nama Mata Kuliah
: Teknologi Industri
: Teknik Industri
: 52224603
: Analisis Keputusan dan Data Mining
Pertemuan ke
:3
Modul ke
:3
Jumlah Halaman : 26
Mulai berlaku
: 2014
satu Cluster
Mencari jarak terdekat antara Cluster dengan obyek dan diperoleh obyek C
bergabung dengan Cluster AB.
f)
FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas
Jurusan/Program Studi
Kode Mata Kuliah
Nama Mata Kuliah
: Teknologi Industri
: Teknik Industri
: 52224603
: Analisis Keputusan dan Data Mining
Pertemuan ke
:3
Modul ke
:3
Jumlah Halaman : 26
Mulai berlaku
: 2014
2 1
Dengan Xij adalah nilai untuk obyek ke-i pada Cluster ke-j.
b.
Divisive Methods
Metode divisive berlawanan dengan metode agglomerative. Metode ini pertama-tama
diawali dengan satu Cluster besar yang mencakup semua observasi (obyek).
Selanjutnya obyek yang mempunyai ketidakmiripan yang cukup besar akan dipisahkan
sehingga membentuk Cluster yang lebih kecil. Pemisahan ini dilanjutkan sehingga
mencapai sejumlah Cluster yang diinginkan.
Splinter average distance methods
Metode ini didasarkan pada perhitungan jarak rata-rata masing-masing obyek dengan
obyek pada grup splinter dan jarak rata-rata obyek tersebut dengan obyek lain pada
grupnya. Proses tersebut dimulai dengan memisahkan obyek dengan jarak terjauh
sehingga terbentuklan dua group. Kemudian dibandingkan dengan jarak rata-rata
masing-masing obyek dengan group splinter dengan groupnya sendiri. Apabila suatu
obyek mempunyai jarak yang lebih dekat ke group splinter daripada ke groupnya
sendiri, maka obyek tersebut haruslah dikeluarkan dari groupnya dan dipisahkan ke
group splinter. Apabila komposisinya sudah stabil, yaitu jarak suatu obyek ke
FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas
Jurusan/Program Studi
Kode Mata Kuliah
Nama Mata Kuliah
: Teknologi Industri
: Teknik Industri
: 52224603
: Analisis Keputusan dan Data Mining
Pertemuan ke
:3
Modul ke
:3
Jumlah Halaman : 26
Mulai berlaku
: 2014
groupnya selalu lebih kecil daripada jarak obyek itu ke group splinter, maka proses
berhenti dan dilanjutkan dengan tahap pemisahan dalam group.
Contoh : Terdapat matriks jarak antara 5 buah obyek, yaitu :
FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas
Jurusan/Program Studi
Kode Mata Kuliah
Nama Mata Kuliah
: Teknologi Industri
: Teknik Industri
: 52224603
: Analisis Keputusan dan Data Mining
Pertemuan ke
:3
Modul ke
:3
Jumlah Halaman : 26
Mulai berlaku
: 2014
Pada D, jarak rata-rata dengan group splinter lebih dekat daripada dengan group
utama. Dengan demikian D harus dikeluarkan dari group utama dan masuk ke
group splinter.
c)
FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas
Jurusan/Program Studi
Kode Mata Kuliah
Nama Mata Kuliah
: Teknologi Industri
: Teknik Industri
: 52224603
: Analisis Keputusan dan Data Mining
Pertemuan ke
:3
Modul ke
:3
Jumlah Halaman : 26
Mulai berlaku
: 2014
2.
FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas
Jurusan/Program Studi
Kode Mata Kuliah
Nama Mata Kuliah
: Teknologi Industri
: Teknik Industri
: 52224603
: Analisis Keputusan dan Data Mining
Pertemuan ke
:3
Modul ke
:3
Jumlah Halaman : 26
Mulai berlaku
: 2014
Studi Kasus
Metode Hierarki
Fizi Shop merupakan toko yang bergerak dibidang retail. Pihak perusahaan ingin
meningkatkan pelayanan terhadap konsumen yang berkunjung melalui web mereka. Dengan
menyebarkan kuesioner, dan menggunakan Clustering, pihak perusahaan ingin mengetahui
selera konsumen dan faktor faktor yang paling berpengaruh terhadap kemajuan bisnisnya.
Berikut adalah hasil kuesioner yang telah dibagikan kepada 100 konsumen yang telah
berkunjung ke toko.
Data Kuesioner 2 :
No
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Nama
Rino
Abdul
Viant
Aan
Romi
Ririn
Rahmawati
Okta
Andre
Niko
Ayuk
Wanti
Mey
Farah
Maryana
Sifa
Wulan
Ulfa
Syahdan
Awan
Perilaku
1
2
3
2
2
2
1
2
3
3
1
2
4
3
2
2
1
1
1
2
Komunikasi
1
2
4
3
2
2
2
2
2
2
1
2
3
3
2
2
1
2
2
2
Pelayanan
1
2
3
2
2
2
2
1
1
3
1
2
2
3
2
2
1
1
3
2
Kelengkapan
2
2
2
2
2
1
2
1
2
2
2
1
1
2
1
1
1
2
3
2
Harga
4
1
1
1
2
1
2
2
4
1
1
1
2
1
1
1
2
2
2
2
FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas
Jurusan/Program Studi
Kode Mata Kuliah
Nama Mata Kuliah
: Teknologi Industri
: Teknik Industri
: 52224603
: Analisis Keputusan dan Data Mining
Pertemuan ke
:3
Modul ke
:3
Jumlah Halaman : 26
Mulai berlaku
: 2014
Data Kuesioner 1 :
No
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Nama
Rino
Abdul
Viant
Aan
Romi
Ririn
Rahmawati
Okta
Andre
Niko
Ayuk
Wanti
Mey
Farah
Maryana
Sifa
Wulan
Ulfa
Syahdan
Awan
2
4
4
2
4
3
3
4
3
2
3
4
4
4
3
2
2
3
4
3
1
4
5
1
3
1
1
3
3
2
1
5
5
4
1
5
1
1
2
1
2
5
4
2
4
5
3
3
3
2
1
5
5
4
5
1
2
1
4
2
3
4
4
3
4
2
2
4
2
2
1
5
5
4
1
5
2
5
2
3
5
5
4
2
3
5
3
4
5
3
1
5
5
4
5
1
2
1
2
4
FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas
Jurusan/Program Studi
Kode Mata Kuliah
Nama Mata Kuliah
: Teknologi Industri
: Teknik Industri
: 52224603
: Analisis Keputusan dan Data Mining
Pertemuan ke
:3
Modul ke
:3
Jumlah Halaman : 26
Mulai berlaku
: 2014
Input Data
-
Variable View
Data View
FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas
Jurusan/Program Studi
Kode Mata Kuliah
Nama Mata Kuliah
2.
: Teknologi Industri
: Teknik Industri
: 52224603
: Analisis Keputusan dan Data Mining
Pertemuan ke
:3
Modul ke
:3
Jumlah Halaman : 26
Mulai berlaku
: 2014
FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas
Jurusan/Program Studi
Kode Mata Kuliah
Nama Mata Kuliah
b.
: Teknologi Industri
: Teknik Industri
: 52224603
: Analisis Keputusan dan Data Mining
c.
Pertemuan ke
:3
Modul ke
:3
Jumlah Halaman : 26
Mulai berlaku
: 2014
FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas
Jurusan/Program Studi
Kode Mata Kuliah
Nama Mata Kuliah
d.
: Teknologi Industri
: Teknik Industri
: 52224603
: Analisis Keputusan dan Data Mining
Pertemuan ke
:3
Modul ke
:3
Jumlah Halaman : 26
Mulai berlaku
: 2014
e.
FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas
Jurusan/Program Studi
Kode Mata Kuliah
Nama Mata Kuliah
f.
3.
: Teknologi Industri
: Teknik Industri
: 52224603
: Analisis Keputusan dan Data Mining
Profilisasi Costumer
a.
Input Data
Variable View:
Pertemuan ke
:3
Modul ke
:3
Jumlah Halaman : 26
Mulai berlaku
: 2014
FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas
Jurusan/Program Studi
Kode Mata Kuliah
Nama Mata Kuliah
: Teknologi Industri
: Teknik Industri
: 52224603
: Analisis Keputusan dan Data Mining
Data View
b.
Pertemuan ke
:3
Modul ke
:3
Jumlah Halaman : 26
Mulai berlaku
: 2014
FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas
Jurusan/Program Studi
Kode Mata Kuliah
Nama Mata Kuliah
: Teknologi Industri
: Teknik Industri
: 52224603
: Analisis Keputusan dan Data Mining
c.
d.
e.
Statistik : Correlation
Pertemuan ke
:3
Modul ke
:3
Jumlah Halaman : 26
Mulai berlaku
: 2014
FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas
Jurusan/Program Studi
Kode Mata Kuliah
Nama Mata Kuliah
: Teknologi Industri
: Teknik Industri
: 52224603
: Analisis Keputusan dan Data Mining
f.
g.
Pertemuan ke
:3
Modul ke
:3
Jumlah Halaman : 26
Mulai berlaku
: 2014
FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas
Jurusan/Program Studi
Kode Mata Kuliah
Nama Mata Kuliah
: Teknologi Industri
: Teknik Industri
: 52224603
: Analisis Keputusan dan Data Mining
Pertemuan ke
:3
Modul ke
:3
Jumlah Halaman : 26
Mulai berlaku
: 2014
DAFTAR PUSTAKA
1. Han,
Jiawei.
Data
Mining
Concept
and
Technique.
Presentation.
http://www.cse.msu.edu/~cse980
2. Bertalya, Konsep Data Mining. Universitas Gunadarma, 2009.
3. Walpole, Ronald E. Probability and Statistics for Engineers and Scientists.
4. http://www.wahana-statistika.com/analisis/analisis-multivariate/103-pengertian-analisiscluster.html
5. Tryfos,Peter, Cluster Analysis, 1997