Anda di halaman 1dari 28

TUGAS DATA MINING

PENERAPAN METODE DBSCAN MENGGUNAKAN APLIKASI WEKA

OLEH:
KELOMPOK 1
1. I KADEK SASTRAWAN (1705551089)
2. MADE BRAMASTA VIKANA PUTRA (1705551096)

PROGRAM STUDI TEKNOLOGI INFORMASI


FAKULTAS TEKNIK
UNIVERSITAS UDAYANA
2019
1. Instalasi Weka
Weka memerlukan JVM (Java Virtual Machine) agar dapat dijalankan dan oleh karena itu
diperlukan instalasi JVM terlebih dahulu. Weka sudah dapat diinstalasi setelah instalasi JVM
selesai dilakukan. Langkah-langkah dalam instalasi Weka dapat dilihat pada Gambar 1, 2, 3, dan
4 berikut.

Gambar 1 Syarat dan Ketentuan


Gambar 1 merupakan salah satu tahapan dalam proses instalasi Weka yaitu permintaan
persetujuan syarat dan ketentuan. Cukup menekan tombol “I Agree” lalu proses instalasi akan
dilanjutkan ke tahap berikutnya.
Gambar 2 Komponen Weka
Gambar 2 merupakan salah satu tahapan dalam proses instalasi Weka yaitu pemilihan
komponen Weka yang perlu diinstal. Cukup menekan tombol “Next” lalu proses instalasi akan
dilanjutkan ke tahap berikutnya.
Gambar 3 Direktori Instalasi Weka
Gambar 3 merupakan salah satu tahapan dalam proses instalasi Weka yaitu pemilihan
direktori instalasi Weka. Pilih direktori yang sesuai dan tekan tombol “Next” untuk menuju ke
tahap berikutnya.
Gambar 4 Proses Instalasi Selesai
Gambar 4 merupakan tampilan ketika proses instalasi Weka sudah selesai. Cukup tekan
tombol “Finish” lalu aplikasi Weka akan dijalankan.

2. Instalasi Package DBSCAN


Hal pertama yang harus dilakukan setelah instalasi Weka yaitu menginstal package agar
dapat menggunakan algoritma clustering DBSCAN. Langkah-langkah instalasi package
DBSCAN dapat dilihat pada Gambar 5, 6, dan 7 berikut.
Gambar 5 Tampilan Awal Weka
Gambar 5 merupakan tampilan awal dari aplikasi Weka. Tampilan ini akan muncul
setelah aplikasi Weka dijalankan. Instalasi package dapat dilakukan dengan memilih menu
package manager pada tab Tools atau dengan menekan tombol CTRL + U.

Gambar 6 Tampilan Package Manager


Gambar 6 merupakan tampilan package manager dari aplikasi Weka. Menu ini akan
menampilkan package-package yang tambahan yang dapat dipergunakan oleh pengguna.
Package DBSCAN dapat ditemukan dengan menggunakan fitur pencarian pada kolom package
search yang kemudian dapat diinstal dengan cara memilih package DBSCAN dan menekan
tombol install.

Gambar 7 Proses Instalasi Package DBSCAN


Gambar 7 merupakan tampilan package-package yang akan diinstal. Cukup tekan tombol
“Yes” dan proses instalasi package DBSCAN akan dimulai. Ketika proses instalasi telah
berakhir, algoritma clustering DBSCAN sudah dapat dipergunakan di aplikasi WEKA.

3. Memilih Dataset
Langkah selanjutnya setelah package DBSCAN diinstal yaitu memilih dataset yang akan
dipergunakan dalam proses clustering nanti. Langkah-langkah untuk memilih dataset dapat
dilihat pada Gambar 8, 9, dan 10 berikut.
Gambar 8 Tampilan Tab Preprocess
Gambar 8 merupakan tampilan dari tab Preprocess pada menu Weka Explorer. Menu
Weka Explorer dapat diakses dengan cara menekan tombol “Explorer” pada tampilan awal
aplikasi Weka. Dataset dapat dipilih dengan menekan tombol “Open file” pada menu Weka
Explorer khususnya di tab Preprocess.
Gambar 9 Open File Dataset
Gambar 9 merupakan tampilan memilih file yang akan dipergunakan sebagai dataset.
Weka mendukung beberapa format file sebagai dataset seperti .csv, .arff, .json, dan lain
sebagainya. Cukup menekan tombol “Open” setelah file dataset sudah terpilih.
Gambar 10 Tampilan Tab Preprocess Setelah Pemilihan Dataset
Gambar 10 merupakan tampilan dari tab Preprocess pada menu Weka Explorer setelah
dataset dipilih. Terlihat beberapa hal seperti daftar atribut yang terdapat pada dataset, nilai dari
atribut, serta tampilan persebaran dari atribut pada dataset yang dipilih.
Dataset yang dipergunakan pada contoh kali ini merupakan dataset pasien hepatitis
dimana terdapat beberapa atribut seperti umur, jenis kelamin, tingkat albumin, riwayat anoreksia,
dan lain sebagainya. Total objek pada dataset ini yaitu 155 objek dengan 20 atribut yang
beraneka ragam.

4. Proses Clustering Menggunakan DBSCAN


Langkah terakhir yaitu proses clustering itu sendiri. Clustering akan menggunakan
algoritma DBSCAN dimana terdapat beberapa parameter penentu yaitu epsilon serta minPoints.
Epsilon merupakan jarak/radius dari titik pusat cluster, sedangkan minPoints merupakan jumlah
minimal titik yang berada di dalam epsilon. Epsilon serta minPoints ini menjadi penentu dalam
pembuatan suatu cluster. Langkah-langkah dalam proses clustering menggunakan algoritma
DBSCAN dapat dilihat pada Gambar 11, 12, 13, 14, dan 15 berikut.
Gambar 11 Tampilan Tab Cluster
Gambar 11 merupakan tampilan dari tab cluster yang ada pada Weka Explorer. Algoritma
DBSCAN dapat dipilih dengan cara menekan tombol “Choose” dan memilih DBSCAN.
Gambar 12 Parameter Default DBSCAN
Gambar 12 merupakan tampilan pengaturan parameter seperti epsilon ataupun minPoints.
Secara default, Weka mengatur nilai epsilon sebesar 0.9 dan minPoints sebesar 6. Nilai epsilon
dan minPoints akan berpengaruh pada jumlah clustering serta jumlah anggota tiap clustering
nantinya.
Gambar 13 Hasil Clustering 1
Gambar 13 merupakan hasil clustering menggunakan algoritma DBSCAN. Eksekusi
dapat dilakukan dengan menekan tombol “Start” setelah memilih algoritma clustering yang akan
dipergunakan serta mengatur nilai parameter seperti epsilon dan minPoints. Hasil clustering akan
ditampilkan pada bagian clustering output dimana ditampilkan data seperti jumlah objek dataset,
atribut pada dataset, nilai epsilon dan nilai minPoints, jumlah clustering yang terbentuk, proses
clustering, serta jumlah objek yang masuk ke tiap clustering dan jumlah noise.
Proses clustering kali ini menggunakan epsilon yang bernilai 0.9 serta minPoints sebesar
6 yang menghasilkan 2 cluster dimana cluster pertama memiliki 7 anggota objek sedangkan
cluster kedua memiliki 18 objek dan 130 objek sisanya tidak tergabung ke dalam cluster dan
menjadi noise.
Gambar 14 Hasil Clustering 2
Gambar 14 merupakan proses clustering yang ke-2 dengan menggunakan epsilon yang
bernilai 0.5 serta minPoints sebesar 6 yang menghasilkan 1 cluster dengan 17 anggota objek dan
138 objek lainnya tidak tergabung ke dalam cluster dan menjadi noise.
Gambar 15 Hasil Clustering 3
Gambar 15 merupakan proses clustering yang ke-3 dengan menggunakan epsilon yang
bernilai default yaitu 0.9 serta minPoints sebesar 3 yang menghasilkan 6 cluster dimana cluster
pertama memiliki 7 anggota objek, cluster kedua memiliki 3 anggota objek, cluster ketiga juga
memiliki 3 anggota objek, cluster keempat memiliki 5 anggota objek, cluster kelima memiliki 18
anggota objek, dan cluster keenam memiliki 4 anggota objek serta 115 objek lainnya tidak
tergabung ke dalam cluster dan menjadi noise.

5. Hasil Analisa Pengaruh Parameter


Berdasarkan tiga proses clustering sebelumnya, hasil analisa pengaruh parameter epsilon
dan minPoints terhadap hasil clustering yaitu parameter epsilon mempengaruhi jumlah anggota
objek yang tergabung ke dalam suatu cluster. Semakin besar nilai epsilon maka semakin banyak
anggota objek suatu cluster dan apabila nilai epsilon semakin kecil maka semakin sedikit
anggota objek suatu cluster. Hal ini dikarenakan semakin besar nilai epsilon maka semakin luas
pula jarak/radius dari titik pusat cluster sehingga menyebabkan banyak anggota objek yang dapat
bergabung ke dalam cluster tersebut dan apabila nilai epsilon semakin kecil maka semakin
sempit pula jarak/radius dari titik pusat cluster sehingga hanya anggota objek yang jaraknya
dekat dengan titik pusat cluster saja yang dapat bergabung ke dalam cluster.
Sedangkan parameter minPoints akan mempengaruhi jumlah cluster yang terbentuk.
Semakin kecil nilai minPoints maka semakin banyak cluster yang akan terbentuk dan begitupun
sebaliknya apabila semakin besar nilai minPoints maka semakin sedikit cluster yang akan
terbentuk. Hal ini dikarenakan minPoints merupakan syarat untuk membentuk suatu cluster yaitu
jumlah anggota objek dalam suatu cluster. Semakin kecil nilai minPoints maka semakin sedikit
pula anggota objek yang diperlukan untuk membentuk suatu cluster yang kemudian
menyebabkan banyak cluster yang terbentuk. Semakin besar nilai minPoints maka semakin
banyak pula anggota objek yang diperlukan untuk membentuk suatu cluster yang kemudian
menyebabkan sedikit cluster yang terbentuk.

Anda mungkin juga menyukai