METODOLOGI PENELITIAN
Waktu penelitian dimulai dari bulan Februari sampai Mei 2019 dan dilaksanakan di Badan
Narkotika Nasional Provinsi Kalimantan Timur yang beralamat di Jl. Rapak Indah KM. 1
Tahun 2019
No Jenis Kegiatan
Februari Maret April Mei
1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4
2 Evaluasi
3 Seminar Hasil
4 Revisi Seminar Hasil
5 Penyempurnaan Laporan
6 Publikasi Karya Ilmiah
Penelitian ini menggunakan pendekatan kuantitatif, karena penelitian ini dilakukan untuk
perbandingan penerapan Clustering dengan metode K-Means dan K-Medoids dalam menentukan
rehabilitasi narkoba.
Data yang digunakan dalam penelitian adalah data primer yang didapat dari database
Teknik pengumpulan data yang digunakan dalam penelitian ini adalah sebagai berikut:
Studi literatur adalah metode yang digunakan dalam penelitian untuk menelusuri sumber –
sumber yang berkaitan dengan penelitian yang diambil dari jurnal, skripsi, buku referensi dan
sumber terpercaya lainnya yang dapat dijadikan referensi yang berhubungan dalam penelitian ini
sehingga dapat menghasilkan penelitian yang maksimal. Pada penelitian ini berdasarkan literature
buku data mining dan jurnal yang berkaitan dengan penggunaan metode K-Means dan K-Medoids.
(2) Studi Lapangan
Pada penelitian ini studi lapangan di lakukan dengan observasi langsung pada tempat
penelitian yaitu di kantor Badan Narkotika Nasional Provinsi Kalimantan Timur bidang
rehabilitasi.
Variabel yang digunakan dalam penelitian ini ada 2 jenis yaitu variabel bebas (independent)
(2) Variabel terikat dalam penelitian ini adalah variabel status rehabilitas yang menentukan jenis
pelayanan dalam rehabilitasi narkoba yaitu rawat inap atau rawat jalan.
Dalam penelitian ini penulis menggunakan perangkat lunak pengolah angka Microsoft Excel
(Office 356), dan perangkat lunak visualisasi prediktif RapidMiner Studio 7.6 untuk membantu
dalam proses perhitungan dan pemodelan proses data mining yang digunakan.
Penelitian ini akan dibagi kedalam 3 tahapan yaitu: pengumpulan data, tahap analisi data, dan
tahap komparasi hasil cluster algoritma dan penarikan kesimpulan yang terdapat pada Gambar 3.1.
Gambar 3. 1 Alur Tahap Penelitian
Dalam penelitian ini menggunakan standar data mining yaitu Cross Industry Standart
Process-Data Mining (CRISP-DM) untuk data mining. Berikut adalah langkah – langkah dari
1. Bussiness Understanding
Dalam penelitian ini akan berfokus untuk mengetahui perbandingan penerapan Clustering
dengan metode K-Means dan K-Medoids untuk memperoleh metode pengklasteran terbaik dalam
penempatan bagi pencandu narokoba dengan data yang diperoleh dari klinik Badan Narkotika dan
2. Data Understanding
Pada tahap ini akan diperoleh data pasien dari bagian klinik BNN Prov Kaltim yang diperoleh
melalui bidang Rehabilitas BNN Provinsi Kaltim. Berikut atribut dalam data yang diperoleh yang
3. Data Preparation
Dari data yang diperoleh akan dilakukan pemilihan variabel yang ditentukan oleh peneliti
berdasarkan penelitian terdahulu. Kemudian setiap atribut akan diuji yang disebut data cleaning
dan data integration and transformation untuk membersihkan data atau nilai atribut jika terjadi
duplikasi data atau data yang inkosisten yang dapat menghambat proses data.
a. Data Cleaning
Dari 350 data terdapat 50 data yang tergolong tidak lengkap (missing value) dan harus dihapus
dikarenakan dapat mengganggu aturan algoritma yang akan dibentuk. Maka data yang
Untuk meningkatkan dan memudahkan dalam proses analisis maka dari 23 atribut yang
diperoleh akan dipilih beberapa atribut inti sebagai penentuan rehabilitiasi narkoba yang
Setelah dilakukan proses diatas melalui tahap integration dan transformation data maka
didapat atribut yang akan digunakan untuk penentuan rehabilitasi narkoba pada Tabel 3.5.
4. Modeling
Algoritma yang digunakan dalam penelitian ini yaitu algoritma K-Means dan K-Medoids
untuk pengklasteran dalam menentukan rehabilitasi narkoba dan untuk mengukur akurasi kedua
algoritma menggunakan metode Confusion Matrix yang hasil akhir menampilkan hitungan dari
nilai rata-rata presentai akurasi, recall, dan error rate. Setelah diketahui hasil dari akurasi tiap
a. Flowchart K-Means
cluster yang dibuat adalah 3 kelompok berdasarkan jumlah atribut yang digunakan. Total
jumlah untuk menentukan cluster diambil dari tidak rehab, rawat inap dan rawat jalan.
2. Penentuan nilai dari cluster untuk dijadikan acuan dalam mekakukan perhitungan jarak
objek ke centroid, perhitungan jarak mengacu pada rumus Euclidean dengan persamaan
pada 3.1
𝐷 𝑝
................................................................. (3.1)
𝑛(𝑥,𝑦)=√∑𝑘=1(𝑋𝑥𝑘 − 𝑌𝑦𝑘 )2̀
Dengan:
𝐷𝑛(𝑥,𝑦) = jarak objek antara objek i dan j
P = dimensi data
menggunakan hasil pada perhitungan jarak pada proses langkah 2. Hasil pada perhitungan
4. Mengalokasikan masing-masing data ke titik pusat terdekat, sehingga dalam tahap ini
5. Menghitung titik pusat baru menggunakan jumlah keseluruhan per cluster. Untuk
menghitung titik pusat cluster yang baru ditentukan berdasarkan rata-rata dari data-data
yang ada di titik pusat yang sama. Adapun penghitung titik pusat dengan persamaan 3.2
𝐶 1 ∑ 𝑑𝑖 .................................................................................... (3.2)
𝑘= ( )
𝑛𝑘
Dengan:
𝐶𝑘 = titik pusat baru
𝑛𝑘 = jumlah dokumen dalam cluster k
1. Kembali ke langkah 3, jika ada data yang berubah – ubah dari cluster atau jika berubahnya
nilai centroid melebihi nilai threshold atau jika berubahnya nilai objective function yang
digunakan melebihi nilai threshold yang digunakan. Adapun flowchart K-Means dapat
1. Masukan jumlah data n yang akan di proses dan jumlah iterasi yang akan dilakukan.
2. Menentukan jumlah cluster k dan pusat cluster (medoids) untuk masing – masing cluster
dari inputan n.
3. Menghitung cost setiap titik data ke pusat cluster(medoids) menggunakan persamaan 3.3
𝑑(𝑥,𝑦)=‖𝑥−𝑦‖
√∑𝑛𝑖=1(𝑥𝑖 − 𝑦𝑖 )² .............................................................. (3.3)
5. Mengecek iterasi yang telah dilakukan sama dengan jumlah iterasi yang telah
ditentukan.
6. Jika ya pilih nilai total costyang terkecil dari total costyang telah dilakukan selama iterasi.
Data hasil cluster dengan total cost yang terkecil tersebut akan menjadi kelompok data yang
8. Ulangi langkah 3 sampai 8 sampai tidak ada perubahan dalam medoids tersebut. Adapun
5. Evaluation
Pada tahap ini dilakukan evaluasi dari kinerja algoritma K-Means dan K-Medoids dengan
menghitung tingkat akurasi dari hasil clustering. Untuk pengukuran tingkat akurasi kedua model
menggunakan metode confussion matrix untuk membandingkan hasil nilai rata – rata akurasi,
recall, dan error rate yang terdapat pada tabel confussion matrix.
6. Deployment
Hasil dari penelitian ini berupa data pasien pencandu narkoba yang masuk dalam cluster -
cluster rehabilitas narkoba yang ditempatkan untuk menjalankan rehabili tas yang sesuai dan