Anda di halaman 1dari 13

BAB III

METODOLOGI PENELITIAN

3.1 Waktu dan Tempat Penelitian

Waktu penelitian dimulai dari bulan Februari sampai Mei 2019 dan dilaksanakan di Badan

Narkotika Nasional Provinsi Kalimantan Timur yang beralamat di Jl. Rapak Indah KM. 1

Samarinda, Kalimantan Timur.

Tabel 3. 1 Waktu Penelitian

Tahun 2019
No Jenis Kegiatan
Februari Maret April Mei
1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4

A. Tahap Pra Penelitian


1 Menentukan Judul Penelitian
Menyusun Rumusan
2
Masalah
3 Mencari Data Pendukung
Menyusun Metode
4
Penelitian
Menyusun Proposal
5
Penelitian
6 Revisi Proposal Penelitian
7 Seminar Proposal
B. Tahap Penelitian
1 Pengumpulan Data
2 Analisis Data
Pengujian Data Training dan
3 Data Testing Dengan
Algoritma K-Means
Pengujian Data Training dan
4 Data Testing Dengan
Algoritma K-Medoids
C. Tahap Akhir Penelitian
1 Penyusunan Laporan
Tahun 2019
No Jenis Kegiatan
Februari Maret April Mei

2 Evaluasi
3 Seminar Hasil
4 Revisi Seminar Hasil
5 Penyempurnaan Laporan
6 Publikasi Karya Ilmiah

3.2 Jenis Penelitian

Penelitian ini menggunakan pendekatan kuantitatif, karena penelitian ini dilakukan untuk

perbandingan penerapan Clustering dengan metode K-Means dan K-Medoids dalam menentukan

rehabilitasi narkoba.

3.3 Data dan Metode Pengumpulan Data

3.3.1 Jenis Data

Data yang digunakan dalam penelitian adalah data primer yang didapat dari database

rehabilitasi BNN Provinsi Kalimantan Timur sebanyak 350 data pasien.

3.3.2 Metode Pengumpulan Data

Teknik pengumpulan data yang digunakan dalam penelitian ini adalah sebagai berikut:

(1) Studi Literatur

Studi literatur adalah metode yang digunakan dalam penelitian untuk menelusuri sumber –

sumber yang berkaitan dengan penelitian yang diambil dari jurnal, skripsi, buku referensi dan

sumber terpercaya lainnya yang dapat dijadikan referensi yang berhubungan dalam penelitian ini

sehingga dapat menghasilkan penelitian yang maksimal. Pada penelitian ini berdasarkan literature

buku data mining dan jurnal yang berkaitan dengan penggunaan metode K-Means dan K-Medoids.
(2) Studi Lapangan

Pada penelitian ini studi lapangan di lakukan dengan observasi langsung pada tempat

penelitian yaitu di kantor Badan Narkotika Nasional Provinsi Kalimantan Timur bidang

rehabilitasi.

3.4 Variabel dan definisi Variabel

Variabel yang digunakan dalam penelitian ini ada 2 jenis yaitu variabel bebas (independent)

dan variabel terikat (dependent).

(1) Variabel bebas (belum tau atribut apa yang digunakan)

(2) Variabel terikat dalam penelitian ini adalah variabel status rehabilitas yang menentukan jenis

pelayanan dalam rehabilitasi narkoba yaitu rawat inap atau rawat jalan.

3.5 Perangkat Penelitian

Dalam penelitian ini penulis menggunakan perangkat lunak pengolah angka Microsoft Excel

(Office 356), dan perangkat lunak visualisasi prediktif RapidMiner Studio 7.6 untuk membantu

dalam proses perhitungan dan pemodelan proses data mining yang digunakan.

3.6 Tahapan Penelitian

Penelitian ini akan dibagi kedalam 3 tahapan yaitu: pengumpulan data, tahap analisi data, dan

tahap komparasi hasil cluster algoritma dan penarikan kesimpulan yang terdapat pada Gambar 3.1.
Gambar 3. 1 Alur Tahap Penelitian
Dalam penelitian ini menggunakan standar data mining yaitu Cross Industry Standart

Process-Data Mining (CRISP-DM) untuk data mining. Berikut adalah langkah – langkah dari

tahapan CRISP-DM sebagai berikut:

1. Bussiness Understanding

Dalam penelitian ini akan berfokus untuk mengetahui perbandingan penerapan Clustering

dengan metode K-Means dan K-Medoids untuk memperoleh metode pengklasteran terbaik dalam

penempatan bagi pencandu narokoba dengan data yang diperoleh dari klinik Badan Narkotika dan

Narkoba Provinsi Kalimantan Timur.

2. Data Understanding

Pada tahap ini akan diperoleh data pasien dari bagian klinik BNN Prov Kaltim yang diperoleh

melalui bidang Rehabilitas BNN Provinsi Kaltim. Berikut atribut dalam data yang diperoleh yang

disajikan dalam Tabel 3.3 dibawah ini:

Tabel 3. 2 Keterangan Atribut Data Rehabilitas


No. Nama Atribut Keterangan
1. Nama Nama Pasien
2. Jenis Kelamin Jenis Kelamin Pasien
3. Status Perkawinan Status Perkawinan Pasien
4. Pendidikan Terakhir Pendidikan Terakhir Pasien
5. Skala Medis Skala Medis berskala 0-9
6. Status Pekerjaan Status Pekerjaan Pasien
7. Pola Kerja Pola Kerja Pasien
8. Dukungan Hidup Dukungan Hidup Pasien
9. Skala Pekerjaan Skala Pekerjaan berskala 0-9
Jumlah jenis zat yang
10. Jumlah jenis yang dikonsumsi pasien
dikonsumsi
11. Zat utama dikonsumsi Zat utama yang dikonsumsi Pasien
12. Frekuensi Pemakaian Frekuensi Pemakaian Pasien
Lama penggunaan narkoba sepanjang
13. Lama Penggunaan Narkoba
hidup pasien
14. Riwayat Rehabilitasi Riwayat Rehabilitasi Pasien
15. Riwayat Overdosis Riwayat Overdosis Pasien
16. Skala Napza Skala Napza berskala 0-9
Jumlah tindakan asusila yang
17. Jumlah tindakan asusila
dilakukan Pasien sepanjang hidup
18. Skala Legal Skala Legal berskala 0-9
19. Status Tinggal Status tinggal Pasien
20. Riwayat Konflik Riwayat konflik Pasien
21. Skala social Skala Sosial berskala 0-9
22. Skala Psikiatris Skala Psikiatris berskala 0-9
23. Status Rehabilitasi Perawatan rehabilitas pasien

3. Data Preparation

Dari data yang diperoleh akan dilakukan pemilihan variabel yang ditentukan oleh peneliti

berdasarkan penelitian terdahulu. Kemudian setiap atribut akan diuji yang disebut data cleaning

dan data integration and transformation untuk membersihkan data atau nilai atribut jika terjadi

duplikasi data atau data yang inkosisten yang dapat menghambat proses data.

a. Data Cleaning

Dari 350 data terdapat 50 data yang tergolong tidak lengkap (missing value) dan harus dihapus

dikarenakan dapat mengganggu aturan algoritma yang akan dibentuk. Maka data yang

digunakan sebanyak 300 data terhitung dari tahun 2017-2018.

b. Data Integration dan Transformation

Untuk meningkatkan dan memudahkan dalam proses analisis maka dari 23 atribut yang

diperoleh akan dipilih beberapa atribut inti sebagai penentuan rehabilitiasi narkoba yang

diantaranya pada Tabel 3.4

Tabel 3. 3 Tahap Integration dan Transformation Data

No. Nama Atribut Keterangan


1. Nama Nama Pasien
2. Jenis Kelamin 1. Laki-laki
2. Perempuan
3. Status Perkawinan 1. Belum Menikah
2. Menikah
3. Duda/Janda
4. Pendidikan Terakhir 0. Tidak Sekolah/tdk tamat SD
1. Tamat SD
2. Tamat SLTP
3. Tamat SLTA
4. Tamat Akademi 4
5. Tamat PT
5. Skala Medis 1. Ringan
2. Sedang
3. Berat
6. Status Pekerjaan 1. Tidak Bekerja
2. Bekerja
8. Mahasiswa/pelajar
9. Ibu Rumah Tangga
7. Pola Kerja 1. Purna Waktu
2. Paruh Waktu
99. Tidak Tentu
8. Dukungan Hidup 1. Ya
2. Tidak
9. Skala Pekerjaan 1. Ringan
2. Sedang
3. Berat
10. Jumlah jenis zat yang Jumlah jenis yang dikonsumsi pasien
dikonsumsi
12. Frekuensi Pemakaian Frekuensi Pemakaian Pasien
13. Lama Penggunaan Narkoba Lama penggunaan narkoba sepanjang hidup
pasien
14. Riwayat Rehabilitasi 1. Ya
2. Tidak
15. Riwayat Overdosis 1. Ya
2. Tidak
16. Skala Napza 1. Ringan
2. Sedang
3. Berat
17. Jumlah tindakan asusila Jumlah tindakan asusila yang dilakukan Pasien
sepanjang hidup
18. Skala Legal 1. Ringan
2. Sedang
3. Berat
19. Status Tinggal 1. Pasangan & anak
2. Pasangan
3. Anak
4. Orang tua
5. Keluarga
6. Teman
7. Sendiri
8. Lingkungan terkontrol
9. Kondisi tdk stabil
20. Riwayat Konflik Jumlah riwayat konflik Pasien
21. Skala social 1. Ringan
2. Sedang
3. Berat
22. Skala Psikiatris 1. Ringan
2. Sedang
3. Berat
23. Status Rehabilitasi Sebagai variable dependen (Rawat Inap dan
Rawat Jalan)

Setelah dilakukan proses diatas melalui tahap integration dan transformation data maka

didapat atribut yang akan digunakan untuk penentuan rehabilitasi narkoba pada Tabel 3.5.

4. Modeling

Algoritma yang digunakan dalam penelitian ini yaitu algoritma K-Means dan K-Medoids

untuk pengklasteran dalam menentukan rehabilitasi narkoba dan untuk mengukur akurasi kedua

algoritma menggunakan metode Confusion Matrix yang hasil akhir menampilkan hitungan dari

nilai rata-rata presentai akurasi, recall, dan error rate. Setelah diketahui hasil dari akurasi tiap

algoritma kemudian dibandingkan untuk mencari algoritma terbaik.

a. Flowchart K-Means

Algoritma K-Means memiliki proses alur sebagai berikut:


1. Menentukan jumlah cluster dan menentukan koordinat titik tengah cluster. Kelompok

cluster yang dibuat adalah 3 kelompok berdasarkan jumlah atribut yang digunakan. Total

jumlah untuk menentukan cluster diambil dari tidak rehab, rawat inap dan rawat jalan.

2. Penentuan nilai dari cluster untuk dijadikan acuan dalam mekakukan perhitungan jarak

objek ke centroid, perhitungan jarak mengacu pada rumus Euclidean dengan persamaan

pada 3.1

𝐷 𝑝
................................................................. (3.1)
𝑛(𝑥,𝑦)=√∑𝑘=1(𝑋𝑥𝑘 − 𝑌𝑦𝑘 )2̀

Dengan:
𝐷𝑛(𝑥,𝑦) = jarak objek antara objek i dan j

P = dimensi data

𝑋𝑥𝑘 = koordinat dari objek x pada dimensi k

𝑌𝑦𝑘 = koordinat dari objek y pada dimensi k

3. Pengelompokkan objek tersebut berdasarkan pada jarak yang dilakukan dengan

menggunakan hasil pada perhitungan jarak pada proses langkah 2. Hasil pada perhitungan

jarak tersebut digunakan untuk penentuan kelompok Clustering.

4. Mengalokasikan masing-masing data ke titik pusat terdekat, sehingga dalam tahap ini

setiap data sudah mulai bergerak ke cluster-nya masing-masing.

5. Menghitung titik pusat baru menggunakan jumlah keseluruhan per cluster. Untuk

menghitung titik pusat cluster yang baru ditentukan berdasarkan rata-rata dari data-data

yang ada di titik pusat yang sama. Adapun penghitung titik pusat dengan persamaan 3.2

𝐶 1 ∑ 𝑑𝑖 .................................................................................... (3.2)
𝑘= ( )
𝑛𝑘
Dengan:
𝐶𝑘 = titik pusat baru
𝑛𝑘 = jumlah dokumen dalam cluster k

𝑑𝑖 = dokumen dalam cluster k

1. Kembali ke langkah 3, jika ada data yang berubah – ubah dari cluster atau jika berubahnya

nilai centroid melebihi nilai threshold atau jika berubahnya nilai objective function yang

digunakan melebihi nilai threshold yang digunakan. Adapun flowchart K-Means dapat

dilihat pada Gambar 3.2

Gambar 3. 2 Flowchart K-Means


b. Flowchart K-Medoids

Gambar 3. 3 Flowchart K-Medoids


Algoritma K-Medoids memiliki proses alur sebagai berikut:

1. Masukan jumlah data n yang akan di proses dan jumlah iterasi yang akan dilakukan.

2. Menentukan jumlah cluster k dan pusat cluster (medoids) untuk masing – masing cluster

dari inputan n.
3. Menghitung cost setiap titik data ke pusat cluster(medoids) menggunakan persamaan 3.3

𝑑(𝑥,𝑦)=‖𝑥−𝑦‖
√∑𝑛𝑖=1(𝑥𝑖 − 𝑦𝑖 )² .............................................................. (3.3)

4. Menghitung total costdari cluster yang sudah terbentuk.

5. Mengecek iterasi yang telah dilakukan sama dengan jumlah iterasi yang telah

ditentukan.

6. Jika ya pilih nilai total costyang terkecil dari total costyang telah dilakukan selama iterasi.

Data hasil cluster dengan total cost yang terkecil tersebut akan menjadi kelompok data yang

akan digunakan untuk proses selanjutnya.

7. Jika tidak tambahkan iterasi dan ubah medoidssecara acak.

8. Ulangi langkah 3 sampai 8 sampai tidak ada perubahan dalam medoids tersebut. Adapun

flowchart K-Medoids dapat dilihat pada Gambar 3.3

5. Evaluation

Pada tahap ini dilakukan evaluasi dari kinerja algoritma K-Means dan K-Medoids dengan

menghitung tingkat akurasi dari hasil clustering. Untuk pengukuran tingkat akurasi kedua model

menggunakan metode confussion matrix untuk membandingkan hasil nilai rata – rata akurasi,

recall, dan error rate yang terdapat pada tabel confussion matrix.

6. Deployment

Hasil dari penelitian ini berupa data pasien pencandu narkoba yang masuk dalam cluster -

cluster rehabilitas narkoba yang ditempatkan untuk menjalankan rehabili tas yang sesuai dan

mencari algoritma Clustering terbaik dari perbandingan yang sudah dihasilkan.

Anda mungkin juga menyukai