Bab Iii PDF

BAB III
METODOLOGI PENELITIAN
3.1 Waktu dan Tempat Penelitian
Waktu penelitian dimulai dari bulan Februari sampai Mei 2019 dan dilaksanakan di Badan
Narkotika Nasional Provinsi Kalimantan Timur yang beralamat di Jl. Rapak Indah KM. 1
Samarinda, Kalimantan Timur.
Tabel 3. 1 Waktu Penelitian
Tahun 2019
No Jenis Kegiatan
Februari Maret April Mei
1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4
A. Tahap Pra Penelitian

1 Menentukan Judul Penelitian
Menyusun Rumusan
2
Masalah
3 Mencari Data Pendukung
Menyusun Metode
4
Penelitian
Menyusun Proposal
5
Penelitian
6 Revisi Proposal Penelitian
7 Seminar Proposal
B. Tahap Penelitian
1 Pengumpulan Data
2 Analisis Data
Pengujian Data Training dan
3 Data Testing Dengan
Algoritma K-Means
Pengujian Data Training dan
4 Data Testing Dengan
Algoritma K-Medoids
C. Tahap Akhir Penelitian
1 Penyusunan Laporan
Tahun 2019
No Jenis Kegiatan
Februari Maret April Mei
2 Evaluasi
3 Seminar Hasil
4 Revisi Seminar Hasil
5 Penyempurnaan Laporan
6 Publikasi Karya Ilmiah
3.2 Jenis Penelitian
Penelitian ini menggunakan pendekatan kuantitatif, karena penelitian ini dilakukan untuk
perbandingan penerapan Clustering dengan metode K-Means dan K-Medoids dalam menentukan
rehabilitasi narkoba.
3.3 Data dan Metode Pengumpulan Data
3.3.1 Jenis Data
Data yang digunakan dalam penelitian adalah data primer yang didapat dari database
rehabilitasi BNN Provinsi Kalimantan Timur sebanyak 350 data pasien.
3.3.2 Metode Pengumpulan Data
Teknik pengumpulan data yang digunakan dalam penelitian ini adalah sebagai berikut:
(1) Studi Literatur
Studi literatur adalah metode yang digunakan dalam penelitian untuk menelusuri sumber –
sumber yang berkaitan dengan penelitian yang diambil dari jurnal, skripsi, buku referensi dan
sumber terpercaya lainnya yang dapat dijadikan referensi yang berhubungan dalam penelitian ini
sehingga dapat menghasilkan penelitian yang maksimal. Pada penelitian ini berdasarkan literature
buku data mining dan jurnal yang berkaitan dengan penggunaan metode K-Means dan K-Medoids.
(2) Studi Lapangan
Pada penelitian ini studi lapangan di lakukan dengan observasi langsung pada tempat
penelitian yaitu di kantor Badan Narkotika Nasional Provinsi Kalimantan Timur bidang
rehabilitasi.
3.4 Variabel dan definisi Variabel
Variabel yang digunakan dalam penelitian ini ada 2 jenis yaitu variabel bebas (independent)
dan variabel terikat (dependent).
(1) Variabel bebas (belum tau atribut apa yang digunakan)
(2) Variabel terikat dalam penelitian ini adalah variabel status rehabilitas yang menentukan jenis
pelayanan dalam rehabilitasi narkoba yaitu rawat inap atau rawat jalan.
3.5 Perangkat Penelitian
Dalam penelitian ini penulis menggunakan perangkat lunak pengolah angka Microsoft Excel
(Office 356), dan perangkat lunak visualisasi prediktif RapidMiner Studio 7.6 untuk membantu
dalam proses perhitungan dan pemodelan proses data mining yang digunakan.
3.6 Tahapan Penelitian
Penelitian ini akan dibagi kedalam 3 tahapan yaitu: pengumpulan data, tahap analisi data, dan
tahap komparasi hasil cluster algoritma dan penarikan kesimpulan yang terdapat pada Gambar 3.1.
Gambar 3. 1 Alur Tahap Penelitian
Dalam penelitian ini menggunakan standar data mining yaitu Cross Industry Standart
Process-Data Mining (CRISP-DM) untuk data mining. Berikut adalah langkah – langkah dari
tahapan CRISP-DM sebagai berikut:
1. Bussiness Understanding
Dalam penelitian ini akan berfokus untuk mengetahui perbandingan penerapan Clustering
dengan metode K-Means dan K-Medoids untuk memperoleh metode pengklasteran terbaik dalam
penempatan bagi pencandu narokoba dengan data yang diperoleh dari klinik Badan Narkotika dan
Narkoba Provinsi Kalimantan Timur.
2. Data Understanding
Pada tahap ini akan diperoleh data pasien dari bagian klinik BNN Prov Kaltim yang diperoleh
melalui bidang Rehabilitas BNN Provinsi Kaltim. Berikut atribut dalam data yang diperoleh yang
disajikan dalam Tabel 3.3 dibawah ini:
Tabel 3. 2 Keterangan Atribut Data Rehabilitas

No. Nama Atribut Keterangan
1. Nama Nama Pasien
2. Jenis Kelamin Jenis Kelamin Pasien
3. Status Perkawinan Status Perkawinan Pasien
4. Pendidikan Terakhir Pendidikan Terakhir Pasien
5. Skala Medis Skala Medis berskala 0-9
6. Status Pekerjaan Status Pekerjaan Pasien
7. Pola Kerja Pola Kerja Pasien
8. Dukungan Hidup Dukungan Hidup Pasien
9. Skala Pekerjaan Skala Pekerjaan berskala 0-9
Jumlah jenis zat yang
10. Jumlah jenis yang dikonsumsi pasien
dikonsumsi
11. Zat utama dikonsumsi Zat utama yang dikonsumsi Pasien
12. Frekuensi Pemakaian Frekuensi Pemakaian Pasien
Lama penggunaan narkoba sepanjang
13. Lama Penggunaan Narkoba
hidup pasien
14. Riwayat Rehabilitasi Riwayat Rehabilitasi Pasien
15. Riwayat Overdosis Riwayat Overdosis Pasien
16. Skala Napza Skala Napza berskala 0-9
Jumlah tindakan asusila yang
17. Jumlah tindakan asusila
dilakukan Pasien sepanjang hidup
18. Skala Legal Skala Legal berskala 0-9
19. Status Tinggal Status tinggal Pasien
20. Riwayat Konflik Riwayat konflik Pasien
21. Skala social Skala Sosial berskala 0-9
22. Skala Psikiatris Skala Psikiatris berskala 0-9
23. Status Rehabilitasi Perawatan rehabilitas pasien
3. Data Preparation
Dari data yang diperoleh akan dilakukan pemilihan variabel yang ditentukan oleh peneliti
berdasarkan penelitian terdahulu. Kemudian setiap atribut akan diuji yang disebut data cleaning
dan data integration and transformation untuk membersihkan data atau nilai atribut jika terjadi
duplikasi data atau data yang inkosisten yang dapat menghambat proses data.
a. Data Cleaning
Dari 350 data terdapat 50 data yang tergolong tidak lengkap (missing value) dan harus dihapus
dikarenakan dapat mengganggu aturan algoritma yang akan dibentuk. Maka data yang
digunakan sebanyak 300 data terhitung dari tahun 2017-2018.
b. Data Integration dan Transformation
Untuk meningkatkan dan memudahkan dalam proses analisis maka dari 23 atribut yang
diperoleh akan dipilih beberapa atribut inti sebagai penentuan rehabilitiasi narkoba yang
diantaranya pada Tabel 3.4
Tabel 3. 3 Tahap Integration dan Transformation Data
No. Nama Atribut Keterangan

1. Nama Nama Pasien
2. Jenis Kelamin 1. Laki-laki
2. Perempuan
3. Status Perkawinan 1. Belum Menikah
2. Menikah
3. Duda/Janda
4. Pendidikan Terakhir 0. Tidak Sekolah/tdk tamat SD
1. Tamat SD
2. Tamat SLTP
3. Tamat SLTA
4. Tamat Akademi 4
5. Tamat PT
5. Skala Medis 1. Ringan
2. Sedang
3. Berat
6. Status Pekerjaan 1. Tidak Bekerja
2. Bekerja
8. Mahasiswa/pelajar
9. Ibu Rumah Tangga
7. Pola Kerja 1. Purna Waktu
2. Paruh Waktu
99. Tidak Tentu
8. Dukungan Hidup 1. Ya
2. Tidak
9. Skala Pekerjaan 1. Ringan
2. Sedang
3. Berat
10. Jumlah jenis zat yang Jumlah jenis yang dikonsumsi pasien
dikonsumsi
12. Frekuensi Pemakaian Frekuensi Pemakaian Pasien
13. Lama Penggunaan Narkoba Lama penggunaan narkoba sepanjang hidup
pasien
14. Riwayat Rehabilitasi 1. Ya
2. Tidak
15. Riwayat Overdosis 1. Ya
2. Tidak
16. Skala Napza 1. Ringan
2. Sedang
3. Berat
17. Jumlah tindakan asusila Jumlah tindakan asusila yang dilakukan Pasien
sepanjang hidup
18. Skala Legal 1. Ringan
2. Sedang
3. Berat
19. Status Tinggal 1. Pasangan & anak
2. Pasangan
3. Anak
4. Orang tua
5. Keluarga
6. Teman
7. Sendiri
8. Lingkungan terkontrol
9. Kondisi tdk stabil
20. Riwayat Konflik Jumlah riwayat konflik Pasien
21. Skala social 1. Ringan
2. Sedang
3. Berat
22. Skala Psikiatris 1. Ringan
2. Sedang
3. Berat
23. Status Rehabilitasi Sebagai variable dependen (Rawat Inap dan
Rawat Jalan)
Setelah dilakukan proses diatas melalui tahap integration dan transformation data maka
didapat atribut yang akan digunakan untuk penentuan rehabilitasi narkoba pada Tabel 3.5.
4. Modeling
Algoritma yang digunakan dalam penelitian ini yaitu algoritma K-Means dan K-Medoids
untuk pengklasteran dalam menentukan rehabilitasi narkoba dan untuk mengukur akurasi kedua
algoritma menggunakan metode Confusion Matrix yang hasil akhir menampilkan hitungan dari
nilai rata-rata presentai akurasi, recall, dan error rate. Setelah diketahui hasil dari akurasi tiap
algoritma kemudian dibandingkan untuk mencari algoritma terbaik.
a. Flowchart K-Means
Algoritma K-Means memiliki proses alur sebagai berikut:

1. Menentukan jumlah cluster dan menentukan koordinat titik tengah cluster. Kelompok
cluster yang dibuat adalah 3 kelompok berdasarkan jumlah atribut yang digunakan. Total
jumlah untuk menentukan cluster diambil dari tidak rehab, rawat inap dan rawat jalan.
2. Penentuan nilai dari cluster untuk dijadikan acuan dalam mekakukan perhitungan jarak
objek ke centroid, perhitungan jarak mengacu pada rumus Euclidean dengan persamaan
pada 3.1
𝐷 𝑝
................................................................. (3.1)
𝑛(𝑥,𝑦)=√∑𝑘=1(𝑋𝑥𝑘 − 𝑌𝑦𝑘 )2̀
Dengan:
𝐷𝑛(𝑥,𝑦) = jarak objek antara objek i dan j
P = dimensi data
𝑋𝑥𝑘 = koordinat dari objek x pada dimensi k
𝑌𝑦𝑘 = koordinat dari objek y pada dimensi k
3. Pengelompokkan objek tersebut berdasarkan pada jarak yang dilakukan dengan
menggunakan hasil pada perhitungan jarak pada proses langkah 2. Hasil pada perhitungan
jarak tersebut digunakan untuk penentuan kelompok Clustering.
4. Mengalokasikan masing-masing data ke titik pusat terdekat, sehingga dalam tahap ini
setiap data sudah mulai bergerak ke cluster-nya masing-masing.
5. Menghitung titik pusat baru menggunakan jumlah keseluruhan per cluster. Untuk
menghitung titik pusat cluster yang baru ditentukan berdasarkan rata-rata dari data-data
yang ada di titik pusat yang sama. Adapun penghitung titik pusat dengan persamaan 3.2
𝐶 1 ∑ 𝑑𝑖 .................................................................................... (3.2)
𝑘= ( )
𝑛𝑘
Dengan:
𝐶𝑘 = titik pusat baru
𝑛𝑘 = jumlah dokumen dalam cluster k
𝑑𝑖 = dokumen dalam cluster k
1. Kembali ke langkah 3, jika ada data yang berubah – ubah dari cluster atau jika berubahnya
nilai centroid melebihi nilai threshold atau jika berubahnya nilai objective function yang
digunakan melebihi nilai threshold yang digunakan. Adapun flowchart K-Means dapat
dilihat pada Gambar 3.2
Gambar 3. 2 Flowchart K-Means

b. Flowchart K-Medoids
Gambar 3. 3 Flowchart K-Medoids

Algoritma K-Medoids memiliki proses alur sebagai berikut:
1. Masukan jumlah data n yang akan di proses dan jumlah iterasi yang akan dilakukan.
2. Menentukan jumlah cluster k dan pusat cluster (medoids) untuk masing – masing cluster
dari inputan n.
3. Menghitung cost setiap titik data ke pusat cluster(medoids) menggunakan persamaan 3.3
𝑑(𝑥,𝑦)=‖𝑥−𝑦‖
√∑𝑛𝑖=1(𝑥𝑖 − 𝑦𝑖 )² .............................................................. (3.3)
4. Menghitung total costdari cluster yang sudah terbentuk.
5. Mengecek iterasi yang telah dilakukan sama dengan jumlah iterasi yang telah
ditentukan.
6. Jika ya pilih nilai total costyang terkecil dari total costyang telah dilakukan selama iterasi.
Data hasil cluster dengan total cost yang terkecil tersebut akan menjadi kelompok data yang
akan digunakan untuk proses selanjutnya.
7. Jika tidak tambahkan iterasi dan ubah medoidssecara acak.
8. Ulangi langkah 3 sampai 8 sampai tidak ada perubahan dalam medoids tersebut. Adapun
flowchart K-Medoids dapat dilihat pada Gambar 3.3
5. Evaluation
Pada tahap ini dilakukan evaluasi dari kinerja algoritma K-Means dan K-Medoids dengan
menghitung tingkat akurasi dari hasil clustering. Untuk pengukuran tingkat akurasi kedua model
menggunakan metode confussion matrix untuk membandingkan hasil nilai rata – rata akurasi,
recall, dan error rate yang terdapat pada tabel confussion matrix.
6. Deployment
Hasil dari penelitian ini berupa data pasien pencandu narkoba yang masuk dalam cluster -
cluster rehabilitas narkoba yang ditempatkan untuk menjalankan rehabili tas yang sesuai dan
mencari algoritma Clustering terbaik dari perbandingan yang sudah dihasilkan.

Bab Iii PDF

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Bab Iii PDF

Diunggah oleh

Hak Cipta:

Format Tersedia

BAB III

3.1 Waktu dan Tempat Penelitian

Samarinda, Kalimantan Timur.

Tabel 3. 1 Waktu Penelitian

A. Tahap Pra Penelitian

3.2 Jenis Penelitian

3.3 Data dan Metode Pengumpulan Data

3.3.1 Jenis Data

rehabilitasi BNN Provinsi Kalimantan Timur sebanyak 350 data pasien.

3.3.2 Metode Pengumpulan Data

(1) Studi Literatur

3.4 Variabel dan definisi Variabel

dan variabel terikat (dependent).

(1) Variabel bebas (belum tau atribut apa yang digunakan)

3.5 Perangkat Penelitian

3.6 Tahapan Penelitian

tahapan CRISP-DM sebagai berikut:

Narkoba Provinsi Kalimantan Timur.

disajikan dalam Tabel 3.3 dibawah ini:

Tabel 3. 2 Keterangan Atribut Data Rehabilitas

digunakan sebanyak 300 data terhitung dari tahun 2017-2018.

b. Data Integration dan Transformation

diantaranya pada Tabel 3.4

Tabel 3. 3 Tahap Integration dan Transformation Data

No. Nama Atribut Keterangan

algoritma kemudian dibandingkan untuk mencari algoritma terbaik.

Algoritma K-Means memiliki proses alur sebagai berikut:

𝑋𝑥𝑘 = koordinat dari objek x pada dimensi k

𝑌𝑦𝑘 = koordinat dari objek y pada dimensi k

3. Pengelompokkan objek tersebut berdasarkan pada jarak yang dilakukan dengan

jarak tersebut digunakan untuk penentuan kelompok Clustering.

setiap data sudah mulai bergerak ke cluster-nya masing-masing.

𝑑𝑖 = dokumen dalam cluster k

dilihat pada Gambar 3.2

Gambar 3. 2 Flowchart K-Means

Gambar 3. 3 Flowchart K-Medoids

4. Menghitung total costdari cluster yang sudah terbentuk.

akan digunakan untuk proses selanjutnya.

7. Jika tidak tambahkan iterasi dan ubah medoidssecara acak.

flowchart K-Medoids dapat dilihat pada Gambar 3.3

mencari algoritma Clustering terbaik dari perbandingan yang sudah dihasilkan.

Anda mungkin juga menyukai