REHABILITASI NARKOBA
PROPOSAL PENELITIAN
Disusun oleh:
Rizki Afriani
1515015033
UNIVERSITAS MULAWARMAN
SAMARINDA
2019
ii
LEMBAR PENGESAHAN
REHABILITASI NARKOBA
Rizki Afriani
1515015033
Mengetahui,
Koordinator Prodi Teknik Informatika,
DAFTAR ISI
BAB I PENDAHULUAN
DAFTAR GAMBAR
DAFTAR TABEL
BAB I
PENDAHULUAN
narkoba pun tidak hanya di kalangan orang tua dan anak remaja tetapi sudah
dalam lingkungan pergaulan dan upaya yang dilakukan untuk pencandu narkotika
2018).
penggunaan narkoba, pemulihan ini bersifat jangka pendek maupun panjang untuk
sedangkan penderita yang mempunyai penyakit serius dan orang yang cacat juga
langsung yang terhitung dari tahun 2017 sampai dengan 2018. (Data Rehabilitasi
2
Provinsi Kalimantan Timur dibagi menjadi dua yaitu rehabilitasi rawat jalan dan
rawat inap. Rehabilitasi rawat jalan diberikan untuk pasien yang tingkat
ketergantungan narkoba dari skala ringan sampe sedang dan dilakukan kurang
lebih 8 kali pertemuan tatap muka antara pasien dan konselor rehab. Sedangkan
narkobanya berskala sedang hingga berat dan dikirim ke balai rehabilitasi narkoba
lama penggunaan narkoba, status napza, status narkoba hingga keadaan keluarga
pasien itu sendiri. Namun terdapat beberapa masalah yang terjadi yaitu dari proses
assesmen yang dihasilkan kurang efektif dikarenakan hanya dilihat dari segi
keadaan pencandu dan tidak melihat dari record data sebelumnya dan
Dari hal tersebut perlu diterapkan teknik data mining dalam pengelompokkan
data untuk penentuan rehabilitasi. Dalam data mining terdapat teknik Clustering
cluster atau kelompok sehingga data dalam satu cluster memiliki tingkat
3
kemiripan yang maksimum dan data antar cluster memiliki kemiripan yang
dalam jumlah besar dengan waktu komputasi yang cepat. Prinsip dari metode ini
menentukan centroid (titik pusat awal) secara acak. Tetapi, metode K-Means ini
metode K-Medoids yang prinsip dari metode hampir sama dengan K-Means tetapi
terdapat perbedaan dalam menentukan centroid yaitu tidak mengambil nilai rata –
rata (mean) dari objek dalam cluster. Dalam metode K-Medoids menggunakan
medoid sebagai titik acuan yang merupakan objek dalam sebuah cluster yang
paling terpusat. Kelebihan dari metode ini adalah metode yang fleksibel karena
bekerja pada setiap jenis data matriks dan mampu menggelompokkan dokumen
rehabilitasi narkoba.
berikut :
(1) Penelitian ini menggunakan teknik data mining clustering dengan metode K-
(2) Data yang digunakan yaitu data rehabilitasi BNN Provinsi Kalimantan Timur
pada tahun 2017 sampai dengan 2018 yang berupa data hasil kesimpulan dari
assesmen diantaranya ada 9 variabel yaitu status medis, status pekerjaan, pola
Dengan adanya penulisan ini dapat menambah karya ilmiah mahasiswa dalam
BAB II
TINJAUAN PUSTAKA
upaya yang terkoordinasi dan terpadu, terdiri atas upaya – upaya medis,
mencapai kemampuan fungsional sesuai dengan potensi yang dimiliki baik fisik,
mental, sosial dan ekonomi. Pada akhirnya mereka yang diharapkan dapat
Pasal 46 ayat (1),(2),(3), Pasal 47, ayat (1) dan (2), Pasal 48 ayat (1) dan
database besar. (Turban et al, 2005). Menurut Gartner Group data mining adalah
suatu proses menemukan hubungan yang berarti, pola, dan kecenderungan dengan
Selain definisi di atas beberapa definisi juga diberikan seperti, “data mining
adalah serangkaian proses untuk menggali nilai tambah dari suatu kumpulan data
(Pramudiono, 2006). “Data mining adalah analisis otomatis dari data yang
berjumlah besar atau kompleks dengan tujuan untuk menemukan pola atau
(Pramudiono, 2006).
menemukan hubungan yang tidak diduga dan meringkas data dengan cara yang
berbeda dengan sebelumnya, yang dapat dipahami dan bermanfaat bagi pemilik
data.” (Larose, 2006). “Data mining merupakan bidang dari beberapa keilmuan
Kemajuan luar biasa yang terus berlanjut dalam bidang data mining
globalisasi ekonomi.
teknologi).
1. Data mining merupakan suatu proses otomatis terhadap data yang sudah ada.
3. Tujuan data mining adalah mendapatkan hubungan atau pola yang mungkin
Hubungan yang dicari dalam data mining dapat berupa hubungan antara dua atau
lebih dalam satu dimensi. Misalnya dalam dimensi produk, dapat di lihat
keterkaitan pembelian suatu produk dengan produk yang lain. Selain itu,
9
hubungan juga dapat dilihat antara dua atau lebih atribut dan dua atau lebih objek.
(Ponniah, 2001).
Beberapa definisi awal dari data mining meyertakan fokus pada proses
otomatisasi. Berry dan Linoff, (2004) dalam buku Data Mining Technique for
suatu proses eksplorasi dan analisis secara otomatis maupun semi otomatis
terhadap data dalam jumlah besar dengan tujuan menemukan pola atau aturan
kembangkan tahun 1996 oleh analisis dari beberapa industri seperti Daimler
Chrysler, SPSS dan NCR. CRISP-DM menyediakan standar proses data mining
sebagai strategi pemecahan masalah secara umum dari bisnis atau unit penelitian.
Dalam CRISP-DM sebuah proyek data mining memiliki siklus hidup yang terbagi
dalam enam fase Gambar 2.2. Keseluruhan fase berurutan yang ada tersebut
10
bersifat adaptif. Fase berikutnya dalam urutan bergantung kepada keluaran dari
Sebagai contoh, jika proses berada pada fase modeling. Berdasar pada perilaku
dan karakteristik model, proses mungkin kembali kepada fase data preparation
untuk perbaikan lebih lanjut terhadap data atau berpindah maju kepada fase
evaluation.
Enam fase CRISP-DM ( Cross Industry Standard Process for Data Mining)
(Larose, 2006).
a. Penentuan tujuan proyek dan kebutuhan secara detail dalam lingkup bisnis
data mining.
a. Mengumpulkan data.
a. Siapkan dari data awal, kumpulan data yang akan digunakan untuk
b. Pilih kasus dan variabel yang ingin dianalisis dan yang sesuai analisis yang
akan dilakukan.
awal.
mining.
klasifikasi antara lain pohon keputusan, nearest neighbor, naïve bayes, neural
variabel. Dalam analisis regresi ada satu atau lebih variabel independentt /
prediktor yang biasa diwakili dengan notasi x dan satu variabel respon yang biasa
klaster (group) sehingga dalam setiap klaster berisi data yang semirip mungkin.
menentuan produk yang sering dibeli bersamaan dan menggunakan informasi ini
sebagai berikut :
14
dikoleksi. Secara umum ada dua kemungkinan yang berbeda. Yang pertama
adalah ketika proses pembangkitan data dibawah kendali dari ahli. Pendekatan ini
Kemungkinan yang kedua adalah ketika ahli tidak memiliki pengaruh pada proses
Data asing merupakan data dengan nilai yang tidak dibutuhkan karena
tidak konsisten pada sebagian pengamatan. Biasanya data asing dihasilkan dari
abnormal yang wajar. Ada dua strategi untuk menangani data asing, yang pertama
mendeteksi dan berikutnya membuang data asing sebagai bagian dari fase pra
skala variabel dan beberapa jenis pengkodean. Sebagai contoh, satu fitur dengan
range [0, 1] dan yang lain dengan range [-100, 100] tidak akan memiliki bobot
yang sama pada teknik yang diaplikasikan dan akan berpengaruh pada hasil akhir
data mining. Oleh karena itu, disarankan untuk pemberian skala dan membawa
Pemilihan dan implementasi dari tehnik data mining yang sesuai merupakan
tugas utama dari fase ini. Proses ini tidak mudah, biasanya dalam pelatihan,
Pada banyak kasus, model data mining akan membantu dalam pengambilan
yang baik pada keseluruhan proses sangat penting untuk kesuksesan aplikasi.
Tidak perduli seberapa kuat metode data mining yang digunakan, hasil dari model
tidak akan valid jika pra pengolahan dan pengkoleksian data tidak benar atau jika
item data ke himpunan bagian yang disebut cluster. Item yang dalam cluster-nya
memiliki karakteristik hampir sama antara satu dengan yang lain dan akan
berbeda dengan item dalam cluster lain. Partisi tidak dilakukan secara manual
16
karena pasti akan sulit mengingat banyaknya data yang akan dipartisi, sehingga
dibutuhkan suatu algoritma clustering. Oleh karena itu, clustering sangat berguna
terlebih dalam menemukan kelompok yang tidak dikenal dalam data. Clustering
juga dikenal sebagai data segmentasi karena mempartisi banyak data ke banyak
Tan, dkk.([4]) membagi clustering dalam dua kelompok, yaitu hierarchical and
obyek data ke dalam kelompok yang tidak saling overlap sehingga setiap data berada
tepat di satu cluster. Hierarchical clustering adalah sekelopok cluster yang bersarang
berikut:
masing cluster dan model yang baik dipilih diantara model hipotesa tersebut.
tantangan yang harus dipenuhi oleh suatu algoritma clustering, menurut Jiawei
17
Han dan Micheline Kamber di dalam bukunya yang berjudul “Data Mining
mampu menangani data dalam jumlah yang besar bahkan sampai jutaan data.
dari clustering dapat berbentuk aneh dan tidak sama antara satu data dengan
lainnya. Karena itu butuh kemampuan analisa cluster dengan bentuk apapun
4. Kemampuan untuk dapat menangani noise, yang artinya data itu tidak selalu
dalam keadaan baik. Terkadang ada data rusak, tidak dimengerti, atau hilang.
Karena itu, algoritma clustering harus mampu menangani data yang rusak.
data dapat berisi banyak dimensi atau atribut. Untuk itu algoritma clustering
himpunan, yang mana data dalam satu kelompok mempunyai karakteristik yang
sama antara data satu dengan yang lainnya dan mempunyai karakteristik berbeda
dengan data yang ada dalam kelompok berbeda. Dengan maksud lain, metode k-
means ini melakukan peminimalan variasi antar data yang ada dalam suatu cluster
dan memaksimalkan variasi dengan data yang ada dalam cluster lainnya.
Distances, Clustering objek dilihat dari jarak objek dengan titik pusatnya yang
paling dekat, yang mana dalam mencari jarak terdekat kadang dibutuhkan hingga
titik di euclidean space, dengan menghitung akar dari kuadrat perbedaan 2 vektor.
Setelah diketahui titik pusat terdekatnya dan posisi objek terhadap cluster-nya
tidak berubah-ubah lagi, objek dapat dipastikan masuk sebagai anggota cluster
2. Dalam mempelajari k-means relatif cepat sehingga tidak perlu waktu lama.
3. Mudah untuk diadaptasikan dari satu masalah ke masalah lain selama data-
Selain algoritma k-means itu sendiri, ternyata banyak algoritma yang didapat
dari hasil pengembangan atau variasi dari metode k-means sebagai berikut [17] :
titik tengah sebagai model dari peng-cluster-annya, maka untuk k-medoids ini
Mulanya tiap-tiap objek tergabung dalam suatu cluster. Di tiap iterasi, dipilih
iterasinya.
satu faktor yang berpengaruh untuk itu pemilihan titik awal harus beralasan.
Dalam menentukan titik pusat awal cluster dapat dengan mengukur nilai titik
tersebut.
Distance space digunakan dalam perhitungan jarak antara data dan titik
pusat. Salah satu persamaan yang dapat digunakan adalah Euclidean Distance
𝐷 𝑝
𝑛(𝑥,𝑦)=√∑𝑘=1(𝑋𝑥𝑘 − 𝑌𝑦𝑘 )2̀
Dengan :
P = dimensi data
Untuk menghitung titik pusat cluster yang baru ditentukan berdasarkan rata-
rata dari data-data yang ada di titik pusat yang sama. Berikut persamaannya :
𝐶 1 ∑ 𝑑𝑖
𝑘= ( )
𝑛𝑘
Dengan :
6. Kembali ke langkah 3, jika ada data yang berubah – ubah dari cluster atau
jika berubahnya nilai centroid melebihi nilai threshold atau jika berubahnya
digunakan.
clustering yang mirip dan K-Means. Perbedaan dari kedua algoritma ini yaitu
𝑑(𝑥,𝑦)=‖𝑥−𝑦‖ 𝑛
√∑ (𝑥𝑖 − 𝑦𝑖 )²
𝑖=1
3. Pilih seara acak objek pada masng – masing cluster sebagai kandidat
medoid baru.
4. Hitung jarak setiap objek yang berada pada masing – masing cluster
5. Hitung total simpangan (S) dengan menghitung total distance baru – total
distance lama. Jika S < 0, maka tukar objek dengan cluster untuk
source). RapidMiner adalah sebuah solusi untuk melakukan analisis terhadap data
kurang lebih 500 operator data mining, termasuk operator untuk input, output,
23
sendiri untuk analisis data dan sebagai mesin data mining yang dapat
Environment), dimana versi awalnya mulai dikembangkan pada tahun 2001 oleh
(GNU Affero General Public License) versi 3. Hingga saat ini telah ribuan
RapidMiner sebagai software open source untuk data mining tidak perlu
menempati peringkat pertama sebagai Software data mining pada polling oleh
sebuah pipeline analitis. GUI ini akan menghasilkan file XML )Extensible
untuk diterpkan ke data. File ini kemudian dibaca oleh RapidMiner untuk
3. Dengan menggunakan
perbandingan rasio simpangan
baku dari metode K-Means
Perbandingan K- dan K-Medoids Clustering,
Means dan K- maka diperoleh metode
Yunita
Medoids Clustering terbaik untuk pengklasteran
Hilda
2017 terhadap Kelayakam terhadap kelayakan Puskemas
Susanti,
Puskesmas di DIY di DIY adalah metode K-
dkk.
Tahun 2015 Means dengan rasio lebih
kecil dibandingkan dengan
metode K-Medoids Clustering
sebesar 54,96%.
Dari beberapa penelitian diatas yang terkait data mining untuk clustering
sebelumnya oleh beberapa peneliti dari berbagai studi kasus karena metode
tersebut sangant terkenal dalam data minning Clustering. Namun hanya beberapa
K-Medoids pada suatu studi kasus. Maka dalam penelitian ini akan diteliti
yang nantinya dapat dijadikan acuan dalam penentuan rehabilitasi narkoba dan
BAB III
METODOLOGI PENELITIAN
Waktu penelitian dimulai dari bulan Oktober 2018 sampai Januari 2019 dan
Tahun 2018
No Jenis Kegiatan
Oktober November Desember Januari
1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4
Menyusun Rumusan
2
Masalah
Menyusun Metode
4
Penelitian
Menyusun Proposal
5
Penelitian
7 Seminar Proposal
B. Tahap Penelitian
1 Pengumpulan Data
2 Analisis Data
28
Tahun 2018
No Jenis Kegiatan
Oktober November Desember Januari
1 Penyusunan Laporan
2 Evaluasi
3 Seminar Hasil
5 Penyempurnaan Laporan
Data yang digunakan dalam penelitian adalah data primer yang didapat dari
database rehabilitasi BNN Provinsi Kalimantan Timur sebanyak 350 data pasien.
29
sebagai berikut :
menelusuri sumber – sumber yang berkaitan dengan penelitian yang diambil dari
jurnal, skripsi, buku referensi dan sumber terpercaya lainnya yang dapat dijadikan
penelitian yang maksimal. Pada penelitian ini berdasarkan literature buku data
mining dan jurnal yang berkaitan dengan penggunaan metode K-Means dan K-
Medoids.
Pada penelitian ini studi lapangan di lakukan dengan observasi langsung pada
Variabel yang digunakan dalam penelitian ini ada 2 jenis yaitu variabel bebas
(1) Variabel bebas dalam penelitian ini diambil dari penelitian terdahulu yang
3.2
30
(2) Variabel terikat dalam penelitian ini adalah variabel status rehabilitas yang
RapidMiner Studio 7.6 untuk membantu dalam proses perhitungan dan pemodelan
Dalam penelitian ini memiliki tahapan yakni pengumpulan data, analisis data,
kesimpulan.
Analisis Data
Pendeskripsian Data
1. Bussiness Understanding
data yang diperoleh dari klinik Badan Narkotika dan Narkoba Provinsi
Kalimantan Timur.
2. Data Understanding
Pada tahap ini akan diperoleh data pasien dari bagian klinik BNN Prov
Kaltim yang diperoleh melalui bidang Rehabilitas BNN Provinsi Kaltim. Berikut
atribut dalam data yang diperoleh yang disajikan dalam tabel 3.3 dibawah ini :
10. Jumlah jenis zat yang Jumlah jenis yang dikonsumsi pasien
dikonsumsi
3. Data Preparation
Dari data yang diperoleh akan dilakukan pemilihan variabel yang ditentukan
oleh peneliti berdasarkan penelitian terdahulu. Kemudian setiap atribut akan diuji
yang disebut data cleaning dan data integration and transformation untuk
membersihkan data atau nilai atribut jika terjadi duplikasi data atau data yang
a. Data Cleaning
Dari 350 data terdapat 50 data yang tergolong tidak lengkap (missing value)
akan dibentuk. Maka data yang digunakan sebanyak 300 data terhitung dari
tahun 2017-2018.
atribut yang diperoleh akan dipilih beberapa atribut inti sebagai penentuan
10. Jumlah jenis zat Data Cleaning Jumlah jenis yang dikonsumsi
yang pasien
dikonsumsi
4. Modeling
Metode yang akan digunakan pada penelitian ini adalah metode K-Means dan
K-Medoids. Dalam pemodelan ini akan dicari performa dari metode K-Means dan
5. Evaluation
Pada tahap ini dilakukan pengujian untuk data awal menjadi data yang
memiliki variabel yang sudah dianalisis dan diaplikasikan ke dalam algoritma data
mining K-Means dan K-Medoids dan menghitung tingkat akurasi dari hasil
confussion matrix.
6. Deployment
Hasil dari penelitian ini berupa data pasien pencandu narkoba yang masuk
rehabilitas yang sesuai dan mencari metode clustering terbaik dari perbandingan