ABSTRAK
METODE PENELITIAN
TUJUAN PENELITIAN
Beberapa metode dalam
Berdasarkan latar belakang dan penelitian ini diantaranya adalah
rumusan masalah diatas, maka 1. Pengumpulan Data
penelitian ini bertujuan untuk 2. Pengolahan Data
menerapkan metode dari algoritma 3. Eksperimen Dan Pengujian
Naive Bayes dalam klasifikasi status
kesejahteran RTS (Rumah Tangga 1. Pengumpulan Data
Sasaran) Keluarga Binaan Sosial. Dataset yang digunakan
merupakan data sekunder hasil
pendataan PPLS 2011 Provinsi
Kalimantan Selatan, Kecamatan Rantau
TARGET LUARAN DAN MANFAAT Badauh Barito Kuala. Dataset tersebut
PENELITIAN memiliki 1 variabel sebagai kelas yaitu
status rumah tangga sangat miskin
Target luaran dalam pembuatan (RTSM) dan status rumah tangga miskin
laporan penelitian ini adalah untuk (RTM) dan 16 variabel sebagai atribut.
memfasilitasi tercapainya tingkat akurasi Sebagian besar variabel atribut bertipe
dari data PPLS dengan menggunakan data nominal kecuali atribut umur,
metode naïve bayes sehingga jumlah keluarga dan jumlah individu.
didapatkan hasil yang akurat dalam Variabel dan kategori yang digunakan
pengelompokkan data. pada penelitian ini adalah :
Manfaat dari penelitian ini adalah:
1. Manfaat Praktis VAR KATEGORI
ANALISA HASIL DAN Perhitungan fakta umum dari sampel 30 Hasil dalam
P( Y = sangat 16
0,53
Sebelum melakukan eksperimen miskin ) 30
dan pengujian model/metode maka data
yang dikumpulkan terlebih dahulu diolah 14
P( Y = miskin) 0,46
agar dapat diproses dalam data mining. 30
Data yang terkumpul kemudian
dilakukan pre-processing dengan cara Hasil perhitungan fakta umum
melakukan identifikasi dan inspeksi yaitu P(Y=sangat miskin) adalah 0,53
sejumlah atribut-atribut yang tidak sedangkan P(Y=miskin) adalah 0,46.
relevan. Kemudian setelah diketahui Selanjutnya menghitung berdasarkan
sejumlah atribut yang tidak relevan maka rumus NaiveBayes atau HMAP data
tahap selanjutnya adalah mengeliminasi training dengan hipotesa berdasarkan
sejumlah atribut tersebut dan melakukan nilai probabilitas kondisi prior yang
subtitusi data sehingga data dapat diketahui.
diproses dalam data mining.
Diketahui
Y X
:
X1 = Jenis Kelamin
Dataset X2 = Umur KRT
X3 = Pendidikan KRT
X4 = Lapangan Usaha KRT
Data Pre- X5 = SKP KRT
PPL Processing X6 = SPB KRT
Asumsi
S X7 = Jenis Atap
Inspeksi Variabel Y = Status Kesejahteraan KRT
2011 X8 = Kualitas Atap
Identifikasi Data 1 = sangat miskin/RTSM
X9 = Jenis Dinding
Substitusi PPLS 2 = miskin/RTM
X10 = Kualitas Dinding
Data 2011
X11 = Jenis Lantai
Eliminasi X12 = Sumber Air Minum
Data X13 = Bahan Bakar Memasak
X14 =Sumber Penerangan
X15 = Jumlah Keluarga
X16 = Jumlah Individu
Dataset akan diproses dengan
metode Naïve Bayes dengan beberapa Hasil Fakta P ( Y = Sangat Miskin ) P ( Y = Miskin )
tahapan sehingga perlu menentukan Umum 0,53 0,46
besarnya nilai fakta umum dari data P (X1 = Jenis Kelamin, X2 = Umur KRT, X3 = Pendidikan KRT, X4 = Lapangan
Usaha KRT, X5 = Status Kependudukan Pekerjaan, X6 = Status
yaitu P( Y = sangat miskin ) dan P( Y = Penguasaan Bangunan, X7 = Jenis Atap, X8 = Kualitas Atap, X9 = Jenis
miskin ). Banyaknya data label status Dinding, X10 = Kualitas Dinding, X11 = Jenis Lantai, X12 = Sumber Air
Minum, X13 = Bahan Bakar Memasak, X14 =Sumber Penerangan, X15 =
kesejahteraan bernilai sangat miskin Jumlah Keluarga, X16 = Jumlah Individu | Y = Status Kesejahteraan)
adalah 16 dari 30 sampel data yang
digunakan sehingga dapat ditentukan
nilai P( status kesejahteraan = sangat Rumus HMAP
(NaiveBayes)
miskin ) sedangkan banyaknya data pada
label status kesejahteraan bernilai miskin
adalah 14 dari 30 sampel data sehingga
Hasil yang didapatkan diketahui
dapat ditentukan nilai P( status
perbandingan hasil keputusan Naïve
kesejahteraan = miskin ).
Bayes dengan data original yaitu 29 data
teridentifikasi akurat dan hanya satu
yang tidak akurat.
Data Maximum
3. 0.70 - 0.80 = fair classification
PPLS Minimum
Average 4. 0.60 - 0.70 = poor classification
Zero
5. 0.50 - 0.60 = failure
Nilai AUC yang didapatkan dari
accuracy = 85.80% +/- 3.44% (mikro: 85.80%) pengujian berdasarkan kurva ROC
PredSangat menggunakan metode Naïve bayes
PredMiskin Classprecision
Miskin
PredMiskin 449 54 89.26%
sebesar 0.930 sehingga dari hasil
PredSangat
92 433 82.48%
tersebut berdasarkan kriteria diatas
Miskin menunjukan klasifikasi yang dihasilkan
Classrecall 82.99% 88.91%
termasuk kedalam kelompok excellent
Hasilnya penggunaan X-
PENUTUP
Validation dengan sampling type
stratified memiliki tingkat akurasi yang 1.KESIMPULAN
sedikit lebih baik daripada sampling type
Dari hasil penelitian yang
yang lain meskipun dalam hal
dilakukan dari tahap awal hingga
kehandalan klasifikasi masih sedikit
pengujian, dan hasil perbandingan dapat
lebih unggul penggunaan sampling
disimpulkan bahwa model yang
typestratified.
terbentuk dengan menggunakan
Kemudian percobaan selanjutnya akan
algoritma Naïve Bayes menghasilkan
dilakukan pengujian algoritma Naïve
akurasi yang cukup baik yaitu sebesar
Bayes dengan teknik folds cross
85.80 %. Berdasarkan kehandalan dalam
validation dengan pengujian data mulai
klasifikasi berupa nilai AUC yang
2,3,4,5,6,7,8,9 dan 10.
didapat dari algoritma Naïve Bayes
Val 2 3 4 5 6 7 8 9 10 adalah 0.930 sehingga tergolong sebagai
Acc 85.70 85.80 86.28 85.50 85.70 85.80 86.19 85.60 85.80 Excellent Classification sehingga dapat
Pre 82.96 82.44 83.31 82.12 82.47 82.96 83.21 82.63 82.75 disimpulkan algoritma Naïve Bayes
Rec 87.89 89.33 88.92 89.12 88.91 88.31 89.13 88.71 88.90 dapat diterapkan untuk melakukan
AUC 0.937 0.935 0.940 0.927 0.938 0.935 0.935 0.938 0.930 klasifikasi status kesejahteraan rumah
tangga.
Kemiskinan, 2010.
[5] Perpres, Perpres No. 15 Tahun 2010 [11] K. Suganda, Metode Analisis
tentang Percepatan Penanggulangan Diskriminan untuk klasifikasi
[19] BPS, Indikator Kemiskinan; Konsep [28] W. Ian H. dan E. Frank, Data Mining:
dan Penghitungan, Jakarta: Badan Practical Machine Learning Tools and
Techniques, 2 penyunt., San