653 1271 1 SM

“Technologia” Vol 7, No.
4, Oktober – Desember 2016 199
ANALISIS ALGORITMA NAIVE BAYES UNTUK KLASIFIKASI

STATUS KESEJAHTERAAN RUMAH TANGGA KELUARGA
BINAAN SOSIAL
Erfan Karyadiputra, S.Kom, M.Kom

(erfantsy@gmail.com)
ABSTRAK
Kemiskinan merupakan salah satu permasalahan yang sering dihadapi dalam

upaya peningkatan kesejahteraan di hampir semua negara. Tersedianya data
kemiskinan yang akurat dan berkesinambungan merupakan salah satu instrumen
penting untuk mengevaluasi kebijakan pemerintah dalam mengentaskan kemiskinan
dengan memfokuskan perhatian pada pendistribusian bantuan sesuai rumah tangga
sasaran (RTS). Penelitian terkait klasifikasi kesejahteraan rumah tangga sering
menggunakan variabel target/kelas berupa kategori miskin dan tidak miskin. Kategori
tersebut jika dilihat dari aspek pendistribusian bantuan masih bersifat umum, hal
tersebut karena kategori rumah tangga miskin tersebut dapat diklasifikasikan lagi
kedalam status kesejahteraan rumah tangga sesuai rumah tangga sasaran (RTS)
sehingga dalam pendistribusian bantuan dapat disesuaikan dengan status
kesejahteraan rumah tangga sasaran (RTS). Oleh sebab itu diperlukan variabel kelas
baru yang sesuai RTS yaitu sangat miskin dan miskin. Dalam penelitian ini akan
dilakukan pengujian menggunakan algoritma Naive Bayes untuk mengklasifikasi status
kesejahteraan rumah tangga miskin yaitu rumah tangga sangat miskin (RTSM) dan
rumah tangga miskin (RTM). Hasil pengujian yang didapatkan adalah algoritma Naive
Bayes menghasilkan akurasi sebesar 85.80% dan nilai AUC sebesar 0.930.
Kata Kunci : Data Mining, Kemiskinan, Naive Bayes , Non-Monetary
PENDAHULUAN menggunakan variabel target/kelas

berupa kategori miskin dan tidak miskin.
Kemiskinan di Indonesia saat ini Kategori tersebut jika dilihat dari aspek
telah menjadi masalah yang harus pendistribusian bantuan masih bersifat
ditanggulangi secara tuntas karena umum, hal tersebut karena kategori
sebagaimana diamanatkan dalam rumah tangga miskin tersebut dapat
Pembukaan Undang – Undang Dasar diklasifikasikan lagi kedalam status
1945. Tersedianya data kemiskinan yang kesejahteraan rumah tangga sesuai
akurat, dan berkesinambungan rumah tangga sasaran (RTS) sehingga
merupakan salah satu instrumen penting dalam pendistribusian bantuan dapat
bagi pengambil kebijakan dalam disesuaikan dengan status kesejahteraan
memfokuskan perhatian pada rumah tangga sasaran (RTS).
pendistribusian bantuan sesuai rumah Berdasarkan uraian permasalahan
tangga sasaran (RTS). diatas, diperlukan analisis proses
Penelitian terkait klasifikasi klasifikasi status kesejahteraan rumah
kesejahteraan rumah tangga sering tangga menggunakan variabel
Jurnal Ilmiah Fakultas Teknik “Technologia”

“Technologia” Vol 7, No.4, Oktober – Desember 2016 200
target/kelas yang sesuai dengan kategori mengidentifikasi kesejahteraan

rumah tangga sasaran (RTS) yaitu rumah rumah tangga sasaran keluarga
tangga miskin (RTM) dan kelompok binaan sosial.
rumah tangga sangat miskin/fakir miskin 2. Manfaat Teoritis
(RTSM) berdasarkan aspek non-
Hasil penelitian ini diharapkan dapat
monetary menggunakan metode
memberikan sumbangan untuk
klasifikasi data mining yaitu naïve
pengembangan teori yang berkaitan
bayes.
metode klasifikasi data mining
untuk klasifikasi kesejahteraan
RUMUSAN MASALAH
rumah tangga khususnya metode
Naive Bayes.
Berdasarkan permasalahan diatas
3. Manfaat Kebijakan
maka rumusan masalah penelitian ini
adalah klasifikasi status kesejahteran Hasil penelitian ini diharapkan dapat
RTS (Rumah Tangga Sasaran) Keluarga memberikan masukan pada instansi
Binaan Sosial mengunakan Naive Bayes. terkait dalam rangka mengambil
Sehingga “Seberapa besar akurasi kebijakan untuk mengevaluasi
metode Naive Bayes untuk klasifikasi kebijakan dalam upaya
status kesejahteran RTS (Rumah Tangga mengentaskan kemiskinan rumah
Sasaran) Keluarga Binaan Sosial ?” tangga sasaran.
METODE PENELITIAN
TUJUAN PENELITIAN
Beberapa metode dalam
Berdasarkan latar belakang dan penelitian ini diantaranya adalah
rumusan masalah diatas, maka 1. Pengumpulan Data
penelitian ini bertujuan untuk 2. Pengolahan Data
menerapkan metode dari algoritma 3. Eksperimen Dan Pengujian
Naive Bayes dalam klasifikasi status
kesejahteran RTS (Rumah Tangga 1. Pengumpulan Data
Sasaran) Keluarga Binaan Sosial. Dataset yang digunakan
merupakan data sekunder hasil
pendataan PPLS 2011 Provinsi
Kalimantan Selatan, Kecamatan Rantau
TARGET LUARAN DAN MANFAAT Badauh Barito Kuala. Dataset tersebut
PENELITIAN memiliki 1 variabel sebagai kelas yaitu
status rumah tangga sangat miskin
Target luaran dalam pembuatan (RTSM) dan status rumah tangga miskin
laporan penelitian ini adalah untuk (RTM) dan 16 variabel sebagai atribut.
memfasilitasi tercapainya tingkat akurasi Sebagian besar variabel atribut bertipe
dari data PPLS dengan menggunakan data nominal kecuali atribut umur,
metode naïve bayes sehingga jumlah keluarga dan jumlah individu.
didapatkan hasil yang akurat dalam Variabel dan kategori yang digunakan
pengelompokkan data. pada penelitian ini adalah :
Manfaat dari penelitian ini adalah:
1. Manfaat Praktis VAR KATEGORI
Hasil penelitian ini diharapkan dapat Status 1

Kelompok 1 (Paling
Y Miskin)
digunakan untuk membantu Kesejahteraan
2 Kelompok 2 (Miskin)

Jenis Kelamin 1 Laki-laki X11 Jenis Dinding 2 Kayu

X1 Kepala Rumah Terluas 3 Bambu
Tangga 2 Perempuan 4 Lainnya
Umur Kepala - Kualitas 1 Bagus/ Kualitas Tinggi
X2 Rumah X12 Dinding 2 Biasa/ Kualitas Sedang
Tangga 3 Jelek/ Kualitas Rendah
1 Satu Keluarga 1 Bukan Tanah/ Bambu/
Jumlah
X3 2 Dua Keluarga X13 Jenis Lantai Kayu
Keluarga
3 Lebih dari Dua Keluarga 2 Tanah
1 1 Orang 3 Bambu
Jumlah 2 2 Orang 4 Kayu
Anggota 3 3 Orang 1 Air Kemasan
X4 Keluarga 4 4 Orang X14 Sumber Air 2 Air Ledeng
5 Lebih dari 4 Orang Minum 3 Air Terlindung
X5 0 Tidak Punya Ijazah 4 Air Tidak Terlindung
Pendidikan 1 SD/Sederajat Sumber 1 Listrik PLN
Kepala Rumah 2 SMP/Sederajat X15 Penerangan 2 Listrik Non-PLN
Tangga 3 SMA/Sederajat Utama 3 Tidak ada Listrik
4 Perguruan Tinggi 1 Listrik/ Gas/ Elpiji
1 Pertanian (Padi & Palawija) X16 Bahan Bakar 2 Minyak Tanah
X6 2 Hortikultura Utama 3 Kayu
Lapangan 3 Perkebunan Memasak 4 Lainnya
Usaha 4 Perikanan Tangkap
Kepala Rumah 5 Perikanan Budidaya
Tangga 6 Peternakan 2. Pengolahan Data
7 Kehutanan & Pertanian
Lain
8 Pertambangan / Penggalian
Setelah pengumpulan data maka
9 Industri Pengolahan data tersebut kemudian diolah agar dapat
10 Listrik & Gas diproses dalam data mining karena
11 Bangunan / Konstruksi
12 Pedagang dalam data mining, attribut yang kurang
13 Hotel & Rumah Makan lengkap tidak dapat ditangani secara
14 Transportasi &
Pergudangan sistematis oleh algoritma data mining.
15 Informasi & Komunikasi
16 Keuangan & Asuransi
17 Jasa Pendidikan/
3. Eksperimen Dan Pengujian
Jasa Kesehatan/ Beberapa tahapan dalam
JasaKemasyarakatan, eksperimen, yaitu (A) Melakukan
Pemerintahan dan
Perorangan pengujian klasifikasi algoritma Naïve
18 Lainnya bayes menggunakan data original yang
X7 Status 1 Berusaha Sendiri
Kependudukan 2 Berusaha dibantu masih terdapat data kosong (B) Mengisi
dalam Buruh tidak data kosong menggunakan replace
Pekerjaan tetap / tidak dibayar
Kepala Rumah 3 Berusaha dibantu missing value (C) Memisahkan dataset
Tangga Buruh tetap/dibayar menjadi data training dan data testing
4 Buruh/ Karyawan/
Pegawai Swasta (D) Mengevaluasi ketepatan klasifikasi
5 Pekerja Bebas Naïve Bayes berupa evaluasi dan validasi
6 Pekerja Keluarga /
Tidak dibayar
hasil.
X8 Status 1 Milik Sendiri
Penguasaan 2 Kontrak/ Sewa
Bangunan 3 Lainnya
Tempat
Tinggal
1 Beton
X9 Jenis Atap 2 Genteng
Terluas 3 Sirap
4 Seng
5 Asbes
6 Ijuk/ Rumbia
7 Lainnya
1 Bagus/ Kualitas Tinggi
X10 Kualitas Atap 2 Biasa/ Kualitas Sedang
3 Jelek/ Kualitas Rendah
1 Tembok

ANALISA HASIL DAN Perhitungan fakta umum dari sampel 30 Hasil dalam
PEMBAHASAN data decimal
P( Y = sangat 16
0,53
Sebelum melakukan eksperimen miskin ) 30
dan pengujian model/metode maka data
yang dikumpulkan terlebih dahulu diolah 14
P( Y = miskin) 0,46
agar dapat diproses dalam data mining. 30
Data yang terkumpul kemudian
dilakukan pre-processing dengan cara Hasil perhitungan fakta umum
melakukan identifikasi dan inspeksi yaitu P(Y=sangat miskin) adalah 0,53
sejumlah atribut-atribut yang tidak sedangkan P(Y=miskin) adalah 0,46.
relevan. Kemudian setelah diketahui Selanjutnya menghitung berdasarkan
sejumlah atribut yang tidak relevan maka rumus NaiveBayes atau HMAP data
tahap selanjutnya adalah mengeliminasi training dengan hipotesa berdasarkan
sejumlah atribut tersebut dan melakukan nilai probabilitas kondisi prior yang
subtitusi data sehingga data dapat diketahui.
diproses dalam data mining.
Diketahui
Y X
:
X1 = Jenis Kelamin
Dataset X2 = Umur KRT
X3 = Pendidikan KRT
X4 = Lapangan Usaha KRT
Data Pre- X5 = SKP KRT
PPL Processing X6 = SPB KRT
Asumsi
S X7 = Jenis Atap
Inspeksi Variabel Y = Status Kesejahteraan KRT
2011 X8 = Kualitas Atap
Identifikasi Data 1 = sangat miskin/RTSM
X9 = Jenis Dinding
Substitusi PPLS 2 = miskin/RTM
X10 = Kualitas Dinding
Data 2011
X11 = Jenis Lantai
Eliminasi X12 = Sumber Air Minum
Data X13 = Bahan Bakar Memasak
X14 =Sumber Penerangan
X15 = Jumlah Keluarga
X16 = Jumlah Individu
Dataset akan diproses dengan
metode Naïve Bayes dengan beberapa Hasil Fakta P ( Y = Sangat Miskin ) P ( Y = Miskin )
tahapan sehingga perlu menentukan Umum 0,53 0,46
besarnya nilai fakta umum dari data P (X1 = Jenis Kelamin, X2 = Umur KRT, X3 = Pendidikan KRT, X4 = Lapangan
Usaha KRT, X5 = Status Kependudukan Pekerjaan, X6 = Status
yaitu P( Y = sangat miskin ) dan P( Y = Penguasaan Bangunan, X7 = Jenis Atap, X8 = Kualitas Atap, X9 = Jenis
miskin ). Banyaknya data label status Dinding, X10 = Kualitas Dinding, X11 = Jenis Lantai, X12 = Sumber Air
Minum, X13 = Bahan Bakar Memasak, X14 =Sumber Penerangan, X15 =
kesejahteraan bernilai sangat miskin Jumlah Keluarga, X16 = Jumlah Individu | Y = Status Kesejahteraan)
adalah 16 dari 30 sampel data yang
digunakan sehingga dapat ditentukan
nilai P( status kesejahteraan = sangat Rumus HMAP
(NaiveBayes)
miskin ) sedangkan banyaknya data pada
label status kesejahteraan bernilai miskin
adalah 14 dari 30 sampel data sehingga
Hasil yang didapatkan diketahui
dapat ditentukan nilai P( status
perbandingan hasil keputusan Naïve
kesejahteraan = miskin ).
Bayes dengan data original yaitu 29 data
teridentifikasi akurat dan hanya satu
yang tidak akurat.

Pada tahap pertama eksperimen Dari hasil pengujian

dan pengujian model dilakukan dengan membuktikan bahwa algoritma Naïve
data original yang sebagian masih Bayes sudah dapat diterapkan untuk
memiliki data kosong. Kemudian mengidentifikasi status kesejateraan
pengujian dilakukan menggunakan rumah tangga miskin dengan akurasi
algoritma Naïve Bayes dengan validasi 85.80%. Meskipun mengalami
model klasifikasi dilakukan terhadap penurunan akurasi setelah dilakukan
data testing dengan teknik 10-folds cross replace missing value, namun hasil
validation. tersebut masih lebih baik karena telah
menggunakan data yang lengkap
accuracy = 89.79% +/- 2.34% (mikro: 89.79%) daripada pada sebelum dilakukan pre-
TrueSangat
TrueMiskin Classprecision processing sekalipun Naïve Bayes
Miskin
PredMiskin 478 42 91.92% merupakan algoritma yang mampu
PredSangat
Miskin
63 445 87.60% menangani data yang hilang. Kemudian
Classrecall 88.35% 91.38% dari hasil pengujian juga dianalisa
berdasarkan kurva ROC
Dari hasil pengujian tersebut
didapatkan akurasi yang sudah cukup
baik sekitar 89,79% dengan nilai AUC
sebesar 0.959. Namun hasil tersebut
belum maksimal karena pada data
original yang digunakan terdapat data
yang kosong. Oleh sebab itu dilakukan
pre-processing untuk memastikan data
yang akan diolah dalam data mining
adalah data yang baik dan lengkap
sehingga menghasilkan model keputusan
yang baik pula. Salah satu teknik yang
digunakan metode replace missing
values.
ALGORITMA
Menurut Gorunescu, tingkat
keakurasian AUC dapat diklasifikasikan
NaiveBaye
menjadi lima kelompok yaitu :
s 1. 0.90 - 1.00 = excellent classification
DATA REPLACE MISSING VALUE 2. 0.80 - 0.90 = good classification
Data Maximum
3. 0.70 - 0.80 = fair classification
PPLS Minimum
Average 4. 0.60 - 0.70 = poor classification
Zero
5. 0.50 - 0.60 = failure
Nilai AUC yang didapatkan dari
accuracy = 85.80% +/- 3.44% (mikro: 85.80%) pengujian berdasarkan kurva ROC
PredSangat menggunakan metode Naïve bayes
PredMiskin Classprecision
Miskin
PredMiskin 449 54 89.26%
sebesar 0.930 sehingga dari hasil
PredSangat
92 433 82.48%
tersebut berdasarkan kriteria diatas
Miskin menunjukan klasifikasi yang dihasilkan
Classrecall 82.99% 88.91%
termasuk kedalam kelompok excellent

classification atau klasifikasi yang Dari hasil pengujian didapatkan

sangat baik. pengulangan pengujian sebanyak 4 kali
Pada tahap evaluasi dan validasi dengan hasil pengukuran berupa nilai
model klasifikasi dilakukan pengujian rata-rata 4 kali pengujian memiliki
yang dilakukan terhadap data testing tingkat akurasi tertinggi sebesar 86.28%
dengan metode tersebut dilakukan dengan nilai AUC sebesar 0.940.
dengan teknik cross validation dengan Namun hasil dari berbagai percobaan
pengujian data mulai 2,3,4,5,6,7,8,9 dan yang ekstensif dan pembuktian teoritis,
10 sehingga dapat di evaluasi hasilnya menunjukkan bahwa penggunaan 10-fold
dengan mengukur seberapa keakuratan cross-validation adalah pilihan terbaik
akurasi yang dihasilkan dari beberapa untuk mendapatkan hasil validasi yang
percobaan tersebut menggunakan akurat. Hal tersebut karena 10-fold
metode Naïve Bayes. Namun sebelum cross-validation akan mengulang
melakukan percobaan tersebut, terlebih pengujian sebanyak 10 kali dan hasil
dahulu akan dilakukan percobaan pengukuran adalah nilai rata-rata dari 10
dengan mengganti jenis parameter pada kali pengujian sehingga dalam evaluasi
X-validation yaitu sampling type yang hasil perbandingan menggunakan
terdiri atas tiga jenis, diantaranya linear pengukuran 10 kali didapatkan akurasi
sampling, shuffled sampling, dan sebesar 85.80% dan pengujian
stratified sampling sehingga didapatkan performance dengan menggunakan
sampling type yang terbaik dan sesuai Confusion Matrix didapatkan nilai AUC
untuk digunakan pada data yang diuji. sebesar 0.930. maka hasilnya algoritma
Sampling Linear Shuffled Stratified
Naïve Bayes tergolong kedalam
Type Sampling Sampling Sampling Excellent Classification dalam
Accuracy 83.18 85.41 85.80 mengklasifikasi datsa status
AUC 0.931 0.937 0.930 kesejahteraan rumah tangga.
Hasilnya penggunaan X-
PENUTUP
Validation dengan sampling type
stratified memiliki tingkat akurasi yang 1.KESIMPULAN
sedikit lebih baik daripada sampling type
Dari hasil penelitian yang
yang lain meskipun dalam hal
dilakukan dari tahap awal hingga
kehandalan klasifikasi masih sedikit
pengujian, dan hasil perbandingan dapat
lebih unggul penggunaan sampling
disimpulkan bahwa model yang
typestratified.
terbentuk dengan menggunakan
Kemudian percobaan selanjutnya akan
algoritma Naïve Bayes menghasilkan
dilakukan pengujian algoritma Naïve
akurasi yang cukup baik yaitu sebesar
Bayes dengan teknik folds cross
85.80 %. Berdasarkan kehandalan dalam
validation dengan pengujian data mulai
klasifikasi berupa nilai AUC yang
2,3,4,5,6,7,8,9 dan 10.
didapat dari algoritma Naïve Bayes
Val 2 3 4 5 6 7 8 9 10 adalah 0.930 sehingga tergolong sebagai
Acc 85.70 85.80 86.28 85.50 85.70 85.80 86.19 85.60 85.80 Excellent Classification sehingga dapat
Pre 82.96 82.44 83.31 82.12 82.47 82.96 83.21 82.63 82.75 disimpulkan algoritma Naïve Bayes
Rec 87.89 89.33 88.92 89.12 88.91 88.31 89.13 88.71 88.90 dapat diterapkan untuk melakukan
AUC 0.937 0.935 0.940 0.927 0.938 0.935 0.935 0.938 0.930 klasifikasi status kesejahteraan rumah
tangga.

Kemiskinan, 2010.
2. Saran [6] D. A. p. Pratama, Klasifikasi

Kesejahteraan Rumah Tangga di Jawa
Pada penelitian ini hanya
Timur dengan Pendekatan
menggunakan 2 variabel target/kelas dari
RTS (Rumah Tangga Saran) yaitu rumah Multivariate Adaptive Regression
tangga sangat miskin dan rumah tangga Spline Bootstrap Aggregating (MARS
miskin sehingga untuk penelitian Bagging), Surabaya: Institute
selanjutnya diharapkan dapat mencoba Teknologi Sepuluh September, 2011.
menggunakan 3 variabel target sesuai
RTS (Rumah Tangga Saran) dengan [7] H. M. G. Prakosa, Klasifikasi
menambahkan variabel target/kelas Kesejahteraan Rumah Tangga Di
rumah tangga hampir miskin.
Provinsi Jawa Timur Dengan
Pendekatan Bootstrap Aggregatting
Classification And Regression Trees
DAFTAR PUSTAKA (CART Bagging), Surabaya: Institute
Teknologi Sepuluh September, 2011.
[1] UUD, Undang-Undang Dasar Negara [8] I. Widyandono, Klasifikasi

Republik Indonesia 1945 Kesejahteraan Rumah Tangga Di
[Amandemen], surabaya: pustaka Provinsi Jawa Timur Dengan
agung harapan, 2002. Pendekatan Cart Arcing [Thesis],
Surabaya: Institute Teknologi
[2] M. Jhingan, ekonomi pembangunan Sepuluh September, 2010.
dan perencanaan, jakarta: Raja
grafindo persada, 2004. [9] Y. Mirawanti, Pebandingan Metode
Regresi Logistik Ordinal Dengan
[3] Bappenas, “Indikator Kemiskinan Jaringan Syaraf Tiruan Fungsi Radial
Indonesia,” 31 5 2013. [Online]. Basis [thesis], surabaya: INSTITUT
Available: TEKNOLOGI SEPULUH
http://ewalmart.blogspot.com. NOVEMBER SURABAYA, 2012.
[Diakses 20 3 2015].
[10] A. Wijaya, Analisis Kemiskinan Di
[4] T. Dartanto, “Profil Kemiskinan Provinsi Lampung Dengan
Indonesia,” 28 maret 2014. [Online]. Pendekatan Analisis Kemiskinan Di
Available: Provinsi Lampung Dengan
http://www.bbc.co.uk/indonesia/majal Pendekatan Spatial Autoregressive
ah/2014/03/140327_bisnis_kemiskina Model (Linear Contiguity Method)
n_profil.shtml. [Diakses 9 september [Thesis], Surabaya: Institute
2014]. Teknologi Sepuluh September, 2011.
[5] Perpres, Perpres No. 15 Tahun 2010 [11] K. Suganda, Metode Analisis
tentang Percepatan Penanggulangan Diskriminan untuk klasifikasi

kemiskinan di kabupaten Jawa tengah Pusat Statistik, 2012.

[thesis], Semarang: Universitas
Kristen Satya Wacana, 2009. [20] BPS, Indikator Kemiskinan; Konsep
dan Penghitungan, Jakarta: Badan
[12] Y. Huang dan L. Li, Naive bayes Pusat Statistik, 2004.
classification algorithm based on
small sample set, IEEE Cloud [21] A. Barrientos, Social Policy and
Computing and Intelligence Systems, Development Programme, E-paper
2011. United Nations Research Institute for
Social Development, 2010.
[13] K. A. Susanto, “rekomendasi pilihan
sekolah menggunakan metode naïve [22] M. Tjokrowinoto, Pembangunan:
bayes classification pada penerimaan Dilema dan Tantangan, Jakarta:
peserta didik baru,” Malang, Pustaka Rajawali, 1996,.
Universitas Barwijaya Malang, 2013.
[23] Chambers, Rural Development,
[14] Y. A. Bakhtiar, “implementasi Puting The Last First, 1983, p. 113 –
metode naïve bayes untuk klasifikasi 114 .
kenaikan grade karyawan pada
fuzzyfikasi data kinerja karyawan,” [24] Bappenas, Indikator Kemiskinan
Malang, Universitas Brawijaya Indonesia, Jakarta: Badan
Malang. Perencanaan dan Pembangunan
Nasional, 2006.
[15] Kemensos, petunjuk pelaksanaan
kelompok usaha bersama (KUBE), [25] V. Moertini, Data Mining Sebagai
jakarta: direktorat penanggulangan Solusi Bisnis, Integral Vol. 7 No. 1,
kemiskinan pedesaan, 2014. 2002.
[16] R. Undang-Undang, Undang-Undang [26] R. Bellazzi dan B. Zupanb, Predictive

Republik Indonesia Nomor 6 Tentang Data Mining In Clinical Medicine:
Ketentuan-Ketentuan Pokok Current Issues And And Guidelines,
Kesejahteraan Sosial, 1974. International Journal Of Medical
Informatics, 2008.
[17] Swasono, Kebersamaan dan Asas
Kekeluargaan, Jakarta: UNJ Press, [27] J. Han dan M. Kamber, Data Mining :
2004. Concepts and Techniques, Second
penyunt., M. R. Jim Gray, Penyunt.,
[18] Rohidi, Ekspresi Seni Orang Miskin, San Francisco: Morgan Kaufmann
Bandung: Nuansa, 2000. Publishers, 2007.
[19] BPS, Indikator Kemiskinan; Konsep [28] W. Ian H. dan E. Frank, Data Mining:
dan Penghitungan, Jakarta: Badan Practical Machine Learning Tools and
Techniques, 2 penyunt., San

Francisco: Morgan Kaufmann [37] Lewis dan R. J, An Introduction to

Publishers is an imprint of Elsevier, Classification And Regression Trees
2005. (CART) Analysis, Presented at the
2000, 2000.
[29] F. Gorunescu, Data Mining: Concept,
Models and Techniques, Romania: [38] R. Eubank, Spline Smoothing and
Springer, 2010. Nonparametric Regression,, New
York: Marcel Deker, 1998.
[30] Larose, Data Mining Methods And
Models, Canada: John Wiley & Sons, [39] X. Wu dan V. Kumar, The Top Ten
Inc, 2006. Algorithms in Data Mining, Taylor ;
Francis Group, LLC, 2009.
[31] M. Dunham, Data Mining Introuctory
and Advanced Topics, New Jersey: [40] Suharto dan N. Birdsal, Membangun
Prentice Hall, 2003. Masyarakat Memberdayakan
Masyarakat, Bandung: Refika
[32] R. IT, “data mining data Aditama, 2005.
preprocessing,” 8 3 2010. [Online].
Available: [41] D. S. D. Putra, Analisis Dan
https://rencanait.wordpress.com. Komparasi Metode Naive Bayes Dan
[Diakses 1 2 2015]. Logistic Regression Dengan Seleksi
Variabel Berbasis Genetic Algorithm
[33] D. Aprilla, D. A. Baskoro, L. Untuk Prediksi Software Defect,
Ambarwati dan I. W. S. Wicaksana, Jakarta: Sekolah Tinggi Manajemen
“Belajar Data Mining dengan Informatika Dan Komputer Eresha ,
RapidMiner,” Jakarta, academia.edu, 2012.
2013.
[42] A. D. R. Prabowo, Prediksi Nasabah
[34] C. Sammut dan G. Web, Yang Berpotensi Membuka Simpanan
Encyclopedia of machine learning, Deposito Menggunakan Naive Bayes
New York: Springer, 2011. Berbasis Particle Swarm
Optimization, Semarang: Universitas
[35] Zhang dan Wang, Application of Dian Nuswantoro.
Bayesian Method to Spam SMS
Filtering, International Conference on [43] F. Handayanna, Penerapan Particle
Information Engineering and Swarm Optimization Untuk Seleksi
Computer Science, 2009. Atribut Pada Metode Support Vector
Machine Untuk Prediksi Penyakit
[36] C. Vercellis, Business Diabetes, Jakarta: Sekolah Tinggi
Intelligence:Data Mining and Manajemen Informatika Dan
Optimization for Decision Making, Komputer Nusa Mandiri , 2012.
2009.

[44] J. Zurada dan K. N. Kunene, 2005.

“Comparisons of the Performance of
Computational Intelligence Methods [50] L. Lin dan N. Huang, “Credit Risk
for Loan Granting Decisions,” dalam Assessment Using BP Neural
Proceedings of the 44th Hawaii Network with Dempster-Shafer
International Conference on System Theory,” International Conference on
Sciences 2011, Hawaii, 2011. Artificial Intelligence and
Computational Intelligence, pp. 397-
[45] M. Mahmoud dan A. A. Najla Algadi, 401, November 2009.
“Expert System for Banking Credit
Decision,” dalam International [51] C. Zhu, Y. Zhan dan S. Jia, “Credit
Conference on Computer Science and Risk Identification of Bank Client
Information Technology 2008, 2008. Basing on Supporting Vector
Machines,” IEEE, 2010.
[46] W. Yogi Yusuf, “Perbandingan
Performance Algoritma Decision Tree [52] J. A. Hall, Accounting Information
C5.0, CART, Dan CHAID: Kasus Systems (Sistem Informasi Akuntasi),
Prediksi Status Resiko Kredit Di 4nd penyunt., South-Western, 2004.
Bank X,” dalam Seminar Nasional
Aplikasi Teknologi Informasi (SNATI [53] D. Olson dan Y. S. , Intoduction to
2007), Yogyakarta, 2007. Business Data Mining, McGraw-Hill,
Penyunt., New York, 2007.
[47] L. Daniel T, Discovering knowledge
in data: An Introduction to Data [54] O. Maimon, Data Mining And
Mining, Wiley Interscience, 2005. Knowledge Discovery Handbook,
London: Springer, 2010.
[48] S. Sani dan S. Dedy, Pengantar Data
Mining: Menggali Pengetahuan Dari
Bongkahan Data, Yogyakarta:
Penerbit Andi, 2010.
[49] W. Lipo dan F. Xiuju, Data Mining

with Computational Intelligence,
Verlag Berlin Heidelberg: Springer,

653 1271 1 SM

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

653 1271 1 SM

Diunggah oleh

Hak Cipta:

Format Tersedia

“Technologia” Vol 7, No.

4, Oktober – Desember 2016 199

ANALISIS ALGORITMA NAIVE BAYES UNTUK KLASIFIKASI

Erfan Karyadiputra, S.Kom, M.Kom

Kemiskinan merupakan salah satu permasalahan yang sering dihadapi dalam

Kata Kunci : Data Mining, Kemiskinan, Naive Bayes , Non-Monetary

PENDAHULUAN menggunakan variabel target/kelas

Jurnal Ilmiah Fakultas Teknik “Technologia”

target/kelas yang sesuai dengan kategori mengidentifikasi kesejahteraan

Hasil penelitian ini diharapkan dapat Status 1

Jurnal Ilmiah Fakultas Teknik “Technologia”

Jenis Kelamin 1 Laki-laki X11 Jenis Dinding 2 Kayu

Jurnal Ilmiah Fakultas Teknik “Technologia”

PEMBAHASAN data decimal

Jurnal Ilmiah Fakultas Teknik “Technologia”

Pada tahap pertama eksperimen Dari hasil pengujian

DATA REPLACE MISSING VALUE 2. 0.80 - 0.90 = good classification

Jurnal Ilmiah Fakultas Teknik “Technologia”

classification atau klasifikasi yang Dari hasil pengujian didapatkan

Jurnal Ilmiah Fakultas Teknik “Technologia”

2. Saran [6] D. A. p. Pratama, Klasifikasi

[1] UUD, Undang-Undang Dasar Negara [8] I. Widyandono, Klasifikasi

Jurnal Ilmiah Fakultas Teknik “Technologia”

kemiskinan di kabupaten Jawa tengah Pusat Statistik, 2012.

[16] R. Undang-Undang, Undang-Undang [26] R. Bellazzi dan B. Zupanb, Predictive

Jurnal Ilmiah Fakultas Teknik “Technologia”

Francisco: Morgan Kaufmann [37] Lewis dan R. J, An Introduction to

Jurnal Ilmiah Fakultas Teknik “Technologia”

[44] J. Zurada dan K. N. Kunene, 2005.

[49] W. Lipo dan F. Xiuju, Data Mining

Jurnal Ilmiah Fakultas Teknik “Technologia”

Anda mungkin juga menyukai