Oleh
Laila Qadrini1),
Andi Seppewali2), Asra Aina3)
1,2Program Studi Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas
Abstrak
Kemiskinan adalah masalah sosial yang masih belum terselesaikan di negara berkembang
khususnya di indonesia. Kemiskinan telah hadir dalam realitas kehidupan manusia dengan bentuk
dan kondisi yang sangat memprihatinkan, Karena kemiskinan memang tidak bisa dihilangkan
begitu saja. Dengan adanya permasalahan terhadap Negara berkembang terutama kemiskinan.
Maka pemerintah membuat kebijakan-kebijakan atau program-program untuk memberantas
masalah tersebut. Diantaranya adalah Bantuan langsung tunai atau biasa disebut BLT. Bantuan
Langsung Tunai (BLT) dapat dipahami sebagai pemberian sejumlah uang (dana tunai) kepada
masyarakat miskin setelah pemerintah memutuskan untuk menaikkan harga BBM dengan jalan
mengurangi subsidi namun selisih dari subsidi itu diberikan kepada masyarakat miskin. Melihat
dari program pemerintah tersebut, upaya pemberantasan kemiskinan di negara Indonesia ini cukup
menarik simpati masyarakat. Hal ini menjadi salah satu objek yang menarik untuk diteliti dan dikaji
lebih lanjut. Untuk menentukan klasifikasi tingkat penduduk miskin terdapat banyak metode yang
dapat digunakan. Salah satunya yang digunakan pada penelitian ini yaitu Decision Tree dan
Adaboost.
Kata Kunci: Klasifikasi, BLT, Decision Tree, Adaboost
…………………………………………………………………………………………………………………………………………………………………..
Jurnal Inovasi Penelitian ISSN 2722-9475 (Cetak)
ISSN 2722-9467 (Online)
Vol.2 No.7 Desember 2021 1961
…………………………………………………………………………………………………………………………………………………………………..
tentunya tidak bisa ditentukan secara mutlak statistik tentang representasi kelas dari suatu
tetapi sangat tergantung dengan karakteristik node.
training set-nya. Beberapa algoritma Decision • Sebuah subtree dapat direplikasi beberapa
Tree yang cukup populer antara lain : ID3, kali dalam Decision Tree tetapi ini akan
C4.5, dan CART. menyebabkan Decision Tree menjadi lebih
2.2 Algoritma C4.5 kompleks dan lebih sulit untuk diinterpretasi.
Algoritma ini dikembangkan untuk (Sibaroni, 2008:8).
memperbaiki algoritma ID3. Algoritma ini Dalam proses pengambilan keputusan,
berbasiskan keputusan biner seperti yang Decision Tree digunakan sebagai alat visual
terlihat dalam CLS. Jadi selain memiliki dan analitis, untuk memprediksi nilai target.
karakteristik seperti ID3, C4.5 juga memiliki (Witten, 2011). Algoritma C4.5 adalah
beberapa karakteristik yang berbeda yang algoritma populer dalam klasifikasi data
merupakan perbaikan dari karakteristik ID3. mining. Algoritma C4.5 menggunakan kriteria
Berikut ini beberapa karakteristik C4.5 yang information gain untuk memilih atribut yang
juga merupakan perbaikan terhadap ID3 : akan digunakan dalam pemisahan objek.
• Dapat menangani atribut numerik Atribut yang mempunyai information gain
• Dapat menangani missing value paling tinggi dibandingkan dengan atribut pada
• Melakukan pruning untuk memperoleh model data lain, maka atribut tersebutlah yang dipilih
yang paling efisien sebagai pemecahan. Decision Tree (Pohon
• Menggunakan kriteria gain ratio untuk Keputusan) sesuai digunakan untuk kasus-
menentukan jenis split yang terbaik. kasus dimana outputnya bernilai diskrit
2.3 Karakteristik Decision Tree (Agustinus, 2012).
Berikut ini adalah beberapa karakteristik 2.4 Adaptive Boosting (Adaboost)
Decision Tree secara umum : Adaptive Boosting (Adaboost)
• Decision Tree merupakan suatu pendekatan merupakan salah satu dari beberapa varian pada
nonparametrik untuk membangun model algoritma boosting (Chezian & Kumar, 2014).
klasifikasi Adaboost merupakan ensemble learning yang
• Teknik yang dikembangkan dalam sering digunakan pada algoritma boosting.
membangun Decision Tree memungkinkan Boosting bisa dikombinasikan dengan classifier
untuk membangun model secara cepat dari algoritma yang lain untuk meningkatkan
training set yang berukuran besar. performa klasifikasi. Tentunya secara intuitif,
• Decision Tree dengan ukuran tree yang kecil penggabungan beberapa model akan membantu
relatif mudah untuk menginterpretasinya. jika model tersebut berbeda satu sama lain.
• Decision Tree memberikan gambaran yang Adaboost dan variannya telah sukses diterapkan
ekpresif dalam pembelajaran fungsi nilai pada beberapa bidang (domain) karena dasar
diskret. teorinya yang kuat, presdiksi yang akurat, dan
• Algoritma Decision Tree cukup robbust kesederhanaan yang besar. Langkah-langkah
terhadap munculnya noise terutama untuk pada algoritma Adaboost adalah sebagai
metode yang dapat menangani masalah berikut.
overfitting. a. Input: Suatu kumpulan sample penelitian
• Adanya atribut yang berlebihan tidak terlalu dengan label {(𝑥𝑖 , 𝑦𝑖 ), … , (𝑥𝑁 , 𝑦𝑁 )}, suatu
mengurangi akurasi Decision Tree. component learn algoritma, jumlah
• Karena sebagian algoritma Decision Tree perputaran T.
menggunakan pendekatan top down, yaitu b. Initialize: Bobot suatu sampel pelatihan
partisi dilakukan secara rekursif maka jumlah 𝑤𝑖1 = 1⁄𝑁, untuk semua 𝑖 = 1, . . . , 𝑁
record menjadi lebih kecil. Pada leaf node, c. Do for t= 1, ...,T
jumlah record mungkin akan terlalu kecil d. Gunakan component learn algoritma untuk
untuk dapat membuat keputusan secara melatih suatu komponen klasifikasi, pada
…………………………………………………………………………………………………………………………………………………………………..
ISSN 2722-9475 (Cetak) Jurnal Inovasi Penelitian
ISSN 2722-9467 (Online)
1962 Vol.2 No.7 Desember 2021
…………………………………………………………………………………………………………………………………………………………………..
sample bobot pelatihan. dari akurasi, presisi, dan recall. Jika label
e. Hitung kesalahan pelatihannya pada ℎ𝑡 : 𝜀𝑡 = prediksi keluaran bernilai benar (true) dan nilai
𝑡
∑𝑁𝑖 𝑤𝑖 , 𝑦𝑖 ≠ ℎ𝑡 (𝑥𝑖 ) sebenarnya bernilai salah (false) disebut
f. Tetapkan bobot untuk component classifier sebagai false positive (FP). Sedangkan jika
1 1−𝜀 prediksi label keluaran bernilai salah (false) dan
ℎ𝑡 = 𝛼𝑡 = 2 𝑙𝑛 ( 𝜀 𝑡)
𝑡 nilai sebenarnya bernilai benar (true) maka hal
g. Update bobot sample pelatihan 𝑤𝑖𝑡+1 = ini disebut sebagai false negative (FN) (Han &
𝑤𝑖𝑡 𝑒𝑥𝑝{−𝛼𝑡 𝑦𝑖ℎ (𝑥 ) } Kember, 2013). Berikut formulasi untuk
𝑡 𝑖
,𝑖 = 1, . . . , 𝑁 𝐶𝑡 adalah suatu menghitung akurasi, presisi, dan recall pada
𝐶𝑡
konstanta normalisasi. pembentukan model klasifikasi ditunjukan
h. Output: 𝑓(𝑥) = 𝑠𝑖𝑔𝑛(∑𝑇𝑡=1 𝛼𝑡 ℎ𝑡 (𝑥)) pada Persamaan (1), Persamaan (2), dan
2.5 Akurasi, Presisi, dan Recall Persamaan (3).
1) Akurasi, Presisi, dan Recall
Akurasi dapat didefinisikan sebagai tingkat 𝑇𝑃+𝑇𝑁
Akurasi = 𝑇𝑃+𝑇𝑁+𝐹𝑃+𝐹𝑁 × 100%
kedekatan antara nilai prediksi dengan nilai
(1)
aktual. Presisi menunjukan tingkat ketepatan
atau ketelitian dalam pengklasifikasian. 𝑇𝑃
Sedangkan recall berfungsi untuk mengukur Presisi = 𝑇𝑃+𝐹𝑃 × 100%
proporsi positif aktual yang benar (2)
diidentifikasi. Untuk mengukur akurasi,
𝑇𝑃
presisi, dan recall biasanya digunakan Recall = 𝑇𝑃+𝐹𝑁 × 100% (3)
confusion matrix. Confusion matrix adalah
alat ukur berbentuk matrix yang digunakan A. Kurva ROC
untuk mendapatkan jumlah ketepatan Kurva ROC (receiver operating
klasifikasi terhadap kelas dengan algoritme characteristic) adalah salah satu alat ukur
yang dipakai. Berikut akan disajikan bentuk untuk menilai kemampuan sistem
confusion matrix pada Tabel 1. klasifikasi. Kurva ROC sering digunakan
untuk mengevaluasi pengklasifikasian
Tabel 1. Bentuk Confusion Matrix Dari Dua karena memiliki kemampuan evaluasi
Kelas algoritma dengan cukup baik . Kurva ROC
merupakan grafik perbandingan antara
Confusion Nilai Sebenarnya sensitivity (true positive rate (TPR)) yang
Matrix True False diterjemahkan kedalam sumbu vertikal
TP (True FP (False atau sumbu koordinat y dengan specificity
Positive) Positive) (false positive rate (FPR)) yang
True diterjemahkan dalam bentuk kurva (Witten
Correct Unexpected
result result et al, 2011). Berikut formulasi dari
Nilai sensitivity dan specificity dipaparkan pada
TN (True
Prediksi FN (False Persamaan (4), dan Persamaan (5) .
Negative)
Negative)
False Correct
Missing 𝑇𝑃
result
absence of Sentivity = 𝑇𝑃+𝐹𝑁 × 100%
result (4)
𝑇𝑃
Specificity = 𝑇𝑃+𝐹𝑁 × 100%
Pada Tabel 1 nilai TP (true positive) dan TN
(true negative) menunjukan tingkat ketepatan (5)
klasifikasi. Umumnya semakin tinggi nilai TP Kurva ROC dapat digunakan sebagai
dan TN semakin baik pula tingkat klasifikasi komparasi beberapa metode (classifier)
…………………………………………………………………………………………………………………………………………………………………..
Jurnal Inovasi Penelitian ISSN 2722-9475 (Cetak)
ISSN 2722-9467 (Online)
Vol.2 No.7 Desember 2021 1963
…………………………………………………………………………………………………………………………………………………………………..
ataupun model classifier yang memiliki
perbedaan parameter guna mendapatkan model Nilai AUC Kategori
yang paling baik. Berikut adalah contoh Pengklasifikasian
penerapan komparasi performansi dari dua
0.90 - 1.00 Excellent
classifier yang berbeda pada Gambar 1.
0.80 - 0.90 Good
0.70 - 0.80 Fair
0.60 - 0.70 Poor
0.50 - 0.60 Fail
METODE PENELITIAN
Penelitian ini dilakukan untuk
pengembangan evaluasi dan pemecahan
masalah yaitu meningkatkan akurasi pada
pelaksanaan program bantuan sosial agar tepat
sasaran. Berikut ini adalah tahapan penelitian
yang dilakukan:
Gambar 1. Komparasi Classifier dengan Kurva
ROC
…………………………………………………………………………………………………………………………………………………………………..
ISSN 2722-9475 (Cetak) Jurnal Inovasi Penelitian
ISSN 2722-9467 (Online)
1964 Vol.2 No.7 Desember 2021
…………………………………………………………………………………………………………………………………………………………………..
g. Sumber Air Minum : Sumur, Ledeng Tabel 3. Perhitungan Metode Adaboost
h. Jenis Jamban: Umum, Bersama, Sendiri Accuracy: 95.00%
i. Pendapatan: 0 sampai 1,5 juta, 1,5 True Tidak True Class
sampai 3 juta, lebih dari 3 juta Miskin Miskin Precision
j. Pekerjaan: Tidak Bekerja/Buruh, Pred Tidak
Petani, Pedagang, Wiraswasta, Pegawai 94 6 94%
Miskin
Pra-pemrosesan Data Pred Miskin 0 20 100%
Prapemrosesan data adalah mengeksplor
Class
dan memahami data yang akan diolah hingga 100% 77%
Recall
data tersebut layak untuk melaju ketahap
pemodelan, Hal ini merupakan langkah awal
pada proses klasifikasi data. Penelitian ini Tabel 4. Perbandingan Akurasi
menggunakan penggabungan dua metode yaitu Metode
No
metode Decision Tree dan Adaboost. Pada Klasifikasi Akurasi
Seleksi Fitur digunakan untuk menyeleksi data 1 Decision Tree 94.17%
yang rusak/tidak lengkap menggunakan fitur 2 Adaboost 95%
"Input Missing Value" dan "Rename Unused
Value" dengan menggunakan metode Decision KESIMPULAN
Tree sehingga didapatkan data set murni. Berdasarkan hasil penelitian yang telah
Mentranformasikan data dari numerik ke dilakukan dapat disimpulkan bahwa:
nominal dan lakukan normalisasi menentukan 1. Metode klasifikasi Decision tree dan
bentuk data yang paling tepat. Selanjutnya Adaboost sama sama memiliki hasil
membagi data training dan data testing dengan akurasi yang baik yaitu sebesar 94% dan
perbandingan 80%:20%. Pemrosesan data 95%
dilakukan dengan menggabungkan metode 2. Metode klasifikasi Decision tree dan
Adaboost dalam proses validasi sehingga Adaboost tepat digunakan untuk
diperoleh akurasi yang lebih tinggi dari menentukan penerima bantuan sosial
pengolahan masing-masing metode. Hasil yang secara tepat
diperoleh dari masing-masing perhitungan
masing-masing metode adalah sebagai berikut: DAFTAR PUSTAKA
Tabel 2. Perhitungan Metode Decision Tree [1] Chezian, D.R.M., & Kumar, K.S. 2014.
Support Vector Machine and K-Nearest
Accuracy: 94.17%
Neighbour Based Analysis for the
True True Prediction of Hypothyroid. International
Class
Tidak Miski Journal of Pharma and Bio Sciences.
Precision
Miskin n 5(4)(B) 447-453.
Pred [2] Elly Firasari, Umi Khultsum, Monikka Nur
Tidak 98 7 93% Winnarto Risnandar, Kombinasi K-NN
Miskin dan Gradient Boosted Trees untuk
Pred Klasifikasi Penerima Program Bantuan
0 15 100%
Miskin Sosial Jurnal Teknologi Informasi dan
Class Ilmu Komputer (JTIIK). Vol. 7, No. 6,
100% 68%
Recall Desember 2020, hlm. 1231-1236.
[3] I.H. Witten, E. Frank, and M.A. Hall,
“Data Mining Practical Machine Learning
Tools and Techniques”, Third Edition,
Elsevier Publisher, USA, 2011.
…………………………………………………………………………………………………………………………………………………………………..
Jurnal Inovasi Penelitian ISSN 2722-9475 (Cetak)
ISSN 2722-9467 (Online)
Vol.2 No.7 Desember 2021 1965
…………………………………………………………………………………………………………………………………………………………………..
…………………………………………………………………………………………………………………………………………………………………..
ISSN 2722-9475 (Cetak) Jurnal Inovasi Penelitian
ISSN 2722-9467 (Online)
1966 Vol.2 No.7 Desember 2021
…………………………………………………………………………………………………………………………………………………………………..
…………………………………………………………………………………………………………………………………………………………………..
Jurnal Inovasi Penelitian ISSN 2722-9475 (Cetak)
ISSN 2722-9467 (Online)