Proposal Skripsi - Septiya Nuraeni - 1955201019 - Ilkom 8a
Proposal Skripsi - Septiya Nuraeni - 1955201019 - Ilkom 8a
PROPOSAL SKRIPSI
Oleh:
SEPTIYA NURAENI
1955201019
i
ANALISIS PERBANDINGAN AKURASI NAÏVE BAYES DAN K-NN DALAM
MENENTUKAN PENERIMA BANTUAN PKH DI LOMBOK UTARA
PROPOSAL SKRIPSI
Proposal Penelitian diajukan kepada Universitas Nahdlatul Ulama Blitar untuk memenuhi
salah satu persyaratan dalam menyelesaikan Program Sarjana
Oleh:
SEPTIYA NURAENI
1955201019
ii
LEMBAR PENGESAHAN PROPOSAL SKRIPSI
PROPOSAL SKRIPSI
Oleh:
SEPTIYA NURAENI
1955201019
Disetujui oleh:
Pembimbing I
Harliana,S.T., M.Cs.
0418098602
Pembimbing II
Tito Prabowo, S.Kom., M.Kom
0707118802
Mengetahui,
iii
DAFTAR ISI
HALAMAN SAMPU
L...................................................................................................................................................i
HALAMAN JUDUL..................................................................................................................ii
HALAMAN PENGESAHAN...................................................................................................iii
DAFTAR ISI..............................................................................................................................iv
DAFTAR TABEL......................................................................................................................vi
DAFTAR GAMBAR................................................................................................................vii
DAFTAR LAMPIRAN...........................................................................................................viii
BAB I..........................................................................................................................................1
PENDAHULUAN......................................................................................................................1
1.1 Latar Belakang.......................................................................................................1
1.2 Rumusan Masalah..................................................................................................3
1.3 Batasan Masalah....................................................................................................3
1.4 Tujuan Penelitian...................................................................................................3
1.5 Manfaat Penelitian.................................................................................................3
BAB II.........................................................................................................................................4
KAJIAN PUSTAKA...................................................................................................................4
2.1 Kemiskinan............................................................................................................4
2.2 PKH (Program Keluarga Harapan)........................................................................4
2.3 Data Mining...........................................................................................................5
2.4 Klasifikasi..............................................................................................................6
2.5 Naïve Bayes...........................................................................................................6
2.6 K-NN......................................................................................................................7
2.7 Penelitian terdahulu...............................................................................................8
BAB III.....................................................................................................................................12
METODE PENELITIAN..........................................................................................................12
3.1 Jenis dan Desain Eksperimen..............................................................................12
3.2 Tempat dan Waktu Penelitian..............................................................................12
3.3 Populasi, Sampel, dan Sampling.........................................................................13
3.4 Metode Pengumpulan Data.................................................................................13
3.4.1 Observassi............................................................................................................13
3.4.2 Dokumentasi........................................................................................................14
iv
3.4.3 Studi literatur.......................................................................................................14
3.5 Definisi Operasional Variabel.............................................................................14
3.6 Teknik Analisis Data...........................................................................................14
3.6.1 Normalisasi Data.................................................................................................14
3.6.2 Perhitungan Naïve Bayes.....................................................................................14
3.6.3 Perhitungan K-NN................................................................................................16
3.6.4 Hasil akurasi........................................................................................................16
3.6.5 Kesimpulan..........................................................................................................16
3.7 Instrumen Penelitian............................................................................................17
3.7.1 Perangkat Keras...................................................................................................17
3.7.2 Perangkat Lunak..................................................................................................17
3.8 Prosedur Eksperimen...........................................................................................17
3.9 Flowchart Penelitian............................................................................................18
DAFTAR PUSTAKA...............................................................................................................19
LAMPIRAN..............................................................................................................................22
v
DAFTAR TABEL
vi
DAFTAR GAMBAR
vii
DAFTAR LAMPIRAN
viii
BAB I
PENDAHULUAN
1
Program bantuan PKH yang di berikan pemerintah memiliki mekanisme atau cara kerja
mulai dari perencanaan, penetapan calon penerima bantuan, validasi data diri, penetapan
KPM (Keluarga Penerima Manfaat), penyaluran dana bantuan, pendampingan masyarakat,
peningkatan kemampuan, verifikasi KPM, pemutakhiran data (Keluarga et al., 2021).
Program ini ternyata belum tepat sasaran dan jumlah penerima bantuan masih belum jelas, hal
ini yang menimbulkan adanya kecemburuan sosial dimasyarakat. Oleh karena itu, dibutuhkan
penelitian ini untuk menentukan layak atau tidak masyarakat menerima program bantuan
PKH. Proses penentuan kelayakan penerima bantuan PKH dilakukan dengan musyawarah
desa yang diselenggarakan bersama tokoh masyarakat setempat. Proses seperti inilah yang
dapat mengakibatkan kurang tepat sasaran penerima PKH dan tidak efisiennya waktu.
Dalam penelitian (Setiawan et al., 2021) Algoritma Naïve Bayes digunakan untuk
mengkalsifikasikan data penentuan penerima bantuan PKH dengan variabel ibu menyusui,
anak SD, balita 0-5 tahun, disabilitas dan lansia, dengan hasil akurasi 60%. Kemudian pada
(Amin Abdullah Sidiq & Febrian Wahyu Christanto, 2020) Naïve Bayes digunakan untuk
penentuan PKH berbasis sistem pendukung keputusan di Kelurahan Karanganyar yang di uji
menggunakan aplikasi Rapid miner dengan hasil akurasi 93%. Pada (Ifon Purnama et al.,
2020) Naïve Bayes digunakan untuk mengklasifikasikan penerima bantuan PKH di desa Wae
Jare dengan hasil akurasi 82%. Kemudian pada (Pratama et al., 2021) Naïve Bayes digunakan
untuk mengklasifikasikan penerima bantuan PKH di desa Minggiran Kediri dengan hasil
akurasi 93%. Sedangkan pada penelitian (Juli, 2022) Naïve Bayes dan K-NN digunakan untuk
mengklasifikasikan penduduk miskin penerima bantuan PKH dengan masing – masing
akurasi yaitu 66% dan 76%. Pada penelitian (Khairi, 2021) K-NN digunakan untuk
mengklasifikasikan masyarakat prasejahtera dengan hasil 98%.
Berdasarkan hal tersebut maka penelitian ini akan membandingkan Algoritma Naïve
Bayes dan K-NN dalam menentukan penerima bantuan PKH di Lombok Utara, dengan
variabel berasal dari keluarga prasejahtera, ibu hamil atau menyusui, balita, anak yang duduk
dibangku sekolah SD, SMP, dan SMA, lansia minimal telah berusia 60 tahun, serta disabilitas
lebih diutamakan yaitu penyandang disabilitas berat.
Dalam penelitian ini akan menggunakan Algoritma Naïve Bayes classifier, yang mana
algoritma ini merupakan metode klasifikasi yang menggunakan probabilitas untuk
memprediksi peluang berdasarkan pengalaman atau menggunakan data training yang sudah
ada, Naïve Bayes memliki ciri-ciri utama yaitu asumsi yang sagat kuat (naif) akan
independensi dari masing – masing kondisi atau kejadian, Naïve Bayes juga meiliki beberapa
keunggulan yaitu melakukan proses klasifikasi tidak memerlukan data latih dalam jumlah
2
banyak dan cepat dalam melakukan kalkulasi, dan dapat mengolah data dalam jumlah
besar(Syarifuddin et al., 2020).
Pada penelitian ini juga menggunakan Algoritma K-NN yaitu metode yang termasuk
dalam pengaplikasian data yang sederhana dan sangat mudah dalam pengimplementasiannya,
efektif pada data yang lebih besar, serta dapat mengklasifikasikan data dengan cepat. K-NN
juga kuat terhadap data training yang noise, dan dapat menghasilkan data yang lebih akurat.
Metode ini dapat mengklasifikasikan objek berdasarkan data pembelajaran yang jaraknya
paling dekat dengan objek tersebut (Yani et al., 2020).
1.2 Rumusan Masalah
Berdasarkan latar belakang yang telah dikemukakan maka perumusan masalah pada
penelitian ini adalah mengetahui perbandingan akurasi yang dihasilkan oleh Naïve Bayes dan
K-NN dalam menentukan penerima bantuan PKH di Desa Akar – akar, Kab. Lombok Utara.
1.3 Batasan Masalah
Berdasarkan permasalahan yang ada, maka penulis membatasi masalah dalam
penelitian ini antara lain :
a. Algoritma yang dibandingkan adalah Naïve Bayes dan K-NN
b. Data yang digunakan adalah data DTKS (Data Terpadu Kesejahteraan Sosial)
perjiwa penerima bantuan PKH tahun 2021 di Desa Akar – akar Lombok Utara
c. Variabel yang digunakan adalah berasal dari keluarga prasejahtera atau yang
memiliki Kartu Keluarga Sejahtera (KKS), ibu hamil atau menyusui, balita, anak
yang duduk di bangku sekolah SD, SMP, SMA, lansia minimal telah berusia 60
tahun, serta penyandang disabilitas lebih diutamakan yaitu penyandang disabilitas
berat.
1.4 Tujuan Penelitian
Adapun tujuan dari penelitian ini yaitu mengetahui akurasi yang dihasilkan oleh Naïve
Bayes dan K-NN dalam menentukan penerima bantuan PKH di Desa Akar – akar, Kab.
Lombok Utara.
1.5 Manfaat Penelitian
Penelitian ini nantinya diharapkan mampu merekomendasikan algoritma terbaik dalam
menentukan penerima bantuan PKH di Desa Akar – akar, Kab. Lombok Utara.
3
BAB II
KAJIAN PUSTAKA
2.1 Kemiskinan
Di berbagai negara termasuk Indonesia mengalami masalah umum yang dapat dilihat
berdasarkan rendahnya Pendidikan, dan Kesehatan. Kemiskinan adalah salah satu penyebab
masyarakat untuk memperoleh kehidupan yang layak atau sejahtera(Khairi, 2021). Menurut
(Alwi, 2019)(Alwi, 2019) adapun faktor terjadinya kemiskinan di Indonesia yaitu :
Mennurut (Alwi, 2019) juga adanya kemiskinan ditimbulkan oleh 2 hal antara lain:
a. Adanya pengangguran, dimana rasa malas untuk mencari pekerjaan terus menempel
pada tubuh masyarakat itu sendiri
b. Ketidakmampuan untuk menutupi dan memenuhi kebutuhan hidupnya
Kemiskinan juga merupakan sebuah kondisi sosial ekonomi yang tidak memenuhi hak
dasar untuk mempertahankan dan mengembangkan kehidupan yang lebih bermartabat,
kebutuhan tersebut seperti Kesehatan, Pendidikan, makanan, tenaga kerja, air bersih,
perumahan, lingkungan, sumber daya alam, tanah, jaminan perawatan dan ancaman, serta
keinginan untuk bertindak(Fabiana Meijon Fadul, 2019)
2.2 PKH
PKH adalah sebuah program pemerintah untuk menanggulangi kemiskinan(Ifon
Purnama et al., 2020). PKH juga merupakan program yang diberikan kepada masyarakat
4
miskin atau keluarga kurang mampu dengan syarat tertentu, seperti ibu hamil atau menyusui,
anak yang sedang menempuh Pendidikan SD, SMP, dan SMA, balita usia 0 – 5 tahun, lansia,
dan penyandang disabilitas(Setiawan et al., 2021). PKH diimplementasikan sejak tahun 2007,
dengan tujuan untuk meningkatkan kualitas hidup dengan perubahan perilaku terhadap
Pendidikan dan Kesehatan serta mendukung pencapaian kesejahteraan sosial, PKH juga
memiliki tujuan lain yaitu untuk membantu mengurangi beban biaya dalam keluarga, dapat
meningkatkan investasi generasi mendatang dengan meningkatkan kualitas Pendidikan anak
dan Kesehatan(Fabiana Meijon Fadul, 2019).
PKH dalam pelaksanaannya memiliki tujuan umum dan tujuan khusus, Adapun tujuan
umum adanya PKH yaitu untuk mengurangi angka dan memutus rantai kemiskinan,
meningkatkan kualitas sumber daya manusia, serta dapat merubah perilaku masyarakat yang
relative kurang peningkatan kesejahteraan. Sedangkan tujuan PKH secara khusus adalah
untuk meningkatkan kondisi sosial ekonomi RTSM(Rumah Tangga Sangat Miskin),
meningkatkan status kesehatan dan gizi ibu hamil, ibu nifas, dan balita di bawah 6 tahun dari
RTSM, meningkatkan taraf Pendidikan anak – anak RTSM, serta dapat meningkatkan akses
dan kualitas pelayanan Pendidikan dan Kesehatan khususnya bagi RTSM(Utomo et al., 2014).
5
c. Classification yaitu Teknik mengklasifikasikan data, klasifikasi memiliki perbedaan
yang sangat mendasar dengan klastering yaitu ada pada datanya, jika pada klastering
tidak ada variabel dependen, sedangkan classification variabel dependent harus
ada,contohnya adalah algoritma ID3 dan K-NN
d. Predictive modelling adalah Teknik pengolahan data mining dengan melakukan
prediksi, contohnya algoritma Linear Regression, Neural Network, dan Support
Vector Machine
2.4 Klasifikasi
Klasifikasi merupakan proses mengidentifikasi model atau fungsi yang membedakan
dan menggambarkan kelas data yang digunakan, konsep klasifikasi dapat digunakan untuk
meramalkan bagaimana setiap kumpulan data akan diklasifikasikan. Proses klasifikasi ini
dapat dibagi menjadi 2 cara untuk mencapai sebuah kesimpulan yaitu : proses pembelajaran
(training), dan proses klasifikasi yang dikenal sebagai pengujian (testing)(Utami et al., 2022).
Metode klasifikasi yang sering digunakan antara lain : Analisa Statistic, Decision Trees,
Naïve Bayes Classifiers, Neural Networks, Algoritma Genetika, Rough Sets, K-Nearest
Neighbor, Metode Rule Based, SVM, dan Memory Based Reasoning (Annur, 2018)
Klasifikasi memiliki tujuan untuk menempatkan sebuah objek hanya ke salah satu
kategori atau kelas, proses ini juga dapat dilakukan dengan menggunakan Teknik klastering.
Dimana klastering merupakan pengelompokkan objek berdasarkan kemiripan objek satu
dengan lainnya. Keduanya memiliki perbedaan yang terletak pada proses pengelompokkan
objek. Jika pada klasifikiasi pengelompokkan dilakukan dengan cara membagi objek
berdasarkan kelompok yang telah di tentukan, maka pada klastering proses pengelompokkan
objek dilihat pada kemiripan antar objek, sehingga kategori belum terdefinisi sebelumnya
(Setiyawan, 2017). Perbedaan klasifikasi dan klastering juga terdapat pada tidak adanya
variabel target dalam melakukan pengelompokkan pada proses klastering(Sindi et al., 2020).
2.5 Naïve Bayes
Naïve bayes merupakan Teknik yang diterapkan dalam menentukan kelas dari setiap
masalah, naïve bayes menggunakan cabang matematika yang sering disebut dengan
probabilitas untuk mencari peluang terbesar dalam klasifikasi dengan melihat frekuensi tiap
klasifikasi pada data training(Fitriani, 2020). Naïve bayes classifier adalah algoritma
klasifikasi yang berakar pada teorema bayes. Naïve bayes memiliki ciri utama yaitu naif
(asumsi yang sangat kuat) terhadap independensi dari masing – masing kejadian(Wibawa et
al., 2018).
6
Adapun langkah – langkah dari perhitungan Naïve Bayes, antara lain (Rifai et al., 2019) :
1. Pembacaan dataset atau data training dan data testing
2. Kemudian menghitung jumlah kelas atau label dari data training yang digunakan
3. Selanjutnya menghitung probabilitas jumlah kasus kelas, dengan rumus persamaan (1)
dibawah ini :
p ( x| y ) . p( y )
p ( y| x )= (1)
p(x)
Keterangan :
P(x) : Probabilitas x
2.6 K-NN
Algoritma K-Nearest Neighbor adalah sebuah algoritma klasifikasi yang hasil datanya
didapatkan berdasarkan jarak tetangga terdekat, tujuannya yaitu mengklasifikasikan objek
baru dari atribut yang berasal dari data latih, dalam proses klasifikasi umumnya nilai K dapat
menggunakan jumlah ganjil dengan pertimbangan perhitungan menggunakan persamaan 3
agar tidak adanya jarak yang sama, jarak tetangga terdekat dapat dihitung dengan Euclidean
Distance, dengan rumus berikut(Tanjungpinang, 2021) :
√
k
d(x,y) = ∑ ¿ ¿ ¿………………………………….. (2)
i=i
Keterangan :
xi merupakan data baru, dan yi merupakan data latih, i yaitu variabel data atau atribut,
dan k yaitu dimensi data.
7
8
Beberapa tahapan dalam perhitungan K-Nearest Neighbor yaitu :
Untuk mengetahui tingkat kesalahan yang terjadi, atau untuk mengukur kinerja suatu
algoritma baik Naïve Bayes atau K-NN dapat dilihat melalui perhitungan nilai akurasi dengan
menggunakan tabel confunsion matrix 2.1 berikut (Normawati & Prayogi, 2021):
Tabel 2. 1 Confunsion matrix
Kelas prediksi
True False
Kelas True TP FN
sebenarnya False FP TN
Keterangan :
TP (True Positive) = jumlah data benar yang terklarifikasi positif
FN (False Negative) = jumlah data salah yang terklarifikasi negatif
FP (False Positive) = jumlah data salah yang terklarifikasi positif
TN (True Negative) = jumlah data benar yang terklarifikasi salah
Dengan menggunkan rumus accuracy, precision dan recall dibawah ini :
Tp+TN
Accuracy = (4)
Jumlah
Tp
Precision = (5)
Tp+ FP
Tp
Recall = (6)
TP+ FN
2.7 Penelitian terdahulu
Adapun rangkuman mengenai beberapa penelitian terdahulu yang penulis jadikan
acuan terdapat pada tabel 2.2
Tabel 2. 2 Penelitian terdahulu
No Judul (nama, tahun) Bahasan Perbedaan dengan penelitian
yang peneliti lakukan
1 Perbandingan akurasi Membahas mengenai seberapa lama Perbedaan dengan penilitian yang
Naïve Bayes dan K- waktu yang diperlukan oleh alumni akan dilakukan terdapat pada
Nearest Neighbor pada dalam mendapatkan pekerjaan setelah objek penelitian dimana dalam
klasifikasi untuk lulus. Data yang digunakan sebanyak penelitian yang akan dilakukan
meramalkan status 1669 dimana 80% atau 1335 sebagai membahas mengenai Penerimaan
pekerjaan alumni ITB data training dan 20% atau 334 Bantuan PKH dengan
9
STIKOM Bali (Maricar sebagai data testing, data tersebut menggunakan 362 data DTKS
& Dian Pramana, 2019) adalah data alumni STIKOM Bali perjiwa penerima bantuan PKH
yang terdiri dari jenis kelamin, masa dengan 6 variabel yaitu berasal
studi, IPK terakhir, dan rentang waktu dari keluarga prasejahtera, ibu
yang diperlukan untuk mendapatkan hamil atau menyusui, balita,
pekerjaan. Dengan hasil akurasi lansia, anak yang sedang
sebesar 83.83% dan MAPE 16.17% menempuh Pendidikan SD, SMP
dari perhitungan Naïve Bayes, dan SMA,serta penyandang
sedangkan dengan perhitungan K- disabilitas
Nearest Neighbor berdasarkan nilai K
terbaik yaitu 9 mendapatkan hasil
akurasi 82.34% dan MAPE 17.66%.
Tujuan dari penelitian ini adalah untuk
mendapatkan akurasi terbaik dari
Naïve Bayes dan K-Nearest Neighbor,
dimana algoritma dengan hasil akurasi
terbaik dapat bermanfaat jika
diterapkan dikemudian hari pada suatu
sistem peramalan untuk memprediksi
status pekerjaan alumni dari segi cepat
atau tidaknya alumni tersebut dalam
mendapatkan pekerjaan.
2 Perbandingan klasifikasi membahas tentang klasifikasi bidang Perbedaan dengan penelitian
tugas akhir mahasiswa keahlian tugas akhir yang ada yang akan dilakukan adalah
jurusan Teknik dijurusan teknik informatika. Data menggunakan data yang lebih
informatika yang digunakan adalah 100 data tugas besar yaitu 362 data, dan objek
menggunakan metode akhir mahasiswa dan dilabel secara yang digunakan adalah Penerima
Naïve Bayes Classifier manual sesuai kelas yang telah Bantuan PKH
dan K-Nearest ditentukan yaitu Ilmu Komputer dan
Neighbor(Yusra et al., Teknik Informasi. Dengan hasil
2016) akurasi dari perhitungan Naïve Bayes
sebesar 87%, sedangkan
menggunakan K-Nearest Neighbor
dengan nilai K=3 menghasilkan
akurasi sebesar 84%, nilai K=5
sebesar 85%, nilai K=7 sebesar 86%,
dan K=9 sebesar 84%. Tujuan dari
penelitian ini adalah untuk mengetahui
perbandingan dari kedua metode yang
digunakan dalam mengklasifikasikan
bidang keahlian mahasiswa Teknik
Informatika
10
deras
4 Perbandingan metode K- membahas mengenai kurangnya Perbedaan dengan penelitian
Nearest Neighbor, Naïve akurat analisis penilaian debitur yang akan dilakukan adalah
Bayes dan decision Tree terhadap kemampuan dalam melunasi seperti yang telah disebutkan
untuk prediksi kelayakan pinjaman kredit. Data yang digunakan sebelumnya, pada penelitian yang
pemberian adalah 147 data training dengan 77 akan dilakukan menggunakan 2
kredit(Wahyuningsih & data diluar dari data set digunakan algoritma saja yaitu Naïve Bayes
Utari, 2018) untuk data testing, yang terdiri dari 12 dan K-NN untuk menentukan
atribut. Dengan hasil akurasi dari penerima bantuan PKH, dengan
perhitungan Algoritma Decision Tree menggunakan data 362 dan 6
sebesar 92.21%, K-NN sebesar atribut
81.82% dan Naïve Bayes sebesar
81.83%. Tujuan dari penelitian ini
adalah membandingkan metode
klasifikasi data mining untuk
menganalisis prediksi kelayakan
pemberian kredit dengan Algoritma
Decision Tree, Naïve Bayes, dan K-
NN
5 Perbandingan akurasi membahas tentang anaalisis suatu Dalam penelitian ini Adapun
klasifikasi citra kayu jati tekstur kayu jati agar bisa perbedaan dengan penelitian yang
menggunakan metode diklasifikasikan ke dalam kelompok – akan dilakukan yaitu terletak
Naïve Bayes dan K- kelompok tertentu. Data yang pada objek yang mana penelitian
Nearest Neighbor (K- digunakan adalah data berupa citra yang akan dilakukan membahas
NN)(Waliyansyah & digital kayu jati yang telah dipotong mengenai penerima bantuan PKH
Fitriyah, 2019) dan belum dihaluskan lalu diambil dengan menggunakan data DTKS
dengan digital microscope camera. perjiwa
Dengan kategori kayu jati yang
berasal dari semarang, blora, dan
Sulawesi dengan masing – masing
berjumlah 50 citra yang terdiri dari 10
citra sebgai data latih dan 40 untuk
citra uji. Dengan hasil perhitungan
Naïve Bayes sebesar 82,7% dan
menggunakan K-NN sebesar 70%.
Tujuan dari penelitian ini adalah untuk
mendapatka hasil akurasi yang lebih
baik dari kedua metode tersebut
dengan pendekatan objek yang
berbeda
6 Perbandingan metode membahas mengenai analisis sentimen Kemudian pada penelitian ini
Naïve Bayes, K-NN, dan terhadap pengguna KRL Commuter perbedaan dengan penelitian yang
Decision Tree terhadap Line Jabodetabek tentang apa yang akan datang adalah algoritma
analisis sentimen dirasakan saat menggunakan yang digunakan, jumlah data dan
transportasi KRL transportasi tersebut. Data yang objek penelitian.
Commuter Line(Tri digunakan adalah 150 data yang di
Romadloni et al., 2019) ambil dari twitter. Dengan hasil
akurasi yang dari perhitungan Naïve
Bayes sebesar 80%, precision 66,67%,
sensitivity 100%, specificity 66,67 dan
pada K-NN mendapatkan hasil akurasi
sebesar 80%, Precision 100%,
sensitivity 50%, dan specificity 100%.
Tujuan dari penelitian ini adalah
membandingkan algoritma Naïve
Bayes dan K-NN dalam melakukan
analisis sentimen terhadap pengguna
KRL Commuter Line Jabodetabek
11
7 Perbandingan metode membahas tentang prediksi tingkat Perbedaan dengan penelitian
data mining untuk kelulusan dengan standar yang telah yang akan dilakukan adalah
prediksi nilai dan waktu ditetapkan untuk mahasiswa yang terletak pada metode atau
kelulusan mahasiswa masih menjalankan studi sehingga algoritma yang digunakan, dalam
prodi Teknik Informatika dapat dilakukan Langkah antisipasi penelitian yang akan dilakukan
dengan Algoritma C4.5, dari awal sehingga dapat cukup menggunakan 2 algoritma
Naïve Bayes, K-NN, dan menanggulangi terjadinya yaitu Naïve Bayes dan K-NN
SVM(Widaningsih, 2019) permaslahan dalam bidang akademik. dengan topik penerima bantuan
Data yang digunakan adalah data PKH, dan data yang digunakan
kelulusan mahasiswa Teknik data yang diambil dari dinas
Informatika angkatan tahun 2008 sosial pada tahun 2021
hingga 2016 yang lulus tepat waktu
dengan IPK kurang lebih 3,00
sebanyak 52%. Dengan hasil akurasi
dari perhitungan Niave Bayes sebesar
76,79%, dan K-NN dengan nilai K=3
sebesar 68,05%. Tujuan dari
penelitian ini adalah membandingkan
algoritma C4.5, Niave Bayes, K-NN
dan SVM untuk memprediksi
kelulusan tepat waktu dengan nilai
IPK minimal 3.00
8 Perbandingan klasifikasi membahas tentang perbandingan dua Pada penelitian yang akan
antara K-NN dan Naïve algoritma klasifikasi pada data – data dilakukan membahas mengenai
Bayes pada penentuan aktivitas status gunung berapa yang penerima bantuan PKH, data
status gunung berapi ada di Indonesia. Data yang digunakan yang digunakan data dtks perjiwa
dengan K-Fold Cross adalah data baru aktivitas gunung api pada tahun 2019 sebanyak 362
Validation(Tempola et dengan gempa vulkanik dangkal 37 data
al., 2018) kali, gempa tektonik jauh 15 kali,
gempa vulkanik dalam 35 kali, gempa
hembusan 45 kali dan status
sebelumnya waspada. Dengan hasil
akurasi dari perhitungan K-NN sebesar
63,68% dan Naïve Bayes sebesar
79,71. Tujuan dari penelitian ini
adalah untuk mengetahui algoritma
yang paling dekat dan akurat dalam
mengklasifikasikan status gunung
berapi dengan menggunkan K-NN dan
Naïve Bayes
9 Perbandingan kinerja membahas terkait klasifikasi dokumen Dan perbedaan pada penelitian
metode Naïve Bayes dan untuk pengelompokan artikel secara yang akan dilakukan adalah topik
K-Nearest Neighbor otomatis dan akurat. Data yang pembahasan yaitu membahas
untuk klasifikasi artikel digunakan adalah abstrak dari artikel penerima bantuan PKH, dengan
berbahasa jurnal berbahasa Indonesia yang ada data yang digunakan data dtks
indonesia(Devita et al., di Universitas Negeri Malang, perjiwa sebanyak 362 data pada
2018) dokumen yang digunakan sebanyak 40 tahun 2021
dokumen jurnal berbahasa Indonesia,
yang telah dipublis 2 tahun terakhir,
dengan hasil akurasi dari perhitungan
Naïve Bayes sebesar 70% dan K-NN
sebesar 40%. Tujuan dari penelitian
ini adalah dapat mengetahui metode
yang memiliki kinerja terbaik dalam
melakukan klasifikasi dokumen
berbahasa Indonesia
12
13
BAB III
METODE PENELITIAN
Studi literatur
Pengumpulan data
Pengolahan data
14
3.3 Populasi, Sampel, dan Sampling
Populasi merupakan keseluruhan kelompok individu – individu, kelompok, atau objek,
dimana hasil dari penelitian akan digeneralisasikan, sedangkan sampel merupakan kumpulan
beberapa kasus yang dipilih dari populasi kasus yang lebih besar(Swarjana, 2022). Populasi
yang digunakan dalam penelitian ini adalah berupa data dtks perjiwa penerima bantuan PKH
di Desa Akar – akar Kab. Lombok Utara. Dan untuk sampel pada penelitian ini adalah 363
data dtks perjiwa penerima bantuan PKH. Kemudian sampling data dilakukan dengan
menggunakan metode simple random sampling yaitu sampling dipilih secara acak, dimana
peluang untuk terpilih harus diketahui besarnya, dan untuk tiap satuan sampling besarnya
harus sama(Swarjana, 2022). Metode sampling ini dilakukan untuk membagi data yang
digunakan menjadi data training dan data testing dengan perbandingan 80 : 20, 80% data
training dan 20% data testing, dengan jumlah data yaitu 290 data sebagai data training dan 72
data sebagai data testing.
3.4 Metode Pengumpulan Data
Dalam penelitian ini pengumpulan data dilakukan melalui sumber primer, yang mana
data primer didapatkan dengan melihat langsung kondisi lapangan(Hirarc et al., 2016). Dan
dapat melalui sumber sekunder dimana data yang didapatkan berasal dari kantor Dinas Sosial
Kab. Lombok Utara. (Imron, 2019). Berikut merupakan metode yang digunakan dalam
pengumpulan data primer dan data sekunder antara lain :
3.4.1 Observassi
Penelitian ini dilakukan dengan mengamati objek yang akan diteliti, dalam hal
ini peneliti mengamati lingkungan dan sekaligus survei dari rumah kerumah untuk
mendapatkan informasi yang lebih akurat.
15
3.4.2 Dokumentasi
Kemudian penelitian ini juga dilakukan dengan menggunakan metode
dokumentasi, dimana peneliti mengumpulkan data – data atau dokumen pendukung
yang dibutuhkan, dengan cara mengambil data melalui koordinator kabupaten di kantor
Dinas Sosial Kab. Lombok Utara. Data yang dibutuhkan dalam penelitian ini adalah
data DTKS perjiwa penerima bantuan PKH di Desa Akar -akar Kab. Lombok Utara,
dengan jumlah data yang digunakan yaitu 362 data.
3.4.3 Studi literatur
Selanjutnya pengumpulan data pada penelitian ini menggunakan studi literatur,
dimana informasi lebih lanjut mengenai topik terkait di tinjau dari beberapa jurnal,
buku dan skripsi lain yang digunakan sebagai referensi dalam pembuatan laporan
penelitian, seluruh sumber ilmiah yang berasal dari studi literatur akan di cantumkan
dalam daftar pustaka.
3.5 Definisi Operasional Variabel
Definisi operasional variabel yaitu variabel yang digunakan untuk menunjukan atau
menjelaskan setiap indikator yang diunakan dalam penelitian(Yulianti, 2019). Variabel yang
digunakan dalam penelitian ini adalah Berasal dari keluarga prasejahtera, ibu hamil atau
menyusui, balita, anak yang duduk dibangku sekolah SD, SMP, dan SMA, lansia minimal
telah berusia 60 tahun, serta disabilitas lebih diutamakan yaitu penyandang disabilitas berat
3.6 Teknik Analisis Data
3.6.1 Normalisasi Data
Normalisasi data merupakan bagian dari preprocessing data, yaitu mengubah
bentuk data mentah menjadi data yang lebih pantas untuk digunakan dalam suatu
model klasifikasi(I et al., 2022). Normalisasi data dapat dilakukan menggunakan rumus
min-max pada persamaan 5 berikut :
17
3.6.3 Perhitungan K-NN
Berikutnya dalam penelitian ini akan dilakukan perhitungan data penerima
PKH dengan menggunakan rumus K-NN, langkah – langkah dalam perhitungan K-NN
dapat dilihat pada gambar 3.2 berikut.
a. Menentukan nilai K
b. Menghitung jarak (Euclidean Distance) data testing dengan data training
c. Kemudian hasil dari perhitungan jarak tersebut di urutkan berdasarkan data
terkecil
d. Selanjutnya menentukan kelas tetangga terdekat
e. Dan tahap terakhir yaitu menetapkan jumlah kelas terbanyak dari tetangga terdekat
sebagai data yang akan diuji.
18
dalam menyusun laporan penelitian yang ditunjang dengan beberapa referensi yang
berasal dari sumber ilmiah, dimana laporan akhir menjadi patokan selesainya kegiatan
penelitian ini.
3.7 Instrumen Penelitian
3.7.1 Perangkat Keras
Penelitian ini menggunakan perangkat keras berupa Laptop dengan merek
Lenovo dengan Processor AMD A6-7310 APU with AMD Radeon R4 Graphics 2.00
GHz, RAM 4 GB, HDD 500 GB dan SSD 256 GB. Laptop ini digunakan untuk alat
pembantu dalam pelaksanaan penelitian sejak pengumpulan data sampai penyusuna
laporan akhir.
3.7.2 Perangkat Lunak
Adapun beberapa perangkat lunak yang digunakan dalam penelitian ini antara
lain :
19
3.9 Flowchart Penelitian
Adapun alur dari penelitian dapat dilihat pada gambar flowchart 3.3.
20
DAFTAR PUSTAKA
Alwi, M. putu karismawan. i dewa ketut yudha s. iwan harsono. (2019). Sarana pendidikan,
kesehatan dan tingkat kemiskinan di kecamatan tanjung sebagai pusat pertumbuhan
kabupaten lombok utara, paska gempa 2018 dan masa pandemi covid-19. 1616–1626.
Amin Abdullah Sidiq, & Febrian Wahyu Christanto. (2020). Algoritma Naive Bayes Untuk
Penentuan Pkh (Program Keluarga Harapan) Berbasis Sistem Pendukung Kepu-Tusan
(Studi Kasus: Kelurahan Karanganyar Gunung Se-Marang). Jurnal Riptek, 14(1), 65–71.
Devita, R. N., Herwanto, H. W., & Wibawa, A. P. (2018). Perbandingan Kinerja Metode
Naive Bayes dan K-Nearest Neighbor untuk Klasifikasi Artikel Berbahasa indonesia.
Jurnal Teknologi Informasi Dan Ilmu Komputer, 5(4), 427.
https://doi.org/10.25126/jtiik.201854773
Fitriani, E. (2020). Perbandingan Algoritma C4.5 Dan Naïve Bayes Untuk Menentukan
Kelayakan Penerima Bantuan Program Keluarga Harapan. Sistemasi, 9(1), 103.
https://doi.org/10.32520/stmsi.v9i1.596
Harapan, K., Metode, D., & Bayes, N. (2019). SIGMA – Jurnal Teknologi Pelita Bangsa
SIGMA – Jurnal Teknologi Pelita Bangsa. 10(September), 108–117.
Hirarc, M., Area, P., & Permai, A. (2016). Analisis risiko k3 dengan metode hirarc pada area
produksi pt cahaya murni andalas permai. 179–185.
I, A. K. A., Nurhadi, F., Setiawan, I. K. O., Rizky, I. A., & Manurung, R. B. (2022).
Pengaruh Normalisasi Data pada Klasifikasi Harga Ponsel Berdasarkan Spesifikasi
Menggunakan Klasifikasi Naive Bayes dan Multinomial Logistic Regression. 3(1), 8–16.
Ifon Purnama, A., Aziz, A., Sartika Wiguna, A., & Kunci, K. (2020). Penerapan Data Mining
Untuk Mengklasifikasi Penerima Bantuan PKH Desa Wae Jare Menggunakan Metode
Naïve Bayes. Kurawal Jurnal Teknologi, Informasi Dan Industri, 3, 1–8.
https://jurnal.machung.ac.id/index.php/kurawal
Keluarga, D. jaminan sosial keluarga, Jaminan, D. jenderal perlindungan dan jaminan sosial,
& RI, K. sosial. (2021). Pedoman pelaksanaan PKH.Pdf. 22.
Maricar, M. A., & Dian Pramana. (2019). Perbandingan Akurasi Naïve Bayes dan K-Nearest
Neighbor pada Klasifikasi untuk Meramalkan Status Pekerjaan Alumni ITB STIKOM
Bali. Jurnal Sistem Dan Informatika (JSI), 14(1), 16–22.
https://doi.org/10.30864/jsi.v14i1.233
Marutho, D. (2019). Perbandingan Metode Naive Bayes , KNN , Decision Tree Pada Laporan
Water Level Jakarta. Manajemen Informatika AMIK JTC Semarang, 15(2), 90–97.
Normawati, D., & Prayogi, S. A. (2021). Implementasi Naïve Bayes Classifier Dan Confusion
Matrix Pada Analisis Sentimen Berbasis Teks Pada Twitter. J-SAKTI (Jurnal Sains
Komputer Dan Informatika), 5(2), 697–711.
Pratama, F. K., Widodo, D. W., & Shofia, N. (2021). Implementasi Metode Naïve Bayes
dalam Mengklasifikasi Penerima Program Keluarga Harapan ( PKH ) Desa Minggiran
Kediri. Seminar Nasional Inovasi Teknologi UN PGRI Kediri, 23–28.
https://proceeding.unpkediri.ac.id/index.php/inotek/article/view/1072%0Ahttps://
proceeding.unpkediri.ac.id/index.php/inotek/article/download/1072/685
Rifai, M. F., Jatnika, H., & Valentino, B. (2019). Penerapan Algoritma Naïve Bayes Pada
Sistem Prediksi Tingkat Kelulusan Peserta Sertifikasi Microsoft Office Specialist
( MOS ). 12(2), 131–144.
Setiawan, D. A., Helilintar, R., & Wahyuniar, L. S. (2021). Penerapan Metode Naive Bayes
Untuk Klasifikasi Penentuan Penerima Bantuan PKH. Seminar Nasional Inovasi
Teknologi, 249–254.
Setiyawan, Y. (2017). Optimasi Naive Bayes Classifier dengan menggunakan particle swarm
optimization pada data iris. 4(September), 1–14.
Sindi, S., Ningse, W. R. O., Sihombing, I. A., R.H.Zer, F. I., & Hartama, D. (2020). Analisis
Algoritma K-Medoids Clustering Dalam Pengelompokan Penyebaran Covid-19 Di
Indonesia. Jurnal Teknologi Informasi, 4(1), 166–173.
https://doi.org/10.36294/jurti.v4i1.1296
Swarjana, I. K. (2022). Populasi - sampel, teknik sampling & bias dalam penelitian (E.
Risanto (ed.); 1st ed.). CV ANDI OFFSET.
Syarifuddin, F., Misdram, M., Widodo, A. A., Informatika, P. S., & Pasuruan, U. M. (2020).
22
KLASIFIKASI DATA SET VIRUS CORONA MENGGUNAKAN. 12(2), 46–52.
Tempola, F., Muhammad, M., & Khairan, A. (2018). Perbandingan Klasifikasi Antara KNN
dan Naive Bayes pada Penentuan Status Gunung Berapi dengan K-Fold Cross
Validation. Jurnal Teknologi Informasi Dan Ilmu Komputer, 5(5), 577.
https://doi.org/10.25126/jtiik.201855983
Tri Romadloni, N., Santoso, I., & Budilaksono, S. (2019). Perbandingan Metode Naive
Bayes, Knn Dan Decision Tree Terhadap Analisis Sentimen Transportasi Krl Commuter
Line. Jurnal IKRA-ITH Informatika, 3(2), 1–9.
Utami, D., Aisyiyah, P., & Devi, R. (2022). Klasifikasi kelayakan penerima bantuan program
keluarga harapan (pkh) menggunakan metode weighted naïve bayes dengan laplace
smoothing. 07, 1373–1384.
Utomo, D., Hakim, A., & Ribawanto, H. (2014). Pelaksanaan Program Keluarga Harapan
Dalam Meningkatkan Kualitas Hidup Rumah Tangga Miskin (Studi pada Unit Pelaksana
Program Keluarga Harapan Kecamatan Purwoasri, Kabupaten Kediri). Jurnal
Administrasi Publik (JAP), 2(1), 29–34.
Wahyuningsih, S., & Utari, D. R. (2018). Perbandingan Metode K-Nearest Neighbor , Naive
Bayes dan Decision Tree untuk Prediksi Kelayakan Pemberian Kredit. Konferensi
Nasional Sistem Informasi 2018 STMIK Atma Luhur Pangkalpinang, 8 – 9 Maret 2018,
619–623.
Waliyansyah, R. R., & Fitriyah, C. (2019). Perbandingan Akurasi Klasifikasi Citra Kayu Jati
Menggunakan Metode Naive Bayes dan k-Nearest Neighbor (k-NN). Jurnal Edukasi
Dan Penelitian Informatika (JEPIN), 5(2), 157. https://doi.org/10.26418/jp.v5i2.32473
Wibawa, A. P., Guntur, M., Purnama, A., Akbar, M. F., & Dwiyanto, F. A. (2018). Metode-
metode Klasifikasi. 3(1), 134–138.
Widaningsih, S. (2019). Perbandingan Metode Data Mining Untuk Prediksi Nilai Dan Waktu
Kelulusan Mahasiswa Prodi Teknik Informatika Dengan Algoritma C4,5, Naïve Bayes,
Knn Dan Svm. Jurnal Tekno Insentif, 13(1), 16–25. https://doi.org/10.36787/jti.v13i1.78
Yani, S., Jumeilah, F. S., & Kadafi, M. (2020). Algoritma K-Nearest Neighbor Untuk
Menentukan Kelayakan Keluarga Penerima Bantuan Pangan Non Tunai (Studi Kasus :
Kelurahan Karya Jaya). Journal of Information Technology Ampera, 1(2), 75–87.
https://doi.org/10.51519/journalita.volume1.isssue2.year2020.page75-87
Yulianti, Y. D. (2019). pergerakan indeks harga saham gabungan sebagai dampak dari
variabl mikro.
Yusra, Olivita, D., & Vitriani, Y. (2016). Perbandingan Klasifikasi Tugas Akhir Mahasiswa
Jurusan Teknik Informatika Menggunakan Metode Naïve Bayes Classifier dan K-
Nearest Neighbor. Jurnal Sains, Teknologi Dan Industri, 14(1), 79–85.
23
LAMPIRAN
24