Anda di halaman 1dari 20

MAKALAH DATA MINING PREDIKSI

Oleh :

Ainy Ardiningsih : 109200940055


Monica Handayani : 109200940079
Wardah Saripah : 109200940058

JURUSAN SISTEM INFORMASI


SEKOLAH TINGGI MANAJEMEN ILMU KOMPUTER
STMIK PRANATA INONESIA
BEKASI

2020

i
KATA PENGANTAR

Puji dan syukur kami panjatkan ke hadirat Tuhan Yang Maha Esa, atas
karunia-Nya kami dapat menyelesaikan makalah dengan topik Data Mining
Prediksi. Walaupun terdapat beberapa hambatan yang kami alami selama proses
pengerjaannya, tapi kami berhasil menyelesaikan makalah ini dengan tepat
waktu.
Tidak luput kami sampaikan terima kasih kepada dosen pengampu, Ibu
Amanda, S.Kom., M.Kom. yang telah memberikan tugas ini dan ikut serta
membantu kami dalam mengerjakan makalah. Tidak luput kami ucapkan terima
kasih terhadap teman-teman yang telah turut serta memberi kontribusi, baik
secara langsung ataupun tidak langsung dalam proses makalah ini. Kami
berharap, semoga makalah ini dapat memberikan dampak baik dan berguna bagi
kita semua.
Kami pun menyadari di dalam penulisan makalah ini masih sangat jauh
dari kata sempurna, maka kami sangat mengharapkan kritik dan saran yang
bersifat positif untuk mencapai sempurnanya makalah ini. Semoga makalah ini
dapat bermanfaat bagi penulis dan juga bagi para pembaca.

ii
DAFTAR ISI

COVER ................................................................................................................... i
KATA PENGANTAR ........................................................................................... ii
DAFTAR ISI ........................................................................................................... iii

BAB I PENDAHULUAN………………………………………………………... 1

1.1 Latar Belakang ……………………………………………………….. 1

1.2 Tujuan Penelitian …………………………………………………….. 1

BAB II LANDASAN TEORI ........................................................................................... 2

2.1 Teori Mengenai Topik .......................................................................... 2-13

2.2 Tinjauan Pustaka ................................................................................... 13-15

BAB III PENUTUP………………………………………………………………. 16

3.1 Kesimpulan…………………………………………………………… 16

3.2 Saran………………………………………………………………….. 16

DAFTAR PUSTAKA…………………………………………………………….. 17

iii
BAB I
PENDAHULUAN

1.1. Latar Belakang

Data mining merupakan serangkaian proses untuk mendapatkan informasi


yang berguna dari gudang basis data yang besar. Data mining juga dapat diartikan
sebagai pengekstrakan informasi baru yang diambil dari bongkahan data besar yang
membantu dalam pengambilan keputusan. Proses pengumpulan dan ekstraksi informasi
tersebut dapat dilakukan menggunakan perangkat lunak dengan bantuan perhitungan statistika,
matematika, ataupun teknologi Artificial Intelligence (AI). Data mining sering disebut juga
Knowledge Discovery in Database (KDD). Jika data ini dimanfaatkan dengan mencari
informasi tersembunyi dari data tersebut mungkin bisa memberikan informasi penting
khususnya yang belum menerapkan metode data mining dalam penggalian informasi, ini
merupakan langkah awal yang besar dan tidak menutup kemungkinan banyak yang mengikuti
langkah ini dalam penggalian informasi.

Banyak metode dan teknik yang sudah dilakukan dalam model prediksi,
teknik klasifikasi misalnya, teknik klasifikasi adalah sebuah metode dari data
mining yang digunakan untuk memprediksi kategori atau kelas dari suatu data
instance berdasarkan sekumpulan atribut-atribut dari data tersebut dan algoritma
C.45 sebagai pembangun decision tree. Decision tree adalah model prediksi yang
biasanya digunakan dalam penelitian, konsep dari decision tree adalah mengubah
data menjadi pohon keputusan dan aturan - aturan keputusan.

1.2. Tujuan Penelitian


Tujuan dari penelitian ini adalah membandingkan beberapa metode pada data mining
untuk mengetahui mana yang lebih unggul kinerjanya dalam mengidentifikasi suatu masalah
sesuai dengan kategorinya masing - masing.

1
BAB II
LANDASAN TEORI

2.1. Teori Mengenai Topik

A. Analisis Prediksi Kelulusan Mahasiswa Tepat Waktu Menggunakan


Metode Data Mining Naive Bayes
Perguruan tinggi merupakan penyelenggara pendidikan akademik bagi mahasiswa.
Lima perguruan tinggi diantaranya adalah universitas, institut, sekolah tinggi, akademik dan
politeknik. Perguruan tinggi diharapkan menyelenggarakan pendidikan yang berkualitas bagi
mahasiswa sehingga menghasilkan mahasiswa yang memiliki kompetensi dibidangnya. Di
Indonesia sendiri kualitas suatu perguruan tinggi ditentukan oleh grade akreditasi yang di
keluarkan oleh Badan Akreditasi Nasional Perguruan Tinggi (BAN-PT). Banyak aspek yang
dapat dijadikan tolak ukur kualitas perguruan tinggi. Salah satunya dapat dilihat dari banyaknya
mahasiswa yang dapat menyelesaikan studi sesuai dengan waktu yang ditentukan atau
istilahnya mahasiswa lulus tepat waktu. Semakin banyak mahasiswa yang lulus tepat waktu
maka semakin baik pula kinerja perguruan tinggi tersebut, sehingga tingkat kelulusan
mahasiswa tepat waktu menjadi salah satu kriteria penilaian akreditasi bagi suatu perguruan
tinggi atau program studi (Broto Legowo & Indiarto, 2017). Banyak faktor yang dapat
mendukung peningkatan jumlah kelulusan mahasiswa tepat waktu Antara lain:
1. Kualitas staf pengajar yang baik
2. Materi pembelajaran yang baik
3. Proses belajar-mengajar telah tertata dengan baik
4. Pengukuran keberhasilan proses pendidikan telah diterapkan
5. Administrasi pendidikan yang berjalan dengan baik
6. Sarana penunjang pendidikan tersedia dan mudah dimanfaatkan
Setiap perguruan tinggi memiliki database yang menyimpan data berupa data akademik
dan biodata mahasiswa. Dengan melimpahnya database yang dimiliki oleh perguruan tinggi
tersebut, informasi yang tersembunyi dapat diketahui dengan cara melakukan pengolahan
terhadap data mahasiswa. Database tersebut dapat digunakan untuk mempelajari pola dan
perilaku mahasiswa sehingga dapat meminimalisir keterlambatan kelulusan. Salah satu metode
yang dapat digunakan untuk menganalisa database tersebut adalah metode data mining.
Menurut Jing dan marceron(2017), data yang berlimpah membuka peluang diterapkannya data
mining untuk pengelolaan pendidikan yang lebih baik dan data mining untuk pelaksanaan
pembelajaran. Metode data mining dengan akurasi terbaik dapat digunakan sebagai pendukung
keputusan bagi perguruan tinggi untuk mengambil kebijakan. Dukungan prediksi data mining
dalam pengambilan keputusan ini diharapkan dapat meningkatkan jumlah kelulusan
mahasiswa tepat waktu sesuai dengan peraturan Menteri Pendidikan (Ayub, 2018).

2
Jurnal ini bertujuan untuk memberikan kajian literatur secara sistematis terhadap
metode data mining Naive Bayes dalam memprediksi jumlah kelulusan tepat waktu
mahasiswa. Setelah membandingkan beberapa literatur, dapat disimpulkan bahwa metode ini
dapat digunakan untuk prediksi tersebut dengan tingkat keakuratan 90%. Kajian literatur ini
penting sebagai faktor pendukung bagi penelitian dengan topik itu.
Beradasarkan hasil identifikasi literatur yang digunakan, didapat bahwa metode data
mining naive bayes dapat membuat suatu prediksi mengenai kelulusan mahasiswa tepat waktu
dengan memperhitungkan atribut – atribut dari database perguruan tinggi yang digunakan.
Sedangkan untuk tingkat akurasi ketiga literatur menghasilkan akurasi di atas 90% walaupun
dengan menggunakan jumlah atribut dan aplikasi data mining yang berbeda. Atribut yang
terdapat pada semua literatur yang dapat menentukan prediksi adalah atribut IPK (Indeks
Prestasi Komulatif).

B. Prediksi Kelulusan Mahasiswa Menggunakan Data Mining Algoritma


K-Means
Kelulusan sebuah mata kuliah sangatlah penting, apabila terdapat mahasiswa yang
tidak lulus disebuah mata kuliah terutama mata kuliah yang memiliki keterikatan dengan mata
kuliah lain harus mengambil ulang mata kuliah tersebut. Kelulusan disebuah mata kuliah tidak
dapat diketahui sebelum dilakukannya ujian final dan perhitungan nilai akhir sebuah mata
kuliah. Untuk itu perlu dilakukannya prediksi terhadap kelulusan mata kuliah agar membantu
mengantisipasi tidak lulusnya mahasiswa dalam sebuah mata kuliah. Melalui tahap studi
literatur, wawancara dan melihat data kinerja akademik yang di dapat, maka digunakan nilai
tugas, nilai unit test, nilai mid test, dan kehadiran yang didapat dari data kinerja serta faktor
internal dan eksternal mahasiswa seperti keaktifan kelas, Status tinggal, Bahasa materi
pelajaran, dan bentuk tugas akhir yang di berikan. Pengolahan data dilakukan menggunakan
K-means, kemudian menghitung chi square atribute selection dan menghitung tingkat akurasi
prediksi tersebut menggunakan confusion matrix. Hasil dari penelitian menunjukkan bahwa
hasil prediksi menggunakan K = 3 dari 118 data yang diolah terdapat 13 mahasiswa yang tidak
lulus, 36 mahasiswa lulus dengan nilai cukup, dan 69 mahasiswa lulus dengan nilai baik. Dan
yang mempengaruhi prediksi kelulusan menggunakanchi square atribute adalah nilai mid
dengan ranked atributes sebesar 49, nilai tugas sebesar 46, dan kehadiran sebesar 42. Bahasa
materi yang menggunakan Bahasa inggris mempengaruhi mahasiswa yang lulus dengan nilai
cukup. Sedangkan tugas akhir yang berupa proyekatau ujian teori tidak terlalu mempengaruhi
prediksi kelulusan mahasiswa di sebuah mata kuliah. Penggunaan confusion matrix terhadap
hasil prediksi menunjukkan tingkat akurasi sebesar 93% dengan presisi dan recall sebesar 96%
dan 92%.
Kelulusan didalam sebuah mata kuliah adalah sebuah harapan besar bagi seorang
mahasiswa karena terdapat beberapa mata kuliah yang memiliki keterikatan dengan mata
kuliah lainnya, Sehingga kelulusan mahasiswa disebuah mata kuliah dapat mempengaruhi
pengambilan mata kuliah disemester yang akan datang. Misalnya, untuk mengambil mata
kuliah algoritma pemrograman 2 di semester genap harus telah lulus dari mata kuliah algoritma
pemrograman 1 di semester ganjil.Terdapat beberapa mata kuliah yang memiliki keterikatan
dengan mata kuliah lainnya, Sehingga kelulusan mahasiswa di sebuahmata kuliah dapat
mempengaruhi pengambilan mata kuliah disemester yang akan datang.Mahasiswa yang lulus
di sebuahmata kuliah tidak dapat diketahui sebelum dilakukannya perhitungan nilai akhir

3
sebuah mata kuliah, sehingga, apabila terdapat mahasiswa yang tidak lulus disebuah mata
kuliah terutama mata kuliah di semester ganjil yang memilikiketerikatan dengan mata kuliah
di semester genap, akan mengalami kesulitan untuk mengambil mata kuliah tersebut, karena
mahasiswa itu harus melakukan pengambilan ulang mata kuliah yang gagal tersebut hanya di
semester ganjil yang akan datang, jika hal ini sering terjadi, dapat membuat mahasiswa tersebut
terlambat untuk diwisuda.Maksud dilakukannya penelitian ini adalah supaya mahasiswa dapat
mengetahui hal-hal apa saja yang dapat membuat seorang mahasiswa tidak lulus dari mata
kuliah. Dan apa saja yang dapat diperhatikan dosen agardapat mengetahui kinerja dan
kemampuan mahasiswanya di kemudian hari.
Tujuan penelitian ini adalah untuk mengetahui bagai mana cara mengolah data
mahasiswa yang dapat digunakan untuk memprediksi kelulusan mahasiswa dalam sebuah mata
kuliah menggunakan data mining algoritma K-means. Berdasarkan studi literatur terhadap
jurnal atau penelitian yang pernah dilakukan sebelumnya, dan dilakukannya wawancara, maka
atributyang digunakan pada penelitian ini adalah kehadiran, status tinggal, bahasa, tugas akhir,
nilai tugas, nilai tugas, nilai unit test, dan mid test, keaktifan kelas. Berdasarkan atributdi atas
terdapat atributnon numerik karna Metode K-meansadalah metode yang bisa di lakukan apabila
data yang digunakan adalah data yang berupa angka. Maka proses binning perlu dilakukan.
Proses Binning disebut juga proses normalisasi, yaitu proses untuk mentransformasi nilai -nilai
dari data-data non-numerik menjadi data-data yang bisa dikalkulasi.

C. Sistem Prediksi Dan Evaluasi Prestasi Akademik Mahasiswa Di


Program Studi Teknik Informatika Menggunakan Data Maining
Algoritma C45
Pada tahun 2019 Program Studi Teknik Informatika Politeknik Negeri Pontianak
memiliki 11 kelas dan sebanyak 1 kelas merupakan program kerjasama internasional dengan
perguruan tinggi di Malaysia yakni Management and Science University. Sistem pembelajaran
yang tepat berperan dalam menghasilkan mahasiswa maupun lulusan yang berkualitas. Prestasi
Mahasiswa yang baik dalam bidangnya juga dapat ditingkatkan dengan sistem pembelajaran
tersebut. Klasifikasi merupakan bentuk penerapan dalam data mining serta dapat digunakan
untuk memprediksi atau meramalkan prestasi mahasiswa berdasarkan paramaeter tertentu.
Teknik ini juga dapat diaplikasikan dalam mencari insight berkaitan dengan prestasi
mahasiswa. Berdasarkan teknik klasifikasi diperoleh parameter yang berpengaruh terhadap
prestasi mahasiswa serta seberapa besar pengaruhnya tersebut dalam peningkatan prestasi.
Indeks prestasi mahasiswa digunakan dalam merepresentasikan prestasi yang diperoleh
mahasiswa selama perkuliahan. Hasil dari klasifikasi diharapkan menjadi rekomendasi atau
bahan masukan kepada akademik kampus, khususnya manajemen di Program Studi Teknik
Informatika untuk membuat sistem pembelajaran yang dapat disesuaikan dalam menangani
mahasiswa yang memiliki prestasi rendah dan upaya dalam melihat faktor-faktor yang berperan
dalam peningkatan prestasi akademik mahasiswa.
Teknologi komputer saat ini tidak lagi hanya digunakan sebagai sarana komputerisasi
danpengolahan kata, pengolahan angka, dan lainya tetapi juga sebagai sarana untuk
mendukungpengambilan keputusan. Salah satunya dilakukan oleh (Imandasari, Wanto, &
Windarto, 2018) yang menentukan mahasiswa PKL menggunakan metode promethee. Untuk
dapat menggali pengetahuan yang terdapat di dalam data yang besar dikenal dengan istilah big
data dilakukan dengan penambangan informasi dari data yang dikumpulkan. Pola maupun rule

4
yang dibutuhkan untuk menganalisis data selanjutnya disebut sebagai pengetahuan. Teknik
yang dilakukan untuk melakukan penggalian informasi tersebut untuk memperoleh
pengetahuan dikenal dengan istilah data mining. Tumpukan data pada saat ini tertimbun di
berbagai bidang dan menyebar dalam lapisan masyarakat luas dalam jumlah besar
memunculkan banyak sekali tools pendukung atau software aplikasi yang di desain untuk
membantu manusia melakukan proses penambangan maupun penggalian pengetahuan dalam
tumpukan data yang ada.
Berbagai tools yang ada sangat membantu manusia untuk dapat mengetahui hasil akhir
output yang dikehendaki serta bagaimana langkah yang dilalui dalam mendapatkan hasil akhir
yang dikehendaki pada khususnya pada era big data (Fitri, Nurjanah, & Astuti, 2018).
Database adalah kumpulan data, pada saat ini database tidak banyak memberikan keuntungan
yang signifikan terhadap perkembangan proses belajar mengajar. Pada saat proses akreditasi
lembaga maupun Akreditasi Program Studi Teknik Informatika di Politeknik Negeri Pontianak
dan untuk mengetahui identitas mahasiswa maupun dosen saat proses belajar mengajar di
kampus biasanya baru akan dibutuhkan database tersebut. Pada saat lulus kuliah data tersebut
akan menjadi tumpukan data yang jarang digunakan. Salah satu cara memanfaatkan data
tersebut adalah dengan mengolahnya, sehingga pola atau kecenderungan pada data tersebut
dapat ditemukan. Dengan mengetahui pola yang terdapat pada data mahasiswa, maka hal
tersebut akan dapat digunakan dalam membantu pengambilan keputusan. Pola atau rule data
mahasiswa ini bisa digunakan untuk memprediksi nilai prestasi seseorang mahasiswa serta
beberapa faktor yang berpengaruh terhadap performansi mahasiswa tersebut. Sehingga dengan
mengetahui potensi maupun faktor yang berpengaruh terhadap performansi mahasiswa
menjadi hal yang penting.
Sistem pembelajaran yang tepat untuk mahasiswa dapat dilakukan salah satunya
dengan mengetahui faktor- faktor tersebut, maka pihak universitas dapat menerapkan
pengetahuan tersebut. Mahasiswa yang memiliki performansi rendah juga dapat diantisipasi
dan segera ditangani oleh pihak universitas (Fahmi, 2014) Pada tahun 2019 Program Studi
Teknik Informatika memiliki jumlah total kelas sebanyak 12 kelas. Salah satu cara untuk
menghasilkan mahasiswa yang berkualitas adalah dengan menciptakan sistem pembelajaran
yang tepat terhadap mahasiswa di program studi teknik informatika supaya mahasiswa tersebut
memiliki prestasi yang baik dalam bidang teknik informatika. Oleh karena itu dibutuhkan
evaluasi performansi mahasiswa. Salah satu bentuk penerapan dalam data mining adalah
klasifikasi. Metode klasifikasi dapat digunakan untuk memprediksi atau meramalkan prestasi
mahasiswa di program studi teknik informatika berdasarkan variabel-variabel tertentu dan juga
diaplikasikan dalam mencari informasi penting berkaitan dengan upaya peningkatan prestasi
mahasiswa. Sebuah penelitian memprediksi masa studi mahasiswa dilakuakan sebuah
menajemen perguruan tinggi untuk menentukan kebijakan preventif terkait pencagahan dini
kasus drop out. (Meinanda, 2009) Berdasarkan teknik klasifikasi akan dapat diketahui faktor-
faktor yang berpengaruh terhadap performansi mahasiswa serta seberapa besar pengaruhnya
tersebut.
Performansi mahasiswa dalam hal ini direpresentasikan dengan nilai indeks prestasi.
Hasilnya diharapkan dapat menjadi pengetahuan atau rekomendasi kepada pihak akademik di
program studi teknik informatika dan khususnya manajemen di Program Studi Teknik
Informatika untuk membuat sistem pembelajaran yang tepat dan dapat menangani dengan

5
segera mahasiswa yang memiliki performansi rendah dan upaya dalam melihat faktor-faktor
yang berperan dalam peningkatan prestasi akademik mahasiswa.

D. Prediksi Mahasiswa Berpotensi Non Aktif Menggunakan Data Mining


dalam Decision Tree dan Algoritma C4.5
Mahasiswa non aktif adalah mahasiswa yang tidak mengikuti proses perkuliahan dan
tidak membayar biaya administrasi kuliah dalam waktu dua semester atau lebih. Laporan
tentang mahasiswa yang tidak aktif akan berdampak terhadap kuantitas perguruan tinggi.
Mahasiswa yang tidak terdata dalam mahasiswa non aktif akan berpotensi untuk dikeluarkan
atau drop out. Untuk itu dilakukan penelitian ini untuk menggali informasi terhadap mahasiswa
yang berpotensi non aktif dengan penerapan ilmu data mining dengan metode Decision Tree
dan algoritma C4.5. Data yang diuji bersumber dari Sekolah Tinggi Manajemen Informatika
dan Komputer (STMIK) Triguna Dharma Medan. Hasil penelitian mendapatkan rule prediksi
data mahasiswa yang berpotensi non aktif dengan tingkat keakurasian yang sangat baik.
Sehingga penelitian ini dapat digunakan untuk menghindari mahasiswa drop out secara
sepihak.
Mahasiswa non aktifmerupakanmahasiswa tidak mengikuti perkuliahan paling lama
2(dua)semester berturut-turut. Mahasiswa non aktifmemiliki kemungkinan untuk dikeluarkan
(drop out) pada sebuah perguruan tinggi. Mahasiswa yang berpotensi untuk didrop out dari
kampus biasa dilatar belakangi oleh terhentinya proses perkuliahan. Alasan utama terjadinya
ketidak aktifan tesebut adalah tidak melakukan pembayaran biaya administrasi. Banyaknya
mahasiswa yang dikeluarkan akan berdampak terhadap mutu perguruan tinggi. Untuk itu pihak
perguruan tinggi harus melakukan monitoring dan evaluasi dalam pelaksaan sistem
pembelajaran secara berkaladan mendata keaktifan mahasiswanya. Pendataan ini akan
meningkatkanmutu sebuah perguruan tinggi. Untuk menghindari terjadinya pemberhentian
mahasiswa, maka perlu pendataan mahasiswa yang tidak aktif dan memprediksi akan
terjadinya ketidakaktifan proses perkuliahan. Hal yang melatar belakangi proses analisa
terhadap permasalahan tersebut akan dapat diketahui faktor penyebabnya. Berdasarkan hal
tersebut perlu dilakukan penelitian untuk memprediksi mahasiswa yang berpotensi non aktif.
Metode yang digunakan untuk mengolah datanya adalah Decision Tree dengan algoritma C4.5.
Decision Tree merupakan sebuah Knowledge Discovery In Database (KDD).
Hasil dari metode ini akan mendapatkan sebuahpengetahuan dari database yang diolah.
Database akan diekstraks isehingga menghasilkan informasi ataup engetahuan yang berguna.
Tahap-tahapan yang dilakukan dalam KDD adalah data mining. Data mining merupakan suatu
algoritma di dalam menggali informasi berharga yang terpendam (tersembunyi) pada koleksi
data (database)yang sangat besar, sehingga ditemukan suatu pola menarik yang sebelumnya
tidak diketahui. Salah satu algoritma yang digunakan dalam data mining adalah algoritma C4.5
Algoritma C4.5 merupakan algoritma yang digunakan untuk membentuk pohon keputusan dan
aturan –aturan (rule). Algoritma C4.5 memetakan nilai atribut menjadi kelas yang dapat
diterapkan untuk klasifikasi baru.
Beberapa penelitian yang menggunakan algoritma C4.5 diantaranya adalah Lorenzadkk
(2014) menggunakanAlgoritma C4.5 untuk memprediksi masa studi mahasiswa berdasarkan
data nilai akademik. Hasil yang didapatkan melalui penelitian tersebutmemberikan pengaruh
besar terhadap nilai persentase kecocokan dan keakurasian dalam memprediksi masa studi

6
mahasiswa berdasarkan data nilai akademik Harryanto & Hansun(2017) menggunakan
algoritma C4.5 untuk memprediksi penerimaan calon pegawai baru pada PT.WISE, serta
memberikan hasil pengujian terhadap keakurasian proses prediksi kepadacalon pegawai.
Penelitian Melissa & Oetama (2013) menggunakan data mining untuk melakukan
analisis data pembayaran kredit nasabah bank. Hasil penelitian dapat mengoptimalkan prediksi
pembayaran kredit nasabah bank. PenelitianNovriansyah dkk (2017) menggunakan data
mining dan algoritma Naive Bayesuntuk mengetahui minat beli pelanggan terhadap kartu
internet XL.
Hasil didapatkan bahwa metode klasifikasi dan algoritma Naive Bayes sangat cocok
dipakai untuk memberikan prediksi yang dapat dipakai di masa depan.

E. Penerapan Data Maining Untuk Prediksi Kelulusan UKP


Menggunakan Metode Naive Bayes
Data - data yang dari hasil ujian kepelautan di UNIMAR AMNI Semarang belum
pernah dilakukan pengolahan data yang maksimal. Artinya data yang sudah ada belum bisa
untuk memprediksi untuk hasil kelulusan ujian kepelautan untuk tahun selanjutnya. Untuk itu
tujuan dari penelitian ini adalah menggunakan sebuah metode data mining agar dapat
memprediksi seberapa besar kelulusan yang akan diperoleh dari hasil ujian kepelautan. Upaya
untuk menaikkan jumlah kelulusan yaitu dengan melakukan prediksi hasil lulusan sebelumnya.
Sehingga akan didapatkan manfaat yaitu dapat melakukan pengambilan keputusan yang tepat.
Data mining merupakan cabang ilmu yang bertujuan untuk mengatasi masalah penggalian
sebuah informasi dari data yang berjumlah besar dan algoritma naive bayes merupakan metode
yang bertujuan untuk mengklasifikasi data yang ada kemudian dapat digunakan untuk
memprediksi kelulusan UKP. Kesimpulan yang diperoleh yaitu dengan menerapkan data
mining yang tepat maka akan dapat memprediksi kelulusan UKP di UNIMAR AMNI
Semarang.
Data mining mempunyai banyak metode yang bisa diterapkan untuk klasifikasi.
Algoritma klasifikasi yang banayak digunakan peneliti yaitu Decision Trees, Neural Networks,
Naive Bayes, dan algoritma Genetik (Yukseltruk, Ozekes, & Turel, 2014, p.119)
Keuntungan menggunakan algoritma Naive Bayes adalah metode Naive Bayes
membutuhkan data latih atau training data dalam jumlah yang kecil untuk menentukan
parameter dalam proses pengklasifikasian.Selain itu kelebihan yang lain adalah mudah dibuat
dan hasilnya bagus. Metode Naïve Bayes juga mempunyai kekurangan yaitu asumsi
independence antar atribut membuat akurasi berkurang.

F. Implementasi Data Maining Untuk Prediksi Penjualan Pestisida Pada


CV Mitra Artha Sejati Mengunkan Algoritma Naive Bayes
Salah satu faktor penting untuk terciptanya perusahaan yang sehat dan berkembang
adalah dengan adanya penjualan. Prediksi adalah salah satu kunci dari keberhasilan penjualan
karena dengan nilai prediksi penjualan bisa dijadikan panduan sebagai acuan menentukan suatu
penjualan produk. Salah satu cara untuk membuat prediksi penjualan yang agar lebih baik
adalah dengan cara memanfaatkan pengolahan data mining menggunakan algoritma Naive
Bayes. Algoritma Naive Bayes menghitung nilai probabilitas dari masing-masing atribut yang

7
di teliti. Dari data penjualan CV Mitra Artha Sejati pada tahun 2017, 2018, 2019, dan 2020.
Hasil perhitungan prediksi menggunakan algoritma Naive Bayes menghasilkan tingkat akurasi
prediksi mencapai 94,59% dengan class precision yaitu “YA” 100.00%, “TIDAK” 94.44%,
dan untuk class recall yaitu “YA” 33.33%, dan “TIDAK” 100.00%.
CV Mitra Artha Sejati adalah salah satu perusahaan yang bergerak dalam bidang
penjualan pestisida yang sudah berdiri dari tahun 2012. Tingginya ketergantungan dan
pemakaian pestisida didalam pertanian menjadikan pangsa pasar bagi para pengusaha atau
perusahaan untuk berlomba dalam menciptakan dan memasarkan produk pestisida mengingat
penggunaan yang sangat tinggi dan wilayah Indonesia sebagai salah satu negara agraris yang
memiliki wilayah cukup luas. Namun dengan demikian akhirnya banyak bermunculan
perusahaan-perusahaan baru yang mengakibatkan ketatnya persaingan dilapangan. Banyaknya
jenis merk dagang yang beredar, ditambah banyaknya produsen juga cuaca yang tidak stabil
menjadi masalah baru bagi perusahaan baik mengatur strategi pemasaran, strategi produk,
ataupun dalam masalah pengadaan barang.
Pada pengumpulan data ini yang digunakan adalah data penjualan CV Mitra Artha
Sejati Bandung tahun 2017, 2018, 2019 dan 2020. Data yang diambil sebayak 968 data dan
yang dapat digunakan sebanyak 554 data. Kenapa data yang diambil berjumlah sekian karena
banyak data yang ada pada variabel tertentu bernilai null sehingga data tersebut tidak dapat
digunakan untuk proses data mining, Data asli yang dihasilkan penulis memiliki 28 atribut
diantaranya yaitu : Segment, PIC, Cust Code, Nama Toko, Alamat, Wilayah, No Telp, Nama
Pelanggan, Tanggal Kirim, Tanggal Jatuh tempo, Umur Faktur, No. PO, No.Surat Jalan, No
Faktur, Distribusi, Retur, Sales, Uang Masuk, Sisa Tagihan, Status Lunas, Group, Produk,
Kemasan, Isi perbox, Qty, Harga, Diskon, Konsinyasi

G. Implementasi Data Mining Untuk Prediksi Persediaan Obat Pada


Puskesmas Kertapati Menggunakan Regresi Linier Berganda
Masyarakat di wilayah Mataram Kertapati Palembang saat ini lebih memilih Puskesmas
sebagai sarana kesehatan. Hal ini membuat Pustu Mataram harus menyediakan stok obat yang
dibutuhkan oleh pasien agar penyakit atau keluhan yang diderita oleh pasiennya dapat teratasi.
Banyaknya pasien yang melakukan pengobatan di Pustu Mataram sering kali membuat
persediaan stok obat yang ada tidak mencukupi karena Pustu Mataram belum pernah
melakukan prediksi persediaan obat. Untuk mengatasi permasalahan tersebut maka penulis
melakukan penelitian untuk memprediksi persediaan stok obat di Pustu Mataram kedepannya
menggunakan Data Mining dengan menerapkan Algoritma Regresi Linier Berganda.
Berdasarkan dari analisa persediaan obat dengan sampel obat Antasida yang dilakukan secara
manual didapat hasil prediksi sebesar 3218 obat dan perhitungan dengan menggunakan tools
Rapidminer sebesar 5197,661 obat. Dimana dari perhitungan secara manual dan menggunakan
bantuan tools terdapat selisih yaitu sebesar 1979,661 obat. Perhitungan yang dilakukan secara
manual dan tools memiliki gap yang cukup besar, hal ini dikarenakan perhitungan secara
manual hanya menggunakan sampel data dan perhitungan ini hanya digunakan untuk proses
simulasi. Sedangkan perhitungan dengan tools Rapidminer data yang digunakan adalah data
keseluruhan dan merupakan perhitungan yang sebenarnya. Sehingga dari kedua perhitungan
tersebut, hasil prediksi yang dapat digunakan oleh Pustu Mataram sebagai acuan adalah hasil
prediksi menggunakan tools Rapidminer

8
Pusat Kesehatan Masyarakat (Puskesmas) adalah unit pelaksanaan teknis dinas
kabupaten/kota yang bertanggung jawab menyelenggarakan pembangunan kesehatan di suatu
wilayah kerja. Puskesmas saat ini menjadi pilihan utama masyarakat untuk melakukan
pengobatan ataupun hal lainnya yang berhubungan dengan kesehatan dikarenakan lokasi yang
mudah dijangkau dan adanya program pengobatan gratis untuk masyarakat. nakan Pustu harus
mengatur persediaan obat agar nantinya dapat memonitor sekaligus memprediksi obat-obatan
untuk kedepannya. Manajemen pengaturan persediaan obat yang seharusnya dilakukan oleh
Pustu Mataram dengan cara memprediksi persediaan obat belum pernah dilakukan, sehingga
sering kali terjadi kekurangan persediaan dan permintaan obat untuk bulan berikutnya.
Adapun metode penelitian yang dilakukan untuk memprediksi jumlah persediaan obat
pada Pustu Mataram dengan menggunakan Algoritma Regresi Linier Berganda. Regresi Linier
Sederhana (Simple Regression) Regresi linier sederhana adalah sebuah metode yang digunakan
untuk menguji hubungan antara variabel bebas dan variabel terikat. Untuk melakukan analisa
regresi yaitu memerlukan perkiraan mengenai arah serta kekuatan dalam hubungan linier dan
variabel dengan melakukan pencarian mengenai koefisien korelasinya. Jika didapat
korelasinya berbeda dari nol, maka langkah berikutnya yaitu melakukan penjabaran dari suatu
persamaan untuk mengungkap hubungan linier antara dua variabel
Sebelumnya sudah dilakukan pencarian pola dengan menggunakan perhitungan secara
manual yaitu memprediksi persediaan obat Antasida sebagai sampel untuk tahun 2019,
selanjutnya akan dilakukan proses penemuan pola prediksi persediaan obat untuk tahun 2019
dengan bantuan tools Rapidminer. Tujuan dilakukannya analisis ini sendiri yaitu untuk
mengetahuai arah hubungan antara variabel independen dengan variabel dependen untuk
melihat prediksi apakah nilai dari variabel independen ini akan mengalami kenaikan atau
penurunan.

H. Analisis Dan Perbandingan Algoritma Data Mining Dalam Prediksi


Harga Saham GGRM
Investasi saham di pasar modal merupakan hal yang sangat bagi setiap perusahaan di
dunia. Harga saham di pasar modal bergerak secara acak, tinggi rendahnya harga saham
dipengaruhi oleh banyak faktor. Oleh karena itu, perlu prediksi harga saham sehingga dapat
membantu para investor untuk melihat prospek investasi di masa yang akan datang. Dalam
penelitian ini akan dilakukan prediksi harga saham GGRM dengan membandingkan beberapa
model algoritma yaitu Neural Network, Linear Regression, Support Vector Machine, Gaussian
Process, dan Polynomial Regression. Untuk mengukur tingkat akurasi dari tiap model
algoritma digunakan model validasi 10 Fold Cros Validation dan evaluasi menggunakan Root
Mean Square Error (RMSE). Hasil penelitian ini menyimpulkan bahwa data harga saham
GGRM dapat diprediksi dengan menggunakan model algortima Neural Network, dengan hasil
akurasi prediksi RMSE 612.474 +/- 89.402 (mikro: 618.916 +/- 0.000) paling kecil
dibandingkan dengan model algoritma lainnya, sehingga dengan prediksi ini dapat membantu
dalam memprediksi harga saham GGRM di pasar modal.
Pada era saat ini, Investasi saham di pasar modal pada setiap negara merupakan aset
yang sangat penting bagi setiap perusahaan di dunia. Sebab secara langsung maupun tidak,
investor dari seluruh dunia dapat memberikan dampak terhadap ekonomi pada negara tempat
berinvestasi. Saham merupakan surat berharga yang dikeluarkan oleh sebuah perusahaan yang

9
berbentuk Perseroan Terbatas (PT) atau yang biasa disebut emitmen. Saham menyatakan
bahwa pemilik saham tersebut adalah juga pemilik sebagian dari perusahaan tersebut .
Indonesia merupakan salah satu negara yang sangat aktif dalam investasi saham di
pasar modal. Pasar modal (capital market) merupakan pasar untuk berbagai instrument
keuangan jangka panjang yang bisa diperjual belikan, baik surat utang (obligasi), ekuiti
(saham), reksadana, instrument derivatif maupun instrument lainnya. Pasar modal merupakan
sarana pendanaan bagi perusahaan maupun institusi lain (misalnya pemerintah), dan sebagai
sarana bagi kegiatan berinvestasi. Dengan demikian, pasar modal memfasilitasi berbagai
sarana dan prasarana kegiatan jual-beli dan kegiatan terkait lainnya.
Harga saham di pasar modal berjalan secara acak. Tinggi rendahnya harga saham
dipengaruhi oleh banyak faktor seperti kondisi perekonomian, laju inflasi, penawaran dan
permintaan serta masih banyak lagi. Dengan kemungkinan perubahan faktor-faktor di atas
menyebabkan harga saham dapat naik atau turun. Para investor pada saat mengambil keputusan
untuk membeli, menahan, atau menjual saham memerlukan suatu informasi. Hasil prediksi
harga saham sangat membantu investor dalam mengambil keputusan. Hasil prediksi yang
akurat diperlukan untuk mengambil keputusan yang tepat. Oleh karena itu, perlu prediksi harga
saham sehingga bermanfaat bagi investor untuk dapat melihat bagaimana prospek investasi di
masa yang akan datang.
Ada beberapa penelitian tentang prediksi dengan menggunakan beberapa model
algortima yang mendukung penelitian ini. Dwi S. (2015) telah melakukan penelitian untuk
prediksi harga saham menggunakan algoritma Support Vector Machine (SVM). Penelitian ini
dilakukan prediksi dengan membandingkan variabel A (open, high, low, dan close) dengan
variabel B (open, high, low, close, dan factory news). Hasil penelitian menunjukkan variabel
A menghasilkan RMSE 4,695 dan variabel B menghasilkan RMSE 4,620.
Hasil penelitian ini menyimpulkan bahwa data harga saham GGRM dapat diprediksi
dengan menggunakan model algoritma Neural Network, dengan hasil akurasi prediksi RMSE
612.474 +/- 89.402 (mikro: 618.916 +/- 0.000) paling kecil dibandingkan dengan model
algoritma lainnya, sehingga dengan prediksi ini dapat membantu dalam memprediksi harga
saham GGRM di pasar modal.

I. Penerapan Data Maining Untuk Prediksi Penerima Bantuan Pangan


Non Tunai (BPNT) Di Desa Wanacala Menggunakan Metode Naïve
Bayes
Program Bantuan Pangan Non Tunai yang diadakan pemerintah seringkali tidak tepat
sasaran dikarenakan banyak faktor salah satunya adalah banyaknya kriteria yang harus
dipertimbangkan untuk menjadi sebuah keputusan penerima bantuan. Dari sebelas kriteria
yang ditetapkan membutuhkan algoritma yang tepat untuk melakukan perhitungan agar hasil
yang diberikan lebih akurat. Algoritma Naïve Bayes merupakan metode untuk klasifikasi
dengan menggunakan teori probabilitas yang memiliki tingkat akurasi tinggi. Pengujian
algoritma Naïve Bayes menggunakan tools Rapid Miner yang menghasilkan tingkat akurasi
sebesar 96% dari 50 data yang diberikan. Algoritma ini tepat digunakan untuk seleksi penerima
bantuan pangan non tunai. Terdapat 2 class yang dibutuhkan yaitu Layak dan Tidak Layak.

10
Desa Wanacala, Kecamatan Harjamukti, Kota Cirebon, merupakan salah satu desa
yang memiliki peranan penting untuk membantu berjalannya program pemberantasan warga
miskin yang diprogramkan oleh pemerintah pusat, yang mewajibkan setiap desa untuk mendata
masyarakatnya yang miskin. Bantuan Pangan Non Tunai (BPNT) adalah bantuan yang
diberikan pemerintah kepada warga miskin guna mengurangi beban ekonomi yang semakin
menekan kehidupan mereka. Kriteria yang digunakan untuk menentukan apakah seorang
warga layak atau tidak menerima BPNT yaitu kondisi hunian, penghasilan perbulan, dan
tanggungan. Dengan penilaian terhadap kriteria tersebut aparat desa dapat mempertimbangkan
dan memberikan keputusan urutan prioritas kelayakannya. Sistem penyaluran bantuan pangan
ini diatur dalam Peraturan Presiden Nomor 63 Tahun 2017 tentang Penyaluran Bantuan Sosial
Secara Non Tunai.
Naïve Bayes Classification merupakan salah satu metode machine learning yang
menggunakan perhitungan probabilitas. Konsep dasar yang digunakan oleh Naïve Bayes
adalah teorema bayes yaitu teorema dalam statistika untuk menghitung peluang, bayes optimal
classifier menghitung peluang dari suatu kelas dari masing-masing kelompok atribut yang ada,
dan menentukan kelas mana yang paling optimal.
Naïve Bayes dapat digunakan untuk meneliti berbagai macam hal, diantaranya adalah
prediksi penggunaan listrik rumah tangga, klasifikasi kelulusan mahasiswa, penentuan
kelayakan calon Tenaga Kerja Indonesia (TKI), dan lain-lain. Sebelumnya juga telah ada yang
melakukan penelitian yang serupa dengan menggunakan metode ini, namun atribut yang
digunakan berbeda. Adapun pembeda lainnya adalah penelitian tersebut dilakukan untuk
menentukan kelayakan penerima bantuan renovasi rumah. Penelitian tersebut dilakukan oleh
Bety Wulan Sari dan Donni Prabowo Vol.18 No.4 Tahun 2017 dengan judul “Tingkat akurasi
yang dihasilkan dari metode Naïve Bayes ini sudah cukup tinggi, oleh karena itu dapat
disimpulkan metode ini cocok untuk diimplementasikan pada penelitian ini. Penentuan
Kelayakan Penerima Bantuan Renovasi Rumah Warga Miskin Menggunakan Naïve Bayes
Berdasarkan hasil penelitian yang telah dilakukan mengenai prediksi untuk
menentukan penerima Bantuan Pangan Non Tunai dengan metode Naïve Bayes pada Desa
Wanacala, maka dapat diambil beberapa kesimpulan sebagai berikut:
1. Penerapan data mining menggunakan algoritma Naïve Bayes dapat digunakan
untuk memprediksi penerima BPNT dengan objektif berdasarkan kriteria kondisi
hunian, penghasilan perbulan, dan tanggungan. Sehingga memudahkan pengurus
desa dalam menentukan keluarga yang berhak menerima bantuan tersebut.
2. Dari pengujian yang dilakukan dengan membandingkan hasil analisa sistem dengan
data training pada tools Rapid miner menghasilkan tingkat akurasi sebesar 96% dan
error sebesar 4%, sedangkan evaluasi dengan kurva ROC dengan nilai Area Under
Curve (AUC) model algoritma Naïve Bayes adalah 0.979.
3. Setelah dilakukan pengujian untuk menentukan hasil prediksi penerima Bantuan
Pangan Non Tunai dengan mengunakan perhitungan manual dan menggunakan
tools Rapid Miner, didapatkan hasil prediksi yang sama.

11
J. Data Mining Untuk Prediksi Status Pasien Covid-19 Dengan
Pengklasifikasi Naïve Bayes
Pandemi Covid-19 di tahun 2020 menjadi masalah kesehatan yang kompleks dan
membutuhkan penanganan cepat serta kolaborasi solusi dari berbagai disiplin ilmu. Pasien
Covid-19 yang mendapatkan perawatan di rumah sakit memiliki kondisi dan tingkat keparahan
yang berbeda-beda. Hal ini berpengaruh pada tindakan penanganan yang akan dilakukan oleh
petugas medis. Banyaknya pasien serta kurangnya tenaga medis mengakibatkan perlunya
dukungan teknologi untuk membantu mengklasifikasikan status pasien berdasarkan kondisinya
agar penanganan dikonsentrasikan pada pasien yang sangat gawat dan membutuhkan
penanganan cepat. Penelitian ini menerapkan teknik prediksi dari disiplin ilmu data mining
untuk mengklasifikasikan status kegawatan pasien. Pengklasifikasi Naive Bayes di terapkan
untuk membangun model berdasarkan dataset pasien yang terinfeksi Covid-19. Dataset pasien
Covid-19 di Indonesia diperoleh dari www.kaggle.com dan diaplikasikan menggunakan
RapidMiner. Model yang dibangun dapat memprediksi status kegawatan pasien berdasarkan
usia dan jenis kelamin yang memiliki kemungkinan tertinggi untuk sembuh dari Covid-19 dan
pasien yang memiliki kemungkinan tinggi untuk tetap menjalani pengobatan dan atau
meninggal dunia. Hasil penelitian ini menunjukkan bahwa klasifikasi metode Naive Bayes
memiliki tingkat akurasi yang tinggi dalam mengklasifikasikan status pasien yaitu 96,67%.
Corona Virus Disease 2019 atau disingkat Covid-19 merupakan penyakit baru yang
muncul di tahun 2019 dan dapat menyebabkan radang paruparu dan gangguan pernapasan.
Penyakit ini disebabkan oleh Severe Acute Respiratory Syndrome Coronavirus 2 (SARS-CoV-
2) dan dapat menyebabkan kematian. Dunia tengah dilanda pandemi Covid-19 yang
melumpuhkan banyak sektor penting kehidupan baik di bidang ekonomi, sosial, dan keamanan.
Tatanan kehidupan dan tantangan akibat krisis Kesehatan global ini melanda semua negara di
dunia.
Pada bulan April 2021, angka kematian akibat virus Corona di Indonesia merupakan
yang tertinggi di Asia setelah China, dengan korban meninggal 41.815 orang. Jumlah total
kasus virus korona mencapai 1.537.967 kasus dengan 1.381.667 orang sembuh pada saat
makalah ditulis. Angka ini terus merangkak naik. Mengingat wabah Covid19 merupakan
masalah global di belahan dunia termasuk di Indonesia. Studi ini dilakukan sebagai bagian dari
upaya Mitigasi terhadap penyebaran penyakit Covid-19 di Indonesia.
Kebanyakan orang yang terinfeksi virus Covid-19 akan mengalami penyakit
pernapasan ringan hingga sedang dan sembuh tanpa memerlukan perawatan. Banyaknya pasien
yang di rumah sakit dan kapasitas tenaga medis menjadi permasalahan utama yang dihadapi di
berbagai daerah. Pasien dengan tingkat kegawatan tinggi memerlukan prioritas penanganan
dibanding pasien dengan gelaja sedang atau tanpa gejala. Tenaga medis memerlukan bantuan
untuk mengklasifikasi status pasien berdasarkan data pasien secara otomatis untuk mengurangi
kelelahan tenaga medis yang harus terus bertugas dan meminimalisir resiko penanganan yang
terlambat terhadap pasien.
Data mining adalah teknik yang digunakan untuk membangun model pembelajaran
mesin. Pembelajaran mesin (machine learning) adalah teknik kecerdasan buatan modern yang
belajar membangun model dengan menggunakan data empiris [11]. Data Mining digunakan
untuk menemukan pola dalam kumpulan besar data mentah. Data Mining menerapkan teknik

12
Machine Learning untuk menarik pengetahuan pada data. Dalam penelitian ini penulis
menerapkan teknik data mining untuk mengklasifikasikan dataset Covid-19 menggunakan
Algoritma Naive Bayes Classifier (NBC) karena NBC telah berhasil diterapkan dalam banyak
tugas klasifikasi berbasis probabilitas bersyarat pada populasi data [12].
Penelitian ini bertujuan memberikan solusi untuk mengklasifikasikan status pasien
Covid-19 secara otomatis berdasarkan gejala yang dialami pasien. Klasifikasi dilakukan
menggunakan algoritma Naïve-Bayes yang dikenal memiliki akurasi tinggi dengan
pembelajaran tersupervisi berbasis distribusi dataset. Pemilihan algoritma yang tepat
diharapkan dapat menghasilkan model klasifikasi yang baik dan berguna untuk
diimplementasikan secara riil pada penanganan dan skrining status kegawatan pasien Covid-
19.
Pada penelitian ini dikembangkan model Data Mining untuk prediksi status pasien
Covid-19 menggunakan algoritma Naive Bayes Classifier atau NBC. NBC digunakan karena
kehandalannya dalam mengklasifikasi data berdasarkan atribut-atribut yang dimiliki, baik
berupa nilai numerik maupun kategorik. Model dibangun menggunakan dataset pasien Covid-
19 yang didapat dari website www.kaggle.com dan diimplementasikan menggunakan
perangkat lunak RapidMiner. Hasil dari model NBC untuk prediksi status pasien Covid19 di
Indonesia memberikan hasil yang diukur dalam nilai presisi, recall, dan akurasi, berturut -turut
nilainya 92%, 88.72%, dan 96.67%. Nilai akurasi yang tinggi menunjukkan kinerja NBC yang
baik dalam mengklasifikasikan tiga status pasien, yaitu isolated, released, dan deceased. Hasil
dari penelitian ini bermanfaat untuk diterapkan pada situasi nyata, untuk membantu tenaga
medis menentukan tindakan. Ke depan, jumlah dataset nyata dan berukuran besar dengan
proporsi nilai setiap kelas yang seimbang sangat baik untuk mendapatkan akurasi prediksi yang
lebih tinggi.

2.2 Tinjauan Pustaka

13
14
15
BAB III
PENUTUP

3.1 Kesimpulan

Data mining adalah proses menemukan anomali, pola, maupun korelasi dalam data set
yang besar untuk memprediksi hasil. Dasar dari data mining sendiri berkaitan dengan disiplin
ilmu seperti statistik, AI, machine learning, dan teknologi database. Data mining juga dikenal
dengan sebutan lain seperti data atau pattern analysis, knowledge discovery, knowledge
extraction, dan information harvesting.

Pada dasarnya keberadaan data mining dibutuhkan mengingat semakin banyaknya


informasi di era teknologi seperti data transaksi bisnis, data ilmiah, gambar, video dan data-
data lainnya. Dengan banyaknya data tersebut dibutuhkan sistem yang mampu mengekstraksi
esensi dari semua informasi yang tersedia dan membuat ringkasan untuk membantu
pengambilan keputusan yang lebih baik.

3.2 Saran

Penerapan data mining pada penelitian yang menggunakan beberapa metode untuk
fungsi klasifikasi dapat dilakukan perbandingan dengan algoritma lainnya untuk kasus yang
sama. Sehingga dapat diketahui algoritma yang mana yang lebih baik untuk diterapkan pada
bidang ini.

16
DAFTAR PUSTAKA

Agusta, Yudhi. 2007. ‘K-meanspenerapan permasalahan dan metode terkait’. Jurnal Sistem
dan Informatika, Vol 3

Baradwaj, B. K., & Pal, S. (2011). Mining Educational Data to Analyze Students‟
Performance. International Journal of Advanced Computer Science and Applications

Borkar, S., & Rajeswari, K. (2014). Atributes Selection for Predicting Student's Academic
Performance using Education Data miningand Artificial Neural Network. International
Journal of Computer Applications

C, D. A., Baskoro, D. A., Ambarwati, L., & Wicaksana , I. S. (2013). Belajar Data
miningDengan Rapid Miner. Jakarta: Remi Sanjaya

Herdianto. (2013). Prediksi Kerusakan Motor Induksi Menggunakan Metode Jaringan Saraf
Tiruan Back propagation”. Universitas Sumatera Utara, 8

Indrawan, B. R. (2018). Penerapan Algoritma K-meansUntuk Menentukan Strategi Promosi


Universitas Islam Negeri Sunan Kalijaga Yogyakarta. 34.

17

Anda mungkin juga menyukai