Anda di halaman 1dari 8

Perbandingan Analisis Klasifikasi Data Nilai Akhir Mata

Kuliah Teori Peluang Aktuaria Tahun 2023 dengan


Menggunakan Metode Decision Tree dan Naïve Bayes
Agnes Monika Simalango1, Jean Sharon Patricia Ginting2, Karine Yoshefa Marybhoto Sitinjak3, Restu
Apriani Zul’aina4, Sesilia Audrey E5.
1,2,3,4,5
Program Studi Sains Aktuaria, Institut Teknologi Sumatera, Indonesia
Jl. Terusan Ryacudu, Way Huwi, Kec. Jati Agung, Kabupaten Lampung Selatan, Lampung 35365
Telp: (0721) 8030188, (0721) 8030189
Email:

ABSTRAK

Penilaian belajaran mahasiswa merupakan atribut terpenting dalam suatu proses pembelajaran. Nilai akhir
dapat digunakan untuk mengevaluasi dan memprediksi kelulusan mahasiswa terhadap mata kuliah yang
diikuti selama satu semester. Penelitian ini dilakukan untuk menganalisis algoritma Naïve Bayes dan
Decision/Classification Trees dalam mengklasifikasi kelulusan mahasiswa berdasarkan nilai akhir pada
salah satu mata kuliah. Penelitian ini bermanfaat bagi pembaca untuk menentukan algoritma terbaik yang
dapat digunakan dalam metode klasifikasi. Hasil penelitian ini menunjukkan bahwa metode Naïve Bayes
mempunyai akurasi yang lebih besar dalam probabilitas kebenaran data dibandingkan dengan Decision
Tree. Selisih nilai yang diperoleh sebesar 7,69% dimana metode Naïve Bayes mempunyai akurasi data
lebih besar 7,69% dibandingkan metode Decision Tree.
Kata kunci : klasifikasi, educational data mining, Naïve Bayes , Decision/Classification Trees

ABSTRACT

Student learning assessment is the most major attribute in a learning process. Final grades can be use to
evaluate and predict student graduation in the courses they take during one semester. This research
conducted to analyze the Naïve Bayes and Decision/Classification Trees algorithms in classifying student
graduation based on the final grade in one of the courses. This research is helpful for readers to determine
the best algorithm that can be use in classification methods. The results of this research show that the
Naïve Bayes method has greater accuracy in the probability of data truth than the Decision Tree method.
The difference in value obtained was 7.69%, where the Naïve Bayes method had a data accuracy value of
7.69% greater than the Decision Tree method.

Keywords: classification, educational data mining, Naïve Bayes, Decision/Classification Trees


1. PENDAHULUAN Decision/Classification Trees, Naïve Bayes
Perguruan tinggi merupakan jenjang pendidikan Classifiers, Genetic Algorithms, Rough Sets, K-
formal yang memiliki tujuan utama untuk Nearest Neighbor Classifier, Rule-based Methods,
menyediakan pendidikan berkualitas bagi Memory Based Reasoning, Support Vector
mahasiswa. Dalam mencapai pendidikan yang Machines, Random Forest. Dengan banyaknya
berkualitas dalam perguruan tinggi, diperlukannya pilihan algoritma yang bisa digunakan serta kondisi
analisis lebih lanjut komponen utama yang pengujian yang berbeda-beda memberikan
mempengaruhi penilaian pembelajaran mahasiswa kesulitan untuk dapat mengidentifikasi algoritma
(Pekuwali, Andriyani, & Trisnawati, 2018). Pada terbaik yang dapat digunakan.
perguruan tinggi setiap pengajar atau dosen Decision/Classification Trees merupakan teknik
memiliki kewajiban untuk memberikan penilain data mining yang digunakan untuk mengeksplorasi
terhadap hasil belajar untuk setiap mata kuliah pada data dengan membagi kumpulan data yang besar
setiap akhir semester. Berdasarkan Peraturan menjadi himpunan record yang lebih kecil dan
Pemerintah Nomor 49 tahun 2014 menjelaskan memperhatikan variabel tujuannya. Pohon
bahwa penilaian pembelajaran adalah kriteria keputusan sangat baik untuk menyelesaikan
minimal tentang penilaian proses dan hasil belajar permasalahan klasifikasi data. Keuntungan utama
mahasiswa dalam rangka pemenuhan capaian dari suatu Decision/Classification Trees adalah
pembelajaran lulusan. Hal ini dikenal sebagai Data kemampuannya untuk melakukan visualisasi data.
Nilai Akhir (DNA), yang berisi akumulasi (Budiman & Parandani, 2017). Sedangkan Naïve
penilaian dari hasil yang dicapai mahasiswa berupa Bayes Classifier (NBC) adalah salah satu dari
persentase nilai dari kuis, tugas terstruktur, Ujian algoritma supervised document classification yang
Tengah Semester (UTS), Ujian Akhir Semester sederhana namun efisien. Model probabilistik dari
(UAS), serta keaktifan mahasiswa saat di kelas algoritma ini didasarkan pada teori Bayes. Naive
dengan bobot yang telah ditentukan. Nilai akhir Bayes Classifier telah diterapkan di berbagai
dinyatakan dalam huruf dan angka berdasarkan bidang, seperti: kedokteran, perbankan,
range nilai yang diperoleh. perpustakaan, instansi perkantoran, dll.
Bertambahnya jumlah data yang tersimpan pada Permasalahan klasifikasi yang sering dipecahkan
basis data perguruan tinggi, membuat eksplorasi dengan NBC antara lain seperti: diagnosa penyakit
pada data yang berukuran besar tidak dapat dan pembuatan keputusan pada prosedur
dilakukan dengan mudah. Namun dengan perawatannya, penyaringan spam pada email
berkembangnya teknologi serta ilmu statistika clients, analisis sentimen, prediksi kelayakan calon
maka diperlukannya pengolahan data yang berasal nasabah asuransi, dll (Pujianto, Widiyaningtyas,
dari konteks pendidikan menjadi suatu informasi Prasetya, & Romadhon, 2017).
yang dikenal sebagai Educational Data Mining Sehingga pada penelitian ini penulis ingin
(EDM). Data mining dibagi menjadi beberapa membandingkan metode Decision/Classification
metode berdasarkan tugas yang dapat dilakukan Trees dan Naïve Bayes dengan metode klasifikasi
salah satunya adalah klasifikasi. Clustering terhadap kelulusan mahasiswa pada nilai akhir
merupakan salah satu teknik data mining yang mata kuliah teori peluang aktuaria tahun 2023.
berfungsi melakukan pengelompokan sejumlah
data atau objek ke dalam cluster (group) sehingga a. Rumusan Masalah
setiap cluster akan berisi data yang semirip Adapun masalah yang akan peniliti angkat adalah :
mungkin dan berbeda dengan objek dalam cluster 1. Bagaimana cara mengekstrasi dan menganalisa
yang lainnya. Teknik klasifikasi merupakan nilai hasil pembelajaran mahasiswa ?
pendekatan fungsi klasifikasi dalam data mining 2. Bagaimana akurasi algoritma
yang digunakan untuk melakukan prediksi atas Decision/Classification Trees dan Naïve
informasi yang belum diketahui sebelumnya. Bayes dalam mengklasifikasi kelulusan
Teknik klasifikasi ini dapat pula digunakan untuk mahasiswa ?
melakukan prediksi atas informasi yang belum
diketahui sebelumnya (Suprawoto, 2016). b. Tujuan Penelitian
Oleh karena itu perlu dilakukan analisis mengenai Adapun tujuan dari penelitian ini yaitu:
hasil belajar mahasiswa, sehingga dari hasil analisis 1. Melakukan klasifikasi nilai akhir mata kuliah
tersebut dapat diperoleh metode terbaik untuk teori peluang aktuaria tahun 2023
mengklasifikasikan tingkat kelulusan mahasiswa menggunakan metode Decision/Classification
dengan cara membandingkan tingkat akurasinya. Trees dan Naïve Bayes untuk mendapatkan
Data penilaian terdiri dari dari sejumlah nilai yaitu klasifikasi nilai mahasiswa dengan tingkat
kuis, tugas terstruktur, keaktifan, ujian tengah akurasi yang baik.
semester, ujian akhir semester, serta total nilai mata 2. Membandingkan nilai akurasi metode decision
kuliah teori peluang aktuaria pada tahun 2023. tree dan naïve bayes sehingga dapat
Algoritma yang biasa digunakan dalam data mining dikategorikan sebagai metode klasifikasi yang
dengan metode klasifikasi yaitu baik.
sebuah institusi untuk mengambil keputusan yang
2. TINJAUAN PUSTAKA akurat dan juga untuk memprediksi hasil siswa.
2.1 Data mining Dengan hasilnya institusi dapat berfokus pada
Secara umum Data Mining terbagi atas 2 (dua) kata materi yang diajarkan serta cara mengajar. Pola
berikut. belajar siswa dapat diambil dan digunakan untuk
a. Data yaitu Kumpulan Fakta yang terekam atau mengembangkan teknik mengajar para tenaga
sebuah entitas yang tidak memiliki arti dan pendidik. (Gede Aditra Pradnyana).
selama ini terabaikan.
b. Mining yaitu proses Penambangan sehingga, 2.3 Klasifikasi
Data Mining itu dapat diartikan sebagai proses Suatu teknik dengan melihat pada kelakuan dan
penambangan data yang menghasilkan sebuah atribut dari kelompok yang telah didefinisikan.
output (keluaran) berupa pengetahuan. Teknik ini dapat memberikan klasifikasi pada data
Data mining adalah sebuah proses pencarian secara baru dengan memanipulasi data yang telah
otomatis informasi yang berguna dalam tempat diklasifikasi dan dengan menggunakan hasilnya
penyimpanan data berukuran besar. Teknik data untuk memberikan sejumlah aturan. Klasifikasi
mining digunakan untuk memeriksa basis data termasuk kedalam supervised learning.
berukuran besar sebagai cara untuk menemukan Proses klasifikasi terdiri atas dua langkah yaitu:
pola yang baru dan berguna.  learning step: di mana klasifikasi model
dibangun
Secara garis besar terdapat 2 pendekatan untuk  classification step: di mana model digunakan
melakukan teknik - teknik data mining di atas, untuk memprediksi kelompok kelas untuk data
yaitu: tertentu
a. Supervised Learning yaitu pembelajaran (Han, Kamber, & Pei, 2001).
menggunakan guru dan biasanya ditandai
dengan adanya class/label/target pada 2.4 Decision/Classification Trees
himpunan data. Supervised learning Decision tree merupakan metode klasifikasi data
merupakan sebuah pendekatan dimana sudah mining. Decision tree dalam istilah pembelajaran
terdapat data yang dilatih, dan terdapat merupakan sebuah struktur pohon dimana setiap
variabel yang ditargetkan sehingga tujuan dari node pohon mempresentasikan atribut yang telah
pendekatan ini adalah mengelompokan suatu diuji. Setiap cabang merupakan suatu pembagian
data ke data yang sudah ada. Adapun teknik-
hasil uji dan node daun (leaf) mempresentasikan
teknik yang digunakan yang bersifat
kelompok kelas tertentu. Level node teratas dari
supervised learning seperti Teknik Prediksi
sebuah Decision Tree adalah node akar (root) yang
dan Klasifikasi seperti Algoritma C4.5, Teknik
biasanya berupa atribut yang paling memiliki
Rough Set dan lain-lain.
pengaruh terbesar pada suatu kelas tertentu. Secara
b. Unsupervised Learning yaitu pembelajaran
umum Decision/Classification Trees merupakan
tanpa menggunakan guru dan biasanya
metode yang sangat popular dan banyak digunakan
ditandai pada himpunan datanya tidak
karena praktis serta mempunyai akurasi yang baik
memiliki atribut keputusan atau
(Han, Kamber, & Pei, 2001).
class/label/target. Perbedaan dengan
supervised learning, pada unsupervised
learning tidak memiliki data latih, sehingga
dari data yang ada dikelompokan menjadi 2
bagian atau 3 bagian dan seterusnya. Adapun
teknik-teknik yang bersifat Unsupervised
Learning yaitu Teknik Estimasi, Clustering,
dan Asosiasi seperti Regresi Linier, Analytical
Hierarchy Clustering dan lain-lain. (Gede
Aditra Pradnyana).

2.2 Educational data mining


Pada bidang pendidikan, muncul bidang baru yang Gambar 2.4 1 Ilustrasi cara kerja Decision Trees
disebut Educational Data Mining (EDM). Bidang (sumber : medium.com)
tersebut berkaitan dengan teknik pengembangan
yang menemukan pengetahuan dari data yang 2.5 Naïve Bayes
berasal dari lingkungan pendidikan. Tujuan EDM Naïve Bayes merupakan sebuah metode
sebagai prediksi perilaku belajar di masa depan penggolongan dengan pendekatan analisis data
siswa, mempelajari dampak dukungan pendidikan, statisktika yang didasari oleh probabilitas
dan memajukan pengetahuan ilmiah tentang sederhana dan dirancang untuk dipergunakan
pembelajaran. Data mining dapat digunakan oleh dengan asumsi bahwa antar satu kelas dengan kelas
yang lain tidak saling tergantung (Browne, 2006). 57 97 95 50 86 76,8 Ya
Menurut (Han, Kamber, & Pei, 2001) klasifikasi Tabel 3 1Data Nilai Akhir mata kuliah Teori Peluang Aktuaria
Tahun 2023
Naïve Bayes terbukti memiliki akurasi dan
kecepatan yang tinggi saat diaplikasikan ke dalam Berdasarkan tabel diatas, berikut variabel yang
basis data dengan jumlah yang besar. Cara kerja digunakan dalam penelitian:
Naïve Bayes didasari oleh teorema Bayes yang
bekerja dengan prinsip probabilitas bersyarat Variabel Keterangan
(conditional probability). Berikut rumus Y Lulus
probabilitas bersyarat. X1 Kuis
X2 Tugas
P ( B| A ) P( A) X3 Keaktifan
P ( A|B )= X4 UTS
P(B)
X5 UAS
Dengan, X6 Total
Tabel 3 2 Variabel penelitian klasifikasi Data Nilai Akhir mata
P(A| = Probabilitas bersyarat A yang kuliah Teori Peluang Aktuaria tahun 2023
B) diberikan oleh B
P(B| = Probabilitas bersyarat B yang 3.2 Prosedur Penelitian
A) diberikan oleh A Langkah- langkah yang harus dilakukan dalam
P(A) = Probabilitas kejadian A penelitian ini adalah sebagai berikut:
P(B) = Probabilitas kejadian B 3.2.1 Menggunakan metode Decision Tree
1. Mengumpulkan data dari Data Nilai
Akhir mata kuliah Teori Peluang
3. METODE PENELITIAN Aktuaria tahun 2023.
3.1 Data 2. Mendeskripsikan data dengan
Data yang digunakan dalam penelitian ini adalah menentukan struktur data.
Data Nilai Akhir Mahasiswa Sains Aktuaria pada 3. Membagi data menjadi data training
mata kuliah Teori Peluang Aktuaria tahun 2023 dan dan data testing, kemudian klasifikasi
merupakan data sekunder. Data diperoleh dari data training dengan Decision Tree
publikasi yang dilakukan tim Dosen Sains Aktuaria 4. Membuat plot Decision Tree.
ITERA sebagai nilai akhir pada mata kuliah Teori 5. Prediksi data testing dalam menentukan
Peluang Aktuaria semester 4 tahun ajaran 2023/ akurasi peluang data dengan metode
2024. Variabel yang digunakan pada data Decision Tree.
berjumlah sebanyak 7 variabel, yakni Kuis (X 1), 6. Menarik kesimpulan.
Tugas (X2), Keaktifan (X3), Ujian Tengah Semester
(UTS) (X4), Ujian Akhir Semester (UAS) (X 5), 3.2.2 Menggunakan metode Naïve Bayes
Total dan Lulus (Y). Variabel yang menjadi 1. Mengumpulkan data dari Data Nilai Akhir
variabel response adalah Lulus dan variabel mata kuliah Teori Peluang Aktuaria tahun
lainnya akan menjadi data inputan yang 2023.
menghasilkan nilai dari variabel Lulus, pengolahan 2. Mendeskripsikan data dengan menentukan
data dilakukan dengan menggunakan software R struktur data.
Studio. 3. Membagi data menjadi data training dan
Berikut tampilan Data Nilai Akhir pada mata data testing, kemudian klasifikasi dengan
kuliah Teori Peluang Aktuaria tahun 2023. menggunakan metode Naïve Bayes.
4. Menghitung nilai prediksi dan kinerja
Kui Tug Kea U U Tot Lulus prediksi untuk menentukan akurasi
s as ktif T A al peluang data dengan metode Naïve Bayes.
an S S 5. Menarik kesimpulan.
11 50 95 35 32 41,1 Tidak
94 95 95 67 98 88,4 ya 4. HASIL DAN PEMBAHASAN
3 98 95 20 20 43,7 Tidak 4.1 Metode Decision Tree
10 93 95 26 36 49,7 Ya 4.1.1 Menentukan struktur data
80 97 95 52 64 72,9 Ya Data diimport kan ke dalam soft ware R Studio,
37 98 95 45 29 56,7 Ya kemudian menentukan struktur data tiap variabel
33 98 95 19 16 45,2 Tidak pada Data Nilai Akhir Mahasiswa Sains Aktuaria
51 95 95 49 68 70,0 Ya pada mata kuliah Teori Peluang Aktuaria tahun
54 97 95 43 65 68,3 Ya 2023.
29 93 95 60 65 69,5 Ya
34 93 95 51 66 68,1 Ya
Model data training yang telah didapatkan akan
dibuat menjadi plot (grafik) untuk memudahkan
membaca peluang dari klasifikasi yang dilakukan
menggunakan packages “rpart”, “rpart.plot”.

Gambar 4 3 plot Decision Tree

Gambar 4 1 Keluaran (output) struktur data tiap variabel pada Plot yang dihasilkan seperti pada gambar diatas
Data Nilai Akhir mata kuliah Teori Peluang Aktuaria tahun
2023
memiliki hasil bahwa pada data training,
4.1.2 Klasifikasi menggunakan metode Decision mahasiswa yang dikatakan lulus pada mata kuliah
Tree Teori Peluang Aktuaria memiliki presentase
sebesar 71%, sedangkan mahasiswa dikatakan
Data Nilai Akhir mata kuliah Teori Peluang tidak lulus memiliki persentase sebesar 29%.
Aktuaria tahun 2023 dibagi menjadi dua tipe data
yaitu data training dan data testing, dimana 80%
bagian adalah data training dan 20% bagian adalah
4.1.4 Prediksi data testing dalam menentukan
data testing. Kemudian, membuat model data
Akurasi Data dengan metode Decision Tree.
training dengan metode Decision Tree, packages
yang digunakan adalah “party” pada R Studio. Plot yang dihasilkan pada langkah sebelumnya
adalah menggunakan data training, sehingga dalam
menentukan prediksi menggunakan 20% bagian
pada Data Nilai Akhir mata kuliah Teori Peluang
Aktuaria tahun 2023 yaitu data testing. Packages
yang digunakan adalah “caret” dengan fungsi
“confusionMatrix.

Gambar 4 2 Model data training pada Data Nilai Akhir mata


kuliah Teori Peluang Aktuaria tahun 2023

4.1.3 Plot Decision Tree


Gambar 4 5Struktur Data Nilai Akhir mata kuliah Teori
Peluang Aktuaria tahun 2023

4.2.1Klasifikasi menggunakan metode Naïve Bayes


Klasifikasi Naïve Bayes menggunakan packages
yang berbeda dengan metode Decision Tree, yaitu
menggunakan packages “e1071” dan “caret”,
dimana pada klasifikasi metode ini menggunakan
data yang sama yaitu data training, dengan function
Gambar 4 4Prediksi data testing dalam menentukan akurasi
data dengan metode Decision Tree yang digunakan adalah “naiveBayes”.

Prediksi data testing yang telah dilakukan


menghasilkan nilai akurasi data sebesar 88,46%,
sensitivitas sebesar 100% (prediksi sepenuhnya
benar), spesitivitas sebesar 85,00%.

4.2 Metode Naïve Bayes

4.2.1 Menentukan struktur data


Sama halnya dengan metode Decision Tree,
metode Naive Bayes juga memerlukan penentuan
dalam struktur data dengan tipe data “factor” akan
menjadi tipe data pada variable response yaitu
“Lulus”.

Gambar 4 6 Model klasifikasi menggunakan metode Naive


Bayes
4.2.3 Prediksi data testing dalam menentukan
Akurasi data dengan metode Naïve Bayes

Akurasi data dengan menggunakan metode Naïve


Bayes menggunakan packages yang sama dengan
metode Decision Tree yakni packages “caret” 6.DAFTAR PUSTAKA
dengan fungsi “confusionMatrix”.

Gambar 4 7 Prediksi data testing dalam menentukan akurasi


data menggunakan metode Naive Bayes

Prediksi data testing yang telah dilakukan


menghasilkan nilai akurasi data sebesar 96,15%,
sensitivitas sebesar 100% (prediksi sepenuhnya
benar), spesitivitas sebesar 95,00%.

5. KESIMPULAN
Kebenaran suatu data ditentukan dari seberapa
besar akurasi data yang didapatkan melalui metode
yang ada, dimana pada penelitian ini menggunakan
dua metode yaitu Decision Tree dan Naïve Bayes.
Berdasarkan perhitungan yang telah dilakukan
menggunakan kedua metode, menghasilkan bahwa
metode Naïve Bayes memiliki akurasi peluang
kebenaran data yang lebih besar dibandingkan
dengan metode Decision Tree. Selisih nilai yang
didapatkan adalah sebesar 7,69%, dimana dengan
metode Naïve Bayes memiliki nilai akurasi data
yang lebih besar 7,69% dibandingkan dengan
menggunakan metode Decision Tree. Dengan
demikian, dalam perbandingan analisis klasifikasi
metode Decision Tree dan Naïve Bayes, metode
klasifikasi Naïve Bayes dapat disimpulkan menjadi
metode yang lebih baik dibandingkan
menggunakan analisis klasifikasi metode Decision
Tree.
Browne, M. W. (2006). LECTURE NOTES IN DATA MINING. World Scientific Publishing .

Gede Aditra Pradnyana, S. M. (n.d.). Konsep Dasar Data. Retrieved from pustaka.ut:
https://pustaka.ut.ac.id/lib/wp-content/uploads/pdfmk/MSIM4403-M1.pdf

Han, J., Kamber, M., & Pei, J. (2001). Data Mining Concepts and Techniques. United States: Elsevier Inc.

Irfan, M. I. (2023, January 1). Algorima Naive Bayes. Retrieved from rpubs.com:
https://rpubs.com/IbadullahIrfan383/994511

M.Kom, P. D., & U’un Setiawati, S. (2021, January 12). Metode Klasifikasi Naive Bayes, Random Forest dan
Decicion Tree untuk Memprediksi Kanker Payudara Menggunakan Rstudio. Retrieved from
rpubs.com: https://rpubs.com/uuns/klasifikasi

Pekuwali, A. A., Andriyani, & Trisnawati, H. (2018). PROSIDING SEMMAU 2018. REDIKSI PENILAIAN
HASIL BELAJAR MAHASISWA NAÏVE BAYESIAN, 647-653.

Tsyukdiah, H. (2020, July 18). Klasifikasi Decision Tree dengan R. Retrieved from medium.com:
https://halimatusyak.medium.com/klasifikasi-decision-tree-dengan-r-f12a0e48e060

Anda mungkin juga menyukai