Anda di halaman 1dari 15

LITERATUR REVIEW : KLASIFIKASI DATA MINING PENGOLAHAN DATA

MAHASISWA
(LITERATURE REVIEW: CLASSIFICATION OF DATA MINING STUDENT DATA
PROCESSING)

BILLI MAHARDIKA
UNIVERSITAS BINADARMA PALEMBANG

ABSTRAK
Pendahuluan:Berlimpahnya data mahasiswa dan data jumlah kelulusan
mahasiswa,informasi yang tersembunyi dapat diketahui dengan cara melakukan
pengolahan terhadap data mahasiswa sehingga berguna bagi pihak perguruan
tinggi. Pengolahan data mahasiswa perlu dilakukan untuk mengetahui informasi pent ing
berupa pengetahuan baru (knowledge discovery), Metode : literature review dilakukan
berdasarkan issue, metodologi,persamaa. hasil : berdasarkan hasil 9 penelitian
inimenggunakan Algoritma klasifikasi terdiri dari 6 bagian terdiri dari : Decision Tree Analysis
(Analisa Pohon Keputusan)Decision tree analysis (atau analisa pohon keputusan adalah suatu teknik
yang termasuk keluarga machine-learning) bisa dibilang teknik klasifikasi yang paling popular pada
area data mining. Statistical Analysis (Analisa Statistik
Kata Kunci : klasifikasi, mahasiswa, pengolahan data
ABSTRACT
Introduction: The abundance of student data and data on the number of student graduations, hidden
information can be found by processing student data so that it is useful for the university. Processing of
student data needs to be done to find out important information in the form of new knowledge
(knowledge discovery). Method: Literature review is carried out based on issues, methodology,
equations.result : Decision Trees) Decision tree analysis (or decision tree analysis is a technique that
belongs to the machine-learning family) is arguably the most popular classification technique in the
data mining area. Statistical Analysis
Keywords: classification, students, data processing
PENDAHULUAN keputusan strategis.Pendidikan memiliki
Perguruan tinggi saat ini dituntut untuk peran yang sangat penting untuk
memiliki keunggulan bersaing dengan meningkatkan dan mempersiapkan sumber
memanfaatkan semua sumber daya yang daya manusia (SDM) yang unggul dan
tersedia. Bukan hanya sumber daya sarana, berdaya saing tinggi. Disinilah peran
prasarana dan manusia, sistem informasi institusi pendidikan tinggi menjadi sangat
merupakan salah satu sumber daya yang penting dalam menciptakan tenaga ahli
dapat digunakan untuk memperoleh, yang mampu mengembangkan ilmu
mengolah dan menyebarkan informasi agar pengetahuan dan memberi sumbangan
dapat menunjang operasional sehari-hari kepada pembangunan. Perguruan tinggi
sekaligus menunjang kegiatan pengambilan sebagai salah satu institusi pendidikan,
dituntut untuk dapat menyelenggarakan teknik yang termasuk keluarga machine-
pendidikan yang bermutu dan berkualitas learning) bisa dibilang teknik klasifikasi
kepada stakeholder-nya[1]. Berlimpahnya yang paling popular pada area data mining.
data mahasiswa dan data jumlah kelulusan Statistical Analysis (Analisa Statistik)[3]
mahasiswa,informasi yang tersembunyi Teknik-teknik statistik pada awalnya
dapat diketahui dengan cara melakukan adalah algoritma klasifikasi yang popular
pengolahan terhadap data mahasiswa selama bertahun-tahun sampai dengan
sehingga berguna bagi pihak perguruan kemunculanteknik-teknik
tinggi. Pengolahan data mahasiswa perlu ‘machinelearning’.Teknik-teknik
dilakukan untuk mengetahui informasi klasifikasi statistik antara lain ‘logistic
penting berupa pengetahuan baru regression’ (regresi logistik) dan
(knowledge discovery), misalnya informasi discriminant analysis (analisa
mengenaipengklasifikasian data mahasiswa diskriminan), keduanya berasumsi bahwa
berdasarkan profil dan data akademik. hubungan antara variabel input dan output
Pengetahuan baru tersebut dapat membantu pada dasarnya adalah linear, data
pihak perguruan tinggi untuk melakukan terdistribusi normal, dan variabel-variabel
klasifikasi mengenai tingkat kelulusan tidak saling terkait dan tidak tergantung
mahasiswa guna menentukan strategi untuk satu sama lain. Sifat-sifat dasar asumsi yang
meningkatkan kelulusan pada tahun-tahun diragukan ini akhirnya membawa
berikutnya. Data mining adalah pergeseran ke arah teknik-teknik
serangkaian proses untuk menggali nilai ‘machinelearning’. Neural Networks
tambah berupa informasi yang selama ini (Jaringan Syaraf Tiruan) Ini adalah salah
tidak diketahui secara manual dari suatu satu diantara teknik-teknik dalam
basis data dengan melakukan penggalian ‘machine-learning’ yang paling popular
pola-pola dari data dengan tujuan untuk yang bisa digunakan untuk problem-
memanipulasi data menjadi informasi yang problem klasifikasi. Case-Based Reasoning
lebih berharga yang diperoleh dengan cara (Penalaran Berbasis Kasus) Pendekatan ini
mengekstraksi dan mengenali pola yang menggunakan kasus historis untuk
penting atau menarik dari data yang mengenali berbagai kesamaan untuk
terdapat dalam basis data[2]. Algoritma menentukan suatu kasus baru ke dalam
klasifikasi terdiri dari 6 bagian terdiri dari : kategori yang paling mungkin. Bayesian
Decision Tree Analysis (Analisa Pohon Classifiers (Klasifikasi Bayesian)
Keputusan)Decision tree analysis (atau Pendekatan ini menggunakan teori
analisa pohon keputusan adalah suatu probabilitas untuk membuat model-model
klasifikasi berdasarkan kejadian-kejadian ditemukan telah menggunakan Bahasa
di masa lalu yang bisa untuk menempatkan Indonesia. Setiap pertanyaan tersebut telah
suatu instans baru ke dalam kelas mengkuti PICOT dimana setiap pertanyaan
(ataukategori) yang paling mungkin. terdapat P= problem/mahasiswa/populasi,
Genetic Algorithms (Algoritma Genetik) I/E= implementasi/intervensi/exposure, C=
Penggunaan analogi terhadap evolusi alami control/intervensi perbandingan, O= hasil
untuk membuat mekanisme berbasis dan T=time. Hal ini relevan yang penulis
pencarian yang terarah untuk digunakan untuk mendapatkan jurnal
mengklasifikasikan sampel-sampel data. tentang klasifikasi data mining pengolahan
BAHAN DAN METODE data mahasiswa. Penulis mengambil semua
Pada bab ini dibahas strategis dalam desain dalam penelitian yang digunakan
mencari jurnal yang digunakan dalam dalam mengidentifikasi data mahasiswa.
literature review, dalam pertanyaan yang HASIL
digunakan untuk melakukan review jurnal 1. Penekanan masalah yang diangkat
yang sesuai dengan PICOT dan istilah untuk penelitian
pencarian jurnal melalui MESH, Batasan Pada penelitian Inna Alvi nikmatum (2019)
yang diambil jurnal dan hal lainnya. Jurnal dan Indra waspada memiliki masalah
tersebut digunakan dalam literature review Ketepatan waktu mahasiswa dalam
yang didapatkan melalui databases yang menyelesaikan studi dan proporsi
menyediakan jurnal scientific Indonesia mahasiswa yang menyelesaikan studi
melalui google scholar. Penulis membuka dalam batas masa studi termasuk dalam
beberapa website seperti elemen penilaian akreditasi. 75.95%[4].
https://garuda.kemdikbud.go.id/,www.sear Pada penelitian Marina windarti (2019) dan
ch.proquest.com, dan www. Google agustinus suradi (2019) yang memiliki
scholar.com. peneliti menuliskan kata masalah yang dapat mempengaruhi kualitas
kunci sesuai dengan MESH (medical sebuah perguruan tinggi adalah kinerja
subject heading) yaitu mahasiswa yang dapat diukur melalui
“pengolahan”,”data”,”mahasiswa” dan lamanya masa studi[5]. Pada penelitian
dipilih full text muncul 100 temuan, Wiwit supriyanti(2018), dan nona
kemudian dipersempit dengan yang puspitasari(2018) memiliki masalah
dissertation dan theses dan temukan 15 Pengolahan data mahasiswa perlu
temuan selanjutnya diurutkan dari yang dilakukan untuk mengetahui informasi
terbaru. Mengenai pemilihan Bahasa tidak penting berupa pengetahuan baru
dilakukan karena semua jurnal yang (knowledge discovery), misalnya informasi
mengenai pengklasifikasian data memudahkan pengguna sistem . Pada
mahasiswa berdasarkan profil dan data penelitian ini menggunakan tools WEKA.
akademik. Pengetahuan baru tersebut dapat Data yang diolah pada WEKA memiliki
membantu pihak perguruan tinggi untuk format ARFF maupun CSV. Pada
melakukan klasifikasi mengenai tingkat penelitian Wiwit supriyanti(2018), dan
kelulusan mahasiswa guna menentukan nona puspitasari(2018) menggunakan
strategi untuk meningkatkan kelulusan Teknik Seleksi Fitur Information Gain Pada
pada tahun tahun berikutnya[6]. Pada untuk Prediksi Performa Akademik Siswa»
penelitian Elga mariati, ariesta lestari, dan berpendapat bahwa masalah utama dalam
widiatry(2020) Penilaian kepuasan dalam proses discovering knowledge dari
mahasiswa terhadap sarana dan data di bidang pendidikan adalah
pembelajaran pada Fakultas Teknik sudah mengidentifikasi data yang
pernah dilakukan sebelumnya, namun representatif. J48, RandomForest, MLP, S
penilaian masih dilakukan secara partial VM untuk memprediksi performa
dan hasil pengumpulan data penilaian akademik siswa pada mata pelajaran
kepuasaan masih belum pernah dievaluasi matematika. Pada penelitian Elga mariati,
sebelumnya. Penelitian ini menggunakan ariesta lestari, dan widiatry(2020) Dalam
teknik data mining dalam melakukan penelitian ini, metode dari pendekatan data
klasifikasi[7]. mining diterapkan untuk
2. Langkah penelitian atau metode mengklasifikasikan apakah mahasiswa
penelitian yang digunakan puas atau tidak dengan kualitas fasilitas
Inna Alvi nikmatum (2019) dan Indra pembelajaran di Fakultas Teknik.
waspada menggunakan . Marina windarti Penelitian ini membandingkan tiga
(2019) dan agustinus suradi (2019) algoritma data mining yaitu Decision Tree
mengunakan Penelitian ini bertujuan untuk C4.5, Support Vector Machine, dan Naïve
mengetahui kinerja keenam algoritme Bayes untuk mendapatkan algoritma
klasifikasi yang digunakan yaitu Decision terbaik untuk sistem prediksi.
Tree C4.5, Bayesian Network , KNearest PEMBAHASAN
Neighbors , Naïve Bayes , Neural Network 1. Analisis terhadap Hasil dari setiap
dan SVM .Terdapat beberapa tools data penelitian.
mining antara lain RapidMiner, Orange, Pada penelitian ini menggunakan data
KNIME, Weka, keel dan R. WEKA sudah riwayat mahasiswa tahun angkatan 2007
berbasis GUI sehingga meminimalkan sampai dengan 2011 yang telah lulus
penggunaan coding yang dapat dengan jumlah data sebanyak 377 orang
dengan 72 atribut nilai mata kuliah dan 1 akurasinya menjadi 92,46. Seleksi fitur
kelas target berupa masa studi. Penelitian adalah proses memilih fitur yang tepat
ini dilakukan dengan mengikuti tahap untuk digunakan dalam proses klasifikasi
pengerjaan data mining yang mengacu pada atau clustering. Variabel independen yang
proses knowledge discovery in database . memberi nilai t paling besar diambil
Aplikasi data mining berhasil dibangun sebagai X1 asalkan H0 ditolak. Kedua
dengan hasil percobaan menunjukkan diambil dari variabel independen diambil
bahwa hasil klasifikasi masa studi terbaik sebagai X2 asalkan H0 ditolak.Wiwit
diperoleh dengan memilih atribut dari supriyanti(2018), dan nona
semua mata kuliah pilihan dengan nilai puspitasari(2018).tugas. pada jumlah hasil
akurasi. Berdasarkan data yang diperoleh kuesioner yang berhasil dikumpulan adalah
dari Departemen Ilmu Komputer/ 981 sampel. Dari 981 data yang terkumpul
Informatika Universitas Diponegoro, pada terdapat 948 data valid yang dapat
mahasiswa tahun angkatan 2007 sampai digunakan dan 33 data tidak valid.
dengan 2011 dengan jumlah kelulusan 377 Dikarenakan dataset yang tidak
orang diperoleh informasi rata-rata masa seimbang, maka dataset diatur seimbang
studi mahasiswa masih di atas 4 tahun. Inna secara acak.menjadi 360 data dengan nilai
Alvi nikmatum (2019) dan Indra waspada. puas dan 350 data dengan nilai tidak puas
Terdapat beberapa tools data mining antara sehingga masing-masing kelas. Uji
lain RapidMiner, Orange, KNIME, Weka, validitas dan readibiltas dilakukan pada 30
keel dan R. WEKA sudah berbasis GUI sampel data yang dipilih secara
sehingga meminimalkan penggunaan acak. Artinya tiap pernyataan yang
coding yang dapat memudahkan pengguna diberikan oleh responden berkorelasi
sistem . Pada penelitian ini menggunakan dengan skor totalnya dan semuanya
tools WEKA. Data yang diolah pada dinyatakan valid Dari hasil implementasi
WEKA memiliki format ARFF maupun perhitungan confusion matrix, didapatkan
CSV. Hasil eksperimen ditarik kesimpulan keluaran performa akuransi model
bahwa menggunakan tiga model kriteria klasifikasi untuk tiga algoritma seperti yang
yakni gain ratio, information gain dan gini terlihat pada Tabel 1. Ketiga
index, hasil akurasi yang paling tinggi algoritma, decision tree C4.5, SVM dan
terdapat pada model kriteria gini index naïve bayes menunjukan akurasi yang
yakni 92,18%. Hasil yang paling tinggi dari cukup baik dalam melakukan klasifikasi
ketiga seleksi fitur yakni information gain secara benar baik untuk kelas puas dan
ratio dengan nilai p=0,6 dan hasil kelas tidak puas cukup baik yaitu diatas
80%, dimana akurasi algoritma C4.5 dan
algoritma SVM lebih baik daripada akurasi
yang diberikan oleh algoritma naïve
bayes. Hasil ini sesuai dengan penelitian-
penelitian sebelumnya yang mengklaim
bahwa masing-masing algoritma memiliki
performa yang bagus pada dataset yang
digunakan.Hasil kuesioner menunjukan
bahwa 61%mahasiwa menjawab puas
terhadap sarana dan prasana pembelajaran
dan 39% menjawab tidak puas. Algoritma
Decision Tree C4. 98% dibandingkan
algoritma Naïve Bayes dan Support Vector
Machine ketika dibuat model dari data latih
dan diuji menggunakan data uji dari dataset
kuesioner kepuasaan mahasiswa terhadap
sarana dan prasana pembelajaran Elga
mariati, ariesta lestari, dan widiatry (2020)
Table 1. table literature review
No. Penulis Judul Penelitian tahun Metode Hasil
1. Inna alvi nikmatum, implementasi data mining untuk 2019 k-nearest neighbor Data mahasiswa dan data kelulusan mahasiswa dapat
dan indra waspada klasifikasi masa studi mahasiswa menghasilkan informasi yang berlimpah, informasi
menggunakan algoritma k-nearest yang tersembunyi dapat diketahui dengan cara
neighbor melakukan pengelolaan pada data
tersebut. Berdasarkan data yang diperoleh dari
Departemen Ilmu Komputer/ Informatika Universitas
Diponegoro, pada mahasiswa tahun angkatan 2007
sampai dengan 2011 dengan jumlah kelulusan 377
orang diperoleh informasi rata-rata masa studi
mahasiswa masih di atas 4 tahun[4].
2. Marina windarti dan Perbandingan kinerka 6 algoritme 2019 Decision Tree, Salah satu faktor yang memengaruhi kualitas sebuah
agustinus suradi klasifikasi data mining untuk Bayesian Network, perguruan tinggi adalah kinerja mahasiswa yang dapat
prediksi masa studi mahasiswa K-Nearest diukur melalui lamanya masa studi. Perolehan
Neighbors, pengetahuan dalam basis data biasa disebut dengan
Naïve Bayes, data mining atau penambangan data. Penelitian ini
Neural Network, bertujuan untuk mengetahui kinerja keenam algoritme
SVM klasifikasi yang digunakan yaitu Decision Tree
C4.5, Bayesian Network , KNearest
Neighbors , Naïve Bayes , Neural Network dan SVM .
The acquisition of knowledge in a database is
commonly referred to as data mining. Decision Tree
C4. Bayes , Neural Network and SVM . Bayesian
Network memiliki kinerja terbaik dengan nilai akurasi
80,615%, nilai presisi dan recall 0,785 dan 0,806,
untuk nilai AUC termasuk dalam kategori baik yaitu
0,837.[5]
3. Wiwit supriyanti, dan Implementasi Teknik seleksi fitur 2018 k-nearest neighbor Hasil eksperimen ditarik kesimpulan bahwa
nona puspitasari forward selection pada algoritma menggunakan tiga model kriteria yakni gain
klasifikasi data minig untuk ratio, information gain dan gini index, hasil akurasi
prediksi masa studi mahasiswa yang paling tinggi terdapat pada model kriteria gini
politeknik indonusa surakarta index yakni 92,18%. Hasil yang paling tinggi dari
ketiga seleksi fitur yakni information gain ratio dengan
nilai p=0,6 dan hasil akurasinya menjadi 92,46. Seleksi
fitur adalah proses memilih fitur yang tepat untuk
digunakan dalam proses klasifikasi atau clustering.
Variabel independen yang memberi nilai t paling besar
diambil sebagai X1 asalkan H0 ditolak. Kedua diambil
dari variabel independen diambil sebagai X2 asalkan
H0 ditolak.[6]
4. Elga mariati, ariesta Model klasifikasi kepuasan 2020 Decision Tree Dari 16 atribut yang digunakan hanya 8 atribut yang
lestari, dan widiatry mahasiswa Teknik terhadap mempengaruhi tingkat kepuasan pelanggan karena
sarana pembelajaran memiliki presentasi jawaban lebih tinggi, sisanya
menggunakan data mining memiliki presentasi relatif kecil. Penggunaan
algoritma naïve bayes pada penelitian ini
menghasilkan akurasi sebesar 74.46% yang
menyatakan bahwa jumlah data yang benar lebih
banyak daripada data yang salah. Atribut masukan
kepuasan pelanggan yang digunakan dalam penelitian
ini mencakup harga, fasilitas, layanan dan
loyalitas. Implementasi algoritma support vector
machine memberikan nilai akurasi yang cukup baik
yaitu 80%.Masing-masing penelitian sebelumnya
hanya menerapkan satu algoritma saja, kemudian
menyatakan bahwa algoritma yang dipergunakan
sudah memberikan hasil yang baik dari segi akurasi.
Hasil kuesioner menunjukan bahwa 61%mahasiwa
menjawab puas terhadap sarana dan prasana
pembelajaran dan 39% menjawab tidak
puas. Algoritma Decision Tree C4. 98% dibandingkan
algoritma Naïve Bayes dan Support Vector Machine
ketika dibuat model dari data latih dan diuji
menggunakan data uji dari dataset kuesioner
kepuasaan mahasiswa terhadap sarana dan prasana
pembelajaran.[7]
5. Eka sabna dan yuda Data mining dengan 2 (dua) model 2021 Naïve Bayes, Hasil dari implementasi data mining dengan
irawan klasifikasi prediksi kinerja menggunakan so ware Rapidminer, dilakukan
mahasiswa terhadap dua model algoritma klasifikasi yaitu C4.5
dan NBC kemudian memasukan dataset sebagai bahan
uji untuk kedua model tersebut yang di dalamnya
terdapat data la h dan data uji. Dengan menggunakan
Metode Associa on Rule. pada model algoritma Naive
Bayes Classifier (NBC) adalah 80 % sedangkan pada
model algoritma C4.5 adalah 60 %.Dapat disimpulkan
nilai akurasi terbaik dari hasil komparasi kedua model
algoritma diperoleh oleh model algoritma Naïve Bayes
dengan nilai akurasi 80%.[8]
6. Resti, dodo zaenal Penerapan data mining klasifikasi 2021 naïve bayes Penelitian ini menggunakan data mahasiswa tahun
abidin, dan errissya berprestasi di stikom dinamika 2015 dan 2016 dengan masing-masing 100, sehingga
rasywir bangsa jambi dengan metode total datayang digunakan adalah 200. Atribut-atribut
naïve bayes inilah yang akan diterapkan kedalam metode naive
bayes pada mahasiswa jurusan Teknik Informatika
angkatan tahun 2015-2016 sebanyak 200 data untuk
memprediksi potensi mahasiswa berprestasi, yang
dikategorikan menjadi 3 yaitu Sangat Berpotensi,
Berpotensi, dan Cukup Berpotensi. Hasil dari
penelitian ini menggunakan Use Training Set dengan
persentasi akurasi Correctly Classified Instances
sebesar 87 % dan Incorrectly Classified Instances 13
%. 5-cross validation Correctly dengan persentasi
akurasi Correctly Classified Instances sebesar 77 %
dan Incorrectly Classified Instances 23 %. 10-Fold
Cross Validation dengan persentasi akurasi Correctly
Classified Instances sebesar 78 %, Incorrectly
Classified Instances 22 %.[9]
7. Anggi trifani, agus Penerapan data mining klasifikasi 2022 Algoritma C4.5 Proses Perhitungan Algoritma C4.5 Perhitungan
perdana windarto, C4.5 dalam menentukan tingkat Algoritma C4.5 untuk menentukan faktor dominan
Hendry qurniawan stress mahasiswa akhir penyebab Stres dapat diuraikan sebagai berikut:
Langkah 1: Menghitung jumlah kasus, jumlah kasus
untuk keputusan Sangat Stres, jumlah kasus untuk
keputusan Tidak Stres.
Langkah 2: Menghitung entropy dari semua kasus dan
kasus yang dibagi berdasarkan kelas atribut dengan
persamaan (1) selanjutnya dilakukan perhitungan gain
untuk masing-masing atribut dengan persamaan (2).
Algoritma C4.5. Menghasilkan 20 rules dan Tingkat
akurasi yang dihasilkan oleh metode tersebut adalah
87.88%. Berdasarkan perhitungan menggunakan
Algoritma C4.5 maka didapatkan faktor yang paling
dominan adalah Interpersonal dengan nilai gain
sebesar 0,328180116.[10]
8. Arief jananto,Sulastri, Data induk mahasiswa sebagai 2020 Algoritma CART Data induk mahasiswa pada tahap persiapan diambil
eko nur wahyudi dan predictor ketepatan waktu lulus dari bagian Biro Administrasi Akademik Fakultas
sunardi menggunakan algoritma CART yang telah lulus pada data wisuda berupa nim, nama
klasifikasi data mining mahasiswa, jenis kelamin, kota lahir, tanggal lahir,
nama sekolah asal selama 5 tahun yang terdistribusi
dalam setiap semester. Dari proses ini diperoleh data
sejumlah 1151 record. Dengan mengimplementasikan
teknik data mining klasifikasi dan algoritma CART
yang menggunakan teknik partisi biner berulang
diharapkan dapat diperoleh sebuah pohon keputusan
yang mampu digunakan memprediksi kelas ketepatan
waktu lulus dari mahasiswa aktif. Dengan
menggunakan data wisuda dan data induk mahasiswa
sejumlah 1018 record, diperoleh sebuah model pohon
keputusan dengan tingkat akurasi 63% dari uji data
testing.[11]
9. Ni luh Ratniasih Optimasi data mining 2019 Algoritma C4.5 dan Hasil klasifikasi pada data training adalah atribut IPK
menggunakan algoritma naïve KNN sebagai root pada decision tree, sedangkan atribut
bayes dan C4.5 untuk klasifikasi lainnya sebagai child node. Dari data training dengan
kelulusan mahasiswa jumlah 50 data dihasilkan 5 aturan. Aturan-aturan yang
telah dari data training diperoleh dapat digunakan
sebagai aturan untuk menentukan kelulusan tepat
waktu atau tidak pada mahasiswa STMIK STIKOM
Bali. 4 atribut predictor dan 1 atribut target
menghasilkan 5 aturan dalam pohon ke-putusan
sehingga aturan tersebut dapat digunakan dalam
menentukan kelulusan tepat waktu pada mahasiswa
STMIK STIKOM Bali. Hasil analisa menggunakan
metode Naïve Bayes diperoleh hasil akurasinya
sebesar 89.27% dimana hasil perfor-mance
akurasi.[12]
KESIMPULAN DAN SARAN dapat melihat kelulusan secara tepat waktu
Kesimpulan atau tidak.
Dari 9 penelitian yang dipaparkan terdapat DAFTAR PUSTAKA
bahwa Teknik-teknik klasifikasi statistic [1] and S. D. Purwandani, C. Sutarsih,
antara lain ‘logistic regression’ (regresi “Pengaruh Mutu Layanan Sarana
logistik) dan discriminant analysis (analisa dan Prasarana Terhadap Kepuasan
diskriminan), keduanya berasumsi bahwa Mahasiswa di Fakultas Pendidikan
hubungan antara variabel input dan output Teknologi dan Kejuruan Universitas
pada dasarnya adalah linear, data Pendidikan Indonesia,”.
terdistribusi normal, dan variabel-variabel [2] F. Gorunescu, “Data Mining
tidak saling terkait dan tidak tergantung Concept, Models and Techniques.
satu sama lain. Penilaian kepuasan Berlin Heidelberg: Springer.,” 2011.
mahasiswa terhadap sarana dan [3] M. Alghobiri, “A Comparative
pembelajaran pada Fakultas Teknik sudah Analysis of Classification
pernah dilakukan sebelumnya, namun Algorithms on Diverse Datasets.
penilaian masih dilakukan secara partial Engineering, Technology & Applied
dan hasil pengumpulan data penilaian Science Research,” 2018.
kepuasaan masih belum pernah dievaluasi [4] Inna Alvi Nikmatun,
sebelumnya. Penelitian ini menggunakan “IMPLEMENTASI DATA
teknik data mining dalam melakukan MINING UNTUK KLASIFIKASI
klasifikasi. MASA STUDI MAHASISWA
Saran MENGGUNAKAN ALGORITMA
Dari hasil literature review K-NEAREST NEIGHBOR”.
merekomendasikan perlunya klasifikasi [5] A. S. Mariana Windarti,
data mahasiswa untuk dapat mengelolah “PERBANDINGAN KINERJA 6
data secara menyeluruh yang terdiri dari ALGORITME KLASIFIKASI
data pribadi mahasiswa yang berupa nama, DATA MINING UNTUK
nim, alamat mahasiswa, nama orang tua PREDIKSI MASA STUDI
serta memiliki data IPK mahasiswa MAHASISWA”.
sehingga dapat diolah secara tepat dengan [6] N. P. Wiwit Supriyanti1),
adanya seperti itu, maka dapat dilihat “IMPLEMENTASI TEKNIK
bagaimana kinerja mahasiswa, ketepatan SELEKSI FITUR FORWARD
mahasiswa, memahami pelajaran serta SELECTION PADA ALGORITMA
KLASIFIKASI DATA MINING
UNTUK PREDIKSI MASA STUDI [12] Ni Luh Ratniasih, “OPTIMASI
MAHASISWA POLITEKNIK DATA MINING
INDONUSA SURAKARTA,” 2018. MENGGUNAKAN ALGORITMA
[7] W. c Elga Mariati a,1,*, Ariesta NAÏVE BAYES DAN C4.5
Lestari b,2, “MODEL UNTUK KLASIFIKASI
KLASIFIKASI KEPUASAN KELULUSAN MAHASISWA”.
MAHASISWA TEKNIK
TERHADAP SARANA
PEMBELAJARAN
MENGGUNAKAN DATA
MINING”.
[8] Y. I. Eka Sabna1, “DATA MINING
DENGAN 2 (DUA) MODEL
KLASIFIKASI UNTUK PREDIKSI
KINERJA MAHASISWA,”
http://doi.org/10.33060/jik/2021/.
[9] E. R. Resti1, Dodo Zaenal Abidin2,
“Penerapan Data Mining Klasifikasi
Untuk Memprediksi Potensi
Mahasiswa Berprestasi Di Stikom
Dinamika Bangsa Jambi Dengan
Metode Naive Bayes,” vol. Vol.3,
2021.
[10] Anggi Trifani, “Penerapan Data
Mining Klasifikasi C4.5 dalam
Menentukan Tingkat Stres
Mahasiswa Akhir,” 2022.
[11] S. Arief Jananto[1]*, Sulastri[2],
Eko Nur Wahyudi[3], “Data Induk
Mahasiswa sebagai Prediktor
Ketepatan Waktu Lulus
MenggunakanAlgoritma CART
Klasifikasi Data Mining,” DOI
10.32736/sisfokom.v10i1.991.

Anda mungkin juga menyukai