Makalah
Diajukan Oleh :
JANUARI 2014
IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI KELULUSAN
MAHASISWA FAKULTAS KOMUNIKASI DAN INFORMATIKA UMS
MENGGUNAKAN METODE NAIVE BAYES
ABSTRACT
ABSTRAK
Fakultas komunikasi dan informatika universitas muhammadiyah
surakarta memiliki jumlah 2358 mahasiswa dan memiliki lulusan 388 mahasiswa.
Dengan bertambah pesatnya jumlah mahasiswa baru setiap tahunnya maka
secara otomatis akan terciptanya data-data yang sangat banyak dan akan
bertambah melimpahnya data yang tersimpan dalam database. Agar data yang
awalnya sangat minim inoformasi tersebut dapat diubah menjadi suatu informasi
yang sangat bermanfaat dengan menggunakan teknik data mining. Salah satunya
dapat untuk memprediksi lama studi mahasiswa apakah dapat lulus kurang dari
sama dengan 4 tahun atau lebih dari 4 tahun berdasarkan atribut-atribut yang
digunakan. Metode naive bayes digunakan untuk menganalisis data dalam
pengenalan pola dan memprediksi kelulusan mahasiswa. Data yang dibutuhkan
adalah data-data mahasiswa yang sudah lulus sebagai data training sedangkan
data-data mahasiswa yang masih menempuh studi kuliah sebagai data uji.
Berdasarkan hasil prediksi dari jumlah 342 data sampel yang diuji hanya 86
mahasiswa yang akan lulus tepat waktu atau hanya sekitar 25,15 %, sedangkan
mahasiswa yang akan lulus terlambat berjumlah 256 mahasiswa mencapai
74,85% dari jumlah data sampel.
e. Membandingkan dengan
Hasil pengklasifikasian
metode lain
mahasiswa yang lulus tepat waktu
Untuk mengetahui tingkat
yaitu lulus kurang sama dengan 4
keakurasian metode naive bayes
tahun didominasi berasal dari jurusan
dengan metode lain perlu adanya
asal IPA, Jenis kelamin antara pria
perbandingan antar metode satu
lebih baik daripada wanita. Untuk
dengan lainnya. Penulis ingin
daerah asal mahasiswa dan sekolah
mengetahui lebih tinggi mana tingkat
asal SMA/SMK didominasi oleh
keakurasianya antara metode naive
Karesidenan Surakarta, dengan
bayes, dengan metode decicion tree (
jumlah rata-rata pengambilan SKS
J48) dan metode OneR dengan data
lebih 18 SKS setiap semesternya dan
yang digunakan sama.
rata-rata pengambilan jumlah mata
kuliah lebih dari 7 mata kuliah.
Asisten laboratorium ternyata tidak
terlalu banyak berpengaruh terhadap
ketepatan waktu mahasiswa lulus
yaitu kurang atau sama dengan 4
tahun.
Tabel 2 Perbandingan dari naive Naive Bayes dari ketiga algoritma
bayes, J48 dan OneR
tersebut.
Naive J48 OneR
bayes
KESIMPULAN
Akurasi 80.645 85,63 78.59
Dari jumlah sampel 342
2% 05 % 24 %
mahasiswa yang digunakan data uji
Waktu 0,01 s 0,05 s 0,01 s
menggunakan metode naive bayes
proses
ternyata didapatkan hasil bahwa
Data 275 292 268
mahasiswa yang akan lulus tepat
benar data data data
waktu hanya berjumlah 86 mahasiswa
Data 66 data 49 73
atau hanya sekitar 25,15 % dari
kurang data data
jumlah sampel sedangkan mahasiswa
sesuai
yang akan lulus terlambat berjumlah
Dari perbandingan pada tabel
256 mahasiswa mencapai 74,85%.
2 dapat disimpulkan bahwa metode
J48 lebih baik dari pada metode naive
SARAN
bayes dan OneR dalam permasalahan
1. Bagi peneliti-peneliti selanjutnya
ini. Sedangkan naive bayes lebih
yang akan melakukan penelitian
bagus dari pada OneR karena
hampir serupa dengan penelitian
memiliki keakurasian hasil prediksi
ini.
lebih baik. Metode J48 lebih unggul
a) Mencoba menggunakan
dalam penelitian ini karena data yang
aplikasi selain Weka dalam
digunakan jumlahnya kurang banyak
analisa data mining.
sehingga metode J48 lebih cepat dan
b) Mencoba lebih banyak record
mudah dalam pengklasifikasian.
dan attribute dalam
Metode J48 (decision tree)
pemrosesan data mining.
merupakan memang algoritma yang
c) Diperlukan tingkat ketelitian
digunakan untuk penglempokan class.
yang tinggi dan pembersihan
Namun untuk waktu pemrosesan
data yang sempurna supaya
(running time) yang paling cepat yaitu
tidak terjadinya noise.
d) Data perlu menyesuaikan membantu fakultas dalam
dengan kurikulum yang meningkatkan nilai
terbaru. akreditasi.
e) Dibuatkan grafik jumlah b) Berdasarkan kesimpulan
lulusan setiap tahunnya agar mahasiswa yang dapat lulus
mengetahui ada kenaikan tepat waktu yang paling
ataukah penurunan. menonjol yaitu dipengaruhi
2. Bagi Fakultas Komunikasi dan oleh pengambilan jumlah
Informatika Universitas rata-rata SKS lebih dari 18
Muhammadiyah Surakarta SKS dan lebih dari 7 mata
berdasarkan hasil penelitian. kuliah setiap semesternya,
a) Melihat hasil kesimpulan mahasiswa yang paling
pada penelitian ini sungguh banyak mengambil jumlah
memprihatinkan karena dari SKS dan Mata kuliah yaitu
jumlah sampel yang berasal dari jurusan IPA
diprediksi hanya sekitar berjenis kelamin Pria
25,15 % saja yang akan lulus berasalkan dari daerah
tepat waktu sedangkan Karesidenan Surakarta. Jika
mahasiswa yang akan lulus fakultas ingin memiliki
terlambat mencapai 74,85%. mahasiswanya dapat lulus
Sehingga pihak fakultas tepat waktu, maka
perlu adanya strategi atau mahasiswa baru yang akan
solusi dalam peningkatan masuk lebih diutamakan
prestasi mahasiswanya berasal dari Jurusan IPA,
sehingga mahasiswa dapat Pria , asal daerah dan
lulus tepat waktu dan sekolah berasal dari
tentunya dengan hasil yang Karesidenan Surakarta.
memuaskan. Sehingga dapat
DAFTAR PUSTAKA
Prasetyo, Eko. 2012. Data Mining konsep dan aplikasi menggunakan matlab.
Yogyakarta: Andi.
Sundika, Putu. Comparisson Of One-R, Decision Tree & Naive Bayes. From
website http://www.slideshare.net/putusundika/oner-bayes-
decisiontree. Diakses pada tanggal 19 Desember 2013.
Umar, Husein. 2004. Metode Penelitian Untuk Skripsi Dan Tesis Bisnis.
Cetakan ke-6. Jakarta: PT Raja Grafindo Persada.