Anda di halaman 1dari 5

JURASIK (Jurnal Riset Sistem Informasi & Teknik Informatika) ISSN 2527-5771

Volume 1, Nomor 1, Juli 2016

PENERAPAN ALGORITMA C4.5 UNTUK KLASIFIKASI PREDIKAT


KEBERHASILAN MAHASISWA DI AMIK TUNAS BANGSA

Yuni Sara Luvia1, Dedy Hartama2, Agus Perdana Windarto3, Solikhun4


1
Mahasiswa S-1 Sistem Informasi, STIKOM Tunas Bangsa
2,3,4
Dosen S-1 Sistem Informasi, STIKOM Tunas Bangsa
Jalan Sudirman Blok A No. 1, 2, 3 Kota Pematangsiantar
E-mail : yuninatani@gmail.com dedyhartama@amiktunasbangsa.ac.id zhantura.gusti@gmail.com
solikhun@amiktunasbangsa.ac.id

Abstrak

Predikat keberhasilan Mahasiswa di perguruan tinggi merupakan hal utama yang


menjadi acuan bagi seorang mahasiswa selama menjalani study. Data mahasiswa yang
terus meningkat dari tahun ke tahun adalah bukti untuk mengembangkan Data Mining.
Banyaknya jumlah Mahasiswa akan diproses Untuk mengetahui berdasarkan kriteria
apa saja Mahasiswa layak mendapatkan predikat keberhasilannya dengan beberapa
atribut seperti, jenis kelamin, kehadiran, sesi perkuliahan, rerata NEM dan Asal
sekolah. Dalam hal ini, peneliti melakukan analisis di Amik Tunas Bangsa Jl. Sudirman
no. 1,2,3 Pematangsiantar. Analisis yang digunakan adalah menggunakan Data Mining
dengan metode C4.5 dan diproses menggunakan software Rapidminer untuk membuat
pohon keputusan. Metode ini diharapkan dapat mempermudah pihak instansi
mengklasifikasi dan memprediksi predikat keberhasilan Mahasiswa sehingga data-data
yang menumpuk bisa bermanfaat untuk keperluan data mining dalam mengambil
keputusan yang baik. Analisis ini diharapkan sebagai salah satu motivasi terhadap
mahasiswa untuk meningkatkan IPK.
Kata kunci : Keberhasilan mahasiswa; metode C4.5; data mining; rapidminer;
decision tree

Pendahuluan data melimpah untuk menyajikan informasi


Predikat keberhasilan adalah kedalam bentuk pengambilan keputusan.
kemampuan aktual seorang mahasiswa Banyak teknik klasifikasi di Data
yang berwujud penguasaan ilmu Mining salah satunya adalah Algoritma
pengetahuan, sikap, dan keterampilan untuk C4.5 yang menyajikan klasifikasi data
mencapai tujuan akhir dari proses belajar kedalam bentuk pohon keputusan.
yaitu Indeks Prestasi. Indeks Prestasi Kelebihan utama Algoritma C4.5 dapat
dihitung, baik pada setiap akhir semester membuat pohon keputusan (decision tree)
dengan hasil yang disebut IP semester, yang efisien menangani atribut tipe diskrit
maupun pada akhir program pendidikan dan tipe diskrit- numerik, mudah untuk
lengkap satu jenjang, dengan hasil yang diinterprestasikan dan memiliki tingkat
disebut IP kumulatif. Indeks Prestasi akurasi yang dapat diterima (Han 2001).
Mahasiswa merupakan data yang sangat Kelemahan Algoritma C4.5 salah satunya
penting di Amik Tunas Bangsa terdapat di skalabilitas yaitu data training
Pematangsiantar sehubung dengan terus hanya dapat digunakan dan disimpan secara
meningkatnya jumlah Mahasiswa dari keseluruhan pada waktu yang bersamaan di
tahun ke tahun maka perlu dilakukan Data memori (Veronica, 2007)
Mining dengan teknik klasifikasi bertujuan Amik Tunas Bangsa Pematang
membantu suatu lembaga yang memiliki Siantar adalah lembaga pendidikan yang

75
JURASIK (Jurnal Riset Sistem Informasi & Teknik Informatika) ISSN 2527-5771
Volume 1, Nomor 1, Juli 2016

memiliki banyak mahasiswa. Dengan Data adalah data mining. Proses KDD
Mining memudahkan lembaga pendidikan (Knowlegge discovery in databases) secara
mengidentifikasi berdasarkan faktor-faktor garis besar dapat dijelaskan sebagai berikut
apa sajakah yang mempengaruhi (Kusrini, 2009)
mahasiswa mendapatkan Indeks Prestasi
Kumulatif baik di kelas. Peneliti
menggunakan Algoritma C4.5 dalam
pengklasifikasian predikat keberhasilan
mahasiswa berdasarkan Atribut jenis
kelamin, NEM, sesi perkuliahan, asal
sekolah, kehadiran, dan IPK. Data Training
yang diambil peneliti adalah data alumni
mahasiswa program studi Manajemen
Informatika dan Komputerisasi Akuntansi Gambar 1. Tahapan knowledge discovery
2010-2012. Dengan demikian proses in databases
pengolahan data-data akademik
Pengolahan Data Mining terdiri dari
menggunakan teknik klasifikasi akan
beberapa metode pengolahan, yaitu (Larose,
membantu lembaga pendidikan dalam
2006):
upaya memotivasi mahasiswa untuk
1. Association (Asosiasi) merupakan teknik
meningkatkan IPK, serta bermanfaat
dalam data mining yang mempelajari
meningkatkan akreditasi program studi di
hubungan antar data. Contoh
Amik Tunas Bangsa.
penggunaannya seperti untuk
Berdasarkan latar belakang tersebut
menganalisis perilaku mahasiswa yang
diterapkan Algoritma C4.5 yang berguna
datang terlambat. Contohnya jika
untuk mengklasifikasi dan memprediksi
mahasiswa memiliki jadwal dengan
Predikat Keberhasilan Mahasiswa di Amik
dosen A dan B, maka mahasiswa akan
Tunas Bangsa Pematangsiantar.
datang terlambat.
2. Predictive modelling yang merupakan
Kajian Teori
pengolahan data mining dengan
Data mining merupakan proses melakukan prediksi/peramalan. Tujuan
iteratif dan interaktif untuk menemukan metode ini untuk membangun
pola atau model baru yang dapat model prediksi suatu nilai yang
digeneralisasi untuk masa yang akan mempunyai ciri-ciri tertentu.
datang, bermanfaat dan dapat dimengerti 3.Classification merupakan teknik
dalam suatu database yang sangat besar mengklasifikasikan data. Perbedaannya
(massive databases). Data mining berisi dengan metode clustering terletak pada
pencarian trend atau pola yang diinginkan data, dimana pada clustering variabel
dalam database besar untuk membantu dependen tidak ada, sedangkan
pengambilan keputusan di waktu yang akan pada classification diharuskan ada
datang. (Hermawati, 2013). variabel dependen.
Istilah data mining dan knowledge 4. Clustering merupakan pengelompokan
discovery in databases (KDD) sering kali terhadap record, yang berfungsi
digunakan secara bergantian untuk memperhatikan dan membentuk kelas
menjelaskan proses penggalian informasi objek-objek yang memiliki kemiripan.
tersembunyi dalam suatu basis data yang Pohon keputusan merupakan
besar. Sebenarnya kedua istilah tersebut metode klasifikasi dan prediksi yang sangat
memiliki konsep yang berbeda, tetapi terkenal. Metode pohon keputusan
berkaitan satu sama lain. Dan salah satu mengubah fakta yang sangat besar menjadi
tahapan dalam keseluruhan proses KDD pohon keputusan yang merepresentasikan
76
JURASIK (Jurnal Riset Sistem Informasi & Teknik Informatika) ISSN 2527-5771
Volume 1, Nomor 1, Juli 2016

aturan. Aturan dapat dengan mudah pengklasifikasian predikat keberhasilan


dipahami dengan bahasa alami, juga dapat mahasiswa di Amik Tunas Bangsa,
diekspresikan dalam bentuk bahasa basis mengingat terus meningkatnya jumlah
data seperti Structured Query Language mahasiswa tiap tahun agar data tersebut
untuk mencari record pada kategori menjadi bermanfaat.
tertentu. Secara umum algoritma C4.5 3. Menentukan variabel yang akan
untuk membangun pohon keputusan adalah diproses, untuk mengerjakan pola
sebagai berikut: pengelompokan peneliti memilih
a. Pilih atribut sebagai akar predikat keberhasilan mahasiswa
b. Buat cabang untuk masing-masing nilai sebagai variabel (A) dimana nilainya
c. Bagi kasus dalam cabang tergantung (dependen) dengan nilai
d. Ulangi proses untuk masing-masing lainnya, selanjutnya variabel (B) yang
cabang sampai semua kasus pada cabang tidak memiliki tergantungan terhadap
memiliki kelas yang sama. nilai-nilai variabel lainnya
Untuk memilih atribut sebagai akar, (independen). Variabel (B) terdiri dari:
didasarkan pada nilai gain tertinggi dari a. B1 : Jenis Kelamin, yang
atribut-atribut yang ada. Untuk menghitung dipertimbangkan sebagai faktor
gain digunakan rumus seperti yang tertera kepintaran dan kerajinan seseorang
berikut (Craw, 2005): sehingga mempengaruhi mahasiswa
Gain(S,A) = Entrropy(S) * Entropy(Si) mendapatkan IPK yang bagus.
b. B2 : NEM, mahasiswa yang
Keterangan :
memiliki NEM bagus sewaktu
S : Himpunan Kasus
menyelesaikan studi di SMA
A : Atribut
Sederajat memiliki pengaruh
N : Jumlah partisi atribut A
mendapatkan IPK yang bagus.
|Si| : Jumlah kasus pada partisi ke i
c. B3: Sesi Perkuliahan, di Amik
|S| : Jumlah kasus dalam S
Tunas Bangsa memiliki 3 sesi
Sedangkan perhitungan nilai Entropy dapat
perkuliahaan yaitu, sesi pagi, siang
dilihat pada rumus 2 berikut (Craw, 2005):
dan malam. Variabel ini dipilih
Entropy(A) =
menjadi salah satu faktor predikat
Keterangan:
keberhasilan mahasiswa
S : Himpunan Kasus
dikarenakan peneliti ingin melihat
A : Fitur
apakah mahasiswa yang memilih
N : Jumlah partisi S
belajar pada sesi pagi termasuk yang
Pi : Proporsi dari Si terhadap S
dapat IPK bagus, ataupun yang
Metode Penelitian belajar di sesi siang, ataupun yang
Metode penelitian ini dilakukan memilih sesi malam. Karena
secara sistematik agar mendapatkan alur mayoritas mahasiswa yang memilih
kerja yang baik, dan dijabarkan menjadi sesi malam masing-masing sudah
beberapa langkah, yaitu: mempunyai pekerjaan dan pasti
1. Studi literatur dilakukan untuk semangat atau kedisiplinannya
membantu peneliti menelusuri teori- berkurang karena terbatasnya waktu
teori yang sedang berkembang yang dimiliki untuk belajar.
mengenai data mining dan Algoritma d. B4 : Asal Sekolah, atribut ini dipilih
C4.5 untuk memperoleh metode yang karena akan menjadi pertimbangan
signifikan dengan permasalahan yang penentuan daerah-daerah strategis
ada. yang cocok untuk kegiatan promosi
2. Pemilihan objek penelitian dilakukan mencari bibit terbaik sebagai calon
untuk memudahkan peneliti dalam mahasiswa di Amik Tunas Bangsa.

77
JURASIK (Jurnal Riset Sistem Informasi & Teknik Informatika) ISSN 2527-5771
Volume 1, Nomor 1, Juli 2016

e. B5 : Kehadiran, Mahasiswa yang 6. Menganalisis data untuk mengklasifikasi


memiliki kehadiran 100% di semua predikat keberhasilan mahasiswa di
mata kuliah akan menjadi Amik Tunas Bangsa sesuai dengan
pertimbangan bahwa mahasiswa entropi berdasarkan masing-masing
tersebut memiliki pengaruh atribut menggunakan metode C.45.
mendapatkan predikat keberhasilan
yang bagus. Hasil dan Pembahasan
4. Menentukan nilai class pada masing- Peneliti memperoleh potongan data
masing variabel (A) dan (B). Nilai mahasiswa Amik Tunas Bangsa yang
classs variabel (A) disesuaikan pada tercatat dalam format excel yang akan
Amik Tunas Bangsa yang dibedakan diolah untuk mendapatkan informasi.
menjadi 5 nilai dengan tipe label, Jika Adapun tabel data mahasiswa, adalah
A1 3.50 adalah cumlaude, jika 2.99 sebagari berikut:
A1 < 3.50 adalah sangat baik, jika 2.5
A1 < 2.99 adalah baik, jika 1.9 A1 <
2.5 adalah cukup, sedangkan jika 0
A1 < 1.9 adalah kurang. Untuk nilai
class pada variabel (B) dapat dilihat
dalam tabel dibawah ini :
Tabel 1. Jenis Kelas Data
Jenis Kelas Data
Varia Nama
Kelas yang
-bel Field
Data Digunakan
Cumlaude,
Predikat Sangat Baik,
Keberhasil Nomin Baik, Cukup, Gambar 2. Data mahasiswa
A an al Kurang Adapun hasil preprocessing data
Jenis Nomin mahasiswa yang di dapat adalah sebagai
B1 Kelamin al Pria, Wanita berikut:
Rerata Nomin NEM 20,
B2 NEM al NEM > 20
Sesi
Perkuliaha Nomin Pagi, Siang,
B3 n al Malam
Asal Nomin Pematangsiant
B4 Sekolah al ar, Luar
Kehadiran <
Nomin 50, Kehadiran
B5 Kehadiran al > 50
5. Pengumpulan data dengan metode Slovin
untuk menentukan jumlah sampel pada Gambar 3. Hasil preprocessing data
pengujian proses data mining, adapun mahasiswa
rumus slovin nya sebagai berikut: Hasil preprocessing yang didapat
kemudian diolah kedalam Decision Tree
menggunakan software Rapidminer untuk
Keterangan: mengetahui klasifikasi predikat
n: jumlah sampel keberhasilan Mahasiswa yang telah
N: jumlah populasi menyelesaikan study, adapun gambar pohon
e: batas toleransi kesalahan 5% keputusan sebagai berikut :

78
JURASIK (Jurnal Riset Sistem Informasi & Teknik Informatika) ISSN 2527-5771
Volume 1, Nomor 1, Juli 2016

Kesimpulan
Hasil penelitian yang diperoleh
disimpulkan bahwa telah di dapat
klasifikasi predikat keberhasilan mahasiswa
di Amik Tunas Bangsa Pematangsiantar.
Variabel yang memiliki prioritas utama
Gambar 4. Pohon keputusan klasifikasi terhadap predikat keberhasilan mahasiswa
predikat keberhasilan adalah mahasiswa yang memilih sesi
Jika dilihat berdasarkan hasil pohon perkuliahan pada Pagi hari dan di dukung
keputusan klasifikasi predikat keberhasilan dengan nilai kehadiran > 50 maka
mahasiswa, bahwa atribut yang mempunyai mahasiswa tersebut mendapatkan predikat
pengaruh utama untuk mendapatkan cumlade dibandingkan dengan mahasiswa
predikat keberhasilan adalah variabel B3 yang berada di sesi perkuliahan siang dan
(Sesi) yang menempati sebagai simpul akar. malam. Pengaruh ini dapat dilihat dari
Agar lebih jelas, peneliti membuat model besarnya semangat belajar mahasiswa pagi
aturan berupa teks, seperti keterangan yang memiliki banyak waktu untuk diskusi
dibwah ini: diluar jam belajar sehingga kepedulian dan
Sesi = Malam kedisiplinan mahasiswa tersebut berhak
| Asal Sekolah = Luar: Sangat Baik mendapatkan predikat keberhasilan
{Cumlaude=0, Sangat Baik=4, Baik=0, cumlaude.
Kurang=0}
| Asal Sekolah = Pematangsiantar: Daftar Pustaka
Cumlaude {Cumlaude=1, Sangat Baik=1, Veronica Sri Moertini, 2007,
Baik=1, Kurang=0} Pengembangan Skalabilitas Algoritma
Sesi = Pagi Klasifikasi C4.5 Dengan Pendekatan
| Kehadiran = kehadiran < 50: Baik Konsep Operator Relasi, studi kasus:
{Cumlaude=1, Sangat Baik=0, Baik=2, pra-pengolahan dan klasifikasi citra
Kurang=0} batik, Bandung.
| Kehadiran = Kehadiran > 50: Cumlaude Han, J., Kamber, M., 2001, Data Mining
{Cumlaude=4, Sangat Baik=2, Baik=0, Concepts and Techniques, Morgan
Kurang=1} Kaufman Pub., USA.
Sesi = Siang Kusrini dan Luthfi. E.
| Asal Sekolah = Luar: Kurang Taufiq.(2009).Algoritma Data Mining.
{Cumlaude=0, Sangat Baik=1, Baik=0, Yogyakarta: Andi.
Kurang=2} Kamagi, David Hartanto dan Seng Hansun.
| Asal Sekolah = Pematangsiantar: Sangat 2014. Implementasi Data mining
baik {Cumlaude=0, Sangat Baik=2, dengan Algoritma C 4.5 untuk
Baik=1, Kurang=0} memprediksi tingkat kelulusan
Dapat dilihat dari hasil pohon Mahasiswa. Jurnal Seminar Nasional
keputusan dan model aturan berbentuk teks Teknologi Informasi dan Multimedia
bahwa, jika seorang mahasiswa sesi 2014. ISSN: 2085-4552.
perkuliahan pagi dan memiliki kehadiran > Hartama, Dedy. 2011. Model aturan
50 maka mahasiswa tersebut diklasifikasi keterhubungan data mahasiswa
mendapat predikat keberhasilan cumlaude, menggunakan Algoritma C4.5 untuk
tanpa melihat kriteria asal sekolah, jenis meningkatkan indeks prestasi di Amik
kelamin dan Nem. Tunas Bangsa. Tesis Program Studi
Magister (S2) Teknik Informastika
Universitas Sumatera Utara.

79

Anda mungkin juga menyukai