Abstract
Data Mining is the process of extracting data from large piles of databases that are used to find
knowledge in the form of important and useful information. Classification is one of the
techniques in data mining. The algorithm used is the C4.5 algorithm with the Decision Tree
method. Decision Tree is a method that converts facts into useful data to explore data into a
decision tree that presents easy-to-understand rules for finding hidden relationships between input
and target variables. One of the Data Mining Decision Tree Processing Software is RapidMiner.
One of the aims of this study was to classify student data at STMIK Pontianak to find out the
factors of students experiencing dropouts. The attributes used consisted of school origin, religion,
student age, parent's occupation, parents' income, and GPA. The attribute that has the most
influence on students who experience dropouts is Religion.
1.PENDAHULUAN
Data Mining yang juga dikenal sebagai knowledge, adalah salah satu bidang yang
berkembang pesat karena besarnya kebutuhan akan nilai tambah dari tumpukan database skala
besar yang terakumulasi sejalan dengan pertumbuhan teknologi informasi yang sangat pesat.
Data mining dapat diartikan sebagai ekstraksi informasi atau pola yang penting atau menarik
dari data yang ada pada database yang besar. Menurut Larose dalam Kusrini dan Emha Taufiq
(2009). Data mining dibagi menjadi beberapa kelompok berdasarkan tugas yang dapat
dilakukan, yaitu Deskripsi, Estimasi, Prediksi, Klasifikasi, Pengklasteran, Asosiasi. Salah satu
teknnik yang umum digunakan adalah teknik Klasifikasi. Metode yang digunakan yaitu metoe
Klasifikasi dengan algoritma C4.5. Pada penelitian sebelumnya,menggunakan data mining
untuk membantu memprediksi peningkatan kinerja mahasiswa dengan teknik Klasifikasi, hasil
penelitian ini memberikan langkah-langkah untuk meningkatkan kinerja siswa yang
diperkirakan akan gagal atau dipromosikan., menggunakan data mining untuk mencari pola
prediksi hujan dengan algoritma C4.5, akurasi pola prediksi didapat mencapai 79%.
menggunakan data mining untuk memprediksi kriteria nasabah kredit menggunakan metode
klasifikasi yang digunakan decision tree diperoleh sebuah aplikasi yang memudahkan bagian
dana bank memperoleh target pemasaran kredit. menggunakan data mining untuk mengkoversi
data training penyakit hipertensi. Pada penelitian ini penulis menggunakan algoritma Decision
Tree C4.5 yang masuk dalam fungsi Classification. Metode decision tree mengubah fakta yang
sangat besar menjadi pohon keputusan yang merempresentasikan aturan. Data mahasiswa yang
diperoleh dari Sistem Informasi UNPAB lima tahun terakhir digambarkan dalam tabel dibawah
ini :
Tabel 1. Data Mahasiswa 2018 sampai 2023
JUMLAH JUMLAH
TAHU MAHASISWA MAHASISWA
N MASUK LULUS
2018 223 Orang 199 Orang
2019 243 Orang 187 Orang
2020 272 Orang 231 Orang
2021 253 Orang 141 Orang
2022 232 Orang 152 Orang
2023 216 Orang -
2.METODE PENELITIAN
Secara umum terdapat beberapa tahapan dalam penelitian ini dengan mengikuti pola umum
penelitian ilmiah seperti yang terlihat pada Gambar 2.
Mulai
Menentukan atribut
Filtering atribut
Selesai
Gambar 1. Kerangka Kerja Penelitian
Didalam Teknik Classification keluaran dari setiap data yang dijadikan target atau class
harus berupa bilangan bulat atau diskrit.
Data mahasiswa pada STMIK Pontianak dalam bentuk Microsoft excel. Data Mahasiswa
yang telah dikumpulkan kemudian ditentukan atribut, dilakukan filtering atribut lalu ditentukan
variabel input dan target, selanjutnya membuat pohon keputusan dengan software
RapidMiner. Data Mahasiswa yang diambil dari tahun 2018 sampai tahun 2023 dengan status
aktif status aktif dan dropout. STMIK Pontianak tidak mengenal istilah dropout, tetapi student
losses
Variabel yang dimiliki yaitu sebagai berikut :
1. NPM
2. Jenis Kelamin
3. Agama
4. Usia
5. Tempat Tinggal
6. Status
Langkah-langkah menggunakan software aplikasi RapidMiner 5.2 sebagai berikut :
1. Data Mahasiswa yang berisi variabel dari kondisi dan atribut keputusan atau target untuk
mengetahui faktor mahasiswa drop out yang disimpan dengan microsoft excel yang berisi
kasus untuk menghasilkan informasi berupa rule.
2. Data mahasiswa yang telah disimpan dalam Microsoft excel dapat dipakai langsung pada
aplikasi
software RapidMiner5.2.
3. Buka software RapidMiner 5.2, klik New.
4. Kemudian klik Repositories, pilih Import Excel Sheet.
5. Pilih data tes yang kita simpan dalam microsoft excel, klik Next.
6. Muncul tampilan Data Import Wizard Step klik Next, pada Annotation pilih Name, klik Next
sehingga muncul tampilan Data Import Wizard Step 4.
Data mahasiswa yang diperoleh dari BPAA.Dengan menggunakan metode Klasifikasi C.45
dalam proses menganalisa mahasiswa drop out berdasarkan menghasilkan informasi baru yang
akurat . Pemilihan variabel data Mahasiswa yaitu atribut kondisi dan atribut keputusan yang
akan digunakan sangat mempengaruhi rule atau knowledge yang dihasilkan, jika data yang
diproses semangkin banyak maka semangkin banyak rule atau pengetahuan yang diperoleh.
Decision treeAlgoritma C4.5 dapat memberikan informasi atau pengetahuan berupa rule yang
mudah dipahami oleh masyarakat luas karena digambarkan dengan pohon keputusan. Atribut
yang digunakan terdiri dari Jenis kelamin, Agama, Usia, Tempat Tinggal, Setatus. Atribut yang
paling berpengaruh terhadap mahasiswa yang mengalami dropout adalah dari variabel Agama.
Informasi yang dihasilkan dapat membantu manajemen kampus dalam melakukan evaluasi
terhadap mahasiswa drop out.
5.SARAN
Project ini masih belum selesai sepenuhnya maka dari itu ini hanya di jadikan bahan acuan
untuk project lebih lanjut.
DAFTAR PUSTAKA
[1] Andriani Anik. 2012. Penerapan Algoritma C4.5 Pada Program Klasifikasi Mahasiswa
Dropout. Seminar Nasional Matematika.
[2] As’ad Bahrawi. 2016. Prediksi Keputusan Menggunakan Metode Klasifikasi Naïve Bayes,
One-R, dan Decision Tree. Jurnal Penelitian Komunikasi dan Opini Publik. 20(1): 1-10.
[3] Defiyanti S,PardedeDLC. 2010.
PerbandinganKinerjaAlgoritmaID3danC4.5dalamKlasifikasiSpam-Mail. Gunadarma.
[4] Dhika H, Destiawati F, Fitriansyah A. 2016. Implementasi Algoritma C4.5 Terhadap
Kepuasan Pelanggan. Prosiding SNaPP2016 Sains dan Teknologi. 6(1): 16-22.
[5] Fajar Astuti Hermawati. 2013. Data Mining.Penerbit: CV. ANDI OFFSET.
Jantan H, Hamdan AR, Othman ZA.2010. Human Talent Prediction in HRM Using
C4.5 Classification Algorithm. International Journal on Computer Science and
Engineering. 2(8): 2526-2534.
[6] Kusrini, Emha Taufiq Luthfi. 2009. Algoritma Data Mining. Penerbit: CV. ANDI
OFFSET.
[7] Mabrur AG, Lubis R. 2012. Penerapan Data Mining Untuk Memprediksi Kriteria Nasabah
Kredit. Jurnal Komputer dan Informatika. 1(1): 53-57.
[8] Muhammad Syahril. 2011. Konversi Data Training Tentang Penyakit Hipertensi Menjadi
Bentuk Pohon Keputusan Dengan Teknik Klasifikasi Menggunakan Tools Rapid Miner
4.1. Jurnal SAINTIKOM.
[9] Panjaitan Febriyanti. 2017. Penerapan Cloud Computing Pada SMKN 1 Indralaya
Selatan. Prosiding SNaPP2017 Sains dan Teknologi. 7(1):
[10] Swatina L. 2013. Penerapan Algoritma C4.5 Untuk Penentuan Jurusan
Mahasiswa. Jurnal GEMA AKTUALITA. 2(1): 93-98.