DISUSUN OLEH :
SANTI
203010503005
1. 1 Latar Belakang
Perkembangan teknologi pada era globalisasi semakin maju dan terus
berkembang dengan pesat. Teknologi tidak hanya dimanfaatkan untuk membantu
pekerjaan tetapi dapat juga digunakan untuk menyelesaikan permasalahan
perkiraan ketepatan waktu kelulusan mahasiswa (prediksi) (Mustafidah et al., n.d.)
Kelulusan mahasiswa merupakan hal yang penting bagi perguruan tinggi baik
negeri maupun swasta. Begitu pun bagi salah satu perguruan tinggi di Kalimantan
tengah ,yaitu Universitas Palangka Raya.
Universitas Palangka Raya disingkat UPR adalah suatu perguruan tinggi
negeri pertama dan tertua di Provinsi Kalimantan Tengah pertama dan tertua di
Provinsi Kalimantan Tengah terdiri dari 8 (delapan) fakultas dan salah satunya,
yaitu Fakultas Teknik memiliki 4 (empat) jurusan terdiri dari : Jurusan Teknik
Informatika, Jurusan Teknik Pertambangan, Jurusan Arsitektur dan Jurusan Teknik
Sipil.
Jurusan Teknik Informatika di Universitas Palangka Raya merupakan salah
satu jurusan yang banyak diminati oleh mahasiswa baru dimana setiap tahunnya
pasti ada angka peningkatan dalam penerimaan mahasiswa barunya. Berdasarkan
data dari PDDikti pada tabel 1.1 data peningkatan mahasiswa di jurusan Teknik
Informatika untuk 3 tahun terakhir ini.
Tabel 1. 1 Data Mahasiwa Teknik Informatika
1. 2 Rumusan Masalah
Berdasarkan latar belakang di atas, rumusan masalah dalam penelitian ini
adalah “Bagaimana cara Algoritma Backpropagation dalam memprediksi tingkat
kelulusan tepat waktu mahasiswa Teknik Informatika Universitas Palangka Raya?”
1. 3 Batasan Masalah
Berikut adalah beberapa batasan masalah yang dapat digunakan sebagai acuan
dalam penelitian:
1. Penelitian ini difokuskan untuk memprediksi kelulusan tepat waktu mahasiswa
Teknik Informatika Universitas Palangka Raya dengan Algoritma
Backpropagation.
2. Penelitian ini terbatas hanya untuk mahasiswa Jurusan Teknik Informatika di
Universitas Palangka Raya.
3. Data yang digunakan untuk penelitian ini mencakup informasi tentang nilai IP
semester 1-4, SKS, IPK, beasiswa bidikmisi, jalur masuk, penghasilan
orangtua dan UKT.
4. Rentang waktu penelitian tahun angkatan 2011-2019 dengan jumlah yang lulus
tepat waktu 45 orang dan tidak tepat waktu 238.
5. Variabel yang digunakan dalam penelitian ini adalah nilai IP semester 1-4,
SKS, IPK, beasiswa bidikmisi, jalur masuk, penghasilan orangtua, dan UKT.
6. Klasifikasi terdiri dari 2 (dua) kelas, yaitu “tepat waktu” dan “tidak depat
waktu”.
7. Pemodelan data prediksi kelulusan tepat waktu ini menggunakan jupiter
notebook dan dikembangkan dalam bentuk website.
8. Penelitian ini menggunakan Algoritma Backpropagation kemudian Algoritma
C4.5 sebagai pembandingnya.
1. 4 Tujuan Penelitian
Tujuan dari penelitian ini adalah:
1. Memprediksi kelulusan tepat waktu mahasiswa Teknik Informatika
Universitas Palangka Raya.
2. Mengimplementasikan algoritma backpropagation untuk prediksi
kelulusan tepat waktu mahasiswa Teknik Informatika Universitas
Palangka Raya.
3. Mengevaluasi akurasi algoritma backpropagation dalam memprediksi
kelulusan tepat waktu mahasiswa Teknik Informatika Universitas
Palangka Raya.
4. Memberikan rekomendasi kepada pihak jurusan Teknik Informatika
Universitas Palangka Raya berdasarkan hasil prediksi kelulusan tepat
waktu mahasiswa Teknik Informatika menggunakan algoritma
backpropagation.
1. 5 Manfaat Penelitian
Manfaat dari penelitian ini adalah:
1. Bagi Penulis
Melalui penelitian ini, penulis dapat meningkatkan dan
meningkatkan kompetensi mereka di bidang pengembangan model
prediktif menggunakan algoritma Backpropagation. Memahami rincian
penggunaan algoritma ini dapat membantu dalam meningkatkan
analisis data dan produktivitas penelitian.
2. Bagi Jurusan Teknik Informatika Universitas Palangka Raya
Penelitian ini dapat membantu perguruan tinggi dan jurusan Teknik
Informatika dalam mengoptimalkan penggunaan sumber daya dengan
mengidentifikasi mahasiswa yang berisiko tinggi tidak lulus tepat
waktu. Hal ini dapat membantu perguruan tinggi dalam perencanaan
dan alokasi sumber daya secara efisien.
1. 6 Sistematika Penulisan
Adapun sistematika penulisan Skripsi ini disusun untuk memberikan
gambaran umum tentang penelitian yang dijalankan. Sistematika penulisan
skripsi adalah sebagai berikut :
1. BAB I PENDAHULUAN
Pada bab ini menguraikan tentang latar belakang permasalahan,
rumusan masalah, batasan masalah, menentukan tujuan dan manfaat
dibuatnya, sistematika penulisan serta jadwal kegiatan.
2. BAB II LANDASAN TEORI
Bab ini berisi paparan tentang algoritma Backpropagation beserta
kajian pustaka penelitian terdahulu.
3. BAB III METODOLOGI PENELITIAN
Metodologi penelitian adalah sekumpulan kegiatan, peraturan serta
prosedur yang dipakai oleh peneliti suatu disiplin ilmu. Metodologi
juga merupakan suatu analisis teoritis tentang sebuah metode atau cara.
Penelitian merupakan sebuah penyajian yang sistematis dengan tujuan
untuk meningkatkan jumlah pengetahuan. Pada bab ini akan
menjelaskan metodologi yang digunakan dalam judul penelitian
“Prediksi Kelulusan Tepat Waktu Mahasiswa Teknik Informatika
Universitas Palangka Raya Menggunakan Algoritma
Backpropagation”.
4. BAB IV HASIL DAN PEMBAHASAN
Bab ini menampilkan hasil pembuatan program dan pembahasan
tentang perbandingan dari kedua algoritma tersebut yang sudah dibuat.
5. BAB V KESIMPULAN DAN SARAN
Bab ini bagian kesimpulan memuat ringkasan dari permasalahan yang
ada pada rumusan masalah hasil penelitian yang sudah dilakukan, serta
saran yang dapat memberikan gambaran untuk membuat sistem ini
lebih berkembang nantinya apabila digunakan
1. 7 Jadwal Penelitian
Adapun jadwal penyusunan proposal skripsi ini dapat dilihat dalam tabel 1.2
berikut:
Tabel 1. 2 Jadwal Penelitian
Bulan
No Kegiatan Februari Maret April Mei Juni
1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4
1. Penyusunan
Proposal dan
Pengumpulan
Proposal
2. Pengumpulan
Data
3. Seminar
Proposal
4. Analisis
Sistem
5. Desain Sistem
6. Implementasi
7. Pengujian
Sistem
8. Evaluasi
9. Pengumpulan
Laporan Akhir
10. Seminar Hasil
BAB II
LANDASAN TEORI
2.2.3 Klasifikasi
Berikut penjelasan mengenai klasifikasi menurut ahli beserta sumber kutipannya :
1. Menurut Affendey dkk. (2010):
Pemodelan prediktif mengacu pada tugas membangun model untuk variable
target sebagai fungsi dari variabel penjelas. Dua jenis tugas pemodelan
prediktif adalah klasifikasi, yang digunakan untuk variable target diskrit,
dan regresi, yang digunakan untuk variable kontinyu sasaran (L.S.Affendey,
2010).
2. Menurut Nghe dkk. (2007):
Klasifikasi melibatkan pembelajaran sebuah fungsi yang memetakan data
input ke dalam salah satu dari sejumlah kategori diskrit (Zhang et al., 2021).
Terdapat beberapa algoritma dengan pendekatan yang berbeda dalam proses
data dan menentukan aturan kriteria pengelompokan klasifikasi. Algoritma ini
dibagi menjadi tiga kelompok: berbasis linear, berbasis non-linear, dan rule-based
(Pradytya, 2018).
Gambar 2. 1 Classification algorithms
Sumber : Wendler, 2016:719
2. Validasi Silang
Validasi silang (cross validation) adalah sebuah teknik validasi model
dalam machine learning yang bertujuan untuk menguji seberapa baik model yang
dibangun dapat digeneralisasikan ke data independen atau data baru. Dalam validasi
silang, data asli dibagi menjadi dua bagian, yaitu data latih (training set) dan data
uji (test set atau holdout set). Data latih digunakan untuk membangun model,
sedangkan data uji digunakan untuk menguji performa model dengan data yang
sebelumnya tidak pernah dilihat oleh model tersebut selama pelatihan. Kelemahan
dari pendekatan ini adalah hasil evaluasi model sangat tergantung dengan data latih
dan data uji yang dipilih. Oleh karena itu, muncul metode validasi silang yang
membagi data menjadi lebih dari dua bagian (Refaeilzadeh et al., 2016).
Dalam k-fold cross validation, data asli dibagi menjadi k buah subset (fold)
dengan ukuran yang sama. Proses validasi dilakukan sebanyak k kali, di mana
setiap kali menggunakan 1 fold sebagai data uji dan k-1 fold lainnya sebagai data
latih. Hasil evaluasi dari setiap iterasi dirata-ratakan untuk mendapatkan performa
model secara keseluruhan. Menurut jurnal yang dilakukan oleh Refaeilzadeh et al.
(2016), k = 5 atau 10 merupakan pilihan umum untuk validasi silang yang
memberikan trade-off optimal antara bias dan varians dalam estimasi performa
model. Semakin besar nilai k, semakin akurat hasil evaluasi model namun semakin
besar juga komputasi yang dibutuhkan (Refaeilzadeh et al., 2016).
3. Confusion Matrix
Confusion matrix merupakan sebuah metode visualisasi performa (akurasi)
sebuah model klasifikasi. Confusion matrix berbentuk matriks yang
merepresentasikan jumlah prediksi benar dan salah yang dibuat oleh model
klasifikasi (Chicco & Davide, 2020). Confusion matrix untuk masalah klasifikasi
biner terdiri dari 2x2 matriks yang merepresentasikan empat kondisi output model,
yaitu :
1) True Positive (TP): data positif yang terprediksi positif
2) True Negative (TN): data negatif yang terprediksi negatif
3) False Positive (FP): data negatif yang terprediksi positif
4) False Negative (FN): data positif yang terprediksi negatif
Dari 4 kondisi di atas dapat dihitung beberapa metrik evaluasi model
klasifikasi seperti akurasi, presisi, recall, dan F1-score. Confusion matrix sangat
bermanfaat dalam evaluasi model karena dapat secara visual menunjukkan
kesalahan prediksi yang dibuat model untuk setiap kelas (Chicco & Davide, 2020).
Menurut jurnal oleh Chicco (2020), confusion matrix sangat
direkomendasikan dalam validasi dan pelaporan kinerja model klasifikasi.
Confusion matrix dianggap sebagai baseline analysis model klasifikasi yang
informatif dan tidak menyesatkan (Chicco & Davide, 2020).
b. Clean data
Melakukan cleaning data yang tidak lengkap/tidak valid,
kemudian memilih data dan atribut yang relevan serta
melakukan encoding variabel kategori. Penghapusan nilai
seperti daftar mahasiswa yang sudah terlalu nilai ip
semesternya, SKS serta IPK bernilai kosong/ sudah tidak
melanjutkan studi, maka data ini tidak dapat diikutsertakan
dalam pemrosesan data mining.
4. Modeling
Memodelkan data menggunakan algoritma jaringan syaraf tiruan
Backpropagation. Melakukan pelatihan data dan penentuan
parameter terbaik. Berdasarkan beberapa eksperimen yang telah
dilakukan, arsitektur algoritma backpropagation untuk prediksi kelulusan
tepat waktu adalah arsitektur 9-6-1. Arsitektur ini terdiri dari 1 lapisan
input dengan 9 neuron, 1 lapisan hidden dengan 6 neuron dan 1 lapisan
output dengan 1 neuron.
Deskripsi Flowchart Ketua Jurusan pada gambar 3.5 adalah sebagai berikut :
Gambar 3. 8 ERD
1. Mahasiswa dan Prediksi : One to One: Setiap baris dalam tabel mahasiswa
berkorelasi dengan satu baris dalam tabel hasil prediksi.
1. Tabel User
Tabel 3. 3 Tabel User
2. Tabel Mahasiswa
Tabel 3. 4 Tabel Mahasiswa
3. Tabel Prediksi
Tabel 3. 6 Tabel Prediksi
Chicco, & Davide. (2020). Ten quick tips for machine learning in computational
biology." BioData mining 13.1. 1–17.
Habibah, U. R., Solichin, A., Habibah Romlah, U., Perumahan Sudirman Indah, K.,
Ki Mas Laeng Jl Syeh Mubarok No, J., & Kab Tangerang -Banten, T. (2022).
Prediksi Kelulusan Mahasiswa Dengan Metode Naïve Bayes dan Artificial
Neural Network: Studi Kasus Fakultas Teknik UNIS Tangerang. 15(1), 73–83.
https://doi.org/10.30998/faktorexacta.v15i1.11816
Han, J. , K. M. , & P. J. (2012). Data mining: concepts and techniques (3rd ed).
Waltham, MA: Morgan Kaufmann Publishers.
Hendri Janto Rahanra, M., & Taufiq Luthfi, E. (2022). Analisa Kelulusan
Mahasiswa Teknik Informatika Tepat Waktu Menggunakan Algoritma
Artificial Neural Network (ANN). In Jurnal Teknologi dan Rekayasa (Vol. 7,
Issue 1).
Ian H. Witten, Eibe Frank, & dan Mark A. (2011). Data Mining: Practical Machine
Learning Tools and Techniques.
Kusrini, & Luthfi, E. T. (2009). Algoritma Data Mining.
Millea, M. , Wills, R. , Elder, A. , & & Molina, D. (2018). What matters in college
student success? Determinants of college retention and graduation rates.
Education, 138(4). 309–322.
Moerdyanto, O. P., Kadek, I., & Nuryana, D. (2023). Prediksi Kelulusan Tepat
Waktu Menggunakan Pendekatan Pohon Keputusan Algoritma Decision Tree.
Journal of Informatics and Computer Science, 05.
Mohammed J. Zaki, & Wagner Meira JR. (2014). Data Mining and Analysis:
Fundamental Concepts and Algorithms.
Mustafidah, H., Fitri, D., Halimah, N., Raya, J., & Purwokerto, D. (n.d.). PREDIKSI
KATEGORI KELULUSAN MAHASISWA MENGGUNAKAN JARINGAN
BACKPROPAGATION.
Mustafidah, H., Fitri, D., Halimah, N., Raya, J., & Purwokerto, D. (2021).
PREDIKSI KATEGORI KELULUSAN MAHASISWA MENGGUNAKAN
JARINGAN BACKPROPAGATION.
Nur Ihsan, M. R., Gandhiadi, G. K., & Harini, L. P. I. (2023). Prediksi Kelulusan
Mahasiswa Program Studi Matematika Universitas Udayana Menggunakan
Backpropagation Neural Network. E-Jurnal Matematika, 12(3), 242.
https://doi.org/10.24843/mtk.2023.v12.i03.p425
Prabowo Pudjo Widodo, & Rahmadya Trias Handayanto. (2012). Penerapan Soft
Computing dengan Matlab.
RevoU. (2024). Apa itu Neural Network? Pengertian dan contoh 2023 |.
Setiyani, L., Wahidin, M., Awaludin, D., & Purwani, S. (2020). Analisis Prediksi
Kelulusan Mahasiswa Tepat Waktu Menggunakan Metode Data Mining Naïve
Bayes : Systematic Review. Faktor Exacta, 13(1), 35.
https://doi.org/10.30998/faktorexacta.v13i1.5548
Zhang, Y., Yun, Y., An, R., Cui, J., Dai, H., & Shang, X. (2021). Educational Data
Mining Techniques for Student Performance Prediction: Method Review and
Comparison Analysis. Frontiers in Psychology, 12.
https://doi.org/10.3389/fpsyg.2021.698490