Anda di halaman 1dari 54

PROPOSAL SKRIPSI

Prediksi Kelulusan Tepat Waktu Mahasiswa Teknik Informatika


Universitas Palangka Raya Menggunakan Algoritma Backpropagation

DISUSUN OLEH :
SANTI
203010503005

JURUSAN TEKNIK INFORMATIKA


FAKULTAS TEKNIK
UNIVERSITAS PALANGKA RAYA
TAHUN 2024
ABSTRAK
DAFTAR ISI
DAFTAR GAMBAR

Gambar 3. 1 Metodologi Penelitian ...................................................................... 30


Gambar 3. 2 Metode CRISP – DM ...................................................................... 31
Gambar 3. 4 DFD Level 0 ..................................................................................... 41
Gambar 3. 5 DFD Level 1 ..................................................................................... 42
Gambar 3. 6 T.Video Level 2................................................................................ 44
Gambar 3. 7 T. Lagu Level 2 ................................. Error! Bookmark not defined.
Gambar 3. 8 DFD Level 2 T. Kuis ......................... Error! Bookmark not defined.
Gambar 3. 9 ERD .................................................................................................. 45
Gambar 3. 10 Desain Halaman Login ................................................................... 47
Gambar 3. 11 Desain Halaman Utama ................... Error! Bookmark not defined.
Gambar 3. 12 Rancangan Halaman Profile ............ Error! Bookmark not defined.
Gambar 3. 13 Rancangan Halaman Video ............. Error! Bookmark not defined.
Gambar 3. 14 Rancangan Halaman Lagu .............. Error! Bookmark not defined.
Gambar 3. 15 Rancangan Halaman Kuis ............... Error! Bookmark not defined.
Gambar 3. 16 Desain Profile Admin ..................................................................... 47
Gambar 3. 17 Desain Kelola Video ...................................................................... 48
Gambar 3. 18 Desain Kelola Lagu ......................... Error! Bookmark not defined.
Gambar 3. 19 Desain Kelola Kuis.......................... Error! Bookmark not defined.
DAFTAR TABEL
BAB I
PENDAHULUAN

1. 1 Latar Belakang
Perkembangan teknologi pada era globalisasi semakin maju dan terus
berkembang dengan pesat. Teknologi tidak hanya dimanfaatkan untuk membantu
pekerjaan tetapi dapat juga digunakan untuk menyelesaikan permasalahan
perkiraan ketepatan waktu kelulusan mahasiswa (prediksi) (Mustafidah et al., n.d.)
Kelulusan mahasiswa merupakan hal yang penting bagi perguruan tinggi baik
negeri maupun swasta. Begitu pun bagi salah satu perguruan tinggi di Kalimantan
tengah ,yaitu Universitas Palangka Raya.
Universitas Palangka Raya disingkat UPR adalah suatu perguruan tinggi
negeri pertama dan tertua di Provinsi Kalimantan Tengah pertama dan tertua di
Provinsi Kalimantan Tengah terdiri dari 8 (delapan) fakultas dan salah satunya,
yaitu Fakultas Teknik memiliki 4 (empat) jurusan terdiri dari : Jurusan Teknik
Informatika, Jurusan Teknik Pertambangan, Jurusan Arsitektur dan Jurusan Teknik
Sipil.
Jurusan Teknik Informatika di Universitas Palangka Raya merupakan salah
satu jurusan yang banyak diminati oleh mahasiswa baru dimana setiap tahunnya
pasti ada angka peningkatan dalam penerimaan mahasiswa barunya. Berdasarkan
data dari PDDikti pada tabel 1.1 data peningkatan mahasiswa di jurusan Teknik
Informatika untuk 3 tahun terakhir ini.
Tabel 1. 1 Data Mahasiwa Teknik Informatika

No. Semester Jumlah Mahasiswa


1. Ganjil 2020 520
2. Ganjil 2021 617
3. Ganjil 2022 691
Sumber : Website PDDikti
Dengan banyaknya peminat di jurusan Teknik Informatika maka alangkah
baiknya jika banyak yang lulus tepat waktu, namun saat ini tampaknya masih ada
keterlambatan kelulusan mahasiswa Teknik Informatika di Universitas Palangka
Raya. Berdasarkan data dari Surat Keputusan (SK) Yudisium Universitas Palangka
Raya tahun 2015-2023 terdapat 45 mahasiswa yang lulus tepat waktu sedangkan
untuk yang lulus tidak tepat waktu berjumlah 238 mahasiswa. Keterlambatan
kelulusan ini dapat menjadi permasalahan bagi jurusan dalam memenuhi standar
akreditasi. Kemudian, adanya ketidakseimbangan antara jumlah mahasiswa yang
baru masuk dengan jumlah lulusan tepat waktu ini juga menyebabkan permasalahan
dalam penentuan kapasitas jurusan seperti, ruang kelas, tenaga pengajar, dan
fasilitas penunjang yang lainnya.
Selama ini masih belum ada sistem yang dapat digunakan untuk prediksi
kelulusan tepat waktu. Maka dari itu diperlukannya sebuah teknik untuk
membangun sistem prediksi. Berikut beberapa tujuan dan manfaat prediksi ini
dilakukan , yaitu dalam peningkatan akreditasi yang baik memerlukan presentase
kelulusan yang memadai, perencanaan kurikulum yang lebih efektif, intervensi
dini, efisiensi sumber daya dan peningkatan kualitas belajar. Metode yang sering
digunakan dalam prediksi kelulusan mahasiswa tepat waktu adalah metode
klasifikasi. Metode klasifikasi merupakan pendekatan untuk menjalankan fungsi
klasifikasi dalam data mining yaitu menggolongkan data (Rohwan, 2018). Dalam
data mining terdapat beberapa algoritma dalam klasifikasi , yaitu naïve bayes,
decision tree, k-nearest neighbor (KNN), support vector machine (SVM) dan neural
network. Dari beberapa algoritma tersebut neural network termasuk salah satu
algoritma klasifikasi yang popular digunakan dalam data mining .
Dalam makalah review tahun 2021 oleh Mohammed et al. yang berjudul
"Machine learning in data mining: a survey", disebutkan bahwa deep learning dan
neural network merupakan algoritma klasifikasi yang paling banyak digunakan saat
ini dalam aplikasi data mining. Popularitas neural network terus meningkat
dikarenakan kemampuannya melakukan representasi data tingkat tinggi dan
pendekatan end-to-end dalam pemodelan (Mohammed, 2021).
Dalam penulisan jurnal oleh Schmidhuber (2015) menyatakan secara
konsisten menggunakan istilah "neural network" dan "artificial neural network"
secara bergantian untuk merujuk ke model komputasi dengan banyak lapisan
neuron buatan tersebut (Schmidhuber, 2015). Jaringan Syaraf Tiruan (JST)
merupakan solusi ideal untuk menyelesaikan permasalahan yang tidak dapat
diformulasikan dengan mudah. Ada beberapa paradigm dalam JST yang dapat
digunakan, salah satunya yaitu jaringan Backpropagation (Mustafidah et al., 2021).
Algoritma backpropagation adalah salah satu metode pembelajaran pada jaringan
saraf tiruan yang digunakan untuk memprediksi kelulusan tepat waktu mahasiswa.
Penelitian yang dilakukan oleh Muhammad Dedek Yalidhan di STMIK
Banjarbaru menggunakan algoritma backpropagation untuk memprediksi kelulusan
mahasiswa (Yalidhan & Amin, 2018). Dari hasil perhitungan tabel confusion matrix,
diperoleh persentase akurasi prediksi sebesar 98.97%. Kelebihan dari algoritma
backpropagation adalah kemampuannya untuk memprediksi kelulusan mahasiswa
dengan akurasi yang tinggi (Yalidhan & Amin, 2018). Kemampuan pattern
recognition dan klasifikasi Backpropagation merupakan algoritma jaringan syaraf
tiruan yang sangat baik dalam mengenali pola dan melakukan klasifikasi. Algoritma
ini cocok digunakan untuk memprediksi apakah seorang mahasiswa akan lulus
tepat waktu atau tidak berdasarkan pola data historis.
Maka dari itu saya mengangkat sebuah judul “Prediksi Kelulusan Tepat
Waktu Mahasiswa Teknik Informatika Universitas Palangka Raya
Menggunakan Algoritma Backpropagation”.

1. 2 Rumusan Masalah
Berdasarkan latar belakang di atas, rumusan masalah dalam penelitian ini
adalah “Bagaimana cara Algoritma Backpropagation dalam memprediksi tingkat
kelulusan tepat waktu mahasiswa Teknik Informatika Universitas Palangka Raya?”

1. 3 Batasan Masalah
Berikut adalah beberapa batasan masalah yang dapat digunakan sebagai acuan
dalam penelitian:
1. Penelitian ini difokuskan untuk memprediksi kelulusan tepat waktu mahasiswa
Teknik Informatika Universitas Palangka Raya dengan Algoritma
Backpropagation.
2. Penelitian ini terbatas hanya untuk mahasiswa Jurusan Teknik Informatika di
Universitas Palangka Raya.
3. Data yang digunakan untuk penelitian ini mencakup informasi tentang nilai IP
semester 1-4, SKS, IPK, beasiswa bidikmisi, jalur masuk, penghasilan
orangtua dan UKT.
4. Rentang waktu penelitian tahun angkatan 2011-2019 dengan jumlah yang lulus
tepat waktu 45 orang dan tidak tepat waktu 238.
5. Variabel yang digunakan dalam penelitian ini adalah nilai IP semester 1-4,
SKS, IPK, beasiswa bidikmisi, jalur masuk, penghasilan orangtua, dan UKT.
6. Klasifikasi terdiri dari 2 (dua) kelas, yaitu “tepat waktu” dan “tidak depat
waktu”.
7. Pemodelan data prediksi kelulusan tepat waktu ini menggunakan jupiter
notebook dan dikembangkan dalam bentuk website.
8. Penelitian ini menggunakan Algoritma Backpropagation kemudian Algoritma
C4.5 sebagai pembandingnya.

1. 4 Tujuan Penelitian
Tujuan dari penelitian ini adalah:
1. Memprediksi kelulusan tepat waktu mahasiswa Teknik Informatika
Universitas Palangka Raya.
2. Mengimplementasikan algoritma backpropagation untuk prediksi
kelulusan tepat waktu mahasiswa Teknik Informatika Universitas
Palangka Raya.
3. Mengevaluasi akurasi algoritma backpropagation dalam memprediksi
kelulusan tepat waktu mahasiswa Teknik Informatika Universitas
Palangka Raya.
4. Memberikan rekomendasi kepada pihak jurusan Teknik Informatika
Universitas Palangka Raya berdasarkan hasil prediksi kelulusan tepat
waktu mahasiswa Teknik Informatika menggunakan algoritma
backpropagation.
1. 5 Manfaat Penelitian
Manfaat dari penelitian ini adalah:
1. Bagi Penulis
Melalui penelitian ini, penulis dapat meningkatkan dan
meningkatkan kompetensi mereka di bidang pengembangan model
prediktif menggunakan algoritma Backpropagation. Memahami rincian
penggunaan algoritma ini dapat membantu dalam meningkatkan
analisis data dan produktivitas penelitian.
2. Bagi Jurusan Teknik Informatika Universitas Palangka Raya
Penelitian ini dapat membantu perguruan tinggi dan jurusan Teknik
Informatika dalam mengoptimalkan penggunaan sumber daya dengan
mengidentifikasi mahasiswa yang berisiko tinggi tidak lulus tepat
waktu. Hal ini dapat membantu perguruan tinggi dalam perencanaan
dan alokasi sumber daya secara efisien.
1. 6 Sistematika Penulisan
Adapun sistematika penulisan Skripsi ini disusun untuk memberikan
gambaran umum tentang penelitian yang dijalankan. Sistematika penulisan
skripsi adalah sebagai berikut :
1. BAB I PENDAHULUAN
Pada bab ini menguraikan tentang latar belakang permasalahan,
rumusan masalah, batasan masalah, menentukan tujuan dan manfaat
dibuatnya, sistematika penulisan serta jadwal kegiatan.
2. BAB II LANDASAN TEORI
Bab ini berisi paparan tentang algoritma Backpropagation beserta
kajian pustaka penelitian terdahulu.
3. BAB III METODOLOGI PENELITIAN
Metodologi penelitian adalah sekumpulan kegiatan, peraturan serta
prosedur yang dipakai oleh peneliti suatu disiplin ilmu. Metodologi
juga merupakan suatu analisis teoritis tentang sebuah metode atau cara.
Penelitian merupakan sebuah penyajian yang sistematis dengan tujuan
untuk meningkatkan jumlah pengetahuan. Pada bab ini akan
menjelaskan metodologi yang digunakan dalam judul penelitian
“Prediksi Kelulusan Tepat Waktu Mahasiswa Teknik Informatika
Universitas Palangka Raya Menggunakan Algoritma
Backpropagation”.
4. BAB IV HASIL DAN PEMBAHASAN
Bab ini menampilkan hasil pembuatan program dan pembahasan
tentang perbandingan dari kedua algoritma tersebut yang sudah dibuat.
5. BAB V KESIMPULAN DAN SARAN
Bab ini bagian kesimpulan memuat ringkasan dari permasalahan yang
ada pada rumusan masalah hasil penelitian yang sudah dilakukan, serta
saran yang dapat memberikan gambaran untuk membuat sistem ini
lebih berkembang nantinya apabila digunakan

1. 7 Jadwal Penelitian
Adapun jadwal penyusunan proposal skripsi ini dapat dilihat dalam tabel 1.2
berikut:
Tabel 1. 2 Jadwal Penelitian

Bulan
No Kegiatan Februari Maret April Mei Juni
1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4
1. Penyusunan
Proposal dan
Pengumpulan
Proposal
2. Pengumpulan
Data
3. Seminar
Proposal
4. Analisis
Sistem
5. Desain Sistem
6. Implementasi
7. Pengujian
Sistem
8. Evaluasi
9. Pengumpulan
Laporan Akhir
10. Seminar Hasil
BAB II
LANDASAN TEORI

2.1 Tinjauan Pustaka

2.1.1 Prediksi Kelulusan Mahasiswa Program Studi Matematika Universitas


Udayana Menggunakan Backpropagation Neural Network
(NUR IHSAN et al., 2023) Studi ini bertujuan untuk memprediksi
waktu kelulusan mahasiswa Program Studi Matematika Universitas
Udayana menggunakan metode Backpropagation Neural Network (BNN).
Metode ini dipilih karena efektif dalam masalah peramalan dan prediksi.
Penelitian ini menggunakan lima variabel input berupa nilai Indeks Prestasi
Semester 1-5 dan satu variabel output berupa lama masa studi. Data
penelitian bersumber dari arsip Fakultas Matematika dan Ilmu Pengetahuan
Alam Universitas Udayana. Hasil pengujian model prediksi menunjukkan
bahwa penggunaan metode Backpropagation Neural Network memiliki
73% nilai akurasi, 58% nilai presisi, 77% nilai recall, dan 66% nilai F-
Measure. Hal ini menandakan bahwa model prediksi dapat digunakan untuk
memprediksi kelulusan mahasiswa Program Studi Matematika FMIPA
Universitas Udayana. Saran yang diusulkan berdasarkan temuan penelitian
meliputi perluasan atribut masukan yang digunakan, studi lebih lanjut
mengenai prediksi kelulusan mahasiswa dengan metode BNN yang lebih
kompleks, serta peningkatan jumlah variabel untuk studi kasus yang lebih
luas. Dengan demikian, penelitian ini memberikan kontribusi dalam upaya
meningkatkan persentase mahasiswa lulus tepat waktu dalam program studi
Matematika Universitas Udayana menggunakan pendekatan
Backpropagation Neural Network.
2.1.2 Prediksi Kelulusan Mahasiswa Dengan Metode Naïve Bayes dan Artificial
Neural Network : Studi Kasus Fakultas Teknik UNIS Tangerang
(Habibah et al., 2022) Studi ini bertujuan untuk memprediksi
kelulusan mahasiswa tepat waktu dengan menggunakan metode Naïve
Bayes dan Artificial Neural Network (ANN) di Fakultas Teknik, UNIS
Tangerang. Penelitian ini menggunakan metode CRISP-DM yang terdiri
dari enam fase, dimulai dari identifikasi masalah hingga evaluasi
pemodelan. Data yang digunakan mencakup atribut seperti Asal Sekolah,
Total SKS, Total Cuti, Kemampuan Finansial, dan nilai IPS. Metode Naïve
Bayes digunakan sebagai teknik klasifikasi data mining yang populer untuk
mengklasifikasikan data dalam jumlah besar. Sementara itu, ANN
digunakan untuk memprediksi kelulusan mahasiswa berdasarkan
pengalaman masa sebelumnya. Hasil penelitian menunjukkan bahwa
metode Naïve Bayes dan ANN dapat membantu mengatasi masalah
rendahnya presentase mahasiswa yang lulus tepat waktu. Evaluasi
pemodelan dilakukan menggunakan Jupyter Notebook Python dan aplikasi
WEKA, dengan algoritma Multilayer Perceptron memiliki akurasi tertinggi
diikuti oleh Naïve Bayes. Penelitian ini memberikan kontribusi dalam
meningkatkan pemahaman tentang prediksi kelulusan mahasiswa
menggunakan metode data mining, serta memberikan wawasan bagi
universitas untuk mengidentifikasi mahasiswa yang berisiko tidak lulus
tepat waktu. Dengan demikian, penelitian ini dapat membantu institusi
pendidikan dalam meningkatkan tingkat kelulusan mahasiswa secara
efektif.
2.1.3 Implementasi Algoritma Backpropagation Untuk Memprediksi Kelulusan
Mahasiswa
(Yalidhan & Amin, 2018) Latar belakang penelitian adalah
kelulusan mahasiswa merupakan salah satu elemen penting dalam akreditasi
perguruan tinggi, namun di Program Studi Sistem Informasi STMIK
Banjarbaru belum ada sistem yang memprediksi ketepatan waktu kelulusan.
Tujuan penelitian adalah membangun sistem prediksi ketepatan waktu
kelulusan mahasiswa dengan akurasi tinggi menggunakan algoritma
backpropagation pada jaringan syaraf tiruan. Metode penelitian yang
digunakan ,yaitu penerapan algoritma backpropagation neural network.
Data yang digunakan sebanyak 318 data mahasiswa dari angkatan 2011-
2013. Hasil penelitian menunjukkan akurasi prediksi sebesar 98,97%.
Parameter neural network yang optimal adalah 10 input nodes, training
cycles 1200, learning rate 0,1, momentum 0,1, 1 hidden layer dengan 3
node. Kesimpulan penelitian adalah algoritma backpropagation dapat
diterapkan untuk memprediksi kelulusan mahasiswa dengan akurasi tinggi.
Beberapa faktor seperti parameter jaringan, jumlah data training, target data
mempengaruhi performa algoritma. Secara keseluruhan, penelitian ini
berkontribusi dalam penerapan algoritma cerdas untuk prediksi kinerja
akademik mahasiswa di perguruan tinggi. Hasil prediksi bermanfaat bagi
evaluasi program studi.
2.1.4 Analisa Kelulusan Mahasiswa Teknik Informatika Tepat Waktu
Menggunakan Algoritma Artificial Neural Network (ANN)
(Hendri Janto Rahanra & Taufiq Luthfi, 2022) Jurnal ini membahas
analisis kelulusan mahasiswa Teknik Informatika tepat waktu menggunakan
Algoritma Artificial Neural Network (ANN). Penelitian ini didasarkan pada
Standar Nasional Pendidikan Tinggi yang mengatur bahwa mahasiswa
program S1 D4 seharusnya lulus dalam waktu maksimal 7 tahun masa studi.
Data yang digunakan berasal dari tahun 2018-2021 dan dibagi menjadi data
training dan data testing. Metode yang digunakan dalam penelitian ini
meliputi pengumpulan data mahasiswa dari Universitas Satya Wiyata
Mandala, pembersihan data untuk menghilangkan data yang tidak lengkap,
dan normalisasi data untuk meningkatkan akurasi. Selain itu, penelitian ini
menggunakan Artificial Neural Network (ANN) untuk menganalisis
kelulusan mahasiswa dengan tahap transformasi, data mining, klasifikasi
data testing dan data training, serta evaluasi hasil klasifikasi dengan
menghitung nilai accuracy, precision, dan recall dari confusion matrix. Hasil
evaluasi menggunakan confusion matrix menunjukkan nilai akurasi sebesar
0.90%, precision sebesar 0.93%, dan recall sebesar 0.86%. Dengan nilai-
nilai tersebut, model klasifikasi yang dihasilkan masuk ke dalam kategori
excellent classification, menunjukkan kemampuan model dalam mendeteksi
dengan tepat sesuai dengan data yang ada. Penelitian ini memberikan
kontribusi dalam memprediksi kelulusan mahasiswa Teknik Informatika
tepat waktu menggunakan ANN, serta menyoroti pentingnya penggunaan
teknologi dalam mendukung keberhasilan pendidikan tinggi.

2.1.5 Prediksi Kelulusan Mahasiswa Tepat Waktu Menggunakan Metode


Decision Tree dan Artificial Neural Network
(Rohwan, 2018) Penelitian ini menggunakan dua metode
klasifikasi, yaitu Decision Tree dan Artificial Neural Network, untuk
memprediksi kelulusan mahasiswa tepat waktu. Data akademik mahasiswa
digunakan sebagai basis prediksi, dengan atribut seperti NIM, jenis kelamin,
asal sekolah, jalur masuk, nilai ujian nasional, gaji orang tua, IP semester 1-
4, dan IPK semester 1-4. Metode Decision Tree memanfaatkan pohon
keputusan berdasarkan Gain Ratio untuk menentukan atribut yang paling
berpengaruh dalam prediksi kelulusan. Sementara itu, Artificial Neural
Network digunakan untuk analisis data lebih lanjut. Penelitian ini
memberikan kontribusi dalam memahami faktor-faktor yang memengaruhi
kelulusan mahasiswa tepat waktu dan memberikan wawasan bagi
universitas dalam meningkatkan tingkat kelulusan mahasiswa. Dengan
menggunakan teknik data mining dan analisis data akademik, penelitian ini
dapat menjadi dasar untuk pengembangan kebijakan yang lebih efektif
dalam mendukung mahasiswa mencapai kelulusan tepat waktu.
2.2 Teori – Teori Pendukung
2.2.1 Kululusan Tepat Waktu
Kelulusan tepat waktu penting karena berkaitan dengan efisiensi biaya
pendidikan, baik bagi mahasiswa maupun institusi. Selain itu, kelulusan tepat waktu
juga meningkatkan peluang kerja dan penghasilan lulusan setelah masuk dunia
kerja (Millea et al., 2018). Bagi mahasiswa, kelulusan tepat waktu adalah masalah
penting di bidang pendidikan yang sulit (Habibah et al., 2022). Berikut adalah
beberapa kutipan dari Ahli tentang kelulusan tepat waktu :
1. Efisiensi Pendidikan dan Akreditasi:
a) Menurut David Hand, Heikki Mannila, dan Padhraic Smyth, data mining
adalah proses analisis data yang bertujuan untuk menemukan pola-pola
yang signifikan dan mengungkap informasi baru yang sebelumnya belum
diketahui (Moerdyanto et al., 2023).
b) Efisiensi pendidikan, termasuk kelulusan tepat waktu, menjadi elemen
penilaian yang signifikan dalam akreditasi perguruan tinggi. Mahasiswa
yang menyelesaikan studi sesuai dengan waktu yang ditentukan
memberikan kontribusi positif dalam meningkatkan akreditasi institusi
tersebut (Setiyani et al., 2020).
2. Pengaruh Disiplin:
a) Menurut Duff, A., Boyle, E., Dunleavy, K., & Ferguson, J. (2004),
menyatakan bahwa mahasiswa yang memiliki tingkat kerajinan (diligence)
dan ketekunan (perseverance) tinggi cenderung memiliki performa
akademik yang lebih baik (Duff et al., 2004).
b) Mahasiswa yang memiliki disiplin belajar cenderung lebih tepat waktu
dalam menyelesaikan tugas dan studi.
3. Prediksi Kelulusan dengan Data Mining:
a) Metode klasifikasi, seperti pendekatan pohon keputusan, sering digunakan
untuk memprediksi kelulusan mahasiswa tepat waktu (Moerdyanto et al.,
2023).
b) Penelitian menggunakan data dari program studi sistem informasi di
Universitas Negeri Surabaya menunjukkan bahwa variabel tertentu
memengaruhi kelulusan tepat waktu. Informasi ini membantu perguruan
tinggi mengambil langkah yang efektif untuk meningkatkan peluang
kelulusan mahasiswa (Moerdyanto et al., 2023).
4. Saran untuk Mahasiswa:
a) Mahasiswa perlu memperhatikan faktor-faktor seperti motivasi, lingkungan
belajar, dan manajemen waktu untuk mencapai kelulusan tepat waktu
(Retnowati, 2009).
b) Memperbaiki relasi dengan rekan mahasiswa dan dosen, meningkatkan
literasi, serta memanfaatkan teknologi juga dapat membantu.
Beberapa faktor yang mempengaruhi kelulusan tepat waktu antara lain (Terkla,
1985) :
1) Kinerja akademik mahasiswa
2) Dukungan institusi melalui advising dan mentoring yang efektif
3) Ketersediaan mata kuliah yang cukup
4) Kurikulum program studi yang tertata dengan baik
5) Dukungan finansial bagi mahasiswa

2.2.2 Data Mining


Data Mining adalah proses menemukan pola dan pengetahuan yang menarik
dari sejumlah besar data. Sumber data dapat mencakup database, gudang data, web,
repositori informasi lainnya, atau data yang ditransmisikan ke sistem secara dinamis
(Han, 2012a).
Berikut adalah definisi data mining menurut beberapa ahli beserta sumbernya:
1) Ian H. Witten, Eibe Frank, dan Mark A. Hall dalam bukunya "Data
Mining: Practical Machine Learning Tools and Techniques" (2011) :
Data mining adalah proses ekstraksi pola yang menarik dan berguna dari
data dalam jumlah besar (Ian H. Witten et al., 2011).
2) Kusrini dan Emha Taufiq Luthfi dalam bukunya "Algoritma Data Mining"
(2009) :
Data mining adalah proses yang menggunakan teknik statistik,
matematika, kecerdasan buatan, dan machine learning untuk
mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan
pengetahuan yang terkait dari berbagai database besar (Kusrini & Luthfi,
2009).
3) Mohammed J. Zaki dan Wagner Meira JR dalam bukunya "Data Mining
and Analysis: Fundamental Concepts and Algorithms" (2014):
Data mining adalah proses penemuan pola dalam data. Pola-pola ini harus
bermanfaat dan valid, dan tidak seharusnya menjadi acak (Mohammed J.
Zaki & Wagner Meira JR, 2014).
4) Florin Gorunescu dalam bukunya "Data Mining: Concepts, Models, and
Techniques" (2011):
Data mining adalah proses pencarian informasi yang tersembunyi dalam
sejumlah besar data. Ini merupakan proses ekstraksi pola atau model yang
bermanfaat dari data yang tersimpan dalam repositori data yang besar
(Gorunescu .F, 2011).
5) Prabowo Pudjo Widodo dan Rahmadya Trias Handayanto dalam bukunya
"Penerapan Soft Computing dengan Matlab" (2012):
Data mining adalah proses analisis data dari perspektif yang berbeda dan
menggabungkannya menjadi informasi yang berguna, yang digunakan
untuk meningkatkan keuntungan dan operasi bisnis (Prabowo Pudjo Widodo
& Rahmadya Trias Handayanto, 2012).

2.2.3 Klasifikasi
Berikut penjelasan mengenai klasifikasi menurut ahli beserta sumber kutipannya :
1. Menurut Affendey dkk. (2010):
Pemodelan prediktif mengacu pada tugas membangun model untuk variable
target sebagai fungsi dari variabel penjelas. Dua jenis tugas pemodelan
prediktif adalah klasifikasi, yang digunakan untuk variable target diskrit,
dan regresi, yang digunakan untuk variable kontinyu sasaran (L.S.Affendey,
2010).
2. Menurut Nghe dkk. (2007):
Klasifikasi melibatkan pembelajaran sebuah fungsi yang memetakan data
input ke dalam salah satu dari sejumlah kategori diskrit (Zhang et al., 2021).
Terdapat beberapa algoritma dengan pendekatan yang berbeda dalam proses
data dan menentukan aturan kriteria pengelompokan klasifikasi. Algoritma ini
dibagi menjadi tiga kelompok: berbasis linear, berbasis non-linear, dan rule-based
(Pradytya, 2018).
Gambar 2. 1 Classification algorithms
Sumber : Wendler, 2016:719

Pada setiap model klasifikasi tersebut memiliki kekurangan dan kelebihannya


masing-masing dan dapat digunakan sesuai dengan kebutuhan dan fungsinya,
dilihat pada tabel 2.1 dibawah ini.
Tabel 2. 1 Kekurangan dan Kelebihan Model Klasifikasi
Sumber : Wendler, 2016:720
Jadi klasifikasi secara umum merupakan teknik pemodelan prediktif dengan
variable target berupa kategori diskrit, bukan kontinyu. Tujuannya adalah
memetakan data input ke dalam kategori diskrit tersebut.
2.2.4 Artificial Neural Network
Neural network atau disebut juga dengan Artificial Neural Network (ANN)
adalah sekumpulan algoritma machine learning yang dirancang untuk mengenali
pola data(Revo, 2024).
Berikut penjelasan mengenai ANN menurut para ahli beserta sumber
kutipannya :
2.3 Menurut Stergiou dan Siganos (2022) :
Artificial Neural Network (ANN) adalah jenis sistem pengambilan
informasi dengan karakteristik yang mirip dengan jaringan saraf biologis.
ANN terdiri dari sejumlah unit pemroses sederhana yang disebut neuron,
yang dihubungkan satu sama lain dalam suatu pola hubungan tertentu
(Stergiou & Siganos, 2022).
2.4 Menurut Budhi, Gunawan dan Jaowry :
Jaringan syaraf tiruan adalah model matematika yang menirukan
cara kerja otak manusia. Jaringan syaraf tiruan terdiri dari sejumlah unit
pemroses kecil yang dihubungkan satu dengan yang lainnya membentuk
jaringan kerja pengolahan data sebagaimana proses yang terjadi didalam
otak manusia (Gunawan, 2020).
ANN meniru cara kerja otak manusia. Otak manusia tersusun atas miliaran
neuron yang saling terhubung satu sama lain. Neuron-neuron ini akan memproses
informasi dan mengirimkan sinyal ke neuron lainnya. Pola hubungan antar neuron
inilah yang membuat otak mampu belajar dari pengalaman dan melakukan tugas
kompleks seperti pengenalan pola (Schmidhuber, 2015). ANN dirancang untuk
meniru perilaku ini. Unit-unit pemroses pada ANN, yaitu neuron buatan, diatur
hubungannya untuk membentuk suatu jaringan. ANN dilatih dengan contoh-contoh
data agar mampu mengenali pola dan membuat prediksi berdasarkan data baru.
Semakin banyak data latih yang diberikan, semakin akurat prediksi yang dihasilkan
ANN (Pal, 2022).

2.2.5 Algoritma Backpropagation


Backpropagation adalah algoritma pelatihan yang populer digunakan untuk
melatih ANN. Algoritma ini bekerja dengan menghitung gradient error output
jaringan (Stergiou & Siganos, 2022). Berikut penjelasan mengenai algoritma
Backpropagation menurut para ahli beserta sumber kutipannya:
1. Menurut Budhi, Gunawan dan Jaowry :
Dalam backpropagation terdapat beberapa langkah-langkah untuk
menyelesaikan masalahnya, dimana ciri dari metode ini adalah
meminimalkan error pada output yang dihasilkan oleh jaringan.
Backpropagation disebut juga sebagai Multilayer Neural Network sehingga
terdri dari beberapa layer yaitu input layer, hidden layer, dan output layer
dan pada setiap layer terdapat satu atau lebih artificial neuron (Gunawan,
2020).
2. Menurut Larose :
Backpropagation adalah algoritma pembelajaran terawasi yang
paling sering digunakan untuk melatih jaringan syaraf tiruan. Tujuan
utamanya adalah untuk meminimumkan error output dengan menyesuaikan
bobot hubungan antar neuron (Larose, 2014).
Backpropagation terdiri dari dua fase, yaitu fase forward dan fase backward.
Pada fase forward, pola input diproses maju dari layer input hingga layer output
untuk menghasilkan output jaringan. Output yang dihasilkan ini kemudian
dibandingkan dengan target yang diinginkan, dan selisihnya (error) dihitung. Pada
fase backward, error ini dipropagasikan mundur dari layer output ke layer-layer
sebelumnya. Bobot hubungan antar neuron kemudian disesuaikan untuk
meminimalkan error pada langkah berikutnya (Pal, 2022).
Berikut ini pelatihan algoritma backpropagation (Hanindya Ujianti, 2016) :
Fase I : Propagasi Maju (forward propagation)
1. Setiap unit input (𝑥𝑖, = 1,2,3, … , ) menerima sinyal 𝑥𝑖 dan meneruskan
sinyal ke seluruh lapis/unit tersembunyi (hidden layer).
2. Setiap unit tersembunyi ( , = 1,2,3, … , ), menjumlahkan bobot sinyal input
dengan persamaan berikut. _𝑖𝑛𝑗 = 0 + ∑ 𝑥𝑖𝑣𝑖𝑗 =1. Dan menerapkan fungsi
aktivasi untuk menghitung sinyal outputnya: 𝑧𝑗 = ( _𝑖𝑛𝑗). Biasanya fungsi
aktivasi yang digunakan adalah sigmoid, kemudian mengirimkan sinyal
tersebut ke semua output
3. Setiap unit output (𝑦𝑘, = 1,2,3, … , ) menjumlahkan bobot sinyal input _𝑖𝑛𝑘
= 0 + ∑ 𝑧𝑖𝑤𝑗𝑘 = 1 Dan menerapakan fungsi aktivasi untuk menghitung
sinyal outputnya:
𝑦𝑘 = f( _𝑖𝑛𝑘)

Fase II : Propagasi mundur (Back propagation)


2.3 Setiap unit output (𝑦𝑘, = 1,2,3, … , ) menerima pola target yang sesuai dengan
pola input pelatihan, kemudian hitung error dengan persamaan berikut:
(𝛿𝑘 = 𝑡𝑘 − 𝑦𝑘) ′(𝑦𝑖𝑛𝑘 )
f’ adalah turunan dari fungsi aktivasi kemudian hitung koreksi bobot dengan
persamaan sebagai berikut:
∆ w0k = 𝛼 ∗ 𝛿 k ∗ 𝑧𝑗
Dan menghitung koreksi bias dengan persamaan berikut, ∆ w0k = 𝛼 ∗ 𝛿 k
Sekaligus mengirimkan 𝛿𝑘 ke unit-unit yang ada di layer paling kanan
2.4 Setiap unit tersembunyi (𝑧𝑗 , = 1,2,3, … , ) menjumlahkan delta inputnya (dari
unit-unit yang berada pada lapisan di kanannya) : 𝛿 _𝑖𝑛𝑗 = ∑ 𝛿𝑘𝑤𝑗𝑘 mk
=1
Untuk menghitung informasi error, kalikan nilai ini dengan turunan dari fungsi
aktivasinya: 𝛿𝑗 = _𝑖𝑛𝑗𝑓′( _𝑖𝑛𝑗), kemudian hitung koreksi bobot dengan
persamaan sebagai berikut:
∆𝑣𝑗𝑘 = 𝛼 ∗ 𝑥𝑖
Dan menghitung koreksi bias dengan persamaan berikut: ∆v0j = 𝛼 ∗ 𝛿𝑗
Fase III : Perubahan bobot dan bias
1. Setelah unit output (𝑦𝑘, = 1,2,3, … , ) dilakukan perubahan bobot dan bias (𝑧𝑗
j, = 1,2,3, … , ) dengan persamaan berikut :
𝑊𝑗𝑘(𝑏𝑎𝑟𝑢) = 𝑊𝑗𝑘(𝑙𝑎𝑚𝑎) + ∆𝑊𝑗𝑘
Setiap unit tersembunyi (𝑧𝑗 , = 1,2,3, … , ) dilakukan perubahan bobot dan
bias(𝑧𝑖 , = 1,2,3, … , ) dengan persamaan berikut:
𝑖𝑗( 𝑎𝑟𝑢) = 𝑉𝑖𝑗(𝑙𝑎𝑚𝑎) + (2.13) 𝑉𝑖𝑗
2. Pengujian kondisi berhenti
Proses ini diulang terus menerus hingga error output jaringan mencapai
batas minimal yang ditentukan atau jaringan dianggap telah konvergen.
(Schmidhuber, 2015).
2.2.6 Metode CRISP-DM
CRISP-DM (Cross Industry Standard Process for Data Mining) adalah
metodologi standar untuk melakukan project data mining (Chapman, 2000).
CRISP-DM memiliki 6 tahapan, yaitu (Azevedo & Santos, 2008):
1. Business Understanding Pada tahap ini, tujuan proyek data mining
ditentukan berdasarkan sasaran organisasi/perusahaan. Dilakukan analisis
situasi saat ini, lalu dirumuskan permasalahan bisnis spesifik yang ingin
diselesaikan dengan data mining. Hasilnya adalah dokumen yang
mencakup analisis situasi bisnis saat ini, tujuan & cakupan proyek,
sasaranmodel analisis, serta criteria keberhasilan.
2. Data Understanding Tahap memahami data yang tersedia untuk proyek
data mining. Aktivitas pada tahap ini meliputi: pengumpulan data awal,
mendeskripsikan & mengeksplorasi data, serta menverifikasi data quality.
Hasilnya berupa laporan detail mengenai data termasuk statistik deskriptif,
asumsi yang dibuat, dan isu-isu data quality yang perlu ditangani.
3. Data Preparation Tahap membersihkan dan mempersiapkan data agar
sesuai untuk pemodelan. Kegiatan meliputi: membersihkan data
(menangani missing value, outlier, duplikasi), pemilihan record & atribut
untuk model, serta transformasi & normalisasi data. Hasilnya dataset
lengkap yang siap di-input ke teknik data mining.
4. Modeling Pada tahap ini, beragam model data mining dibangun dan
dikonfigurasi menggunakan algoritma seperti klasifikasi, clustering,
regresi. Model tuning dan optimization dilakukan untuk mencari
performing model terbaik berdasarkan criteria yang ditentukan. Hasil
akhirnya model analitik terpilih yang siap dievaluasi.
5. Evaluation Melakukan evaluasi model analitik apakah sudah memenuhi
kriteria kesuksesan bisnis yang telah didefinisikan sejak awal. Dilakukan
proses review hasil analitik dan juga rekomendasi model improvement jika
diperlukan.
6. Deployment Tahap akhir menerapkan model data mining yang sudah
dievaluasi ke dalam proses pengambilan keputusan bisnis. Misal
digunakan untuk pemberian kredit, deteksi penipuan transaksi,
pengambilan keputusan operasional perusahaan. Model disajikan dalam
bentuk laporan, dashboard analitik, maupun fully-integrated ke sistem
operasi perusahaan.
2.2.7 Pengujian Performa Model
1. Akurasi
Akurasi model prediksi didefinisikan sebagai persentase kondisi yang
diklasifikasikan dengan benar (Nguyen Thai Nghe dkk., 2007). Akurasi (accuracy)
adalah suatu ukuran yang menunjukkan tingkat kedekatan antara nilai prediksi yang
dibuat oleh model terhadap nilai aktualnya (Han, 2012). Secara lebih rinci dan
detail, akurasi dapat dijelaskan sebagai berikut (Powers, 2020):
2.3 Akurasi diukur berdasarkan jumlah prediksi yang benar (true positives + true
negatives) dibandingkan dengan keseluruhan data (true positives + false
positives + true negatives + false negatives).
2.4 Secara matematis, akurasi didefinisikan dengan rumus:
Akurasi = (TP + TN) / (TP + FP + TN + FN)
Keterangan:
a) TP = True positives
b) TN = True negatives
c) FP = False positives
d) FN = False negatives
2.5 True positives (TP) adalah jumlah hasil prediksi positif yang tepat.
2.6 True negatives (TN) adalah jumlah hasil prediksi negatif yang tepat.
2.7 False positives (FP) adalah jumlah hasil prediksi positif yang salah.
2.8 False negatives (FN) adalah jumlah hasil prediksi negatif yang salah.
2.9 Semakin tinggi nilai akurasi, semakin akurat model dalam memprediksi kelas
yang benar.
2.10 Akurasi bernilai 0-100% atau 0-1.
2.11 Model yang baik seharusnya memiliki akurasi setidaknya di atas 50%.
Jadi secara singkat, akurasi merupakan metrik evaluasi model yang
menunjukkan seberapa sering model memprediksi kelas yang benar. Semakin
tinggi akurasi, semakin akurat model tersebut.

2. Validasi Silang
Validasi silang (cross validation) adalah sebuah teknik validasi model
dalam machine learning yang bertujuan untuk menguji seberapa baik model yang
dibangun dapat digeneralisasikan ke data independen atau data baru. Dalam validasi
silang, data asli dibagi menjadi dua bagian, yaitu data latih (training set) dan data
uji (test set atau holdout set). Data latih digunakan untuk membangun model,
sedangkan data uji digunakan untuk menguji performa model dengan data yang
sebelumnya tidak pernah dilihat oleh model tersebut selama pelatihan. Kelemahan
dari pendekatan ini adalah hasil evaluasi model sangat tergantung dengan data latih
dan data uji yang dipilih. Oleh karena itu, muncul metode validasi silang yang
membagi data menjadi lebih dari dua bagian (Refaeilzadeh et al., 2016).
Dalam k-fold cross validation, data asli dibagi menjadi k buah subset (fold)
dengan ukuran yang sama. Proses validasi dilakukan sebanyak k kali, di mana
setiap kali menggunakan 1 fold sebagai data uji dan k-1 fold lainnya sebagai data
latih. Hasil evaluasi dari setiap iterasi dirata-ratakan untuk mendapatkan performa
model secara keseluruhan. Menurut jurnal yang dilakukan oleh Refaeilzadeh et al.
(2016), k = 5 atau 10 merupakan pilihan umum untuk validasi silang yang
memberikan trade-off optimal antara bias dan varians dalam estimasi performa
model. Semakin besar nilai k, semakin akurat hasil evaluasi model namun semakin
besar juga komputasi yang dibutuhkan (Refaeilzadeh et al., 2016).

3. Confusion Matrix
Confusion matrix merupakan sebuah metode visualisasi performa (akurasi)
sebuah model klasifikasi. Confusion matrix berbentuk matriks yang
merepresentasikan jumlah prediksi benar dan salah yang dibuat oleh model
klasifikasi (Chicco & Davide, 2020). Confusion matrix untuk masalah klasifikasi
biner terdiri dari 2x2 matriks yang merepresentasikan empat kondisi output model,
yaitu :
1) True Positive (TP): data positif yang terprediksi positif
2) True Negative (TN): data negatif yang terprediksi negatif
3) False Positive (FP): data negatif yang terprediksi positif
4) False Negative (FN): data positif yang terprediksi negatif
Dari 4 kondisi di atas dapat dihitung beberapa metrik evaluasi model
klasifikasi seperti akurasi, presisi, recall, dan F1-score. Confusion matrix sangat
bermanfaat dalam evaluasi model karena dapat secara visual menunjukkan
kesalahan prediksi yang dibuat model untuk setiap kelas (Chicco & Davide, 2020).
Menurut jurnal oleh Chicco (2020), confusion matrix sangat
direkomendasikan dalam validasi dan pelaporan kinerja model klasifikasi.
Confusion matrix dianggap sebagai baseline analysis model klasifikasi yang
informatif dan tidak menyesatkan (Chicco & Davide, 2020).

4. Area Under the Receiver Operating Characteristic Curve (AUC-ROC)


AUC-ROC (Area Under the Receiver Operating Characteristic Curve)
merupakan metrik evaluasi untuk model klasifikasi yang mengukur separabilitas
antara distribusi prediksi dari masing-masing kelas. Receiver Operating
Characteristic (ROC) curve menggambarkan trade-off antara true positive rate dan
false positive rate untuk berbagai nilai threshold yang digunakan oleh model
klasifikasi dalam membuat prediksi. Semakin besar area di bawah kurva ROC
(AUC), semakin baik model tersebut dalam memisahkan kelas positif dan kelas
negatif. Kelebihan AUC-ROC dibandingkan metrik evaluasi lain seperti akurasi
adalah tidak terpengaruh oleh distribusi kelas dan threshold cut-off yang digunakan.
AUC-ROC akan sama nilainya meskipun perbandingan data positif dan negatif
tidak seimbang. Menurut jurnal oleh Lobo et al. (2008), nilai AUC-ROC 0,9-
1=sangat baik; 0,8-0,9=baik; 0,7-0,8=cukup; 0,6-0,7=buruk; 0,5-0,6=sangat buruk.
Nilai AUC-ROC model yang baik sebaiknya di atas 0,8 agar model dapat
diandalkan dalam aplikasi nyata (Lobo et al., 2008).

5. Precision, Recall, dan F1-Score


Precision, Recall, dan F1-Score merupakan metrik evaluasi yang sering
digunakan untuk mengukur performa model klasifikasi, terutama pada masalah
dengan kelas data yang tidak seimbang (imbalanced class).Precision merupakan
rasio prediksi positif benar (true positive) terhadap keseluruhan prediksi positif
yang dibuat model. Precision merepresentasikan seberapa akurat model
memprediksi suatu kelas.Recall atau sensitivity adalah rasio prediksi positif benar
(true positive) terhadap keseluruhan data aktual positif. Recall mengukur
kemampuan model dalam menemukan kembali data positif (Sokolova, 2009).
Kekurangan precision dan recall jika digunakan sendiri adalah tidak
memperhitungkan keduanya sekaligus. Oleh karena itu diciptakan metrik F1-score
yang merupakan rata-rata harmonik dari precision dan recall.Menurut jurnal oleh
Sokolova et al. (2006), nilai F1-score yang tinggi menunjukkan model memiliki
keseimbangan precision dan recall yang baik, sehingga merekomendasikan
penggunaan metrik ini untuk evaluasi performa model klasifikasi (Sokolova, 2009).
BAB III
METODOLOGI PENELITIAN

3.1 Metodologi Pelaksanaan


Berikut ini metodologi penelitian yang penulis gunakan untuk
menyelesaikan laporan skripsi ini. Secara ringkas metodologi penelitian
yang digunakan penulis sebagai berikut .
3.1.1 Menentukan Topik Penelitian
Langkah awal yang harus dilakukan sebelum melakukan penelitian
yaitu menentukan topik. Setelah topiknya ditentukan ,yaitu data mining
selanjutnya menjadi persiapan awal penelitian. Data mining ini cukup
menarik untuk dibahas karena dapat menghasilkan suatu pengetahuan dari
beberapa data yang sebelumnya tidak pernah terpikirkan untuk dapat diolah
sedemikan rupa.
3.1.2 Menentukan Objek Penelitian
Langkah selanjutnya, setelah topik ditentukan yaitu menentukan
objek penelitian. Objek penelitian yang dipilih dalam melakukan penelitian
skripsi ini adalah Jurusan Teknik Informatika di Universitas Palangka Raya
(UPR), yakni dengan menggunakan data mahasiswa Jurusan Teknik
Informatika UPR
3.1.3 Menentukan Metode atas Topik Terpilih
Metode yang akan digunakan dalam penelitian ini adalah metode
Backpropagation.
3.1.4 Studi Literatur
Pada tahap ini memulai dengan mencari dan membaca teori-teori
yang berhubungan dengan penelitian yang akan dilakukan penulis. Pada
tahap ini diharapkan memiliki pedoman teoritis dalam penelitian ini. Studi
literatur ini bersumber dari buku-buku data mining dan jurnal-jurnal
penelitian sebelumnya.
Gambar 3. 1 Metodologi Penelitian
3.1.5 Merumuskan masalah
Setelah menentukan topik penelitian, objek penelitian dan
melakukan studi literatur, maka langkah selanjutnya merangkum setiap
pertanyaan yang menjadi kajian penelitian ke dalam rumusan masalah dan
membuat peta konsep data mining untuk menyelesaikan permasalahan
tersebut
3.1.6 Fase-fase CRISP-DM
Siklus CRISP-DM meliputi enam (6) fase yang masing-masing
memiliki fungsi tersendiri untuk memberikan kontribusi terhadap proses
pengerjaan data mining, dimulai dari fase business understanding, fase data
understanding, fase data preparation, fase modeling, fase evaluation, dan
fase deployment (Pradytya, 2018).

Gambar 3. 2 Metode CRISP – DM


Sumber : (Chapman, 2000)
Berikut penjelasan mengenai CRISP-DM membagi project data
mining menjadi 6 fase :
1. Bisnis Understanding
Business Understanding adalah memahami permasalahan prediksi
kelulusan tepat waktu mahasiswa Teknik Informatika UPR dan
bagaimana prediksi tersebut berguna bagi pihak universitas.
2. Data Understanding
Pengambilan data ini dari jurusan Teknik Informatika dan UPT. TIK
Univeristas Palangka Raya. Mengumpulkan data mahasiswa seperti
IP Semester 1 - 4, jumlah SKS lulus, IPK, beasiswa bidikmisi,
penghasilan orangtua, dan UKT. Klasifikasi ini terdiri dari 2 kelas,
yaitu “tepat waktu” dan “tidak tepat waktu”. Lalu melakukan
eksplorasi data untuk memahami data lebih mendalam. Data yang
akan digunakan berjumlah 301 record data.
3. Data Preparation
a. Pemilihan data dan penentuan variabel
Dalam penelitian ini sudah dilakukan pemilihan data yang
akan menjadi parameter status kelulusan mahasiswa seperti
pada tabel 3.1
Tabel 3. 1 Variabel Prediktor dan Variabel Target
Variabel Prediktor
No Nama Field Keterangan
IP semester diambil dari
semester 1 sampai semester
1 IP Semester 1 sampai 4
4 untuk angkatan 2011-
2019
Satuan Kredit Semester
(SKS) yang diambil total
2 SKS
sks lulus mata kuliah
sampai semester 4
IPK yang diambil pada saat
3 IPK
semester 4
Mahasiswa tersebut
tergolong ke beasiswa
4 Beasiswa Bidikmisi
bidikmisi atau non
beasiswa.
Penghasilan dari orangtua
mahasiswa jurusan Teknik
5 Penghasilan Orangtua
Informatika tahun angkatan
2011-2019
6 UKT UKT mahasiswa tersebut.
Variabel Target
No Nama Field Keterangan
Menyatakan status
1 Status Kelulusan kelulusan mahasiswa (tepat
waktu, tidak tepat waktu)

b. Clean data
Melakukan cleaning data yang tidak lengkap/tidak valid,
kemudian memilih data dan atribut yang relevan serta
melakukan encoding variabel kategori. Penghapusan nilai
seperti daftar mahasiswa yang sudah terlalu nilai ip
semesternya, SKS serta IPK bernilai kosong/ sudah tidak
melanjutkan studi, maka data ini tidak dapat diikutsertakan
dalam pemrosesan data mining.
4. Modeling
Memodelkan data menggunakan algoritma jaringan syaraf tiruan
Backpropagation. Melakukan pelatihan data dan penentuan
parameter terbaik. Berdasarkan beberapa eksperimen yang telah
dilakukan, arsitektur algoritma backpropagation untuk prediksi kelulusan
tepat waktu adalah arsitektur 9-6-1. Arsitektur ini terdiri dari 1 lapisan
input dengan 9 neuron, 1 lapisan hidden dengan 6 neuron dan 1 lapisan
output dengan 1 neuron.

Gambar 3. 3 Model Prediksi Kelulusan Tepat Waktu


a) Perhitungan Manual Algoritma Backpropagation
Berikut perhitungan manual algoritma backpropagation :
1. Input:
a. IP Semester 1: (x_1)
b. IP Semester 2: (x_2)
c. IP Semester 3: (x_3)
d. IP Semester 4: (x_4)
e. IPK: (x_5)
f. SKS: (x_6)
g. UKT: (x_7)
h. Penghasilan Orangtua: (x_8)
i. Beasiswa: (x_9) (misalnya, 1 jika menerima beasiswa, 0
jika tidak)
j. Jenis Kelamin: (x_{10}) (misalnya, 1 untuk laki-laki, 0
untuk perempuan)
2. Output:
a. Prediksi Kelulusan: (y_1) (misalnya, 1 jika lulus, 0 jika tidak
lulus)

Mulai dengan inisialisasi bobot secara acak:


a. Bobot Lapisan Input -> Lapisan Tersembunyi (W1):
W11 = 0.2, W12 = -0.3, W13 = 0.4, W14 = -0.5, W15 = 0.1,
W16 = -0.2, W17 = 0.3, W18 = -0.4, W19 = 0.5, W110 = -
0.1
b. Bobot Lapisan Tersembunyi -> Lapisan Output (W2):
W21 = -0.1, W22 = 0.2, W23 = -0.3, W24 = 0.4, W25 = -0.5
Langkah 1: Feedforward
1. Hitung keluaran (output) pada lapisan tersembunyi:
h1 = sigmoid(W11x1 + W12x2 + W13x3 + W14x4 + W15x5 +
W16x6 + W17x7 + W18x8 + W19x9 + W110x10)
= sigmoid(0.23.5 - 0.33.8 + 0.43.6 - 0.53.7 + 0.13.65 - 0.2120 +
0.35000000 - 0.48000000 + 0.51 - 0.10)
≈ sigmoid(-0.4)

h2 = sigmoid(W21x1 + W22x2 + W23x3 + W24x4 + W25x5 +


W26x6 + W27x7 + W28x8 + W29x9 + W210x10)
= sigmoid(-0.13.5 + 0.23.8 - 0.33.6 + 0.43.7 - 0.5*3.65)
≈ sigmoid(0.015)
h3, h4, h5, h6 sama dengan perhitungan h1 dan h2.
2. Hitung keluaran (output) pada lapisan output:
y1 = sigmoid(V1h1 + V2h2 + V3h3 + V4h4 + V5h5 + V6h6)
= sigmoid(-0.1*(-0.4) + 0.2*0.015 + ...)
≈ sigmoid(-0.1)
Langkah 2: Hitung Error
Hitung error antara output yang dihasilkan dengan output yang
diharapkan (prediksi kelulusan sebenarnya).
error = 1 - y1
Langkah 3: Backpropagation
1. Hitung delta pada lapisan output:
delta_output = error * sigmoid_derivative(y1)
= error * (y1 * (1 - y1))
2. Hitung delta pada lapisan tersembunyi:
delta_h1 = (V1 * delta_output) * sigmoid_derivative(h1)
= (-0.1 * delta_output) * sigmoid_derivative(-0.4)
≈ (-0.1 * error) * (0.24 * (1 - 0.24))
≈ -0.024 * error
delta_h2, delta_h3, delta_h4, delta_h5, delta_h6, delta_h7,
delta_h8, delta_h9, delta_h10, hingga delta_h10 juga dihitung
dengan cara yang sama.
3. Perbarui bobot:
W11 = W11 + (learning_rate * delta_h1 * x1)
≈ 0.2 + (learning_rate * -0.024 * error * 3.5)
4. Lakukan langkah serupa untuk perbarui bobot yang lainnya.
Ulangi langkah 1-3 hingga iterasi yang diinginkan atau hingga
error minimal.
Untuk menghitung error, biasanya digunakan fungsi loss
seperti mean squared error (MSE) atau binary cross-entropy,
tetapi karena ini adalah contoh sederhana, kita menggunakan
perbedaan langsung antara prediksi dan nilai yang diharapkan.
Juga, untuk update bobot, biasanya menggunakan nilai learning
rate yang kecil untuk menghindari overshooting.
5. Evaluation
Menguji performa model Backpropagation yang terbentuk
menggunakan data test. Menghitung accuracy, precision, recal, dan
lain-lain.
6. Deployment
Implementasi model pada sistem untuk digunakan jurusan Teknik
Informatika dalam memprediksi kelulusan tepat waktu mahasiswa
UPR. Dalam implementasi ini terdapat desain database dan desain
inrerface web tersebut.

3.1.7 Kesimpulan dan Saran


Tahap akhir dalam metodologi penelitian ini mencakup kesimpulan
dan saran atas penelitian yang sudah dilakukan. Kesimpulan dari penelitian
ini merupakan jawaban dari rumusan masalah yang menjadi pertanyaan
penulis pada saat merumuskan masalah. Saran dari penelitian ini merupakan
usulan membangun untuk pengembangan penelitian ini atas permasalahan
yang mungkin belum terjawab secara lengkap dan terperinci.

3.2 Metode Pengembangan Perangkat Lunak


Pada penelitian tentang prediksi kelulusan tepat waktu berbasis website
ini menggunakan metode Software Development Life Cycel (SDLC) model
waterfall menurut Rossa A.S. & M. Shalahuddin (2013: 29) disajikan pada
Gambar 3.1.

Gambar 3. 3 Software Development Life Cycel (SDLC) Model Waterfall Menurut


Rossa A.S. & M. Shalahuddin (2013: 29)
Tahap-tahap pengembangan dalam model waterfall menurut Rossa A.S. &
M. Shalahuddin (2013: 29) disajikan pada Gambar 3.1. Model Waterfall.
a) Analisis
Analisis merupakan sebuah proses pengumpulan informasi
kebutuhan perangkat lunak. Dalam tahap ini dilakukan pengumpulan
kebutuhan perangkat lunak secara spesifik agar dapat diketahui seperti apa
perangkat lunak yang dibutuhkan. Fungsi-fungsi, batasan, spesifikasi, dan
tujuan dari perangkat lunak yang akan dibuat didefinisikan dalam tahap ini.
Analisis dapat dilakukan dengan observasi, wawancara, arsip, dan
kuesioner.
b) Desain
Pada tahap ini, analisis kebutuhan perangkat lunak diubah ke dalam
bentuk desain agar dapat diimplementasikan menjadi program pada tahapan
selanjutnya.
c) Pengodean/Implementasi
Abdul Kadir (2003: 86) mendefinisikan pengodean/implementasi
sebagai tahap pemindahan desain ke dalam bahasa yang dapat dimengerti
oleh komputer. Pada tahapan ini, modul hasil desain diterjemahkan ke
dalam aplikasi dengan menggunakan bahasa pemrograman tertentu dan
menyatukannya menjadi sebuah sistem. Tools yang digunakan untuk
mengembangkan sistem informasi pengelolaan dan peminjaman barang
adalah sebagai berikut.
d) Pengujian
Tahap pengujian dilakukan setelah implementasi program selesai
dilaksanakan. Milind G. Limaye (2009: 77) mendefinisikan pengujian
sebagai proses eksekusi produk dan mencari kesalahan di dalamnya,
kemudian diperbaiki sehingga tidak lagi ditemukan kesalahan saat program
digunakan. Rosa dan Shalahuddin (2013: 30) menambahkan bahwa
pengujian dilakukan untuk meminimalisasi kesalahan (error) dan
memastikan keluaran yang dihasilkan sesuai dengan yang diinginkan. Kai
Petersen dkk (2009: 4) menjelaskan bahwa pada tahap pengujian dilakukan
pemeriksaan apakah ada penyimpangan dari hasil quality gate sebelumnya
dan apakah hasil pengembangan tersebut telah memenuhi persyaratan.
Pengujian memiliki beberapa pendekatan diantaranya yaitu metode
whitebox testing dan blackbox testing. Pressman (2010: 558)
mendefinisikan metode whitebox sebagai perancangan test case dengan
struktur kontrol yang dijelaskan sebagai bagian dari perancangan perangkat
komponen untuk menghasilkan test case. Sedangkan metode blackbox
fokus pada fungsifungsi perangkat lunak apakah sudah berjalan dengan
baik. Berdasarkan pendapat 15 para ahli di atas, dapat ditarik kesimpulan
mengenai tujuan pengujian yaitu untuk menemukan kesalahan dalam
sebuah perangkat lunak dan memperbaikinya sehingga perangkat lunak
tersebut dapat digunakan tanpa adanya error.
3.3 Analisis Sistem
Tahap analisis sistem ini berisikan flowchart dan DFD. Flowchart
menunjukkan aliran kerja sistem secara keseluruhan.
3.2.1 Flowchart
Flowchart ini menggambarkan urutan dari prosedur-prosedur yang
terdapat dalam sistem serta memperlihatkan apa yang dikerjakan oleh sistem.
Didalam website ini yang menjadi pengguna , yaitu ketua jurusan Teknik
Informatika dan adminnya merupakan staf jurusan Teknik Informatika.
Flowchart sistem prediksi ditunjukkan pada gambar 3.4. dan 3.5.
Deskripsi Flowchart Admin pada gambar 3.4 adalah sebagai berikut :
1. Admin mengakses website prediksi kelulusan tepat waktu.
2. Sistem menampilkan halaman login
3. Admin melakukan login.
4. Sistem melakukan pengecekan pada username dan password jika Ya
menampilkan halaman utama, jika Tidak kembali ke halaman login.
5. Admin mengelola data mahasiswa, hasil prediksi dan data pengguna.

Deskripsi Flowchart Ketua Jurusan pada gambar 3.5 adalah sebagai berikut :

5. Ketua Jurusan mengakses website prediksi kelulusan tepat waktu.


6. Sistem menampilkan halaman dashboard.
7. Ketua Jurusan melihat data hasil prediksi kelulusan.
Gambar 3. 4 Flowchart Admin

Gambar 3. 5 Flowchart Ketua Jurusan

3.2.2 DFD Level 0

Gambar 3. 6 DFD Level 0

Dari gambar di atas, sistem yang digunakan dalam prediksi


kelulusan tepat waktu mahasiswa Teknik Informatika memiliki 2
pengguna yaitu, admin (staf TI) dan ketua jurusan. Admin harus
login terlebih dahulu dan kemudian sistem memvalidasi data agar
yang login tersebut benar seorang admin. Setelah login admin
memiliki hak penuh untuk mengelola data mahasiswa yang
digunakan untuk prediksi dan melihat data pengguna yang telah
melakukan prediksi di website tersebut tersebut.

3.2.3 DFD Level 1

Gambar 3. 6 DFD Level 1


1. Definisi Storange

Tabel 3. 1 Tabel Keterangan Storange

No. Nama Penyimpanan Keterangan


1 T. User Merupakan tabel untuk
menyimpan data admin
2 T. Mahasiswa Merupakan tabel untuk
menyimpan data yang akan
digunakan untuk prediksi seperti
jenis kelamin, ip semester 1 – 4,
ipk, sks, penghasilan orangtua,
beasiswa dan UKT.
3 T. Prediksi Merupakan tabel untuk
menyimpan data mahasiswa
yang akan digunakan untuk
prediksi seperti jenis kelamin, ip
semester 1 – 4, ipk, sks, UKT,
beasiswa, penghasilan orangtua
dan disini akan ada status
kelulusan.

2. Definisi Alur Proses

Proses yang dilakukan dalam Data Flow Diagram Level 1


ini sebagai berikut :

Tabel 3. 2 Tabel Definisi Alur Proses


No. Nama Aliran Data Aliran Data Keterangan
Proses Input Output
1 Login - Username Tampilan Kegiatan memasukan
- Password informasi data data admin agar dapat
login masuk ke dalam sistem
2 Kelola Data admin Informasi data Merupakan data Kelola
Admin admin admin untuk
menampilkan data admin
3 Kelola Data Informasi data Merupakan data Kelola
Data mahasisa mahasiswa data mahasiswa untuk
Mahasiswa memprediksi kelulusan
tepat waktu
4 Kelola Data Prediksi Informasi data Merupakan Kelola hasil
Data prediksi prediksi mahasiswa
Prediksi

3.2.4 DFD Level 2

Gambar 3. 7 T.Mahasiswa Level 2


3.4 Desain
3.3.1 Desain Database

Gambar 3. 8 ERD

Penjelasan relasi antar tabel pada gmabar 3.8 :

1. Mahasiswa dan Prediksi : One to One: Setiap baris dalam tabel mahasiswa
berkorelasi dengan satu baris dalam tabel hasil prediksi.

3.3.2 Desain Tabel

1. Tabel User
Tabel 3. 3 Tabel User

Tipe Lebar Keterangan


No. Nama Field
Data
id_user Integer 11 Primary
1
Key
2 nama_user Varchar 50 Null
3 email_user Varchar 50 Null
4 password_user Varchar 20 Null
6 nama_lengkap Varchar 50 Null
7 alamat Varchar 50 Null
8 telp integer 10 Null

2. Tabel Mahasiswa
Tabel 3. 4 Tabel Mahasiswa

No. Nama Field Tipe Lebar Keterangan


Data
1 id_mahasiswa Integer 11 Primary Key
2 nim Integer 11 Null
3 jenis_kelamin Varchar 20 Null
4 ukt bigint 20 Null
5 ips_1 float 10 Null
6 ips_2 float 10 Null
7 ips_3 float 10 Null
8 ipk float 10 Null
9 sks int 5 Null
10 penghasilan_orangtua bigint 20 Null
11 bidikmisi varchar 10 Null
12 jalur_masuk varchar 20 Null
13 nama varchar 30 null

3. Tabel Prediksi
Tabel 3. 6 Tabel Prediksi

No. Nama Field Tipe Lebar Keterangan


Data
1 id_prediksi Integer 11 Primary Key
2 Id_mahasiswa Integer 11 Null
3 status_kelulusan varchar 20 Null
3.3.3 Desain Interface Admin
1. Rancangan Halaman Login
Pada rancangan yang pertama ini, merupakan tampilan dari
halaman login yang merupakan halaman awal ketika memasuki
website. Maka pada bagian ini admin akan diminta login terlebih
dahulu.

Gambar 3. 9 Desain Halaman Login


2. Rancangan Interface Dashboard

Gambar 3. 14 Desain Interface Dashboard


3. Rancangan Interface Kelola Data Mahasiswa

Gambar 3. 15 Desain Kelola Data Mahasiswa


4. Rancangan Interface Hasil Prediksi Kelulusan Tepat Waktu

Gambar 3. 16 Desain Interface Hasil Prediksi Kelulusan


Tepat Waktu

5. Desain Interface User ( Ketua Jurusan)

Gambar 3. 4 Desain Interface User


BAB IV
HASIL DAN PEMBAHASAN
BAB V KESIMPULAN DAN SARAN
DAFTAR PUSTAKA

Azevedo, A. , & Santos, M. F. (2008). KDD, SEMMA and CRISP-DM: a parallel


overview. In IADIS European Conference on Data Mining 2008.

Chapman, P. (2000). CRISP-DM 1.0 Step-by-step data mining guide.


DaimlerChrysler.

Chicco, & Davide. (2020). Ten quick tips for machine learning in computational
biology." BioData mining 13.1. 1–17.

Duff, A. , Boyle, E. , Dunleavy, K. , & & Ferguson, J. (2004). The relationship


between personality, approach to learning and academic performance.
Personality and individual differences,. 1907–1920.

Gorunescu .F. (2011). Data Mining: Concepts, Models, and Techniques.

Gunawan, A. , B. G. S. , J. A. (2020). Penerapan Algoritma Backpropagation Neural


Network untuk Prediksi Cuti Melahirkan Karyawan. . Jurnal RESTI (Rekayasa
Sistem Dan Teknologi Informasi), 844–850.

Habibah, U. R., Solichin, A., Habibah Romlah, U., Perumahan Sudirman Indah, K.,
Ki Mas Laeng Jl Syeh Mubarok No, J., & Kab Tangerang -Banten, T. (2022).
Prediksi Kelulusan Mahasiswa Dengan Metode Naïve Bayes dan Artificial
Neural Network: Studi Kasus Fakultas Teknik UNIS Tangerang. 15(1), 73–83.
https://doi.org/10.30998/faktorexacta.v15i1.11816

Hanindya Ujianti, D. (2016). Rancang Bangun Aplikasi Data Mining Untuk


Prediksi Kelulusan Mahasiswa Dengan Algoritma Backpropagation Neural
Network Development Of Data Mining Application For Student Completion
Time Using Backpropagation Neural Network. In Journal of Information
System.

Han, J. , K. M. , & P. J. (2012). Data mining: concepts and techniques (3rd ed).
Waltham, MA: Morgan Kaufmann Publishers.

Hendri Janto Rahanra, M., & Taufiq Luthfi, E. (2022). Analisa Kelulusan
Mahasiswa Teknik Informatika Tepat Waktu Menggunakan Algoritma
Artificial Neural Network (ANN). In Jurnal Teknologi dan Rekayasa (Vol. 7,
Issue 1).

Ian H. Witten, Eibe Frank, & dan Mark A. (2011). Data Mining: Practical Machine
Learning Tools and Techniques.
Kusrini, & Luthfi, E. T. (2009). Algoritma Data Mining.

Larose, D. T. (2014). Discovering Knowledge in Data.

Lobo, Jorge M., & Alberto Jiménez‐Valverde, and R. R. (2008). “AUC: a


misleading measure of the performance of predictive distribution models.”
Global Ecology and Biogeography 17.2.

L.S.Affendey, I. H. M. P. N. M. Md. N. S. and Z. M. (2010). Ranking of Influencing


Factors in Predicting Students’ Academic Performance. Information
Technology Journal.

Millea, M. , Wills, R. , Elder, A. , & & Molina, D. (2018). What matters in college
student success? Determinants of college retention and graduation rates.
Education, 138(4). 309–322.

Moerdyanto, O. P., Kadek, I., & Nuryana, D. (2023). Prediksi Kelulusan Tepat
Waktu Menggunakan Pendekatan Pohon Keputusan Algoritma Decision Tree.
Journal of Informatics and Computer Science, 05.

Mohammed J. Zaki, & Wagner Meira JR. (2014). Data Mining and Analysis:
Fundamental Concepts and Algorithms.

Mohammed, R. uz Z. et al. (2021). “Machine learning in data mining: a survey.”


Machine Learning and Knowledge Extraction 3.3. 775–795.

Mustafidah, H., Fitri, D., Halimah, N., Raya, J., & Purwokerto, D. (n.d.). PREDIKSI
KATEGORI KELULUSAN MAHASISWA MENGGUNAKAN JARINGAN
BACKPROPAGATION.

Mustafidah, H., Fitri, D., Halimah, N., Raya, J., & Purwokerto, D. (2021).
PREDIKSI KATEGORI KELULUSAN MAHASISWA MENGGUNAKAN
JARINGAN BACKPROPAGATION.

Nguyen Thai Nghe dkk. (2007). A Comparative Analysis of Techniques for


Predicting Academic Performance.

Nur Ihsan, M. R., Gandhiadi, G. K., & Harini, L. P. I. (2023). Prediksi Kelulusan
Mahasiswa Program Studi Matematika Universitas Udayana Menggunakan
Backpropagation Neural Network. E-Jurnal Matematika, 12(3), 242.
https://doi.org/10.24843/mtk.2023.v12.i03.p425

Pal, M. , & M. P. M. (2022). Assessment of artificial neural network model


parameters for satellite image classification. . . . International Journal of
Applied Earth Observation and Geoinformation, 104.
Powers, D. M. (2020). Evaluation: From precision, recall and F-measure to ROC,
informedness, markedness and correlation.

Prabowo Pudjo Widodo, & Rahmadya Trias Handayanto. (2012). Penerapan Soft
Computing dengan Matlab.

Pradytya, D. A. (2018). Kajian Data Mining Untuk Memprediksi Kelulusan


Mahasiswa Dengan Metode Klasifikasi (Studi Kasus : STMIK LIKMI
BANDUNG).

Refaeilzadeh, Payam, & Lei Tang. (2016). “Cross-validation.” Encyclopedia of


database systems 5 .

Retnowati, S. (2009). Faktor-Faktor Yang Mempengaruhi Tingkat Kelulusan


Mahasiswa FE UNNES.

RevoU. (2024). Apa itu Neural Network? Pengertian dan contoh 2023 |.

Rohwan, E. P. (2018). 281628-prediksi-kelulusan-mahasiswa-tepat-waktu-


42eb4c1b. Jurnal Ilmiah MATRIK .

Schmidhuber, J. (2015). Deep learning in neural networks: An overview (Vol. 61).

Setiyani, L., Wahidin, M., Awaludin, D., & Purwani, S. (2020). Analisis Prediksi
Kelulusan Mahasiswa Tepat Waktu Menggunakan Metode Data Mining Naïve
Bayes : Systematic Review. Faktor Exacta, 13(1), 35.
https://doi.org/10.30998/faktorexacta.v13i1.5548

Sokolova, M. and G. L. (2009). A systematic analysis of performance measures for


classification tasks. Information Processing & Management 45.4.

Stergiou, C. , & Siganos, D. (2022). Neural Networks. Imperial College Press.

Terkla, D. G. (1985). Does financial aid enhance undergraduate persistence?


Journal of Student Financial Aid, 11–18.

Yalidhan, M. D., & Amin, M. F. (2018). Implementasi Algoritma Backpropagation


Untuk Memprediksi Kelulusan Mahasiswa. Kumpulan JurnaL Ilmu Komputer
(KLIK), 05(02).

Zhang, Y., Yun, Y., An, R., Cui, J., Dai, H., & Shang, X. (2021). Educational Data
Mining Techniques for Student Performance Prediction: Method Review and
Comparison Analysis. Frontiers in Psychology, 12.
https://doi.org/10.3389/fpsyg.2021.698490

Anda mungkin juga menyukai