Anda di halaman 1dari 8

CASE BASE REASONING UNTUK PREDIKSI INDEKS PRESTASI MAHASISWA BARU (Studi Kasus : Program Studi Teknik Komputer

Politeknik Negeri Medan)


1

Handri Sunjaya, S.Si.,M.Cs1 Jurusan Teknik Elektro, Program Studi Teknik Komputer, Politeknik Negeri Medan

ABSTRACT There are some factors cause in increasing or decreasing collage students GPA, such as environment, teachers, study motivation, facilities, and friends. The capability of studying varies from student to student is not same from one student to others. This condition causes student who has high study capability feels that the study process in class is too slow. If this condition is not anticipated, their study spirit will decrease. If new students GPA on semester 1 can be predicted based on their grades i n Senior High School, the student classification can be done in order to give an appropriate model of lecturing for each student according to his/her study capability. Case based reasoning method is used to predict the students GPA based on 26 subjects in Senior High Schools. The k-nearest neighbor is used in retrieval process. According to some experiments, the accuracy of GPA prediction is about 71%, whenever the GPA is classified into 4 classes and the value of the k of nearest neighbor algorithm is set to 9. Keyword: case based reasoning, GPA prediction, k-nearest neighbor, student classification Latar Belakang Politeknik Negeri Medan salah satu Politeknik Negeri merupakan ke dalam dua bagian faktor-faktor, yaitu faktor yang ada di internal dan faktor eksternal. Contoh faktor Indonesia. Politeknik memiliki 14 Program Studi. internal antara lain kondisi jasmani dan kesehatan, Salah satu Program Studinya adalah Teknik kecerdasan, bakat, kepribadian, emosi, sikap serta Komputer yang diminati cukup banyak calon kondisi-kondisi psikis lainnya. Contoh faktor mahasiswa. Mahasiswa-mahasiswa tersebut eksternal berasal dari berbagai sekolah menengah atas di lingkungan sekolah termasuk di dalamnya faktor kota Medan, kabupaten di sekitar maupun di luar pengajar dan lingkungan sosial dan sejenisnya Sumatera Utara, Selain asal sekolah, jurusan pada (Sudrajat, 2007). Selain itu, salah satu komponen saat di SMA juga beragam, seperti IPA, IPS, dan lain yang berdampak besar terhadap kualitas kejuruan. Politeknik Negeri Medan tidak belajar mahasiswa adalah proses pembelajaran itu melakukan pembatasan terhadap asal jurusan calon sendiri (Humas UGM, 2006). mahasiswa baru untuk memilih suatu program studi. Beragamnya asal sekolah tersebut dapat mengindikasikan bahwa mahasiswa memiliki Karena kemampuan dasar yang dimiliki mahasiswa tidak sama, sering kali proses antara lain lingkungan rumah, Ada banyak faktor yang mempengaruhi indeks prestasi mahasiswa. W.H. Burton membagi

kemampuan dasar yang berbeda-beda.

perkuliahan terkesan menjadi lambat, karena dosen harus menyesuaikan dengan mahasiswa yang

memiliki

kemampuan

paling

rendah.

Untuk

dengan

menggunakan

metode

case

based

mahasiswa yang telah memiliki kemampuan lebih hal tersebut dapat menjadi bosan penghambat.

reasoning. Tinjauan Pustaka

Mahasiswa

akan

merasa

dan

dapat Case-based reasoning (CBR) merupakan suatu teknik pemecahan masalah yang mengadopsi

menyebabkan semangat belajarnya menurun. Apabila indeks prestasi mahasiswa baru

solusi masalah-masalah sebelumnya yang mirip pada semester I dapat diprediksi, maka tiap-tiap dengan mahasiswa dapat dibimbing dalam hal akademis mendapatkan solusinya (Riesbeck dan Shank, dengan berbeda-beda sesuai dengan kebutuhan dari 1989). Kasus-kasus pada masa lalu disimpan mahasiswa itu sendiri. Pembimbing akademik dengan sejak awal telah mengetahui kemampuan dari menggambarkan karakteristik dari kasus tersebut mahasiswa bimbingannya, sehingga dapat beserta solusinya. memberi arahan yang tepat. Selain itu dapat pula diberikan materi-materi tambahan yang sesuai dengan kemampuan mahasiswa. Sebagai contoh mahasiswa yang memiliki prediksi indeks prestasi yang bagus dapat diberikan materi tentang sertifikasi. Bagi mahasiswa yang dinilai kurang dalam hal akademik dapat diberikan materi-materi dasar yang lebih intensif agar pada semestersemester berikutnya dapat mengimbangi bidang. CBR telah banyak digunakan di berbagai Secara umum aplikasi CBR menyertakan fitur-fitur yang masalah baru yang dihadapi untuk

dikelompokkan menjadi kelompok klasifikasi dan kelompok sintesis (Watson, 1997). Pada kelopok klasifikasi, setiap kasus dikelompokkan

berdasarkan kemiripannya yang dilihat dari fiturfiturnya. Kasus yang baru akan mengadopsi solusi dari kasus-kasus yang berada dalam kelompok kasus yang sama. Pada kelompok sintesis, solusi didapat dengan cara mengombinasikan solusisolusi dari kasus-kasus sebelumnya. Kelompok ini

mahasiswa lain yang telah memiliki kemampuan dasar yang cukup. Permasalahan

biasanya merupakan suatu sistem gabungan antara Permasalahan yang diangkat pada CBR dengan teknik yang lain. Bjarne K. Hasen dan Denis Riordan dari indeks prestasi mahasiswa baru pada semester I Faculty dengan menggunakan paramater nilai Ujian Akhir University melakukan penelitian tentang Weather Sekolah berdasarkan kasus-kasus sebelumnya Prediction Using Case-Based Reasoning and of Computer Science, Dalhousie

penelitian ini adalah bagaimana memprediksi

Fuzzy Set Theory. Sistem tersebut memiliki kasus sebagai pengetahuannya berupa data laporan cuaca dalam 36 tahun terakhir. Sistem tersebut

diujikan pada saat Ujian Akhir Sekolah. Mata pelajaran tersebut adalah: 1. Pendidikan Pancasila dan Kewarganegaraan Pendidikan Agama Praktik Pendidikan Agama Bahasa dan Sastra Indonesia Praktik Bahasa dan Sastra Indonesia Pendidikan Jasmani dan Kesehatan Praktik Pendidikan Jasmani dan Kesehatan Sejarah Nasional dan Sejarah Umum Bahasa Inggris

menggunakan motode nearest neighbors untuk 2. melakukan perhitungan tingkat kesamaan antara 3. kasus yang akan diprediksi dengan kasus yang 4. disimpan sebagai pengetahuan. Metode tersebut 5. digabungkan metode fuzzy based prediction yang 6. kemudian gabungan kedua metode tersebut diberi 7. nama WIND-1. Dari hasil uji coba disimpulkan 8. WIND-1 memberikan hasil prediksi yang akurat. 9. Untuk menghasilkan suatu prediksi WIND-1 10. Praktik Bahasa Inggris memerlukan waktu kurang lebih satu menit (Hasen 11. Fisika dan Riordan, 2001). 12. Praktik Fisika Cara Penelitian Data yang akan dijadikan case base 15. Kimia adalah data mahasiswa angkatan 2008 Jurusan 16. Praktik Kimia Sistem Informasi. Data yang diperlukan adalah 17. Matematika nilai-nilai hasil Ujian Akhir Sekolah, yang terdiri 18. Ekonomi dari 26 mata pelajaran. Data tersebut tidak 19. Komputer termasuk data mahasiswa transisi. Setiap kali 20. Kewirausahaan penambahan case base, maka akan selalu 21. Praktik Kewirausahaan dilakukan pengukuran tingkat kesamaan antara 22. Praktik Produksi kasus yang akan dimasukkan dengan kasus yang 23. Sosiologi telah ada di case base. Hal ini dimaksudkan agar 24. Tatanegara tidak terjadi duplikasi kasus di dalam case base 25. Geografi (Kolodner, 1993; Pramudyo, 2008). 26. Praktik Kompetensi Keahlian Setiap kasus akan memiliki 28 fitur, yaitu NIM, indeks prestasi, dan 26 mata pelajaran yang NIM hanya bersifat sebagai fitur informasi yang tidak digunakan dalam proses retrieval. Solusi 13. Biologi 14. Praktik Biologi

untuk setiap kasus adalah indeks prestasi dari mahasiswa yang bersangkutan pada semester I. Metode retrieval yang digunakan adalah algoritma k-nearest neighbor. Metode ini akan mengambil kasus dalam case base sebanyak k kasus yang memiliki tingkat kesamaan paling besar. Tingkat kesamaan dihitung dengan jarak antara kasus dalam case base dengan kasus yang baru. Semakin kecil jarak antarkasus, maka semakin besar tingkat kesamaannya. Untuk

Algortima pada tahap reuse ini adalah sebagai berikut:

1. Ambil kelompok IP yang paling banyak muncul dari kasus-kasus hasil retrieval. 2. Apabila ada kelompok IP yang jumlah munculnya sama, maka pilih kelompok IP yang memiliki rata-rata jarak terkecil.
Basis data digunakan sebagai media

penyimpanan kasus-kasus (case base) dan datadata mahasiswa baru. Untuk itu dibutuhkan dua tabel, yaitu tabel cases dan tabel data. Tabel cases digunakan untuk menyimpan kasus-kasus yang akan digunakan sebagai case base. Tabel cases memiliki field NIM, IP, dan 26 mata pelajaran. NIM digunakan sebagai primary key. Tabel data digunakan untuk menyimpan data-data mahasiswa baru yang akan diprediksi indeks prestasinya pada semester I. Tabel data memiliki field NIM dan 26 mata pelajaran. NIM digunakan sebagai primary

mendapatkan jarak digunakan rumus Euclidean Distance seperti pada persamaan 1 (Tekmono, 2004). Pemilihan nilai k dilakukan dengan cara menguji coba beberapa nilai k sehingga didapatkan tingkat akurasi yang paling besar.

d ij

x
n k 1

ik

x jk (1)
2

Keterangan : dij = jarak kasus i (kasus baru) dengan kasus j (case base) n = banyak fitur

key (Pramudyo, 2008). Pihak yang akan menggunakan sistem ini adalah pusat pelayanan mahasiswa dan ketua program studi. Input yang akan diproses adalah data mahasiswa yang kemudian dijadikan case

xik = nilai fitur ke k dari kasus i xjk = nilai fitur ke k dari kasus j Solusi yang berupa indeks prestasi dari

base, data kasus baru yang berupa data mahasiswa baru, tahun akademik, dan jumlah kelompok yang diinginkan. Gambar 1 sampai dengan gambar 4. menunjukkan diagram aliran data dari sistem yang

kasus-kasus hasil retrieval akan digunakan untuk akan dibuat. menjadi prediksi indeks prestasi dari kasus baru.

Hasil dan Pembahasan Untuk menentukan nilai k yang akan digunakan pada algoritma k-Nearest Neighbor, perlu dilakukan pengujian terhadap nilai k. Dalam Gambar 1. DFD Level 0 uji coba ini, nilai k yang digunakan adalah 1 sampai dengan 20. Kasus yang dijadikan sebagai kasus baru adalah salah satu dari 231 kasus pada case base, sehingga akan digunakan 1 kasus baru dan 230 kasus sebagai case base. Setiap kasus pada case base akan diprediksi satu per satu secara bergantian, sehingga dilakukan 231 kali pengujian. Hasil dari uji coba nilai k ditunjukkan dengan grafik pada gambar 5. Gambar 2. DFD Level 1
Pengaruh nilai k terhadap tingkat akurasi
75 70
akurasi (%)

65 60 55 50 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 k

Gambar 3. DFD Level 2 Proses Perekaman Kasus Gambar 5. Pengaruh nilai k terhadap tingkat akurasi prediksi Dari uji coba yang telah dilakukan, diketahui bahwa nilai k yang memiliki tingkat akurasi paling tinggi adalah 9 dengan tingkat akurasi 71%. Gamabr 4. DFD Level 2 Proses Pelaporan Nilai k = 9 dalam algoritma

nearest neighbor memiliki arti bahwa akan diambil 9 kasus yang memiliki jarak paling dekat dengan

kasus yang baru. Kesembilan kasus tersebut kemudian akan masuk pada proses selanjutnya, yaitu reuse. Analisa terhadap pengelompokan indeks prestasi dengan mengelompokkan indeks prestasi menjadi seperti pada tabel 1. Tabel 1. Pembagian Kelompok Indeks Prestasi 8

1.14 - 1.71 0.57 - 1.13 0.00 - 0.56 3.50 - 4.00 3.00 - 3.49 2.50 - 2.99 2.00 - 2.49 1.50 - 1.99 1.00 - 1.49

E F G A B C D E F G H

Jumlah Kelompok

Pembagian Indeks Prestasi 3.00 - 4.00 2.00 - 2.99 A B C D A B C D E A B C D E F A B C D

0.50 - 0.99 0.00 - 0.49

4 1.00 - 1.99 0.00 - 0.99 3.20 - 4.00 2.40 - 3.19 5 1.60 - 2.39 0.80 - 1.59 0.00 - 0.79 3.33 - 4.00 2.67 - 3.32 2.00 - 2.66 6 1.33 - 1.99 0.67 - 1.32 0.00 - 0.66 3.43 - 4.00 2.86 - 3.42 7 2.29 - 2.85 1.72 - 2.28 algoritma k-nearest neighbor adalah 9. Hasil dari uji coba tersebut ditunjukkan dengan grafik pada gambar 6. Dengan menggunakan kelompok indeks prestasi tersebut, dilakukan uji coba untuk

mengetahui tingkat akurasi dari prediksi indeks prestasi dari kasus yang baru. Uji coba dilakukan dengan menggunakan salah satu kasus dari case base sebagai kasus baru dan selebihnya digunakan sebagai case base, karena setiap kasus dalam case base digunakan sebagai kasus baru, maka

dilakukan 231 kali pengujian dengan kasus baru yang berbeda-beda. Nilai k yang digunakan pada

80 70 60
akurasi (%)

[-3]
71 54.11 47.19 46.75 42.86

: IP yang diprediksi lebih kecil 3 tingkat dari IP sebenarnya

50 40 30 20 10 0 4 5

[-2]

: IP yang diprediksi lebih kecil 2 tingkat dari IP sebenarnya

kelompok indeks prestasi

[-1] Gambar 6. Pengaruh kelompok indeks prestasi terhadap tingkat akurasi prediksi Dengan menggunakan nilai k = 9 untuk algoritma nearest neighbor dan pengelompokan indeks prestasi menggunakan 4 kelompok atau interval 1, maka dilakukan uji coba terhadap [0]

: IP yang diprediksi lebih kecil 1 tingkat dari IP sebenarnya : IP yang diprediksi sama dengan IP sebenarnya

[+1] : IP yang diprediksi lebih besar 1 tingkat dari IP sebenarnya [+2] : IP yang diprediksi lebih besar 2 tingkat

sistem secara keseluruhan. Kasus yang dijadikan dari IP sebenarnya sebagai kasus baru adalah salah satu dari 231 kasus pada case base, sehingga akan digunakan 1 kasus baru dan 230 kasus sebagai case base. Setiap kasus pada case base akan diprediksi satu per satu secara Kesimpulan bergantian, sehingga dilakukan 231 kali pengujian. Hasil dari uji coba tersebut ditunjukkan dengan grafik pada gambar 7. Dari penelitian ini dapat ditarik beberapa kesimpulan sebagai berikut: 1. Memprediksi indeks prestasi mahasiswa [+3] : IP yang diprediksi lebih besar 3 tingkat dari IP sebenarnya

Hasil analisa sistem secara keseluruhan


80 70 60 71

dengan menggunakan nilai hasil Ujian Akhir Sekolah sebagai parameternya dan case-based reasoning
13.42

akurasi (%)

50 40 30 20 10 0 [-3] [-2] [-1] [0] [+1] [+2] [+3] 6.49 0 0 7.36 1.3

sebagai

metodenya

dengan

menggunakan nilai k = 9 pada algortima knearest neighbor yang digunakan pada proses retrieval dapat dilakukan dan menghasilkan

Gambar 7. Hasil analisa sistem secara keseluruhan prediksi dengan tingkat akurasi sekitar 71%. Keterangan: Hal ini menunjukkan bahwa faktor akademik pada jenjang SMA memberikan andil yang

cukup besar dalam menentukan prestasi di tingkat perguruan tinggi. 2. Dengan mengelompokkan indeks prestasi menjadi 4 kelompok, indeks prestasi hasil prediksi cenderung lebih tinggi daripada indeks prestasi sebenarnya. 3. Semakin presisi hasil prediksi yang diinginkan yang ditunjukkan dengan semakin banyak kelompok indeks prestasi yang digunakan, maka semakin menurun tingkat akurasi hasil prediksi.

Humas UGM, 2006, Tingginya Kualitas Belajar Siswa Kelas Akselerasi Di Kota Yogya, http://www.ugm.ac.id/index.php ?page=rilis&artikel=295, diakses tanggal 13 November 2007. Kolodner, J.L., 1993, Case-Based Reasoning, Morgan Kaufmann Publisher Inc., San Franscisco, California.

Riesbeck, C. dan Schank, R., 1989, Inside casebased reasoning, Lawrence Erlbaum, NJ.

Sudrajat, A., 2007, Kesulitan Belajar dan Bimbingan Belajar , http://www.duniaguru.com/index.php?optio n=com_content&task=view&id=448&Itemi d=29, diakses 13 November 2007.

Saran 1. Karena metode retrieval yang digunakan adalah k-nearest neighbor yang akan Tekmono, K., 2004, Euclidean Distance, http://people.revoledu.com/kardi/tutorial/ Similarity/EuclideanDistance.html, diakses tanggal 4 November 2007.

mengakibatkan proses retrieval akan menjadi lambat pada saat kasus pada case base Watson, semakin banyak, maka perlu digunakan I., 1997, Applying Case-Based Reasoning: Techniques for Enterprise Systems, Morgan Kaufmann Publisher Inc., San Franscisco, California.

metode lain yang dapat mengatasi masalah tersebut. 2. Untuk mempermudah penggunaan dari

aplikasi ini, sebaiknya diintegrasikan dengan sistem informasi akademik yang akan

dikembangkan oleh Politeknik Negeri Medan.

Daftar Pustaka Hansen, B.K. dan Riordan, D., 2001, Weather Prediction Using Case-Based Reasoning and Fuzzy Set Teory, Falucty of Computer Science, Dalhousie University, Canada.

Anda mungkin juga menyukai