Abstrak
Prodi Informatika Universitas Brawijaya mempunyai 5(lima) keminatan yang akan ditempuh
mahasiswa dalam menjalani perkuliahan. Mengingat sangat pentingnya keminatan ini untuk perkuliahan
mahasiswa yang nantinya juga berpengaruh pada tugas akhir (skripsi) hingga kelulusan mahasiswa,
maka mahasiswa diharapkan untuk memilih keminatan yang sesuai dengan minat dan bakatnya.
Berdasarkan Buku Pedoman Fakultas Ilmu Komputer Universitas Brawijaya tahun 2016 keminatan
yang ada pada prodi Informatika ada 5 (lima) keminatan yaitu Rekayasa Perangkat Lunak, Komputasi
Cerdas, Perangkat bergerak, Jaringan Komputer serta Game. Agar mahasiswa dapat memilih keminatan
yang sesuai maka di perlukan sistem rekomendasi untuk keminatan mahasiswa dengan harapan
mahasiswa dapat memilih keminatan yang sesuai dengan bakat, keinginan serta tentu saja nilai mata
kuliah wajib yang sudah ditempuh. Dengan mengimplementasikan metode K-Nearest Neighbor yang
bertujuan untuk memberikan rekomendasi keminatan berdasarkan atribut nilai-nilai mata kuliah wajib.
Pengujian dilakukan dengan membandingkan hasil keminatan yang sudah diverifikasi oleh akademik
kampus dengan hasil dari sistem. Dari pengujian data uji sebanyak 30 data mahasiswa yang sudah
memilih keminatan maka didapatkan hasil akurasi sebanyak 76,66% terhadap data latih dengan nilai K
yang paling optimal adalah K bernilai 10, maka dapat disimpulkan sistem rekomendasi keminatan ini
dapat membantu mahasiswa memberikan rekomendasi keminatan yang akan dipilih.
Kata kunci: sistem Rekomendasi, keminatan, k-nearest neighbor, KNN
Abstract
The Informatics Engineering Programme in Brawijaya University has 5 (five) interests that should be
taken by each students in their course period. Considering the importance of this interests to students’
academic process which later will affect their final project until their graduation, therefore students are
expected to choose their insterests based on their attentiveness and ability. Based on the Faculty of
Computer Science Handbook Universitas Brawijaya 2016, there are 5 (five) interests existing in
Informatics Programme, namely Software Engineering, Smart Computing, Mobile devices, Computer
Networks and Games. In order for students to choose the right interest then they need a recommendation
system for students so that students can choose interest that suites their talent, desire and scores of
courses that have been taken. By implementing K-Nearest Neighbor method which aims to give
recommendation of interests based on attribute of compulsory courses scores. Testing is done by
comparing the results of the interests that has been verified by campus’ academic with the results of the
system. From the test of data train as much as 30 data of students which have chosen their interests
hence gotten the result of accuracy as much 76.66% to trainned data with the most optimal K value, the
K value 10, therefore can be concluded this recommendation of interest system can help student give
recommendation of interest which will be chosen.
Keyword : recommendation system, interests, k-nearest neighbor, KNN.
latih yang digunakan sebanyak 185 karena indeks yang sesuai dengan data uji adalah
memiliki akurasi yang tinggi pada pengujian sebanyak 20 kemudian setelah diakurasi maka
jumlah data latih data latih yaitu 76,66%. Nilai didaptkan hasil 18,11%.
K yang digunakan adalah dari 2 sampai dengan
6.1.4 Pengujian Variasi Data
10. Hasil pengujian ini dapat dilihat pada tabel
9. Pada pengujian ini akan dilakukan
pengambilan data latih dan data uji secara acak
Tabel 9. Hasil pengujian terhadap nilai K dengan jumlah data berdasarkan perbandingan
Nilai K Jumlah Indeks Akurasi 40%:60%, 50%:50%, 30%:70% dari dataset
2 11 36,66%
yang ada. Pada pengujian variasi data ini K yang
3 11 36,66%
akan digunakan adalah K=10. Hasil pengujian
ini dapat dilihat pada tabel 12
4 15 50%
5 20 66,66% Tabel 12. Hasil dari pengujian variasi data
6 16 53,33%
Jumlah Jumlah
7 22 73,33% Hasil
No data uji data latih Akurasi
Indeks
8 19 63,3% (%) (%)
9 21 70% 1 70 30 38 23,89%
10 23 76,66% 2 50 50 28 24,77 %
3 40 60 25 27,47%
Dari hasil pengujian diatas maka
didapatkan K yang paling optimnal adalah K=10 Berdasarkan hasil pengujian variasi data
yaitu dengan hasil akurasi sebanyak 23. maka didapatkan hasil paling akurat adalah pada
6.1.3 Pengujian Keseimbangan Data pengambilan data uji dan data latih sebanyak
60:40 yang mana 60% mewakili data uji dan
Pada tahap ini akan dilakukan pengujian 40% untuk mewakili data latih yaitu dengan
keseimbangan data yang mana data yang akan prosentase sebesar 27,47%.
menjadi data latih adalah jumlah data yang sama
pada masing-masing kelas keminatan yang 6.2 Analisis Pegujian Akurasi
diambil dan yang menjadi acuan untuk
Setelah dilakukan 4 pengujian maka dari
menentukan jumlah data tersebut adalah kelas
hasil yang didapatkan dari sistem dapat
yang paling sedikit memiliki jumlah data.
dianalisis pada masing masing pengujian.
Sedangkan yang menjadi data uji adalah sisa
data dari data latih yang telah ditentukan 6.2.1. Pengujian terhdadap jumlah Data
sebelumnya. Hasil pengujian ini dapat dilihat
Pada pengujian terhadap data latih yang
pada tabel 11.
berbeda-beda jumlahnya, K yang digunakan ada
Tabel 10. Data yang digunakan untuk pengujian lah K=10 dan jumlah data latih yang digunakan
keseimbangan adalah 40, 80, 120, 185 data latih. Setelah
dilakukan pengujian maka didapatkan hasil yang
Kelas Data Latih Data Uji
memiliki akurasi tertinggi adalah data yang
Game 20 0 berjumlah 185 data yaitu akurasinya mencapai
Mobile 20 12 76,66% sedangkan yang terendah adalah 40 data
Jaringan 20 16 yaitu akurasinya hanya 20%. Disini terlihat
RPL 20 43 semakin banyak data latih yang digunakan maka
KC 20 56 akurasi dari metode K-Nearest Neighbor akan
Jumlah data 100 127 semakin bagus.
6.2.2. Pengujian mencari nilai K optimal
Tabel 11. Hasil dari pengujian keseimbangan data
Setelah melakukan pengujian akurasi
No Jumlah Jumlah Jumlah Akurasi
terhadap jumlah data latih maka sudah
Data latih data uji Indeks
didapatkan data latih untuk mencari K optimal
1 100 127 23 18,11%
yaitu dengan menggunakan 185 data latih. Nilai
Dari hasil yang diperoleh dari pengujian K yang di uji adalah 2-10 setelah kemudian
keseimbangan data maka didapatkan banyaknya setelah melakukan pengujian maka didapatkan
nilai K optimal yaitu K=10 dengan akurasi
sebanyak 76,66%. Dan nilai akurasi terendah • Berdasarkan pengujian yang telah dilakukan
dari nilai K adalah K=2 dan K-3 akurasinya dari 30 data uji dengan membandingkan
hanya 36,66%. antara hasil sistem dengan data yang
6.2.3. Pengujian keseimbangan Data diperoleh dari pakar maka diperoleh hasil
akurasi sebesar 76,66%.
Pada pengujian ini akan didapatkan hasil • Terjadinya ketidaksesuaian hasil dari sistem
nilai kebenarannya sebesar 18,11%, hasil itu dengan hasil sudah diverifikasi disebabkan
berarti data yang sudah ada memiliki komposisi oleh kelemahan dari metode dan adanya
yang cukup baik walaupun tidak seimbang persis faktor-faktor luar yang mempengaruhi hasil
namun proporsinya sudah memenuhi untuk dan tidak dapat tercover oleh perhitungan
dijadikan data latih sistem.
6.2.4. Pengujian Variasi Data • Faktor lingkungan dan teman sangat
mempengaruhi mahasiswa dalam
Dari 3 variasi data yang diuji, dapat dilihat mengambil keminatan yang akan ditempuh
bawha variasi yang memberikan akurasi yang sehingga ada ketidaksesuaian antara hasil
terbesar adalah pada variasi data ke-3 yaitu
yang diperoleh dari sistem.
dengan membagi dataset menjadi 2 dengan
perbandingan 60% untuk data uji dan 40% untuk DAFTAR PUSTAKA
data latih. Prosentasi yang dihasilkan adalah
sebesar 27,47%. Parvin, Hamid. 2008. MKNN: Modified K-
Nearest Neighbor. World Congress on
6.2.5. Analisis Hasil Engineering and Computer Science. USA.
Proses analisis pada hasil pengujian akurasi San Francisco.
implementasi metode K-Nearest Neighbor pada Ayu K, Noviana. 2014. Implementasi Algoritma
Keminatan studi, dengan melihat hasil Modified K-Nearest Neighbor (MKNN)
persentase keakurasian dan ketidakakurasian Untuk Menentukan Tingkat Resiko
sistem dari pengujian menunjukan adanya Penyakit Lemak Darah (Profil Lipid).
ketidaksesuaian antara analisa sistem dengan Universitas Brawijawa. Malang
analisa pakar. Ketidaksesuaian hasil yang
diperoleh sistem dengan yang didapat dari hasil Tri Halomoan Simanjuntak, Wayan Firdaus
yang sudah terverifikasi disebabkan beberapa Mahmudy dan Sutrisno. 2014.
hal yaitu: Implementasi Modified K-Nearest
• Dari sisi metode : Neighbor dengan Otomatisasi Nilai K Pada
Sebelum menjalankan algoritma maka K Pengklasifikasian Penyakit Tanaman
yang dinisialisasikan adalah random Kedelai.
sehingga pengelompokkan data yang Hardiyanti, Siti. 2014. Implementasi Metode
dihasilkan dapat berbeda-beda. Modified K-Nearest Neighbor (MKNN)
• Dari sisi data : Pada Penentuan Keminatan Sekolah
Ketidaksesuaian data nilai dengan Menengah Atas (SMA) (Studi Kasus: SMA
keminatan yang yang dipilih dikarenakan Negeri 1 Seririt). Universitas Brawijaya.
adanya factor-faktor yang tidak bisa di Malang.
cover dengan perhitungan membuat akurasi
system menjadi berkurang. Shouman, Mai. 2012. Applying k-Nearest
Neighbour in Diagnosing Heart Disease
7. PENUTUP Patients. University of New South Wales at
the Australian Defence Force Academy
Berdasarkan hasil perancangan, Northcott Drive. Canberra ACT2600
implementasi dan pengujian yang dilakukan
maka dapat ditarik kesimpulan : Kamber, H. &. (2006). Data Mining Concept
• Implementasi metode K-Nearest Neighbor and Tehniques. San Fransisco: Morgan
untuk rekomendasi keminatan pada studi Kauffman.
mahasiswa teknik informatika dapat
digunakan sebagai sarana bagi mahasiswa
yang masih bingung untuk menentukan
keminatan yang akan diambil.