K-NN_REKOMENDASI

KLASIFIKASI DATA SISWA UNTUK REKOMENDASI
JURUSAN PERGURUAN TINGGI MENGGUNAKAN

METODE K-NEAREST NEIGHBOR
Kelompok B7
Data Mining
ANGGOTA KELOMPOK
Andhika Wijaya F. Maya Saraswati

10201012 10201054
Risa Rilhana Timothy Leonard T.

10201076 10201082
01 Latar Belakang OUTLINE
02 Metode Pelaksanaan
03 Implementasi Pada RapidMiner
04 Kendala Penyusunan
05 Rencana Tahap Selanjutnya

01
Pendahuluan
Pendahuluan
Pada penelitian ini, bertujuan untuk mengklasifikasikan data siswa SMA Negeri 1 Bontang berdasarkan nilai
tiap semester serta bidang peminatan tiap siswa berdasarkan jurusan yang ada yaitu jurusan IPA dan IPS. Dari
klasifikasi data yang telah dilakukan, maka hasil yang dicapai merupakan prediksi terhadap siswa yang akan
masuk ke perguruan tinggi baik melalui jalur SNMPTN atau SBMPTN berdasarkan golongan jurusan yaitu Sains
dan Teknologi (SAINTEK) serta Sosial dan Humaniora (SOSHUM). Untuk mengetahui faktor yang mendukung
minat calon mahasiswa untuk masuk ke perguruan tinggi berdasarkan golongan jurusan, maka perlu dilakukan
analisis dan pengolahan data dengan menggunakan Data Mining. Selain dari itu bagaimana menerapkan proses
Data Mining dengan algoritma k-Nearest Neighbors dan bantuan aplikasi RapidMiner untuk mendapatkan hasil
prediksi terhadap siswa yang akan masuk ke perguruan tinggi berdasarkan golongan jurusan yaitu SAINTEK
serta SOSHUM.
02
Metode
Pelaksanaan
Metode Pelaksanaan
Pengumpulan Data
Pada tahap ini dilakukan pengumpulan data yang sesuai dengan kebutuhan dari penelitian. Data yang digunakan
dalam penelitian ini diambil berdasarkan dokumen-dokumen keterangan nilai siswa pada SMA Negeri 1 Bontang dari
semester 1 hingga semester 5 yang diambil berdasarkan nilai rata-ratanya.
Data Pre-processing
Analisis Hasil
Dari hasil proses klasifikasi dengan algoritma K-nearest neighbor dilakukan analisis data untuk mengidentifikasi
pola-pola menarik yang menjelaskan mengenai ukuran dasar pengetahuan yang ada. Pada penelitian ini hasil yang
diinginkan berupa prediksi jenis peminatan yang sesuai untuk siswa berdasarkan nilai akademik.
Diklasifikasikan Sebagai
Klasifikasi yang benar
Positive ( + ) Negative ( - )
+ (Positive) True Positive False Negative
- (Negative) False Positive True Positive

03
Implementasi
pada RapidMiner
Hasil
Atribut Data
No Atribut Deskripsi Nilai
1 Nama Berisikan nama siswa SMA Nama Siswa
2 Jurusan Berisikan jurusan siswa di SMA IPA, IPS
3 Nilai Sem 1 Nilai rata-rata semester 1 siswa Integer
8 Peminatan Bidang peminatan perguruan tinggi Saintek, Soshum

Split Validation
Pengujian Confusion Matrix
Pada perhitungan yang dilakukan dengan data training dengan kasus baru pada data testing, diketahui dari 22
record data, 15 diantaranya diklasifikasikan dengan tepat, 0 data yang diklasifikasikan tepat namun ternyata tidak, 1
data tidak diklasifikasikan dengan sesuai, dan 6 data diklasifikasikan tidak tapi ternyata tepat. Tingkat akurasi
penerapan algoritma K-NN ini sebesar 72%, dan recall 85,7% jika K yang digunakan adalah 5.
Hasil Prediksi
Cross Validation
Main Process Sub-Process
Gambar 2.7 Main Process (Cross Validation)

Confusion Matrix
Pada perhitungan yang dilakukan dengan Cross Validation, diketahui dari 108 record data yang diuji, 66
diantaranya diklasifikasikan dengan tepat, 9 data yang diklasifikasikan tepat namun ternyata tidak, 27 data tidak
diklasifikasikan dengan sesuai, dan 6 data diklasifikasikan tidak tapi ternyata tepat. Tingkat akurasi penerapan
algoritma K-NN ini sebesar 66.73% dengan nilai standar deviasi sebesar 12.21%, jika K yang digunakan adalah 5.
04
Kendala
Penyusunan
Kendala
1. Keterbatasan waktu pada saat pelaksanaan tugas besar.

2. Pemilihan metode untuk penelitian yang selalu berubah, dikarenakan menyesuaikan dengan
studi literatur yang digunakan.
3. Kurangnya studi literatur yang tersedia, dan tidak adanya sesi asistensi yang menyulitkan tiap
tahapan pengerjaan tugas besar.
4. Sulitnya mencari dataset bertemakan pendidikan yang sesuai dengan penelitian.
05
Rencana Tahap
Selanjutnya
Rencana Tahap Selanjutnya
Dalam penelitian ini, data yang digunakan untuk menentukan klasifikasi hanya berdasarkan nilai dan peminatan. namun
masih banyak faktor faktor lain yang dapat mempengaruhi pengklasifikasian ini tidak sebatas variabel-variabel yang telah
dibahas pada penelitian seperti bakat, ekstrakurikuler yang diikuti, lomba-lomba yang pernah diikuti. oleh karena itu, diperlukan
penelitian lebih lanjut untuk mengimplementasikan atribut atribut lain, agar didapatkan hasil rekomendasi yang lebih tepat.
dengan adanya pengklafikasian ini dapat membantu mahasiswa dalam menentukan jurusan yang paling sesuai dengan mereka.
Pada penelitian ini, analisa yang dihasilkan merupakan analisis yang mendasar sehingga perlu dikembangkan lagi, lebih
baik jika pengembangan selanjutnya analisa dilakukan lebih spesifik dan data yang digunakan dapat disesuaikan dengan
kebutuhan peneliti. Selain itu, dapat menggunakan metode lain untuk membandingkan tingkat akurasi dari data yang dihasilkan.
THANKS!

K-NN_REKOMENDASI

Diunggah oleh

Informasi Dokumen

Deskripsi Asli:

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

K-NN_REKOMENDASI

Diunggah oleh

Hak Cipta:

Format Tersedia

KLASIFIKASI DATA SISWA UNTUK REKOMENDASI

JURUSAN PERGURUAN TINGGI MENGGUNAKAN

Andhika Wijaya F. Maya Saraswati

Risa Rilhana Timothy Leonard T.

03 Implementasi Pada RapidMiner

05 Rencana Tahap Selanjutnya

+ (Positive) True Positive False Negative

- (Negative) False Positive True Positive

No Atribut Deskripsi Nilai

1 Nama Berisikan nama siswa SMA Nama Siswa

2 Jurusan Berisikan jurusan siswa di SMA IPA, IPS

3 Nilai Sem 1 Nilai rata-rata semester 1 siswa Integer

4 Nilai Sem 2 Nilai rata-rata semester 2 siswa Integer

5 Nilai Sem 3 Nilai rata-rata semester 3 siswa Integer

6 Nilai Sem 4 Nilai rata-rata semester 4 siswa Integer

7 Nilai Sem 5 Nilai rata-rata semester 5 siswa Integer

8 Peminatan Bidang peminatan perguruan tinggi Saintek, Soshum

Gambar 2.7 Main Process (Cross Validation)

1. Keterbatasan waktu pada saat pelaksanaan tugas besar.

Anda mungkin juga menyukai