Anda di halaman 1dari 22

KLASIFIKASI DATA SISWA UNTUK REKOMENDASI

JURUSAN PERGURUAN TINGGI MENGGUNAKAN


METODE K-NEAREST NEIGHBOR
Kelompok B7
Data Mining
ANGGOTA KELOMPOK

Andhika Wijaya F. Maya Saraswati


10201012 10201054

Risa Rilhana Timothy Leonard T.


10201076 10201082
01 Latar Belakang OUTLINE
02 Metode Pelaksanaan

03 Implementasi Pada RapidMiner

04 Kendala Penyusunan

05 Rencana Tahap Selanjutnya


01
Pendahuluan
Pendahuluan

Pada penelitian ini, bertujuan untuk mengklasifikasikan data siswa SMA Negeri 1 Bontang berdasarkan nilai
tiap semester serta bidang peminatan tiap siswa berdasarkan jurusan yang ada yaitu jurusan IPA dan IPS. Dari
klasifikasi data yang telah dilakukan, maka hasil yang dicapai merupakan prediksi terhadap siswa yang akan
masuk ke perguruan tinggi baik melalui jalur SNMPTN atau SBMPTN berdasarkan golongan jurusan yaitu Sains
dan Teknologi (SAINTEK) serta Sosial dan Humaniora (SOSHUM). Untuk mengetahui faktor yang mendukung
minat calon mahasiswa untuk masuk ke perguruan tinggi berdasarkan golongan jurusan, maka perlu dilakukan
analisis dan pengolahan data dengan menggunakan Data Mining. Selain dari itu bagaimana menerapkan proses
Data Mining dengan algoritma k-Nearest Neighbors dan bantuan aplikasi RapidMiner untuk mendapatkan hasil
prediksi terhadap siswa yang akan masuk ke perguruan tinggi berdasarkan golongan jurusan yaitu SAINTEK
serta SOSHUM.
02
Metode
Pelaksanaan
Metode Pelaksanaan
Pengumpulan Data
Pada tahap ini dilakukan pengumpulan data yang sesuai dengan kebutuhan dari penelitian. Data yang digunakan
dalam penelitian ini diambil berdasarkan dokumen-dokumen keterangan nilai siswa pada SMA Negeri 1 Bontang dari
semester 1 hingga semester 5 yang diambil berdasarkan nilai rata-ratanya.
Data Pre-processing
Analisis Hasil
Dari hasil proses klasifikasi dengan algoritma K-nearest neighbor dilakukan analisis data untuk mengidentifikasi
pola-pola menarik yang menjelaskan mengenai ukuran dasar pengetahuan yang ada. Pada penelitian ini hasil yang
diinginkan berupa prediksi jenis peminatan yang sesuai untuk siswa berdasarkan nilai akademik.

Diklasifikasikan Sebagai
Klasifikasi yang benar
Positive ( + ) Negative ( - )

+ (Positive) True Positive False Negative

- (Negative) False Positive True Positive


03
Implementasi
pada RapidMiner
Hasil
Atribut Data

No Atribut Deskripsi Nilai

1 Nama Berisikan nama siswa SMA Nama Siswa

2 Jurusan Berisikan jurusan siswa di SMA IPA, IPS

3 Nilai Sem 1 Nilai rata-rata semester 1 siswa Integer

4 Nilai Sem 2 Nilai rata-rata semester 2 siswa Integer

5 Nilai Sem 3 Nilai rata-rata semester 3 siswa Integer

6 Nilai Sem 4 Nilai rata-rata semester 4 siswa Integer

7 Nilai Sem 5 Nilai rata-rata semester 5 siswa Integer

8 Peminatan Bidang peminatan perguruan tinggi Saintek, Soshum


Split Validation
Pengujian Confusion Matrix

Pada perhitungan yang dilakukan dengan data training dengan kasus baru pada data testing, diketahui dari 22
record data, 15 diantaranya diklasifikasikan dengan tepat, 0 data yang diklasifikasikan tepat namun ternyata tidak, 1
data tidak diklasifikasikan dengan sesuai, dan 6 data diklasifikasikan tidak tapi ternyata tepat. Tingkat akurasi
penerapan algoritma K-NN ini sebesar 72%, dan recall 85,7% jika K yang digunakan adalah 5.
Hasil Prediksi
Cross Validation
Main Process Sub-Process

Gambar 2.7 Main Process (Cross Validation)


Confusion Matrix

Pada perhitungan yang dilakukan dengan Cross Validation, diketahui dari 108 record data yang diuji, 66
diantaranya diklasifikasikan dengan tepat, 9 data yang diklasifikasikan tepat namun ternyata tidak, 27 data tidak
diklasifikasikan dengan sesuai, dan 6 data diklasifikasikan tidak tapi ternyata tepat. Tingkat akurasi penerapan
algoritma K-NN ini sebesar 66.73% dengan nilai standar deviasi sebesar 12.21%, jika K yang digunakan adalah 5.
04
Kendala
Penyusunan
Kendala

1. Keterbatasan waktu pada saat pelaksanaan tugas besar.


2. Pemilihan metode untuk penelitian yang selalu berubah, dikarenakan menyesuaikan dengan
studi literatur yang digunakan.
3. Kurangnya studi literatur yang tersedia, dan tidak adanya sesi asistensi yang menyulitkan tiap
tahapan pengerjaan tugas besar.
4. Sulitnya mencari dataset bertemakan pendidikan yang sesuai dengan penelitian.
05
Rencana Tahap
Selanjutnya
Rencana Tahap Selanjutnya

Dalam penelitian ini, data yang digunakan untuk menentukan klasifikasi hanya berdasarkan nilai dan peminatan. namun
masih banyak faktor faktor lain yang dapat mempengaruhi pengklasifikasian ini tidak sebatas variabel-variabel yang telah
dibahas pada penelitian seperti bakat, ekstrakurikuler yang diikuti, lomba-lomba yang pernah diikuti. oleh karena itu, diperlukan
penelitian lebih lanjut untuk mengimplementasikan atribut atribut lain, agar didapatkan hasil rekomendasi yang lebih tepat.
dengan adanya pengklafikasian ini dapat membantu mahasiswa dalam menentukan jurusan yang paling sesuai dengan mereka.
Pada penelitian ini, analisa yang dihasilkan merupakan analisis yang mendasar sehingga perlu dikembangkan lagi, lebih
baik jika pengembangan selanjutnya analisa dilakukan lebih spesifik dan data yang digunakan dapat disesuaikan dengan
kebutuhan peneliti. Selain itu, dapat menggunakan metode lain untuk membandingkan tingkat akurasi dari data yang dihasilkan.
THANKS!

Anda mungkin juga menyukai