Anda di halaman 1dari 4

Pengelompokan Penjurusan Calon Siswa Baru SMK Berdasarkan Nilai Ujian Nasional Dan Ujian Masuk Dengan Algoritma

K-Means
Nama : Muslichun Alcharis T NIM : P31.2011.01114 Kelas : weekend XX Abstraksi Pada penelitian ini, penulis berusaha menambang data(data mining) calon siswa baru sebuah Sekolahan Menengah Kejuruan untuk mengelompokkan calon siswa baru yang akan di masukkan ke dalam 3 jurusan Teknik Otomotif, Teknik Mesin Perkakas dan Teknik Listrik. Data yang ada dianalisis menggunakan pendekatan K-means. Dengan algoritma ini dapat diketahui data calon siswa baru yang akan dikelompokkan ke dalam jurusan Teknik Otomotif, Teknik Mesin Perkakas dan Teknik Listrik.
Kata Kunci: data mining, algoritma k-means.

1. Latar Belakang Masalah Seiring dengan perkembangan jaman, peran komputer semakin banyak di dalam kehidupan masyarakat. Hampir semua bantu. langsung bidang kehidupan sebagai telah alat pada dapat oleh menggunakan komputer Diharapkan computer manfaatnya dirasakan

Sehingga dari kasus ini akan diuji dengan melakukan clustering atau pengelompokan siswa berdasarkan nilai ujian nasional dan nilai tes sekolah, Agar bisa diketahui kelompok siswa yang berkemampuan kurang, sedang, dan baik. Dengan demikian seorang panitia bisa mengambil kebijakan untuk memberikan penjurusan pada calon siswa yang masuk. K-Means merupakan salah satu metode data clustering non hirarki yang berusaha mempartisi data yang ada ke dalam bentuk satu atau lebih cluster/kelompok. Metode ini mempartisi data ke dalam cluster/kelompok sehingga data yang memiliki karakteristik yang sama dikelompokkan ke dalam satu cluster yang sama dan data yang mempunyai karakteristik yang berbeda dikelompokkan ke dalam kelompok yang lain. 2. Tinjauan Pustaka

perkembangannya, masyarakat.

Nilai ujian nasional dan ujian tes masuk sekolah merupakan kemampuan dasar yang harus diakui, Dari nilai tes masuk dan nilai ujian nasional itu bisa diklasifikasikan menempati siswa dengan otomotif, untuk mesin jurusan

perkakas, dan listrik.

Pengelompokan siswa Siswa dikelompokan dari hasil tes rata2 nilai tes ujian nasial dan ujian tes masuk, batasan nilai mulai dari 0 sampai 10 dengan batas pengelompokan sebagai berikut : < 5.9 : Jurusan Listrik 6 8.9 : Jurusan Mesin Perkakas >9 : Jurusan Otomotif K-Means merupakan algoritma clustering yang berulang-ulang. Algoritma K-Means dimulai dengan pemilihan secara acak K, K disini merupakan banyaknya cluster yang ingin dibentuk. Kemudian tetapkan nilai-nilai K secara random, untuk sementara nilai tersebut menjadi pusat dari cluster atau biasa disebut dengan centroid, mean atau means. Hitung jarak setiap data yang ada terhadap masing-masing centroid menggunakan rumus Euclidian hingga ditemukan jarak yang paling dekat dari setiap data dengan centroid. Klasifikasikan data berdasarkan kedekatanya dengan centroid. Lakukan langkah tersebut hingga nilai centroid tidak berubah (stabil).[2] 3. Metodologi Penelitian Data pengujian Contoh data awal sebelum dilakukan klasifikasi adalah sebagai berikut : Tabel 1. Contoh kemampuan siswa
Sisw a ke 1 2 3 UAN 5 8 6,5 UTes 7 8 5

4 5

10 7,5

9 8

Pengelompokkan Dari contoh dokumen yang sudah diperoleh, selanjutnya akan digunakan algoritma klasifikasi KMeans untuk mengelompokkan data yang ada. Data yang ada akan dikelompokkan menjadi 3 kelompok, adapun langkah dari pengelompokkan data adalah sebagai berikut : 1. Tentukan pusat cluster secara acak, misalkan, kita tentukan c = (5;8), c = (7;9), dan c = (8;10) 2. Hitung jarak setiap data yang ada terhadap setiap pusat cluster. Misalkan untuk menghitung jarak data siswa pertama dengan pusat cluster pertama adalah : d = (5-5) + (7-8) = 1 d = (5-7) + (7-9) = 2,83 d = (5-8) + (7-10) = 4,24 Tabel 2. Hasil perhitungan pada iterasi pertama
Siswa ke 1 2 3 4 5 UAN 5 8 6,5 10 7,5 UTes 7 8 5 9 8

Algoritma klasifikasi K-Means

c
1 3 3,35 5,10 2,5

c
2,83 1,41 4,03 3 1,12

c
4,24 2 5,22 2 2,06

3. Suatu data akan menjadi anggota dari suatu cluster yang memiliki jarak terkecil dari pusat clusternya. Misalkan untuk data pertama, jarak terkecil

diperoleh anggota

pada dari

cluster cluster

pertama, pertama.

sehingga data pertama akan menjadi Demikian juga untuk data kedua, jarak terkecil ada pada cluster kedua, maka data tersebut akan masuk pada cluster kedua. Posisi cluster selengkapnya

Siswa ke 1 2 3 4 5

UAN 5 8 6,5 10 7,5

Utes 7 8 5 9 8

c
1,25 3,10 1,25 5,20 2,66

c
2,92 0,25 3,25 2,46 0,25

c
5,38 2,24 6,10 0 2,69

Tabel 5. Hasil cluster pada iterasi ke-2


Siswa ke 1 2 3 4 5 UAN 5 8 6,5 10 7,5 Utes 7 8 5 9 8

dapat dilihat pada Tabel 3 Tabel 3. Hasil cluster pada iterasi pertama
Siswa ke 1 2 3 4 5 UAN 5 8 6,5 10 7,5 UTes 7 8 5 9 8

c
*

c
*

c
*

c
*

* * *

* * *

Karena pada iterasi ke-1 dan ke-2 (Tabel 3 &5) posisi cluster tidak berubah, maka iterasi dihentikan dan hasil akhir yang diperoleh adalah 3 cluster : Cluster pertama memiliki pusat (5.7,6) yang dapat diartikan sebagai kelompok siswa dengan nilai kurang pada UAN dan sedang pada Nilai UTes maka akan dimasukkan ke jurusan Listrik. Cluster kedua memiliki pusat (7.75,8) yang dapat diartikan sebagai kelompok siswa yang akan masuk jurusan mesin perkakas karena nilainya rata dari UAN dan UTes. Cluster ketiga memiliki pusat (10,9) yang dapat diartikan sebagai kelompok siswa dengan nilai bagus pada UAN dan UTes dan akan dimasukkan ke Jurusan Otomotif. Daftar pustaka :

4. Hitung pusat cluster baru. Untuk cluster pertama, ada 2 data yaitu data ke-1 dan data ke-3, sehingga: C11 = (5+6,5) / 2 = 5,75 C12 = (7+5) / 2 = 6 Untuk cluster kedua, ada 2 data yaitu data ke-2 dan data ke-5, sehingga: C21 = (8+7,5)/2 = 7,75 C22 = (8+8)/2 = 8 Untuk cluster ketiga, ada 1 data yaitu data ke-4. C31= 10 C32= 9 Ulangi langkah 2 hingga posisi data sudah tidak mengalami perubahan. Tabel 4. Hasil perhitungan pada iterasi ke-2

[1] Agusta, Yudi. Pebruari 2007. K-Means-Penerapan, Permasalahan dan Metode Terkait. Jurnal Sistem dan Informatika Vol.3 : 47-60. [2] Witten, Ian H. dan Frank, Eibe. 2005. Data Mining Practical Machine Learning Tools and Techniques, Second Edition. Morgan Kaufmann, San Fransisco.

Referensi :
Tedi Rismawan dan Sri Kusumadewi, 2008. Aplikasi KMeans Untuk Pengelompokkan Mahasiswa berdasarkan Nilai Bodi Mass Index (BMI) dan Ukuran Kerangka. FTI,UII, Yogyakarta.