Anda di halaman 1dari 7

Nama : Ramadani

NIM : 2117000025
Kelas : Sore – A
Prodi : Pasca Sarjanan - Ilmu Komputer
Tugas : Review Jurnal
Dosen : Dr. Rika Rosnelly, S.Kom, M.Kom

PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAH MENENGAH


Judul Jurnal
KEJURUAN UNTUK CLUSTERING JURUSAN
Nama Jurnal Jurnal Nasional Informatika dan Teknologi Jaringan

Vol. & Hal. Vol. 1, No. 2

Tahun Terbit Jurnal Maret 2017

e-ISSN 2540 - 7600


p-ISSN 2540 - 7597
Penulis 1. Fauziah Nur
2. Prof. M. Zarlis
3. Dr. Benny Benyamin Nasution
Tanggal Review Jurnal 01 November 2021
Nama Reviewer Ramadani - 2117000025

Data mining merupakan teknik pengolahan data dalam jumlah besar untuk
pengelompokan.Teknik ini digunakan dalam proses Knowledge Discovery in
Database (KDD). Teknik tersebut mempunyai beberapa metode dalam
Abstrak
pengelompokannya Naïve-Bayes dan Nearest Neighbour, pohon keputusan (KD-
Tree), ID3, K-Means, text mining dan dbscan. Penerapkan algoritma K-Means
Clustering digunakan untuk pengelompokan data siswa baru sekolah menengah
kejuruan agar pengelompokan yang dihasilkan menjadi lebih optimal. Tujuan dari
pengelompokan ini adalah terbentuknya kelompok jurusan pada siswa yang
menggunakan algoritma K-Means clustering.
Clustering merupakan salah satu metode data mining yang bersifat tanpa arahan
(unsupervised) dan suatu metode untuk mencari dan mengelompokan data yang
memiliki kemiripan karakteristik antara satu data dengan data lain[1]. Menurut

1
kategori kekompakan, pengelompokan terbagi menjadi dua, yaitu komplet dan
parsial. Jika semua data dapat bergabung menjadi satu, dapat dikatakan semua data
Latar belakang kompak menjadi satu kelompok[2]. Pada clustering ini terdapat beberapa
algoritma pengelompokan untuk mengelompokan data secara mudah. Salah
satunya adalah algoritma KMeans yang merupakan metode analisis kelompok yang
mengarah pada partisian N objek pengamatan ke dalam K kelompok, di mana setiap
objek pengamatan sebuah kelompok data dengan mean (rata-rata)
terdekat[2].
Data mining mulai dikenal sejak tahun 1990, ketika pekerjaan pemanfaatan data
menjadi sesuatu yang penting dalam berbagai bidang, mulai dari
bidang akademik, bisnis hingga medis[2]. Munculnya data mining didasarkan pada
jumlah data yang tersimpan dalam basis data semakin besar. Dalam berbagai
literatur, teori-teori pada data mining sudah ada sejak lama seperti antara lain
Naïve-Bayes dan Nearest Neighbour, Pohon Keputusan, aturan asosiasi,
K-Means Clustering dan text mining[3]. Data mining disebut juga dengan
knowledgediscovery in database (KDD) ataupun pattern recognition
Bagaimana Cara untuk Mengelompokan data pada siswa baru dalam hal pemilihan
Perumusan Masalah Jurusan atau meng Cluster Jurusan dengan menggunakan Algoritma K-Means sesuai
dengan Kriteria-Kriteria yng dipilih dari data siswa
Tujuan penelitian
Mengelompokan data siswa baru sekolah menengah kejuruan untuk Clustering
Tujuan dan Manfaat Jurusan dengan menggunakan algoritma K-Means.
Penelitian
Manfaat penelitian
Penelitian ini diharapkan dapat memberikan manfaat yang efektif dan
mempermudah pekerjaan bagi pihak-pihak yang membutuhkan, baik secara teoritis
maupun praktisi.
1. Mengumpulkan Data melalui observasi dan interview yang dilakukan
dari pihak Sekolah Menengah Kejuruan Medan Area Tahun ajaran 2014-2015
2. Data yang di analisa berupa nilai tes masuk sekolah menengah kejuruan,
Metode Penelitian penghasilan orang tua, dan tanggungan anak orang tua.
3. Untuk set data dikelompokan berdasarkan konsep kedekatan atau kemiripan,
namun kuantitas yang digunakan untuk mengukurnya adalah ketidakmiripan
(centroid)
2
4. Metode yang digunakan menggunakan algoritma K-Means sebagai metode
analisis dan pengamatan selanjutnya adalah data diproses untuk membentuk
pengelompokan data ke dalam jurusan sesuai kriteria yang telah ditentukan.
1. Sumber Data
Dalam penelitian ini, sumber data diambil dari smk swasta medan area-1dimana
data tersebut merupakanndata siswa baru tahun ajaran 2014/2015.

Hasil Penelitian

2. Pengolahan Data
Sebelum data siswa baru tersebut dikelompokan ke dalam jurusan yang sesuai
kriteria. Data mentah tersebut akan ditransformasi dengan cara menginisialisasi
data ke dalam bentuk angka yang dapat diolah dalam pengelompokan.

penghasilan orang tua menjadi


X1, Tanggungan anak diubah
menjadi X2, dan hasil nilai tes
diubah menjadi X3.

3
Adapun tahapan proses algoritma K-means
adalah sebagai berikut:
1. Menentukan nilai k dari jumlah cluster
yang akan dibentuk. Pada tahapan ini cluster
yang terbentuk sebanyak 3 cluster.
2. Menentukan titik pusat (centroid) awal
dari setiap cluster. Dalam penelitian ini titik
pusat awal ditentukan dengan menggunakan
range dari jurusan. Setelah titik pusat cluster
ditentukan, maka tahap selanjutnya adalah
menghitung jarak terdekat atau euclidean
dengan menggunakan persamaan
3. yaitu menghitung jarak dari data siswa
baru pertama ke titik pusat cluster.

Dari hasil perhitungan di atas didapatkan


bahwa jarak terdekat bernilai 1.48657.
Selanjutnya perhitungan jarak data pertama untuk cluster kedua.

Dari hasil perhitungan tersebut didapatkan jarak terdekat bernilai 1.72627.


Kemudian perhitungan jarak data pertama untuk cluster ketiga

4
Setelah data dikelompokan pada iterasi
pertama, maka langkah selanjutnya
adalah membentuk titik pusat baru
dengan menentukan nilai rata – rata
dari setiap data yang sudak
memebentuk cluster untuk
melanjutkan perhitungan jarak
terdekat iterasi kedua dan akan
menunjukkan cluster yang terbentuk
selanjutnya dapat membentuk cluster yang konvergen.

Jika cluster belum konvergen, maka centroid


akan dibangkitkan kembali dan menghitung
kembali euclidean dari setiap data siswa.
Langkah perhitungan jarak terdekat seperti langkah ketiga sebelumnya.

Pada perhitungan jarak terdekat di atas


centroid baru yang dibangkitkan ternyata
belum konvergen, sehingga iterasi harus
dilanjutkan. Dalam penelitian ini, iterasi
clustering data siswa terjadi sebanyak 3
kali iterasi.

Centroid baru kedua yang dibangkitkan ternyata sudah konvergen, sehingga


perhitungan jarak terdekat clustering berhenti pada iterasi-3.

5
Pada iterasi-3 tersebut, titik pusat
dari setiap cluster sudah tidak
berubah dan tidak ada lagi
terdapat data yang berpindah dari
satu cluster ke cluster yang lain.
Maka dari itu, data siswa baru SMK
telah terkelompok sesuai kriteria
yang ditentukan untuk memasuki
jurusan pada sekolah menengah kejuruan menggunakan algoritma K-Means.
Dari hasil penelitian yang telah dilakukan, maka dapat menarik beberapa
kesimpulan, diantaranya sebagai berikut:
1. Pengujian yang dilakukan dalam penelitian ini, iterasi clustering pada data siswa
baru SMK terjadi sebanyak 3 kali iterasi.
2. Berdasarkan hasil cluster dengan menerapkan beberapa kriteria dari calon siswa
Kesimpulan menggunakan K-Means dapat diambil pengelompokan dengan rata – rata jurusan
yang diambil adalah rekayasa perangkat lunak dan sedikit jumlah siswa yang tidak
lulus. Bahkan ada beberapa jurusan yang tidak dibuka dikarenakan kriteria – kriteria
siswa tidak dapat lulus dalam jurusan tersebut.

6
7

Anda mungkin juga menyukai