28 53 1 SM PDF
28 53 1 SM PDF
Abstract: The high level of student success and the low level of student failure is a
quality of the education world. The world of education is currently required to have the
ability to compete by utilizing all resources owned. In addition to facilities, infrastructure
and human resources, information systems are one of the resources that can be used to
improve competency skills. Data mining is a process of data analysis to find a dataset of
data set. Data mining is able to analyze large amounts of data into information that has
meaning for decision supporters. One process of data mining is clustring. Attributes used
in the grouping of student achievement are Name, Extracurricular, Value which include
Task Value, Uts Value, Value of Uses, total absenteeism, and Attitude value. The case
study of 20 students with distance calculation using manhattan distance, chbychep
distance and euclidian distance yielded 67% accuracy.
Abstrak: Tingginya tingkat keberhasilan siswa dan rendahnya tingkat kegagalan siswa
merupakan cemin kualitas dunia pendidikan.Dunia pendidikan saat ini dituntut untuk
memiliki kemampuan bersaing dengan memanfaatkan semua sumber daya yang dimiliki.
Selain sumber daya sarana, prasarana dan manusia, sistem informasi merupakan salah
satu sumber daya yang dapat digunakan untuk meningkatkan kemampuan barsaing. Data
mining merupakan proses analisa data untuk menemukan suatu pola dara kumpulan data.
Data mining mampu menganalisa jumlah data yang besar menjadi informasi yang
mempunyai arti bagi pendukung keputusan. Salah satu proses data mining adalah
clustring. Atribut yang digunakan dalam pengelompokan prestasi siswa adalah Nama,
Ekstrakulikuler, Nilai yang meliputi Nilai Tugas, Nilai Uts, Nilai Uas, jumlah ketidak
hadiran siswa (absensi), dan Nilai sikap. Studi kasus pada 20 siswa dengan perhitungan
jarak menggunakan manhattan distance, chbychep distance dan euclidian distance
menghasilkan akurasi sebesar 67%.
85
JURTEKSI (Jurnal Teknologi dan Sistem Informasi) ISSN 2407-1811 (print)
Vol. IV No. 1, Des 2017, hlm. 85 - 92 ISSN 2550-0201 (online)
Available online at http://jurnal.stmikroyal.ac.id/index.php/jurteksi
dalam berbagai basis data akan senantiasa yang penting dari data kumpulan data,
terbarukan, baik dikarenakan adanya yang disebut dengan data mining.
update maupun penambahan data baru. Secara umum penilaian prestasi
Permasalahn yang kemudian muncul siswa yaitu mata pelajaran baik teori dan
adalah bagaimana mengetahui informasi praktek, penilaian ekstrakurikuler keha-
yang terdapat dalam basis data yang diran dan ketidakhadiran siswa dan pada
sangat besar. saat mengikuti ekstrakulikuler, yang
Knowledge discovery in database dikategorikan dalam nilai pengetahuan,
(KDD) didefenisikan sebagai ekstraksi nilai keterampilan dan penilaan sikap.
informasi potensial, implisit dan tidak Evaluasi dan penilaian terhadap prestasi
dikenal dari sekumpulan data. Proses siswa dilakukan dengan memberi nilai
knowledge discovery melibatkan hasil dari oleh pengajar kepada semua siswa yang
proses data mining (proses mengekstrak mengikuti pelajaran yang diajarkan dan
kecenderungan pola suatu data), kemudia ekstrakurikuler yang diikutinya.
mengubah hasilnya secara akurat menjadi Seiring dengan terus bertambah-
informasi yang mudah dipahami. nya jumlah data siswa setiap tahun, maka
Ada beberapa macam pendekatan jumlah data yang siswa yang terus
berbeda yang diklasifikasikan sebagai meningkat sehingga penumpukan data
teknik pencarian informasi/pengetahuan yang belum diolah dengan optimal untuk
dalam KDD. Ada pendekatan kuantitatif, menggali imformasi dan pengetahuan
seperti pendekatan probalistik and baru melalui pola-pola yang terbentuk
statistik. Beberapa pendekatan meman- dari penumpukan data tersebut. Jumlah
faatkan teknik visualisasi, pendekatan data yang terus meningkat ini merupakan
klasifikasi seperti logika induktif, bebrapa teknik ataupun metode untuk
pencarian pola, dan analisis pohon mengolah nya menjadi sebuah informasi
keputusan. Pendekatan yang lain meliputi dan pengetahuan yang dapat digunakan
deviasi, analisis kecendrungan, algoritma sebagai bahan pertimbangan pendidik
genetik, jaringan syaraf tiruan dan dalam proses pengambilan kebijakan dan
pendekatan campuran dua atau lebih dari keputusan juga sebagai peringatan dini
beberapa pendekatan yang ada. (early warning) bagi siswa tertentu yang
Tingginya tingkat keberhasilan berdasarkan hasil pengelompokan prestasi
siswa dan rendahnya tingkat kegagalan rendah yang berpotensi terhadap ketidak
siswa merupakan cermin kualitas dunia lulusan siswa.
pendidikan. Dunia pendidikan saat ini Beberapa penelitian yang telah
dituntut untuk memiliki kemampuan dilakukan melakukan pemodelan menge-
bersaing dengan memanfaatkan semua nai pemodelan aturan dalam memprediksi
sumber daya yang dimiliki. Selain sumber akademik siswa, mengevaluasi kinerja
daya sarana, prasarana dan manusia. akademik mahasiswa pada tahun ke-2 dan
Sistem informasi dapat digunakan untuk diklasifikasikan dalam kategori maha-
meningkatkan kemampuan bersain. siswa yang dapat lulus tepat waktu atau
Sistem informasi dapat digunakan untuk tidak, konsep pengclasteran dengan pola
menunjang kegiatan opersional sehari- data yang sudah diatur, tehnik cluster
hari sekaligus menunjang kegiatan membuat pengelompokan data iklim
pengambilan keputusan strategis. tropis di samudra hindia bagian utara.
Metode pengambilan keputusan
konvensional yang ada, tidak dapat Data Mining
menangani data dalam jumlah yang Data mining merupakan salah
sangat besar. Hal ini mendorong satu disiplin ilmu yang digunakan untuk
munculnya cabang ilmu baru untuk menentukan suatu informasi tertentu
mengatasi masalah penggalian informasi dalam sekumpulan data sebagai pen-
86
JURTEKSI (Jurnal Teknologi dan Sistem Informasi) ISSN 2407-1811 (print)
Vol. IV No. 1, Des 2017, hlm. 85 - 92 ISSN 2550-0201 (online)
Available online at http://jurnal.stmikroyal.ac.id/index.php/jurteksi
87
JURTEKSI (Jurnal Teknologi dan Sistem Informasi) ISSN 2407-1811 (print)
Vol. IV No. 1, Des 2017, hlm. 85 - 92 ISSN 2550-0201 (online)
Available online at http://jurnal.stmikroyal.ac.id/index.php/jurteksi
Ada banyak metode yang dapat 1. Bila jumlah data tidak terlalu banyak,
digunakan dalam pengelompokan mudah untuk menetukan cluster
contohnya metode K-means. Penge- awal.
lompokan yang dapat digunakan seperti 2. Jumlah cluster, sebanyak K, harus
pengelompokan non hierarki yang ditentukan sebelum dilakukan per-
membagi data kedalam bentuk dua atau hitungan.
lebih kelompok. K-means merupakan 3. Tidak pernah mengetahui real cluster
metode analisis kelompok yang mengarah dengan menggunakan data yang
pada pembagian N objek pengamatan sama, namun jika dimasukan dengan
kedalam K kelompok (cluster) dansetiap cara yang bebeda mungkin dapat
objek pengamatan dimiliki oleh suatu memproduksi cluster yang berbeda
kelompok dengan rata-rata (mean) jika jumlah datanya sedikit.
terdekat (Prasetyo, 2012). 4. Tidak tahu kontribusi dari atribut
Dalam menentukan nilai centroid dalam proses pengelompokan karena
untuk awal interasi, nilai awal centroid dianggap bahwa setiap atribut
dilakukan secara acak. Sedangkan jika memiliki bobot yang sama.
menentukan nilai centroid yang
merupakan tahap dari iterasi, maka RapidMiner
digunakan rumus sebagai berikut: RapidMiner merupakan perangakat
lunak yang bersifat terbuka (open source).
RapidMiner adalah sebuah solusi untuk
melakukan analisis terhadap data mining,
text mining dan analisis prediksi.
1. Menghitung jarak antara titik RapidMiner menggunakan berbagai
centroid dengan titik tiap objek. teknik deskriptif dan prediksi dalam
memberikan wawasan kepada pengguna
sehingga dapat membuat keputusan yang
2. Pengelompokan object untuk paling baik. RapidMiner memiliki kurang
menentukan anggota cluster adalah lebih 500 operator data mining, termasuk
dengan memperhitungkan jarak operator untuk input, output, data
minimum objek. preprocessing dan visualisasi. Rapid-
3. Kembali ke tahap ke-2, lakukan Miner merupakan software yang berdiri
perulangan hingga nilai centroid sendiri untuk analisis data dan sebagai
yang dihasilkan tetap dan anggota mesin data mining yang dapat
cluster tidak berpindah ke cluster diintegrasikan pada produknya sendiri.
lain. RapidMiner ditulis dengan munggunakan
Metode K-Means Clustering bahasa java sehingga dapat bekerja di
hanya bisa mengolah data dalam bentuk semua sistem operasi.
angka, maka untuk data yang berbentuk
nominal harus diinisialisasikan terlebih
dahulu ke dalam bentuk angka. METODOLOGI
Langkahnya adalah:
1. Urutkan data berdasarkan frekuensi Clustering merupakan salah satu
kemunculannya. teknik dari salah satu fungsionalitas data
2. Inisialisasikan data tersebut mulai mining, algoritma clustering merupakan
dari data tertinggi dengan niali 1. algoritma pengelompokan sejumlah data
Kemudian data selanjutnya 2, 3 dan menjadi kelompok-kelompok data terten-
seterusnya. tu (cluster).
Kelemahan K-Means: Setiap cluster memiliki centroid
yang merupakan suatu besaran yang
88
JURTEKSI (Jurnal Teknologi dan Sistem Informasi) ISSN 2407-1811 (print)
Vol. IV No. 1, Des 2017, hlm. 85 - 92 ISSN 2550-0201 (online)
Available online at http://jurnal.stmikroyal.ac.id/index.php/jurteksi
dihitung dari rata-rata nilai tiap items dari Data yang diolah dalam penelitian
suatu cluster dan juga memiliki medoid ini merupakan sampel yang diambil dari
yang merupakan item yang letaknya data rapot peserta didik SMK Yapim
paling tengah. Sementara jarak antar Simpang Kawat kelas X AK2 tahun
cluster didefenisikan dengan menggunkan ajaran 2016/2017. Dataset siswa terdiri
beberapa metode-metode untuk menen- dari atribut data induk dan data rapot.
tukan cluster mana yang berdekatan. Atribut yang dijadikan variable dalam
(Kusrini, 2009) algoritma ini di sederhanakan menjadi
1. Single Link adalah jarak terkecil atribut yang terdiri dari NIS, Nama,
antara satu elemen cluster dalam Ekstrakulikuler, Nilai Tugas, Uts , Uas
suatu cluster dengan elemen dalam dan Jumlah ketidakhadiran. Data sampel
suatu cluster dengan elemen lain di yang akan diuji cobakan terdiri dari 10
cluster yang berbeda. peserta didik.
2. Complete Link adalah jarak terbesar Selanjutnya dicoba mengelom-
antara satu elmen dalam suatu pokkan data diatas menjadi 3 kelompok.
cluster dengan elemen lain dicluster Dengan menggunakan algoritma K-
yang berbeda. means, berikut langkah-langkah penyele-
3. Average adalah jarak rata-rata antara saiannya:
satu elemen dalam suatu cluster 1. Menentukan Jumlah cluster, jumlah
dengan elemen lain di cluster yang cluster merupakan jumlah kelompok
berbeda. yan akan dihasilakan. Dalam
4. Centroid adalah jarak anatar centroid penelitian ini jumlah cluster yang
dari tiap cluster dengan akan digunakan adalah sebanyak 3
centroidcluster lainnya. cluster.
5. Medoid adalah jarak antara medoid 2. Menentukan centroid awal, centroid
dari tiap cluster dengan medoid awal diperoleh secara acak. Centroid
cluster lainya. awal merupakan titik pusat cluster
pertama. Centroid awal dari
penelitian ini adalah :
HASIL DAN PEMBAHASAN C1 = (4, 83.00, 80.08, 87.67, 2, 75)
C5 = (1, 86.67, 84.33, 93.67, 2, 65)
C10= (3, 83.67, 90.07, 70.97, 1, 78)
89
JURTEKSI (Jurnal Teknologi dan Sistem Informasi) ISSN 2407-1811 (print)
Vol. IV No. 1, Des 2017, hlm. 85 - 92 ISSN 2550-0201 (online)
Available online at http://jurnal.stmikroyal.ac.id/index.php/jurteksi
90
JURTEKSI (Jurnal Teknologi dan Sistem Informasi) ISSN 2407-1811 (print)
Vol. IV No. 1, Des 2017, hlm. 85 - 92 ISSN 2550-0201 (online)
Available online at http://jurnal.stmikroyal.ac.id/index.php/jurteksi
91
JURTEKSI (Jurnal Teknologi dan Sistem Informasi) ISSN 2407-1811 (print)
Vol. IV No. 1, Des 2017, hlm. 85 - 92 ISSN 2550-0201 (online)
Available online at http://jurnal.stmikroyal.ac.id/index.php/jurteksi
DAFTAR PUSTAKA
92
JURTEKSI (Jurnal Teknologi dan Sistem Informasi) ISSN 2407-1811 (print)
Vol. IV No. 1, Des 2017, hlm. 85 - 92 ISSN 2550-0201 (online)
Available online at http://jurnal.stmikroyal.ac.id/index.php/jurteksi
495
Jurnal Pena Edukasi ISSN 2407-0769
Vol. 4 No. 2, Maret 2017 e-ISSN 2549-4694
496