566 1191 1 PB PDF

Clustering Data Ujian Tengah Semester (UTS) Data Mining
Menggunakan Algoritma K-Means

1)
Ginanjar Abdurrahman
1)
Jurusan Teknik Informatika, Fakultas Teknik, Universitas Muhammadiyah Jember
Jl. Karimata No. 49 Jember Kode Pos 68121
1)
Email: abdurrahmanginanjar@unmuhjember.ac.id
ABSTRAK
Ilmu pengetahuan dan teknologi akan mempermudah pekerjaan manusia. Namun,
disisi lain akan meningkatkan persaingan. Dalam menghadapi ketatnya persaingan,
perlu dipersiapkan sumber daya manusia yang kompeten. Mahasiswa diharapkan
siap secara akademik, berupa kesiapan pengetahuan maupun keterampilan untuk
menghadapi persaingan yang semakin ketat. Salah satu cara untuk melihat
kompetensi mahasiswa adalah dengan melihat hasil belajar yang dapat
direpresentasikan dengan nilai ujian yang ditempuh. Ujian tengah semester (UTS)
merupakan salah satu bentuk ujian yang menjadi komponen penilaian. Dengan
mengetahui nilai UTS, dosen mengetahui sebaran mahasiswa dalam hal
kompetensi akademik. Untuk itulah, diperlukan pengelompokan (clustering)
menggunakan algoritma k-means sebagai pertimbangan dosen dalam membentuk
kelompok belajar mahasiswa berdasarkan cluster nilai UTS.
Kata kunci: UTS, Kompetensi, Clustering, K-means
1. PENDAHULUAN tes/ujian (Gronlud, 1977:1). Ada

Di satu sisi, perkembangan ilmu beberapa komponen penilaian dalam
pengetahuan dan teknologi akan menentukan nilai akhir mata kuliah di
mempermudah pekerjaan manusia. tingkat pendidikan tinggi, yang salah
Namun, di lain sisi hal ini akan satunya adalah nilai Ujian Tengah
meningkatkan persaingan baik itu Semester (UTS). Dengan mengetahui
persaingan lokal maupun global. Untuk nilai UTS, dosen dapat mengetahui
menghadapi persaingan, perlu sebaran mahasiswa dalam hal
dipersiapkan sumber daya manusia. kompetensi akademik.
Dalam hal ini mahasiswa yang kompeten Dengan pertimbangan tersebut,
dalam bidang akademik berupa maka perlu diadakan pengelompokan
pengetahuan dan keterampilan. Salah mahasiswa berdasarkan nilai UTS agar
satu cara untuk mengukur kompetensi dosen dapat menerapkan metode
akademik adalah dengan nilai mata pembelajaran yang tepat dan menjadi
kuliah. Permendikbud nomor 66 tahun bahan pertimbangan untuk pembentukan
2013 tentang Standar Penilaian kelompok belajar sesuai dengan sebaran
Pendidikan menyebutkan bahwa kemampuan akademik mahasiswa. Salah
penilaian adalah proses pengumpulan satu metode untuk pengelompokan
dan pengolahan informasi untuk adalah metode clustering dengan
mengukur pencapaian hasil belajar algoritma k-means. Algoritma k-means
peserta didik, dalam hal ini adalah dipilih karena sederhana dan dimulai
mahasiswa. Sedangkan untuk dengan deskripsi dasar algoritma (Tan,
mengetahui tingkat kompetensi akademik, Steinbech, & Kumar, 2006:497). Selain
diperlukan suatu prosedur penilaian yakni itu, k-means juga dapat digunakan untuk
71
Ginanjar Abdurrahman, Clustering Data Ujian… hlm 71-79
data berukuran besar dan sangat efisien selama ini tidak diketahui secara manual.
(Tan, Steinbech, & Kumar, 2006:510). Masih menurut Pramudiono (Kusrini &
Pada Penelitian ini, dataset berupa hasil Luthfi, 2009:6) menyatakan bahwa Data
UTS mata kuliah Data Mining yang akan Mining diidentikkan dengan knowledge
dikelompokkan dengan metode clustering discovery in database (KDD) yang
menggunakan algoritma k-means dengan mempunyai definisi proses penggalian
bantuan program aplikasi WEKA 3.6. informasi tersembunyi dalam suatu basis
data yang besar.
2. TINJAUAN PUSTAKA Dari beberapa pengertian di atas,
2.1 Data Mining dapat disimpulkan bahwa Data Mining
Data mining merupakan proses merupakan serangkaian proses dalam
dalam menemukan hubungan yang pencarian pola, hubungan, penggalian
berarti, pola dan tren dengan memeriksa nilai tambah dari data dan informasi yang
data berukuran besar dalam suatu berukuran besar berupa pengetahuan
penyimpanan dengan menggunakan dengan tujuan menemukan hubungan
teknologi pengenalan pola, misalnya dan menyederhanakan data agar
statistik dan matematika. Hal ini sesuai diperoleh informasi yang dapat dipahami
dengan definisi yang dikemukakan oleh dan bermanfaat dengan bantuan ilmu
Gartner Group dalam Larose (2005:2) statistik dan matematika.
yaitu “Data mining is the process of Secara garis besar tahap-tahap Data
discovering meaningful new correlations, Mining terdiri dari selection,
patterns and trends by sifting through preprocessing, transformation, data
large amounts of data stored in mining, interpretation/evaluation (Fayyad
repositories, using pattern recognition dalam Kusrini & Luthfi, 2009: 3). Dalam
technologies as well as statistical and Data Mining, umumnya metode penelitian
mathematical techniques”. berkaitan dengan klasifikasi, clustering,
Data mining juga dapat diartikan dan Asosiasi. Metode klasifikasi adalah
sebagai proses menemukan pola dalam metode yang melibatkan variabel kategori
data. Hal ini dikemukakan oleh Witten, (Larose, 2005:14) yang artinya suatu
Frank, & Hall (2011:5) yaitu “Data mining objek dinyatakan ke salah satu kategori
is defined as the process of discovering atau kategori yang lain. Metode dalam
patterns in data”. Sedangkan menurut Data Mining yang merupakan klasifikasi
Hand et al dalam (Larose, 2005:2) yaitu diantaranya adalah C.4.5, Nearest
“Data mining is the analysis of (often Neighbor, Naïve bayesian, back
large) data sets to find unsuspected propagation. Metode clustering
relationships and to summarize the data merupakan metode pengelompokan data,
that are both understandable and useful”. observasi, atau kasus menjadi kelas
Hal ini berarti bahwa data mining objek-objek yang serupa. Sedangkan
merupakan analisis dari data berukuran cluster didefinisikan sebagai kumpulan
besar untuk menemukan hubungan tak data yang sama satu sama lain, dan tidak
terduga dan meringkas data agar dapat sama dengan data di lain cluster. Metode
dipahami dan dapat digunakan. Menurut clustering mencari segmen keseluruhan
Pramudiono (Kusrini & Luthfi, 2009: 3) data menjadi subgrup-subgrup yang
Data Mining adalah serangkaian proses relatif homogen atau biasa disebut
untuk menggali nilai tambah dari suatu sebagai cluster (Larose, 2005: 16).
kumpulan data berupa pengetahuan yang Menurut Wu & Kumar (2009:33) algoritma
72
JUSTINDO, Jurnal Sistem & Teknologi Informasi Indonesia, Vol. 1, No. 2, Agustus 2016
clustering menempatkan data-data yang Adapun langkah-langkah dari

sama pada satu kelompok (cluster), algoritma K-means adalah sebagai
sedangkan data yang tidak sama pada berikut (Tan, Steinbech, & Kumar,
kelompok (cluster) yang lain. Contoh 2006:497).
metode clustering ini adalah algoritma K- 1. Tentukan K data sebagai centroid, K
means, algoritma Agglomerative adalah jumlah cluster yang diinginkan
Hierarchical Clustering, Divisive (ditentukan oleh peneliti).
Hierarchical Clustering. Sedangkan 2. Tiap titik (data) kemudian dicari
asosiasi sering disebut sebagai analisis centroid terdekatnya.
keranjang belanja (market basket 3. Setiap himpunan titik (data) yang
analysis) merupakan metode dalam Data menjadi centroid disebut cluster.
Mining untuk menemukan aturan untuk 4. Hitung kembali centroid dari setiap
mengukur hubungan antara dua atau cluster.
lebih atribut. Aturan asosiasi biasanya 5. Ulangi langkah 1-4 sampai centroid
dinyatakan dalam bentuk jika anteseden, tidak berubah.
maka konsekuen, bersama dengan
besarnya nilai support dan confidence Metode clustering menggunakan
yang berasosiasi dengan aturannya Algoritma K-means, ukuran kedekatan
(Larose, 2005:17). Contoh metode ini data dihitung menggunakan jarak
adalah algoritma FP-Growth, algoritma Euclidean. Algoritma K-means bertujuan
Apriori. untuk meminimumkan jarak total
Euclidean diantara setiap titik xi, dan
2.2 Algoritma K-means cluster terdekat yakni cj (Wu & Kumar,
Algoritma K-means merupakan salah 2009:23). Jarak Euclidean ditentukan
satu algoritma clustering dengan menggunakan persamaan 2.1
(pengelompokan). K-means clustering berikut ini (Agusta, 2007).
merupakan metode clustering non-hirarki
yang mengelompokkan data dalam 2
n
bentuk satu atau lebih cluster/kelompok.
Data-data yang memiliki karakteristik
dij   xik  x jk  …. (2.1)
k 1
yang sama dikelompokkan dalam satu
cluster/kelompok dan data yang memiliki Keterangan:
karakteristik yang berbeda dikelompokkan dij = jarak antara data ke-i dan data ke-
dengan cluster/kelompok yang lain, j
sehingga data yang berada dalam satu n = dimensi data
cluster/kelompok memiliki tingkat variasi xik = koordinat data ke-i pada dimensi k
kecil (Agusta, 2007). Sedangkan menurut xjk = koordinat data ke-j pada dimensi k
Wu & Kumar (2009:33) K-means adalah
algoritma clustering yang mempartisi Sedangkan menurut Hans & Kamber
himpunan D menjadi k cluster data. (2016) algoritma k-means membagi data
Algoritma K-means mengklaster semua ke dalam k-buah cluster yang telah
titik data pada D sedemikian sehingga titik ditentukan. Ada beberapa cara yang
data xi menjadi satu-satunya k partisi. dapat digunakan untuk menghitung jarak
Dengan kata lain, satu titik data hanya yaitu antara lain dengan menggunakan
masuk ke dalam satu cluster. Euclidean distance, Manhattan distance,
dan Chebisev distance. Masing-masing
73
cara perhitungan jarak tersebut dijelaskan memberikan informasi yang terbaik bagi
sebagai berikut ini. guru dan siswa untuk bisa mendapatkan
1. Euclidean Distance informasi tentang keberhasilan upaya
Formula untuk menghitung jarak mereka setelah mengajar dan belajar.
antar dengan Euclidean Distance untuk Ebel & Frisbie (1986: 20-21)
dua titik dalam satu, dua dan tiga dimensi menambahkan bahwa fungsi utama dari
secara berurutan ditunjukan pada tes adalah untuk mengukur prestasi siswa
persamaan (2.2), (2.3), dan (2.4) sebagai dan kontribusinya terhadap evaluasi dan
berikut. pencapaian proses pendidikan, tes juga
membantu guru dalam menentukan nilai
( x  y )2 | x  y | .... (2.2) yang valid dan level yang reliabel bagi
siswa.
Nitko & Brookhart (2011:5)
d ( p, q)  ( p1  q1 )2  ( p2  q2 )2 ...(2.3)
menyatakan “test is defined as an
instrument or systematic procedure for
( p1  q1 )2  ( p2  q2 ) 2 observing and describing one or more
d ( p, q )  ...(2.4)
characteristics of a student using either a
( p3  q3 )2
numerical scale or a classification
scheme.” Hal ini berarti tes merupakan
2. Manhattan Distance (Taxicab distance)
suatu instrumen atau prosedur sistematik
n
untuk mengobservasi atau
d1( p, q)  p  q 1   pi  qi ...(2.5)
i 1 mendeskripsikan satu atau lebih
karakteristik siswa dengan menggunakan
3. Chebisev Distance (Maximum Metric) skala numerik atau skala
Untuk menentukan jarak dengan pengklasifikasian. Menurut Muijs &
menggunakan Chebisev Distance Reynolds (2005: 232) tes prestasi
dilakukan dengan cara mengambil nilai mengukur kinerja siswa dalam satu mata
maksimum dari setiap koordinat pelajaran dalam waktu tertentu.
dimensinya. Jika dinyatakan dalam Berdasarkan Permendiknas nomor 66
persamaan matematika, maka Chebisev tahun 2013 tentang Standar Penilaian
Distance dapat dilihat pada persamaan Pendidikan disebutkan bahwa penilaian
(2.6) adalah proses pengumpulan dan
pengolahan informasi untuk mengukur
Dcheb ( p, q)  max  pi  qi  ....(2.6) pencapaian hasil belajar siswa. Prestasi
belajar siswa akan diketahui melalui
penilaian yang dilakukan guru melalui
Dalam penelitian ini, formula yang akan suatu evaluasi belajar yang biasanya
digunakan untuk menentukan jarak berupa tes tertulis.
adalah formula Euclidean Distance pada Menurut Miller, Linn, & Gronlund
persamaan (2.2), (2.3), dan (2.4) (2009:140-142) pemberian tes dapat
dilakukan berdasarkan tujuan
2.3 Ujian/Tes pembelajaran dan penilaian yang
Tes digunakan untuk mengukur berbeda-beda, antara lain : (a) sebelum
tingkat keberhasilan prosedur pengujian, diawal suatu pembelajaran
pembelajaran (Gronlund, 1977:1). Ebel & bertujuan untuk menentukan apakah
Frisbie (1991:30) menyatakan bahwa tes siswa memiliki keterampilan prasyarat
74
yang dibutuhkan untuk pembelajaran, a. Identifikasi

atau untuk mengetahui tingkat kesiapan Pada tahap ini, dilakukan identifikasi
siswa untuk mencapai tujuan masalah yang ada apa saja serta
pembelajaran yang direncanakan (untuk menawarkan solusi yang dapat digunakan
menentukan posisi siswa atau modifikasi untuk menyelesaikan masalah tersebut.
pembelajaran), (b) Tes formatif, b. Studi Literatur
digunakan untuk memonitor kemajuan Tahap ini merupakan tahap untuk
pembelajaran, mendeteksi miskonsepsi, mencari referensi, berupa jurnal
menyemangati siswa untuk belajar, dan penelitian, paper, buku-buku referensi,
menyediakan umpan balik untuk siswa dan referensi lain terkait penelitian.
dan guru, (c) tes sumatif, tes pada akhir c. Penyusunan Dataset
pembelajaran dapat digunakan sebagai Penelitian ini melibatkan 103 data
umpan balik terhadap siswa, nilai UTS Mahasiswa semester IV
menyemangati siswa untuk maju dan Universitas Muhammadiyah Jember
mengerjakan yang lebih menantang, pada Mata Kuliah Data Mining.
menentukan kerja remedial, dan menilai d. Clustering
pembelajaran. Pada tahap ini, metode clustering
Berdasarkan uraian di atas, maka digunakan untuk mengelompokkan data
dapat disimpulkan bahwa ujian/tes adalah menjadi tiga kelompok.
alat untuk mengukur tingkat keberhasilan e. Algoritma K-Means
prosedur pembelajaran untuk Pada tahap ini, algoritma K-means
memberikan informasi kepada dosen diterapkan untuk mengelompokkan
untuk mengobservasi atau dataset yang ada menjadi tiga cluster.
mendeskripsikan satu atau lebih f. Interpretasi dan Evaluasi
karakteristik siswa dengan menggunakan Pada tahap akhir ini informasi yang
skala numerik. dihasilkan dari proses data mining perlu
disajikan dalam bentuk yang mudah
3. METODE PENELITIAN dimengerti oleh pihak yang
Langkah-langkah dalam penelitian berkepentingan.
dapat dilihat pada Gambar 1 berikut ini.
Sebagai contoh, perhitungan dari
Identifikasi Masalah
algoritma k-means berdasarkan dataset
pada Tabel 1 dibawah ini.
Studi Literatur
Tabel 1. Dataset Contoh
Clustering Jumlah Total

Data
Transaksi Belanja
Penyusunan Dataset 1 4 2.255
2 2 1.788
3 2 1.255
Algoritma K-means
4 4 3.322
5 4 3.012
Interpretasi dan Evaluasi 6 3 1.261
Gambar 1. Langkah-Langkah Penelitian
75
Langkah pertama, ditentukan terlebih C3=(C31,C32)) dengan melihat matriks

dahulu jumlah cluster, misalnya k=3 dan penempatan cluster dan menggunakan
ditentukan centroid (pusat cluster) data pada Tabel 1.
awalnya adalah C1=(2,1); C2=(4,3),
C3=(3,2). C11=Average (2,2)=2
Dengan menggunakan Tabel 1, maka C12=Average (1.788,1.255)=1.5215
dihitung Jarak Euclidean setiap item C21=Average (4,4,4)=4
(Jumlah Transaksi dan Total Belanja) C22=Average (2.255, 3.322, 3.012) =
dengan centroid awal, maka diperoleh: 2.863
Maka data-1, diperoleh: C31=Average (3)=3
C32=Average (1.261)=1.261
Sehingga centroid baru tersebut adalah:
C1=(C11,C12)=(2,1.5215)
C2=(C21,C22)=(4,2.863)
C3=(C31,C32)=(3,1.261)
dan seterusnya, sehingga diperoleh jarak
antara data dengan centroid awal seperti
Dengan menggunakan centroid baru,
pada Tabel 2.
ditentukan kembali jarak setiap item
terhadap centroid baru tersebut, sehingga
Tabel 2. Jarak Euclidean
diperoleh data jarak terhadap centroid
C1 C2 C3 baru seperti terlihat pada Tabel 4.
1 2.361149085 0.745 1.032000484
Tabel 4. Jarak Euclidean
2 0.788 2.338577 1.022225024
3 0.255 2.654247 1.247006415 C1 C2 C3
4 3.064585453 0.322 1.657613948 1 2.130263423 0.608 1.409977305
5 2.836925096 0.012 1.422724148 2 0.2665 2.2706 1.130366755
6 1.033499395 2.006021 0.739 3 0.2665 2.566255 1.000018
4 2.691059317 0.459 2.290790475
5 2.494311578 0.149 2.016432741
Dari Tabel 2 dipilih jarak Euclidean
6 1.033373238 1.888493 0
terkecil, sehingga diperoleh matriks
penempatan cluster seperti tampak pada
Dari Tabel 4 dipilih jarak Euclidean
Tabel 3 berikut ini.
terkecil sehingga diperoleh matriks
Tabel 3. Matriks Penempatan Cluster penempatan cluster seperti tampak pada
Tabel 5.
C1 C2 C3
1 * Tabel 5. Matriks Penempatan Cluster
2 *
3 * C1 C2 C3
4 * 1 *
5 * 2 *
6 * 3 *
4 *
5 *
Ditentukan centroid baru yakni
6 *
(C1=(C11,C12), C2=(C21,C22),
76
Dengan membandingkan Tabel 3 dan nilai awal maupun asumsi yang

Tabel 5 ternyata tidak terjadi perpindahan digunakan dalam analisis data yaitu (1)
centroid, sehingga iterasi clustering Jumlah cluster (k) ditentukan sebanyak 3
dihentikan. cluster, dan (2) Cluster-cluster yang
terbentuk yakni cluster nilai rendah,
4. HASIL DAN PEMBAHASAN cluster nilai sedang, dan cluster nilai
Penelitian ini menggunakan program tinggi.
aplikasi weka 3.6 untuk mengelompokkan Dari hasil pengolahan terhadap data
(clustering) nilai UTS mahasiswa dengan nilai UTS mahasiswa dengan algoritma k-
algoritma clustering, yakni algoritma k- means untuk clustering menggunakan
means. Clustering dilakukan pada nilai aplikasi WEKA 3.6, diperoleh dua hasil
Ujian Tengah Semester (UTS) clustering. Hasil clustering pertama untuk
mahasiswa Universitas Muhammadiyah kelas Teknik Informatika-A dari output
Jember tahun akademik 20152 untuk aplikasi weka 3.6 menunjukkan sebanyak
mata kuliah Data Mining pada kelas 5 (10%) nilai UTS termasuk dalam cluster
Teknik Informatika-A dan Teknik nilai rendah, sebanyak 17 (33%) nilai UTS
Informatika-B. mahasiswa termasuk dalam cluster nilai
Data dari kelas Teknik Informatika-A sedang, dan sebanyak 30 (58%) nilai
dan kelas Teknik Informatika-B, diproses UTS mahasiswa termasuk dalam cluster
secara terpisah dengan algoritma k- nilai tinggi. Selengkapnya, hasil clustering
means menggunakan aplikasi WEKA 3.6 untuk nilai UTS data mining kelas teknik
untuk mendapatkan clustering mahasiswa informatika-A dapat dilihat pada Gambar
berdasarkan nilai UTS. Pada pengujian ini 2.
Gambar 2. Plot hasil clustering nilai UTS TI-A
77
Gambar 3. Plot hasil clustering nilai UTS TI-B
Hasil clustering kedua untuk kelas nilai UTS termasuk dalam cluster nilai
Teknik Informatika-B dari output weka 3.6 rendah, sebanyak 17 (33%) nilai UTS
menunjukkan sebanyak 12 (24%) nilai mahasiswa termasuk dalam cluster nilai
UTS termasuk dalam cluster nilai rendah, sedang, dan sebanyak 30 (58%) nilai
sebanyak 24 (49%) nilai UTS mahasiswa UTS mahasiswa termasuk dalam cluster
termasuk dalam cluster nilai sedang, dan nilai tinggi. Sedangkan untuk Teknik
sebanyak 13 (27%) nilai UTS termasuk Informatika-B, sebanyak 12 (24%) nilai
dalam cluster nilai tinggi. Selengkapnya, UTS termasuk dalam cluster nilai rendah,
hasil clustering untuk nilai UTS Data sebanyak 24 (49%) nilai UTS mahasiswa
Mining kelas Teknik Informatika-B dapat termasuk dalam cluster nilai sedang, dan
dilihat pada Gambar 3. sebanyak 13 (27%) nilai UTS termasuk
dalam cluster nilai tinggi.
5. KESIMPULAN DAN SARAN Saran pengembangan dapat
Berdasarkan hasil dan pembahasan dilakukan perbandingan dengan algoritma
output dari aplikasi weka, maka dapat clustering yang lain untuk data UTS
diambil dua kesimpulan. Pertama, sebagai perbandingan validitas clustering
clustering yang terbentuk adalah tiga yang terbentuk. Disamping itu, penelitian
cluster, yakni cluster nilai UTS tinggi, ini dapat dijadikan sebagai salah satu
cluster nilai UTS sedang, dan cluster nilai referensi untuk dosen pengampu dalam
UTS rendah. Kedua, dari clustering yang pembentukan kelompok belajar
terbentuk dari masing-masing kelas, mahasiswa, dan sebagai referensi untuk
dapat dijabarkan bahwa untuk kelas penelitian selanjutnya yang serumpun.
Teknik Informatika-A, sebanyak 5 (10%)
78
DAFTAR PUSTAKA Larose, D.T., (2005). Discovering

Agusta. (2007). K-means-penerapan, knowledge in data: an introduction
permasalahan, dan metode terkait to data mining. New Jersey: John
stmik stikom bali, denpasar, bali. Wiley & Sons.
Ebel, R.L.,& Frisbie, D.A., (1986). Miller, M.D., Linn, R.L., & Gronlund, N.E.,
Essentials of education (2009). Measurement and
measurement (4th ed.). Engelwood assessment in teaching (10th
Cliffs, New Jersey: Prentice Hall. ed.).Upper Saddle River, New
Ebel, R.L.,& Frisbie, D.A., (1991). Jersey: Pearson Education, Inc.
Essentials of educational Muijs, D., & Reynolds, D., (2005).
th
measurement (5 ed.).Engelwood Effective teaching: evidence and
Cliffs, New Jersey: Prentice Hall. practice(2nd ed). London: SAGE
Gronlund, N.E., (1977). Constructing Publications, Ltd.
achievement test (2nd ed.). Nitko & Brookhart. (2011). Educational
Engelwood Cliffs, New Jersey: Assessment of Students. Boston:
Prentice-Hall. Allyn & Bacon..
Hans, J., & Kamber, M., (2006). Data Tan, P.N., Steinbech, M., & Kumar, V.,
mining: concepts and techniques, (2006). Introduction to data mining.
2nd ed. Burlington: Morgan Boston: Pearsong Education, Ltd.
Kaufmann. Witten, I.H., Frank, E., Hall, M.A., (2011).
Kemendikbud. (2006). Peraturan menteri Data mining: practical machine
pendidikan dan kebudayaan learning tools and techniques third
republik indonesia nomor 66, tahun edition. Burlington: Morgan
2013, tentang standar penilaian Kaufmann.
pendidikan. Wu, X., & Kumar, V., (2009). The top ten
Kusrini & Luthfi. (2009). Algoritma data algorithms in data mining. Boca
mining. Yogyakarta: Andi. Raton: CRC Press.
79

566 1191 1 PB PDF

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

566 1191 1 PB PDF

Diunggah oleh

Hak Cipta:

Format Tersedia

Clustering Data Ujian Tengah Semester (UTS) Data Mining

Menggunakan Algoritma K-Means

1. PENDAHULUAN tes/ujian (Gronlud, 1977:1). Ada

clustering menempatkan data-data yang Adapun langkah-langkah dari

yang dibutuhkan untuk pembelajaran, a. Identifikasi

Clustering Jumlah Total

Gambar 1. Langkah-Langkah Penelitian

Langkah pertama, ditentukan terlebih C3=(C31,C32)) dengan melihat matriks

Sehingga centroid baru tersebut adalah:

Dengan membandingkan Tabel 3 dan nilai awal maupun asumsi yang

Gambar 2. Plot hasil clustering nilai UTS TI-A

Gambar 3. Plot hasil clustering nilai UTS TI-B

DAFTAR PUSTAKA Larose, D.T., (2005). Discovering

Anda mungkin juga menyukai