PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
SKRIPSI
Disusun Oleh :
Maria Riana Megawati
115314058
A THESIS
By :
YOGYAKARTA
2015
ii
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
HALAMAN PERSETUJUAN
iii
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
HALAMAN PENGESAHAN
iv
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
HALAMAN PERSEMBAHAN
Success does not suddenly come to you. You have to go out and work hard to get it
Time is like a river. You cannot touch the same water twice, because the flow that has
passed will never pass again.
Enjoy every moment of life
When you keep saying you are busy, then you are never free.
When you keep saying you have no time, then you will never have time.
When you keep saying that you will do it tomorrow, then your tomorrow will never come
Intelligence is not the determinant of success, but hard work is the real determinant of
your success.
Do nt be afraid to move, because the distance of 1000 miles starts by a single step.
v
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
Saya menyatakan dengan sesungguhnya bahwa skripsi saya yang saya tulis ini
tidak memuat karya atau bagian karya orang lain, kecuali yang telah saya sebutkan
dalam kutipan dan daftar pustaka, sebagaimana layaknya karya ilmiah.
Penulis,
vi
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
Yang bertanda tangan di bawah ini, saya mahasiswa Universitas Sanata Dharma :
beserta perangkat yang diperlukan (bila ada). Dengan demikian saya memberikan
kepada Perpustakaan Universitas Sanata Dharma hak untuk menyimpan, me-
ngalihkan dalam bentuk media lain, mengelolanya dalam bentuk pangkalan data,
mendistribusikan secara terbatas, dan mempublikasikannya di Internet atau media
lain untuk kepentingan akademis tanpa perlu meminta ijin dari saya maupun
memberikan royalti kepada saya selama tetap mencantumkan nama saya sebagai
penulis.
vii
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
ABSTRAK
viii
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
ABSTRACT
ix
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
KATA PENGANTAR
Puji syukur kepada Tuhan Yesus Kristus, atas segala berkat dan karunia
sehingga penulis dapat menyelesaikan tugas akhir yang berjudul Implementasi
Algoritma Fuzzy C-Means untuk Pengelompokan Sekolah Menengah Atas di
DIY Berdasarkan Nilai Ujian Nasional dan Nilai Sekolah. Tugas akhir ini ditulis
sebagai salah satu syarat memperoleh gelar sarjana program studi Teknik
Informatika, Falkutas Sains dan Teknologi Sanata Dharma.
Penulisan tugas akhir ini berjalan dengan baik dari awal hingga akhir karena
adanya dukungan doa, semangat dan motivasi yang diberikan oleh banyak pihak.
Untuk itu, penulis ingin mengucapkan terima kasih kepada:
1. Tuhan Yesus Kristus dan Bunda Maria yang selalu memberikan anugerah,
rahmat, kekuatan dan keberuntungan sehingga penulis dapat menyelesaikan
tugas akhir ini.
2. Kedua Orang Tua saya, Ir. Agustinus Sumasriyana M.Si dan Fransiska Wiwik
Suryani S.Pd atas doa, kasih sayang, perhatian,kepercayaaan, dukungan baik
moral maupun financial yang diberikan kepadaku.
3. Kakak ku tersayang, Catharina Andrian Shinta Dewi, dan saudara-saudarku
tersayang, Lintang Sari P, serta Sukma yang menemani dalam penyusunan
tugas akhir.
4. Ibu Paulina Heruningsih Prima Rosa, S.Si., M.Sc. selaku Dekan Fakultas
Sains dan Teknologi Universitas Sanata Dharma Yogyakarta sekaligus Dosen
Pembimbing yang telah dengan sabar membimbing dan memberikan
motivasi.
5. Ibu Dr. Anastasia Rita Widiarti selaku Ketua Program Studi Teknik
Informatika Falkutas Sains dan Teknologi Universitas Sanata Dharma
Yogyakarta.
x
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
Penulisan menyadari bahwa penulisan laporan tugas akhir ini masih memiliki
banyak kekurangan. Untuk itu, penulis sangat membutuhkan saran dan kritik
untuk perbaikan di masa yang akan datang. Semoga penulisan laporan tugas
akhir ini dapat berguna dan bermanfaat bagi semua pihak.
Penulis
xi
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
DAFTAR ISI
ABSTRACT ................................................................................................................. ix
BAB I ............................................................................................................................ 1
PENDAHULUAN ........................................................................................................ 1
xii
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
BAB II ........................................................................................................................... 7
xiii
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
BAB IV ....................................................................................................................... 39
xiv
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
BAB V ........................................................................................................................ 77
LAMPIRAN ................................................................................................................ 79
xv
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
DAFTAR TABEL
Tabel 4.4 Sampel Data Uji Secara Manual dan Sistem ............................................ 61
Tabel 4.5 Uji Perbandingan Algoritma FCM Secara Manual dan Sistem ................ 62
Tabel 4.6 Hasil uji perbandingan member percluster secara manual dan
sistem ....................................................................................................... 62
Tabel 4.7 Uji perubahan nilai Galat ( e) dan maksimal Iterasi (i) ............................. 63
Tabel 4.8 Uji Perbandingan Algoritma FCM dengan matlab dan Sistem ............... 64
Tabel 4.9 Hasil uji perbandingan member percluster nilai ujian nasional, nilai
sekolah ...................................................................................................... 64
Tabel 4.10 Uji Perbandingan Algoritma FCM dengan matlab dan Sistem ............. 68
Tabel 4.11 Hasil uji perbandingan member percluster nilai ujian .......................... 68
Tabel 4.12 Uji Perbandingan Algoritma FCM dengan matlab dan Sistem ............. 71
xvi
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
Tabel 4.13 Hasil uji perbandingan member percluster nilai ujian sekolah .............. 71
Tabel 4.14 Hasil uji perbandingan hasil jumlah member percluster ....................... 75
xvii
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
DAFTAR GAMBAR
Gambar 2.1 Tahapan proses sebuah sistem KDD (Jiawei Han & Micheline
Kamber,2006) ........................................................................................ 12
Gambar 3.4 Desain Proses Clustering Fuzzy C-Means pada aplikasi ....................... 30
Gambar 4.3 Antarmuka Halaman Praposes Data (Berkas .xls atau .csv) ................ 41
xviii
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
xix
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
1
BAB I
PENDAHULUAN
Kelebihan yang dimiliki oleh Fuzzy C-Means adalah clustering dapat dilakukan
lebih dari satu variabel secara bersamaan (Hadi HY,2005).
Algoritma Fuzzy C-Means (FCM) dapat diimplementasikan pada
sekumpulan data numerik dalam proses pengelompokan data. Salah satu contoh
data numerik yaitu data sekolah yang berupa data nilai ujian nasional dan nilai
sekolah.
Permendiknas No. 63 tahun 2009 tentang Sistem Penjaminan Mutu
Pendidikan (SPMP) pasal 20 dimana dinyatakan salah satu jenis kegiatan
penjaminan mutu pendidikan adalah evaluasi dan pemetaan mutu satuan atau
program pendidikan oleh Pemerintah, pemerintah provinsi, dan pemerintah
kabupaten atau kota. Pemerintah telah menentukan kebijakan dalam
meningkatkan standar mutu pendidikan dengan melakukan Ujian Nasional (UN)
dan Ujian Sekolah (US) setiap tahunnya.
Konsep clustering adalah membagi data menjadi kelompok-kelompok
dapat membantu dalam proses pengelompokan Sekolah Menengah Atas
khususnya yang ada di DIY berdasarkan data Nilai Ujian Nasional dan Nilai
Sekolah.
Berdasarkan hal diatas, maka penulis tertarik untuk mengimplementasikan
algoritma Fuzzy C-Means dan mengangkat judul skripsi yaitu Implementasi
Algoritma Fuzzy C-Means untuk Pengelompokan Sekolah Menengah Atas di DIY
berdasarkan Nilai Ujian Nasional dan Nilai Sekolah untuk membantu dan
mempermudah dalam proses pengelompokan data Sekolah Menengah Atas
dengan algoritma Fuzzy C-Means .
1.3 Tujuan
Penelitian ini bertujuan membantu, mendesain, mengimplementasikan
algoritma Fuzzy C-Means untuk mempermudah pengguna dalam
mengelompokkan Sekolah Menengah Atas berdasarkan nilai ujian nasional dan
nilai sekolah dengan algoritma Fuzzy C-Means.
Sistem
Engineering
Analysis
Design
Coding
Testing
Maintenance
BAB II
TINJAUAN PUSTAKA DAN DASAR TEORI
memunculkan beberapa custer data yang dapat dianalisis lebih lanjut persamaan
dan perbedaannya. Dari 4 pusat cluster yang di set di awal iterasi, ada 2 cluster
yang mempunyai nilai sama, yaitu cluster 3 dan cluster 4, dengan demikian hanya
dihasilkan 3 buah cluster performance mengajar dosen.
benar diberi skor satu, sehingga skor maximal yang mungkin dicapai
adalah siswa sebanyak 60. kemudian dihitung nilai rata-ratanya (X) dari
semua siswa yang ada di kelas tersebut, misalnya 25 dan simpangan
bakunya (SD) adalah 8,0. dengan demikian, skor yang dinyatakan lulus
adalah 25 + 0,25 (8,0) = 27, Skor-skor di atas 27 dinyatakan lulus
sedangkan skor di bawah 27 dinyatakan gagal atau tidak lulus.
2. Batas lulus ideal
Batas lulus ideal sama dengan batas lulus aktual, yaitu menentukan batas
lulus dengan menggunakan nilai rata-rata dan simpangan baku ideal. Nilai
rata-rata dan simpangan baku dalam batas lulus ideal mudah dihitung
menggunakan aturan sebagai berikut: Nilai rata-rata ideal adalah setengah
dari maksimum skor. Simpangan baku ideal adalah sepertiga dari nilai
rata-rata ideal. Misalnya, kembali pada contoh dalam batas lulus aktual.
Skor maksimum yang mungkin dicapai dari tes bahasa Inggris adalah 60.
rata-rata idealnya adalah setengah dari 60, yakni 30, sedangkan simpangan
bakunya adalah sepertiga dari rata-rata ideal, yakni 10. batas lulusan
idealnya adalah 30 + 0,25 (10) = 32,50. skor dia atas 32,50 dinyatakan
lulus, sedangkan skor di bawah 32,50 dinyatakan gagal atau tidak lulus.
3. Batas lulus purposif
Batas lulus purposif mengacu pada PAP sehingga tidak perlu menghitung
nilai rata-rata dan simpangan baku. Dalam hal ini ditentukan kriteria-nya,
misalnya 75%. Artinya skor yang dinyatakan lulus adalah skor di atas 75
% dari skor maksimum. Pada contoh di atas maka batas lulusnya adalah
75% dari 60, yakni 45. skor yang besarnya di atas 45 dinyatakan lulus dan
yang berada di bawahnya dinyatakan gagal atau tidak lulus. Makin tinggi
kriteria kelulusannya, maka makin tinggi pula kualitas hasil belajar yang
dituntutnya. Sebaliknya, makin rendah kriterianya, makin rendah pula
kualitas hasil belajar yang dihasilkannya (Sudjana, 2001:106-107).
Standar kriteria kelulusan dalam UAN sudah ditetapkan dalam POS
kelulusan UN yaitu 5,5. Artinya skor di atas 5,5 dinyatakan lulus,
sedangkan skor di bawah 5,5 dinyatakan gagal atau tidak lulus. Batas
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
11
tipe data yang akan di-cluster (kuantitatif atau kualitatif) juga menentukan ukuran
apa yang tepat digunakan dalam suatu algoritma. Selain kemiripan antar data
dalam suatu cluster, clustering juga dapat dilakukan berdasarkan jarak antar data
atau cluster yang satu dengan yang lainnya.Ada beberapa macam rumus
perhitungan jarak antar cluster. Untuk Tipe data numerik, sebuah data set X
beranggotakan x1 X, i = 1, ..., n, tiap item direpresentasikan sebagai vektor X1=
{Xi1, Xi2, Xim} dengan m sebagai jumlah dimensi dari item. Rumus-rumus yang
biasa digunakan sebagai ukuran jarak antara
Xi dan Xj untuk data numerik ini antara lain:
a. Euclidean Distance
..................................................(2.1)
b. Manhattan Distance
..............................................................(2.2)
Jika tiap item digambarkan sebagai sebuah titik dalam grid, ukuran jarak
ini merupakan banyak sisi yang harus dilewati suatu titik untuk mencapai
titik yang lain seperti halnya dalam sebuah peta jalan.
c. Minkwoski Metric
...........................................................(2.3)
Distance dan juga Manhattan Distance, ukuran ini memiliki masalah jika
salah satu atribut dalam vektor memiliki rentang yang lebih besar
dibandingkan atribut-atribut lainnya.
d. Cosine Corelation (ukuran kemiripan dari model Euclidean n-dimensi)
..........................................................(2.4)
Ukuran ini bagus digunakan pada data dengan tingkat kemiripan tinggi
walaupun sering pula digunakan bersama pendekatan lain untuk
membatasi dimensi dari permasalahan.
Dalam mendefenisikan ukuran jarak antar cluster yang digunakan
beberapa algoritma untuk menentukan cluster mana yang terdekat, perlu
dijelaskan mengenai atribut-atribut yang menjadi referensi dari suatu cluster
(Kantardzic, 2003). Untuk suatu cluster Km berisi N item {Xm1, Xm2, ...,
Xmn}:
a) Centroid: suatu besaran yang dihitung dari rata-rata nilai dari setiap
itemdari suatu cluster menurut rumus:
...........................................................(2.5)
untuk tiap-tiap cluster. Dengan cara memperbaiki pusat cluster dan derajat
keanggotaan tiap-tiap titik data secara berulang, maka akan dapat dilihat bahwa
pusat cluster akan bergerak menuju lokasi yang tepat. Perulangan ini didasarkan
pada minimisasi fungsi objektif yang menggambarkan jarak dari titik data yang
diberikan ke pusat cluster yang terbobot oleh derajat keanggotaan titik data
tersebut.
Dalam metode Fuzzy C Means dipergunakan variabel membership
fucntion iku, yang merujuk pada seberapa besar kemungkinan suatu data bisa
menjadi anggota ke dalam suatu cluster . Pada metode ini juga digunakan
suatu variabel m yang merupakan weighting exponent dari membership function.
Variabel ini dapat mengubah besaran pengaruh dari membership function iku
dalam proses clustering. Variabel m mempunyai wilayah nilai m > 1 , sampai
pada saat ini tidak ada ketentuan yang jelas berapa besar nilai m yang optimal
dalam melakukan optimasi suatu permasalahan clustering. Nilai m yang umum
digunakan adalah 2 (Wahyuni,2009) .
Secara mendasar terdapat dua cara pengalokasian data kembali kedalam
masing-masing cluster pada saat proses iterasi clustering. Yang pertama adalah
pengalokasian dengan cara tegas (hard). Dimana data item secara tegas
dinyatakan sebagai anggota cluster yang satu dan tidak menjadi anggota cluster
yang lain. Yang kedua dengan menggunakan nilai Fuzzy dimana masing-masing
data item diberikan nilai kemungkinan untuk bisa bergabung ke setiap cluster
yang ada. Pada K-Means pengalokasian data kembali didasarkan pada
perbandingan jarak antara data dengan centroid setiap cluster yang ada. Pada
Fuzzy C Means pengalokasian kembali data kedalam masing-masing cluster
dipergunakan variabel membership function uik yang merujuk pada seberapa besar
kemungkinan suatu data bisa menjadi anggota dalam satu cluster.
Keluaran dari FCM bukan merupakan sistem inferensi fuzzy, namun
merupakan deretan pusat cluster dan beberapa derajat keanggotaan untuk tiap
tiap titik data.
Algoritma Fuzzy C-Means (FCM) diberikan sebagai berikut (Kusumadewi,2010).
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
18
b. Jika yk = vfi,
ik (yk) = 1, jika i =g;
ik (yk) = 0, jika i g;
7. Menghitung fungsi objektif sebagai berikut.
Tahun
Tempat
2006 2007 2008 2009 2010
Kraton
45,450 31,723 43,103 47,486 58,235
Yogyakarta
Taman Sari 4,104 5,422 5,424 22,292 12,575
Gembira Loka 43,783 45,357 51,066 88,967 86,857
Purawisata 8,615 13,346 11,346 9,460 13,215
Data pada Tabel 2.1 merupakan data kunjungan wisata dari tahun 2006 -
2010 dalam satuan ribuan orang. Berdasarkan data tersebut ditentukan beberapa
parameter sebagai berikut.
1. Banyaknya cluster yang diinginkan; c = 3
2. Pangkat (pembobot); w = 2
3. Maksimum Iterasi; MaksIter = 1
4. Error Terkecil; Eps = 10-3
5. Fungsi Objektif awal Pt(0) = 0
6. Iterasi awal; t = 1
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
20
ik
i
k1 k2 k3
1 0.8 0.2 0
2 0.1 0.9 0
3 0 0.8 0.2
4 0 1 0
i i1w i1w* Xi1 i1w* Xi2 i1w* Xi3 i1w* Xi4 i1w* Xi5
1 0.64 29088 20302.72 27585.92 30391.04 37270.4
2 0.01 41.04 54.22 54.24 222.92 125.75
3 0 0 0 0 0 0
4 0 0 0 0 0 0
Jml 0.65 29129.04 20356.94 27640.16 30613.96 37396.15
i i2w i2w* Xi1 i2w* Xi2 i2w* Xi3 i2w* Xi4 i2w* Xi5
1 0.04 1818 1268.92 1724.12 1899.44 2329.4
2 0.81 3324.24 4391.82 4393.44 18056.52 10185.75
3 0.64 28021.12 29028.48 32682.24 56938.88 55588.48
4 1 8615 13346 11346 9460 13215
Jml 2.49 41778.36 48035.22 50145.8 86354.84 81318.63
4 0 0 0 0 0 0
Jml 0.04 1751.32 1814.28 2042.64 3558.68 3474.28
Tabel 2.3 - 2.5 merupakan data perhitungan v yang dipisah kan setiap
komponen ij, sehingga hasil akhir dari perhitungan pusat cluster v, sebagai
berikut.
v11 = 29129.04/0.65 = 44813.908
v12 = 20356.94/0.65 = 31318.369
v13 = 27640.16/0.65 = 42523.323
v14 = 30613.96/0.65 = 47098.4
v15 = 37396.15/0.65 = 57532.538
v21 = 41778.36/2.49 = 16778.458
v22 = 48035.22/2.49 = 19291.253
v23 = 50145.8/2.49 = 20138.876
v24 = 86354.84/2.49 = 34680.659
v25 = 81318.63/2.49 = 32658.084
v31 = 1751.32/0.04 = 43783
v32 = 1814.28/0.04 = 45357
v33 = 2042.64/0.04 = 51066
v34 = 3558.68/0.04 = 88967
v35 = 3474.28/0.04 = 86857
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
22
BAB III
ANALISIS DAN PERANCANGAN SISTEM
akan diolah dalam bentuk file berformat .xls atau .csv. Kedua, pengguna dapat
melakukan seleksi atribut serta melihat distribusi atribut. Seleksi atribut
digunakan untuk memilih atribut tertentu yang akan dihapus. Distribusi atribut
digunakan untuk melihat variasi nilai dalam setiap atribut berserta jumlahnya
dalam bentuk tabel. Tahap kedua ini merupakan tahap pilihan sehingga tidak
harus dikerjakan. Ketiga, pengguna harus memasukkan jumlah cluster (k), jumlah
pembobot(w), maksimum iterasi(i), toleransi kesalahan/Galat(e). Kemudian
sistem akan melakukan proses clustering sesuai dengan algoritma Fuzzy C-Means
sebagai berikut :
1. Membentuk matriks partisi awal keanggotaan (Uik) yg nilai awalnya acak,
i= banyak data, k = banyak kluster(antara0 -1),
2. Menghitung pusat vektor tiap-tiap cluster untuk matrik partisi tersebut,
3. Menghitung fungsi objektif ,
4. Memodifikasi matriks partisi sebagai berikut.
5. Memeriksa kondisi untuk berhenti,(Pt(c) - Pt-1(c) < Eps) atau (t > MaxIter),
Jika Ya berhenti, dan jika Tidak maka ulangi dari langkah ke-2.
6. Menampilkan hasil dari algoritma Fuzzy C-Means berupa fungsi objektif
(Pt), matriks keanggotaan (ik) dan pusat kluster (Vkj).
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
27
TIDAK
YA
Pada gambar 3.3 diperlihatkan proses dari aplikasi mulai dari membuka
berkas berekstensi .xlx atau .csv kemudian aplikasi akan memeriksa kondisi
berkas, jika berkas .xlx atau .csv sesuai dan format penulisannya benar, maka
aplikasi akan melanjutkan menampilkan ukuran dan jumlah instances yang berada
pada berkas. Namun jika tidak maka aplikasi akan memerintahkan untuk
membuka berkas kembali.Setelah berkas diperiksa langkah selanjutnya adalah
merubah isi berkas ke bentuk array list agar dapat diolah oleh aplikasi.
Gambar 3.4 menunjukkan aplikasi memproses clustering menggunakan
algoritma Fuzzy C-Means. Dimulai dari mengambil array list data yang kemudian
diubah ke bentuk matriks (mxn). Proses selanjutnya adalah memasukkan jumlah
cluster yang diinginkan, banyaknya maksimum iterasi dan galat (batas kesalahan
yang diperbolehkan). Aplikasi kemudian akan mengelompokkan data sesuai
algoritma clustering pada Gambar 3.2, terus berulang sampai didapatkan kondisi
selisih fungsi objektif kurang dari galat (Pt(c) - Pt-1(c) < Eps) atau kondisi iterasi
maksimum sudah terpenuhi.
Secara singkat proses dari clustering dalam aplikasi ini adalah menentukan
centroid atau pusat data secara random dari salah satu titik data yang ada pada
instances, sebanyak jumlah cluster yang diinginkan. Proses kemudian dilanjutkan
dengan perhitungan jarak dari titik instances ke centroid. Perhitungan jarak akan
terus dilakukan untuk mencari jarak terdekat semua titik ke centroid yang ada.
Jika semua data instances sudah terkelompokkan, namun masih ada instance yang
tidak sesuai dengan kelompoknya maka aplikasi akan menentukan centroid baru
dengan mencari rata-rata (mean) jarak instance terhadap centroid yang sudah ada.
Proses akan terus berulang sampai ditemukan jarak yang terdekat sesuai
centroid.Jika iterasi cluster sudah mencapai maksimum, atau data instances sudah
terkelompokkan dengan baik, maka aplikasi akan menampilkan data kelompok
tersebut.
Hasil yang ditampilkan oleh aplikasi adalah hasil clustering berupa poin
cluster dan instances data yang termasuk didalamnya, jumlah iterasi yang telah
dilakukan, fungsi objektif yang dicapai (Pt) , nilai kesalahannya serta grafik
clustering .
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
30
run()
masuk()
pilihBerkas()
requestInput()
InputFile(.xls || .csv)
cekAtribut()
cekAtribut(OK)
tabelPraproses.setEnabled()
showData()
run()
klastering()
data(OK)
proses(parameter)
matriksAwal()
hitungPusatKlaster()
fObjektif()
matriksUBaru()
tampilHasil()
plot()
scatter(Tabel)
plotKlaster(OK)
terjadi dimulai dari Pengguna ketika aplikasi dimulai, objek Pengguna akan
melakukan event meminta run() terhadap Praproses yang kemudian dijawab oleh
objek FuzzyCMeans dengan melakukan klastering(). Setelah mendapatkan return
message data() sudah baik dari objek FuzzyCMeans, maka Pengguna melanjutkan
perintah proses() dengan input parameter klaster, begitu seterusnya sampai pada
akhirnya objek pengguna mendapatkan return message berupa tampilan hasil
analisa clustering dari PlotKlaster.
BAB IV
IMPLEMENTASI DAN PENGUJIAN SISTEM
Gambar 4.3 Antarmuka Halaman Praproses Data (Berkas .xls atau .csv)
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
42
Pengguna dapat melakukan seleksi atribut pada tabel atribut, dengan cara
menandai atribut yang ingin dihapus. Atribut yang sudah dilakukan proses hapus
akan hilang dari tabel data. Tampilan penanda hapus atribut seperti ditunjukkan
pada Gambar 4.4 berikut.
btnMasukActionPerformed(java.awt.event.ActionEvent evt) {
this.dispose();
PraprosesGUI pg = new PraprosesGUI();
pg.setLocationRelativeTo(null);
pg.setVisible(true);
pg.setExtendedState(pg.MAXIMIZED_BOTH);
}
public void run() {
MenuAwal dialog = new MenuAwal(new javax.swing.JFrame(),
true);
dialog.addWindowListener(new
java.awt.event.WindowAdapter() {
public void windowClosing(java.awt.event.WindowEvent e) {
System.exit(0);
}
});
dialog.setVisible(true);
}
memasukkan berkas data, maka nama berkas beserta lokasi penyimpanannya akan
disimpan dalam variable nama_file.
Untuk dapat membaca isi berkas, diperlukan perintah untuk mendeteksi
ekstensi berkas. Jika berkas berekstensi .xls maka method pilihXLS() akan
dijalankan, sedangkan jika berkas berekstensi .csv maka method pilihCSV() akan
dijalankan, namun jika tidak keduanya maka pesan kesalahan akan ditampilkan ke
layar.
private void hapusAtribut() {
List<String> hapus_atribut = new ArrayList<String>();
for (int i = 0; i < ctm.getRowCount(); i++) {
if (ctm.getValueAt(i, 1).equals(true)) {
hapus_atribut.add(ctm.getValueAt(i, 0).toString());
}}
ctm.removeRow();
TableModel model = tabelPraproses.getModel();
int column = model.getColumnCount();
int row = model.getRowCount();
Vector columnNames = new Vector();
Vector data = new Vector();
for (int i = 0; i < ctm.getRowCount(); i++) {
if (!cekAtribut(ctm.getValueAt(i, 0).toString(),
hapus_atribut)) {
columnNames.addElement(ctm.getValueAt(i, 0));
}}
for (int i = 0; i < row; i++) {
Vector rows = new Vector();
for (int j = 0; j < column; j++) {
if (cekAtribut2(model.getColumnName(j).toString(),
columnNames)) {
rows.addElement(model.getValueAt(i, j));
}
}
data.addElement(rows);
}
DefaultTableModel new_model = new
DefaultTableModel(data, columnNames);
tabelPraproses.setModel(new_model);
ctm.removeRow();
}
2. Untuk setiap baris tabel hapus atribut, ambil nama atribut dan tambahkan
ke ArrayList.
3. Hapus baris dari tabel hapus Atribut yang telah dipilih .
4. Buat objek vector baru nama kolom, kolom dan baris untuk menyimpan
data kolom dan baris dari tabel hapus atribut.
5. Buat tabel model baru dari vector vector hasil poin 3, dan set tabel
praproses dengan model baru tersebut.
hitungUW[i][j]=Math.pow(matriksU[i][j],w);
//var jumU untuk menyimpan jumlah dari var
hitungUW
jumU[j] += hitungUW[i][j];
}
}
System.out.println("");
//var df untuk format penulisan dua angka dibelakang
koma
df = new DecimalFormat("###.###");
// for (int i=0;i<baris;i++){
// for (int j=0;j<k;j++){
//
System.out.print(df.format(hitungUW[i][j])+"\t");
// }
// System.out.println("");
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
52
private XYDataset createData() {
XYSeriesCollection xySeriesCollection = new
XYSeriesCollection();
xySeriesCollection.addSeries(added);
return xySeriesCollection;
}
sesuai fungsinya.
Tombol simpan sudah dapat menyimpan dalam
format.xls, .txt dan .doc
Sudah memunculkan plot xy klaster data dan klaster,
Halaman Plot
5 namun belum dapat memberikan pembedaan warna data
Klaster
klaster sesuai klaster.
Halaman Sudah bekerja baik, muncul teks petunjuk pemakaian
6
Bantuan aplikasi.
Iterasi ke-6 :
==============================
Pusat Kluster =
4.836 3.222 4.641
8.406 8.176 8.066
Matriks U Baru =
0.003 0.997
0.003 0.997
0.983 0.017
0.969 0.031
0.004 0.996
0 1
0.985 0.015
0.997 0.003
0.985 0.015
0.991 0.009
Banyak Data = 10
************************************
Hasil Klaster data sebagai berikut :
Banyak Klaster 1 = 6
Isi Klaster 1 =
Data ke-3 SMA PATRIA BANTUL
Data ke-4 SMA SANTO THOMAS YOGYAKARTA
Data ke-7 SMA MUHAMMADIYAH SEWON
Data ke-8 SMA PEMBANGUNAN 2 KARANGMOJO
Data ke-9 SMA MUHAMMADIYAH WATES
Data ke-10 SMA PEMBANGUNAN 3 PONJONG
Banyak Klaster 2 = 4
Isi Klaster 2 =
Data ke-1 SMA NEGERI 3 YOGYAKARTA
Data ke-2 SMA NEGERI 1 BANTUL
Data ke-5 SMA NEGERI 1 SLEMAN
Data ke-6 SMA NEGERI 1 YOGYAKARTA
************************************
Banyak Iterasi = 6
Error Fungsi Obyektif = 4.981817772353736E-5
Waktu Klastering = 0.208 detik
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
61
Data uji yang digunakan merupakan data sampel nilai ujian nasional dan
niali sekolah pada tahun 2011. Pengujian pada data uji dimaksudkan untuk
mengetahui apakah sistem dapat mengelompokkan sekolah sesuai dengan data uji.
Tabel data uji secara manual dan sistem ditunjukkan pada tabel 4.4 dan data uji
pada matlab dan sistem terdapat pada lampiran, sebagai berikut.
Tabel 4.5 Uji Perbandingan Algoritma FCM Secara Manual dan Sistem
No Uji Sistem M. Excel
1 Jumlah data 10 10
2 Jumlah Iterasi 4 6
3 Fungsi Obyektif 4.855 4.86
4 Error FObyektif 0.008328 0.00
5 Member klaster 1 6 6
6 Member klaster 2 4 4
Tabel 4.6 Hasil uji perbandingan member percluster secara manual dan
sistem
Sistem Manual
SMA PATRIA BANTUL SMA PATRIA BANTUL
SMA SANTO THOMAS YOGYAKARTA SMA SANTO THOMAS YOGYAKARTA
klaster SMA MUHAMMADIYAH SEWON SMA MUHAMMADIYAH SEWON
1 SMA PEMBANGUNAN 2 KARANGMOJO SMA PEMBANGUNAN 2 KARANGMOJO
SMA MUHAMMADIYAH WATES SMA MUHAMMADIYAH WATES
SMA PEMBANGUNAN 3 PONJONG SMA PEMBANGUNAN 3 PONJONG
Tabel 4.7 Uji perubahan nilai Galat ( e) dan maksimal Iterasi (i)
Maksimal iterasi(i) 5 9 13 21 100
G 0.1 5 5 5 5 5
A 0.01 5 5 5 5 5
L (e) 0.001 5 5 5 5 4
A 0.0001 5 5 5 5 3
T 0.00001 5 5 4 2 1
Tabel 4.8 Uji Perbandingan Algoritma FCM dengan matlab dan Sistem
Tabel 4.9 Hasil uji perbandingan member percluster nilai ujian nasional, nilai
sekolah
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
65
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
66
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
67
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
68
Tabel 4.10 Uji Perbandingan Algoritma FCM dengan matlab dan Sistem
No Uji Sistem Matlab
1 Jumlah data 134 134
2 Jumlah Iterasi 22 21
Jumlah Member
3 50 50
klaster 1
Jumlah Member
4 54 54
klaster 2
Jumlah Member
5 30 30
klaster 3
Tabel 4.11 Hasil uji perbandingan member percluster nilai ujian nasional
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
69
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
70
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
71
Tabel 4.13 Hasil uji perbandingan member percluster nilai ujian sekolah
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
72
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
73
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
74
Pada table 4.14 dapat dilihat perbandingan hasil dari ketiga percobaan
tersebut, yang menghasilkan jumlah anggota member cluster yang berbeda
perclusternya dalam 3 data inputan uji coba yang berbeda. Hal ini dikarenakan
inputan data yang diuji memiliki nilai yang berbeda-beda. Untuk melihat rincian
perbandingan hasil anggota percluster dari table 4.9, 4.11, dan 4.13 dapat dilihat
pada lampiran table perbandingan detail table 4.14.
BAB V
KESIMPULAN DAN SARAN
5.1 Kesimpulan
Kesimpulan yang diperoleh sebagai hasil penyelesaian tugas akhir ini
adalah:
1. Implementasi algoritma Fuzzy C-Means untuk pengelompokan Sekolah
Menengah Atas di DIY berdasarkan nilai Ujian Nasional dan nilai sekolah
telah berhasil dibangun dan dapat digunakan untuk pengelompokan
Sekolah Menengah Atas di DIY .
2. Metode Clustering dengan algoritma Fuzzy C-Means terbukti dapat
mengelompokkan data sekolah dengan valid.
5.2 Saran
Berdasarkan hasil analisis pada tugas akhir ini, penulis memberikan saran
untuk perbaikan dan pengembangan program lebih lanjut antara lain:
1. Program yang dibangun ini belum bisa menerima masukan selain berkas
berformat .xls, .csv. Sistem ini bisa dilengkapi dengan tambahan pembaca
data dari format lain contohnya seperti .doc.
2. Program dapat menampilkan data statistik selain distribusi atribut yaitu
mean, median, range, maksimumdan minimum.
3. Program dapat menampilkan grafik selain hasil klaster yaitu grafik iterasi,
grafik fungsi objektif dan grafik error fungsi objektif.
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
78
DAFTAR PUSTAKA
LAMPIRAN
FC-005 Lihat grafik plot Use case ini menggambarkan grafik Pengguna
Hasil dari proses clustering
FC-007 Lihat bantuan Use case ini untuk melihat petujuk Pengguna
bagaimana cara kerja dari sistem ini
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
80
Diagram Aktivitas
1. Input data file .xls, .csv
Pengguna Sistem
2. Proses clustering
Pengguna Sistem
Menampilkan halaman
Menekan tombol FCMGUI dan menampilkan
Klastering data yang telah dipilih inputan
pada tabel
4. Seleksi Atribut
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
83
5. Distribusi Atribut
Pengguna Sistem
6. Melihat plot
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
84
7. Melihat Bantuan
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
85
Dari hasil sebagian uji diatas, dapat disimpulkan dalam 5 kali percobaan
dengn galat (e )= 0,1 dan maksimal iterasi ()= 100 menghasilkan konsisten yang
rendah terhadap jumlah anggota perclusternya. Dengan kata lain jumlah anggota
perclusternya mengalami perubahan dari setiap kali uji.
Cluster 1 47 43 29 29 29
Cluster 2 42 44 47 47 47
Cluster 3 48 50 61 61 61
Dari hasil sebagian uji diatas, dapat disimpulkan dalam 5 kali percobaan
dengan galat (e)= 0,00001 dan maksimal iterasi ()= 100 menghasilkan konsisten
yang tinggi terhadap jumlah anggota perclusternya. Dengan kata lain jumlah
danggota perclusternya tidak mengalami perbedaan dari setiap kali uji.
Sehingga akan lebih baik jika menggunakan nilai Galat (e) yang kecil dan
maksimal iterasi (i) yang besar dalam melakukan proses clustering karena
menghasilkan konsistensi data anggota percluster yang tinggi dan hasilnya akan
semakin serupa dengan yang dihasilkan uji matlab.
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
90
Data uji yang digunakan untuk matlab dan sistem yakni dengan banyak data
sejumlah 12 atribut dan 134 record,berikut cuplikan data yang ada pada file Data
IPA 2011.
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
91
a. Screenshot Hasil Data uji Nilai Ujian Nasional dan Sekolah IPA tahun 2011
3. Hasil obj_fcn
b. Screenshot Hasil Data uji Nilai Ujian Nasional IPA tahun 2011
3. Hasil obj_fcn
3. Hasil obj_fcn
a. Dengan data Nilai Ujian Nasional dan Sekolah IPA tahun 2011
,cuplikan gambar screenshot hasil uji sistem pada hasil iterasi terakhir .
..
..
.
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
98
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
99
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
100
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
101
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
102
Detail gambar screenshot perbandingan hasil percobaan table 4.8 member per
cluster hasil uji matlab dengan sistem
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
103
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
104
1. Permasalahan
Variabel
Data
ING MAT BIO
x1 8.73 8.40 8.20 SMA NEGERI 3 YOGYAKARTA
x2 8.14 8.32 8.31 SMA NEGERI 1 BANTUL
x3 4.00 2.63 4.53 SMA PATRIA BANTUL
x4 5.80 3.75 4.38 SMA SANTO THOMAS YOGYAKARTA
x5 8.29 7.85 7.81 SMA NEGERI 1 SLEMAN
x6 8.47 8.14 7.95 SMA NEGERI 1 YOGYAKARTA
x7 5.58 3.52 4.52 SMA MUHAMMADIYAH SEWON
x8 4.55 2.96 4.66 SMA PEMBANGUNAN 2 KARANGMOJO
x9 3.93 2.97 4.69 SMA MUHAMMADIYAH WATES
x10 5.19 3.52 5.05 SMA PEMBANGUNAN 3 PONJONG
108
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
2. Menentukan besarnya kluster (k >= 2), pemangkat/pembobot (w>1), maks iterasi (max = 5),
galat (e= 0.01)
k= 2 fungsi objektif(P0) = 0, dan iterasi awal = 1
w= 2
max = 50
e= 0.001
P0 = 0
1
iter =
Iterasi 1
Langkah 3. Bentuk matriks partisi awal keanggotaan (Uik) yg nilai awalnya acak, i= banyak data, k = banyak kluster(antara0
-1)
Uik i k1 k2
1 0.21 0.36
2 0.66 0.18
3 0.01 0.22
4 0.38 0.76
5 0.16 0.81
6 0.12 0.94
7 0.09 0.62
8 0.46 0.51
9 0.11 0.8
10 0.81 0.13
109
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
i Uik Xij
(Ui1^w) * (Ui1^w) (Ui1^w) (Ui2^w) * (Ui2^w) (Ui2^w)
1 2 1 2 3 Ui1^w Ui2^w
(Xi1) * (Xi2) * (Xi3) (Xi1) * (Xi2) * (Xi3)
1 0.21 0.36 8.73 8.40 8.20 0.0441 0.1296 0.38 0.37 0.36 1.13 1.09 1.06
2 0.66 0.18 8.14 8.32 8.31 0.4356 0.0324 3.55 3.62 3.62 0.26 0.27 0.27
3 0.01 0.22 4.00 2.63 4.53 0.0001 0.0484 0.00 0.00 0.00 0.19 0.13 0.22
4 0.38 0.76 5.80 3.75 4.38 0.1444 0.5776 0.84 0.54 0.63 3.35 2.17 2.53
5 0.16 0.81 8.29 7.85 7.81 0.0256 0.6561 0.21 0.20 0.20 5.44 5.15 5.12
6 0.12 0.94 8.47 8.14 7.95 0.0144 0.8836 0.12 0.12 0.11 7.48 7.19 7.02
7 0.09 0.62 5.58 3.52 4.52 0.0081 0.3844 0.05 0.03 0.04 2.14 1.35 1.74
8 0.46 0.51 4.55 2.96 4.66 0.2116 0.2601 0.96 0.63 0.99 1.18 0.77 1.21
9 0.11 0.8 3.93 2.97 4.69 0.0121 0.64 0.05 0.04 0.06 2.52 1.90 3.00
10 0.81 0.13 5.19 3.52 5.05 0.6561 0.0169 3.41 2.31 3.31 0.09 0.06 0.09
1.5521 3.6291 9.563579 7.854828 9.321519 23.793303 20.077661 22.266364
Pusat Kluster
Vkj 1 2 3
1 6.162 5.061 6.006
2 6.556 5.532 6.136
110
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
111
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
(Xi1- (Xi2- (Xi3- Total (Xi1- (Xi2- (Xi3- Total Ui1 = Ui2 =
Total
Vk1)^2 Vk2)^2 Vk3)^2 1^-1 Vk1)^2 Vk2)^2 Vk3)^2 2 Tot1/Tot Tot2/Tot
1 6.60 11.15 4.81 0.04 4.73 8.22 4.26 0.06 0.10 0.433 0.567
2 3.91 10.62 5.31 0.05 2.51 7.77 4.73 0.07 0.12 0.431 0.569
3 4.67 5.91 2.18 0.08 6.53 8.42 2.58 0.06 0.14 0.579 0.421
4 0.13 1.72 2.64 0.22 0.57 3.18 3.08 0.15 0.37 0.603 0.397
5 4.53 7.78 3.26 0.06 3.01 5.37 2.80 0.09 0.15 0.418 0.582
6 5.33 9.48 3.78 0.05 3.66 6.80 3.29 0.07 0.13 0.425 0.575
7 0.34 2.37 2.21 0.20 0.95 4.05 2.61 0.13 0.33 0.607 0.393
8 2.60 4.41 1.81 0.11 4.03 6.62 2.18 0.08 0.19 0.592 0.408
9 4.98 4.37 1.73 0.09 6.90 6.57 2.09 0.06 0.15 0.584 0.416
10 0.94 2.37 0.91 0.24 1.87 4.05 1.18 0.14 0.38 0.626 0.374
Ulangi hingga ,
Iterasi 6
112
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
Pusat Kluster
Vkj 1 2 3
1 4.836 3.222 4.641
2 8.406 8.176 8.066
113
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
114
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
1 15.16 26.81 12.67 0.02 0.10 0.05 0.02 5.77 5.79 0.003 0.997
2 10.91 25.99 13.46 0.02 0.07 0.02 0.06 6.61 6.63 0.003 0.997
3 0.70 0.35 0.01 0.94 19.41 30.75 12.50 0.02 0.96 0.983 0.017
4 0.93 0.28 0.07 0.78 6.79 19.59 13.59 0.03 0.81 0.969 0.031
5 11.93 21.42 10.04 0.02 0.01 0.11 0.07 5.41 5.43 0.004 0.996
6 13.20 24.19 10.95 0.02 0.00 0.00 0.01 53.29 53.32 0.000 1.000
7 0.55 0.09 0.01 1.52 7.99 21.67 12.57 0.02 1.55 0.985 0.015
8 0.08 0.07 0.00 6.62 14.87 27.20 11.60 0.02 6.64 0.997 0.003
9 0.82 0.06 0.00 1.13 20.04 27.10 11.40 0.02 1.14 0.985 0.015
10 0.12 0.09 0.17 2.62 10.34 21.67 9.10 0.02 2.65 0.991 0.009
Karena sudah memenuhi salah satu syarat yakni | P6-P5| < galat ,maka yang digunakan pusat kluster iterasi ke-6
Pusat Kluster
Vkj 1 2 3
1 4.8365 3.2220 4.6407
2 8.4062 8.1755 8.0659
115
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
Matriks U
U1 U2
0.003 0.997
0.003 0.997
0.983 0.017
0.969 0.031
0.004 0.996
0.000 1.000
0.985 0.015
0.997 0.003
0.985 0.015
0.991 0.009
116
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
117
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
Data yang digunakan dalam penelitian ini adalah data nilai Ujian Nasional dan Nilai Sekolah jurusan IPA tahun 2014. Data
berupa Nilal Ujian Nasional meliputi nilai Bahasa Indonesia, Bahasa Inggris, Matematika, Fisika, Kimia, Biologi, serta Nilai Sekolah
meliputi nilai Bahasa Indonesia, Bahasa Inggris, Matematika, Fisika, Kimia, Biologi. Kemudian dilakukan proses clustering dan
diperoleh hasil yaitu nilai fungsi obyektif selama iterasi, pusat cluster atau center serta derajat keanggotaan lulusan untuk setiap
cluster pada iterasi terakhir. Dalam penelitian ini, proses iterasinya berhenti pada iterasi ke-16 karena nilai |Pt - Pt-1|< . Nilai fungsi
obyektif pada iterasi terakhir yang diperoleh adalah 229.56468745177847. Hasil dari clustering yang dilakukan dapat dilihat di
bawah ini
1. Nilai fungsi obyektif selama 16 iterasi dapat dilihat pada Tabel 1 di bawah ini:
118
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
10 230.25302077227119
..
16 229.56468745177847
7.152 4.619 3.673 3.623 3.698 4.717 8.811 8.757 8.74 8.751 8.722 8.741
7.831 5.651 4.94 4.732 4.907 5.951 8.397 8.359 8.331 8.308 8.318 8.339
8.313 7.05 6.986 6.62 6.436 7.433 8.376 8.39 8.297 8.318 8.339 8.344
3. Derajat keanggotaan lulusan untuk sertiap cluster pada iterasi terakhir (iterasi ke-16)
i1 i2 i3
119
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
Dari derajat keanggotaan lulusan pada iterasi terakhir dapat diperoleh informasi mengenai kecenderungan lulusan untuk masuk ke cluster mana.
Derajat keanggotaan terbesar menunjukkan bahwa kecenderungan tertinggi lulusan untuk masuk menjadi anggota cluster tersebut. Misalnya
untuk lulusan ke-1, dapat menjadi:
Derajat keanggotaan terbesarnya terletak di cluster ketiga, maka data ke -1 akan dimasukkan kedalam cluster ketiga. Hasil selengkapnya
pengelompokkan ke-141 SMA kedalam 3 cluster dapat dilihat pada di bawah ini:
120
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
1 10, 11, 16, 17, 19, 20, 21, 22, 23, 28, 30, 31, 33, 34, 35, 36, 47, 49, 50, 51,
52, 62, 63, 64, 66, 67, 69, 72, 78, 79, 80, 86, 92, 93, 94, 95, 97, 98, 99,
100, 105, 110, 111, 112, 114, 117, 130, 131, 133, 137, 138, 139, 140
2 8, 9, 12, 25, 29, 32, 38, 40, 45, 46, 48, 53, 54, 55, 58, 60, 61, 65, 68, 70,
71, 76, 81, 82, 83, 84,8 5, 87, 88, 96, 102, 103, 104, 107,108,115,116,
118, 119, 120, 121, 122, 123, 126, 127, 128, 129, 132, 134, 135, 136, 141
3 1, 2, 3, 4, 5, 6, 7, 13, 14, 15, 18, 24, 26, 27, 37, 39, 41, 42, 43, 44, 56, 57,
59, 73, 74, 75, 77, 89, 90, 91, 101, 106, 109, 113, 124, 125
121
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
Cluster Jumla Bahasa indoUN Bahasa InggrisUN MatematikaUN FisikaUN KimiaUN BiologiUN
h RAT MAX MI RAT MAX MI RAT MA MIN RAT MAX MIN RAT MAX MIN RAT MAX MI
Anggo A- N A- N A- X A- A- A- N
ta RAT RAT RAT RAT RAT RAT
A A A A A A
1 53 7.15 8.50 5.3 4.61 5.93 3.5 3.67 4.7 2.89 3.62 5.00 2.65 3.69 4.78 2.39 4.71 6.25 3.2
2 0 9 7 3 5 3 8 7 1
2 25 7.83 8.25 6.8 5.65 7.76 4.3 4.94 6.3 4.17 4.73 6.99 3.66 4.90 6.03 4.08 5.95 6.83 5.1
1 4 1 8 1 2 7 1 0
3 36 8.31 9.40 5.5 7.05 8.20 5.8 6.98 8.3 5.50 6.62 7.83 5.00 6.43 7.25 5.59 7.43 9.00 6.4
3 1 5 6 5 6 3 0
Bahasa indoUS Bahasa InggrisUS MatematikaUS FisikaUS KimiaUS BiologiUS
RAT MAX MI RAT MAX MI RAT MA MIN RAT MAX MIN RAT MAX MIN RAT MAX MI
A- N A- N A- X A- A- A- N
RAT RAT RAT RAT RAT RAT
A A A A A A
8.81 9.71 8.0 8.75 9.74 7.8 8.74 9.7 7.96 8.75 9.72 7.97 8.72 9.69 8.00 8.74 9.71 7.7
1 2 7 0 2 1 2 1 3
8.39 9.28 7.9 8.35 9.03 7.7 8.33 8.9 7.87 8.30 8.96 7.82 8.31 8.96 7.81 8.33 8.93 7.9
7 6 9 5 1 1 8 8 9 1
8.37 9.32 7.8 8.39 9.45 7.8 8.29 9.3 7.67 8.31 9.34 7.77 8.33 9.31 7.81 8.34 9.29 7.7
6 0 0 7 4 8 9 4 7
122
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI
a. Berdasarkan uji coba clustering yang dilakukan, pada data SMA di DIY pada tahun 2011 jurusan IPA diset dalam 3 cluster.
b. Dari hasil uji coba, ketiga cluster tersebut diketahui bahwa pada cluster 1 memiliki jumlah yang paling banyak dengan 53 sekolah
sedangkan cluster 2 dengan 52 sekolah dan cluster 3 dengan 36 sekolah.
c. Untuk cluster 1 memiliki criteria nilai yang rendah dibanding kedua cluster yang lain di bagian nilai UN dan memiliki nilai tinggi dibagian
nilai US, sedangkan cluster 2 memiliki criteria nilai yang sedang dibanding kedua cluster yang lain di bagian nilai UN dan memiliki nilai
rendah dibagian nilai US, dan cluster 3 memiliki criteria nilai yang tinggi dibanding kedua cluster yang lain di bagian nilai UN dan memiliki
nilai sedang dibagian nilai US.
123
PLAGIAT
PLAGIATMERUPAKAN
MERUPAKANTINDAKAN
TINDAKANTIDAK
TIDAKTERPUJI
TERPUJI