128 183 1 SM

UPI YPTK Jurnal KomTekInfo Vol. 4, No. 2, Desember 2017, Hal.
267-283 ISSN :2356-0010

Copyright©2017 by LPPM UPI YPTK Padang
DATA MINING DALAM MENENTUKAN PENJUALAN
KACAMATA PADA OPTIK ZAL LARIS DAN TIDAK
LARIS MENGGUNAKAN METODE CLUSTERING
Eva Rianti
UniversitasPutra Indonesia “YPTK”Padang
E-mail:evarianti28@gmail.com
Abstrak
Dalam pengolahan data konsumen pada proses penjualan, masih ada proses-proses yang dilakukan
secara manual sehingga sering terjadi kesalahan dalam pencatatan data-data yang ada dan mengurangi
efektifitas waktu dalam bekerja. Sehingga pemilik sulit menemukan informasi dari data penjualan yang
belum diolah ,dimana data tersebut berguna dalam menghasilkan laporan penjualan. Dari latar belakang
tersebut maka dibutuhkan sistem informasi yang terkomputerisasi untuk menunjang arus data dan informsi
sesuai dengan kebutuhan dari proses-proses tersebut.Masalah yang akan di teliti berkaitan dengan proses
pengolahan data penjualan tentang bagaimana menghasilkan informasi serta pengetahuan yang bermanfaat
melalui software data mining yaitu menggunakan metode clustering dengan algoritma K-Means pada data
penjualan dari optic Zal padang. Data penjualan frame kacamata di okptik Zal Padang, diharapkan dapat
membantu pimpinan perusahaan dalam menganalisadan melihat besarnya minat dan banyaknya pelanggan
yang membeli Frame Kacamata. Pemilik optic dapat mengetahui frame apa saja yang banyak diminati dan
juga yang kurang diminati sehingga bias membantu pemilik dalam pengambilan keputusan dalam pembelian
barang untuk masa yang akan dating.
Kata Kunci :K-means, Clustering, efektifitas, Software.
1. Pendahuluan
Kacamata merupakan alat bantu bagi penggunanya yang mengalami masalah dengan
indra pengelihatannya. Semakin berkembangnya teknologi khususnya benda-benda elektronik
yang menggunakan layar monitor, orang-orang di tuntut untuk sering kali melihat kelayar monitor,
contohnya di kalangan pekerja kantor, atau bahkan kalangan anak-anak yang tidak bisa lepas dari
telepon seluler mereka, seringnya terpapar dengan radiasi monitor atau telepon seluler ini membuat
daya pengelihatan terganggu, biasanya gangguan pada pengelihatan di atasi dengan cara operasi,
ini tentu mengeluarkan biaya yang tidak sedikit, alternative lainnya orang-orang memilih
menggunakan kacamata atau lensa kontak. Optik merupakan toko atau gerai yang menyediakan
kacamata dan kontak lensa.Optik Zal di Sentral Pasar Raya Plaza lantai GROUND FLOOR Blok
B1 No 1 & 2 adalah salah satu toko atau gerai yang menjual kacamata dan kontak lensa dengan
berbagai merk dan ukuran untuk memenuhi kebutuhan konsumennya, namun toko ini belum bisa
menentukan merk kacamata mana yang terlaris dan mana yang kurang diminati konsumennya,
sehingga penyediaan kacamata kurang tepat dengan yang diminati pembeli. Datamining adalah
serangkaian proses untuk menggali nilai tambah dari suatu kumpulan data berupa pengetahuan
yang selama ini tidak diketahui secara manual(Pramudiono, 2006).Proses pada pohon keputusan
adalah mengubah bentuk data (tabel)menjadi model pohon,mengubah modelpohon menjadi
rule,dan menyederhanakan rule(BasukidanSyarif, 2003).
2. LandasanTeori
2.1 Pengertian Data Mining
267
UPI YPTK Jurnal KomTekInfo Vol. 4, No. 2, Desember 2017, Hal. 267-283 ISSN :2356-0010
Data Mining merupakan sebuah analisa dari observasi data dalam jumlahbesar untuk
menemukan hubungan yang tidak diketahui sebelumnya dan metode baru untuk meringkas
data agar mudah dipahami serta kegunaanya untuk pemilik data.
2.1.1 Proses Data Mining
Data mining sesungguhnya merupakan salah satu rangkaian dari proses pencarian
pengetahuan pada database (Knowledge Discovery in Database/KDD). KDD adalah
keseluruhan proses untuk mencari dan mengidentifikasi pola(patern) dalam data, dimana pola
yang ditemukan bersifat sah, baru, dapat bermanfaat dan dimengerti. Serangkaian proses
tersebut memiliki tahap sebagai berikut(Tan, 2010):
1. Pembersihan data dan integrasi data (cleaning and integration)

Proses ini digunakan untuk membuang data yang tidak konsisten dan bersifat noise
dari data yang terdapat di berbagai basis data yang mungkin berbeda format maupun
platform yang kemudian diintegrasikan satu database datawarehouse.
2. Seleksi dan transformasi data (selection and transformation)
Data yang terdapat dalam database datawarehouse kemudian direduksi dengan
berbagai teknik. Proses reduksi diperlukan untuk mendapatkan hasil yang lebih akurat dan
mengurangi waktu komputasi terutama untuk masalah skala besar. Beberapa cara seleksi
antara lain:
1) Sampling, adalah seleksi subset representatif dari populasi data yang besar.
2) Denoising, adalah proses menghilangkan noise dari data yang akan di trasnformasikan.
3) Feature extraction, adalah proses membuka spesifikasi data yang akan signifikan dalam
konteks tertentu.
Transformasi data diperlukan sebagai tahap pre-processing, dimana data yang diolah siap
untuk ditambang. Beberapa cara transformasi sebagai berikut :
1) Centering, mengurangi setiap data dengan rata-rata dari setiap atribut yang ada.
2) Normalization, membagi setiap data yang decentering dengan standar deviasi dari
atribut bersangkutan.
3) Scaling, mengubah data sehingga berada dalam skala tertentu.
3. Penambangan data (data mining)
Data-data yang telah diseleksi dan ditransformasi ditambang dengan berbagai
teknik. Proses data mining adalah proses mencari pola atau informasi menarik dalam data
terpilih dengan menggunakan fungsi-fungsi tertentu.
4. Evaluasi pola dan presentasi pengetahuan
Tahap ini merupakan bagian dari proses pengetahuan yang mencakup pemeriksaan
apakah pola atau informasi yang ditemukan bertentangan dengan fakta atau hipotesa yang
ada sebelumnya. Langkah terakhir KDD adalah merepresentasikan pengetahuan dalam
bentuk yang mudah dipahami oleh pengguna.
2.2. Analisis Cluster
Analisis Cluster adalah teknik yang digunakan untuk mengidentifikasi objek atau
individu yang serupa dengan memperhatikan beberapa kriteria.
Analisis cluster yaitu analisis untuk mengelompokkan elemen yang mirip sebagai
objek penelitian menjadi kelompok (cluster) yang berbeda dan mutually exclusive.
Analisis cluster termasuk dalam analisis statistik multivariat metode interdependen.
Sebagai alat analisis interdependen maka tujuan analisis cluster tidak untuk menghubungkan
ataupun membedakan dengan sampel/variabel lain. Analisis cluster merupakan salah satu
alat analisis yang berguna sebagai peringkas data. Dalam meringkas data ini dapat dilakukan
dengan jalan mengelompokkan objek-objek berdasarkan kesamaan karakteristik tertentu di
antara objek-objek yang hendak diteliti (Tim Penelitian dan Pengembangan, 2012:120).
Analisis cluster adalah suatu alat untuk mengelompokkan sejumlah n obyek
berdasarkan p variat yang secara relatif mempunyai kesamaan karakteristik diantara obyek –
268
obyek tersebut, sehingga keragaman di dalam suatu kelompok tersebut lebih kecil
dibandingkan keragaman antar kelompok. Obyek dapat berupa barang, jasa, tumbuhan,
binatang dan orang (responden, konsumen, atau yang lainnya). Obyek tersebut akan
diklasifikasikan ke dalam satu atau lebih cluster (kelompok) sehingga obyek–obyek yang
berada dalam satu cluster akan mempunyai kemiripan atau kesamaan karakter.
Adapun ciri-ciri cluster adalah:
1. Homogenitas (kesamaan) yang tinggi antar anggota dalam satu cluster (within-cluster).
2. Heterogenitas (perbedaan) yang tinggi antar cluster yang satu dengan cluster yang lainnya
(between-cluster).
Analisis cluster mempunyai beberapa istilah penting, antara lain:
1. Skedul aglomerasi (agalomeration schedule), ialah jadwal yang memberikan informasi
tentang objek atau kasus yang akan dikelompokkan pada setiap tahap pada suatu proses
analisis cluster yang hierarkis.
2. Rata-rata cluster (cluster centroid), ialah nilai rata-rata variabel dari semua objek atau
observasi dalam cluster tertentu.
3. Pusat cluster (cluster centers), ialah titik awal dimulainya pengelompokkan di dalam cluster
nonhierarki.
4. Keanggotaan cluster (cluster membership), ialah keanggotaan yang menunjukkan cluster
untuk setiap objek yang menjadi anggotanya.
5. Dendogram, disebut juga grafik pohon, output SPSS yang memvisualisasikan hasil analisis
cluster yang dilakukan peneliti. Garis vertikal atau tegak menunjukkan cluster yang
digabung bersama. Posisi garis pada pada skala menunjukkan jarak untuk mana cluster
digabung. Dendogram harus dibaca dari kiri ke kanan.
6. Distances between cluster centers, ialah jarak yang menunjukkan bagaimana terpisahnya
pasangan individu cluster.
2.2.1 Tujuan Analisis Cluster

Setelah mengelompokkan n buah obyek pengamatan kedalam m kelompok
berdasarkan p variat dapat diketahui bahwa tujuan utama dari pengclusteran obyek adalah
untuk mendapatkan kelompok obyek yang memiliki nilai relatif sama. Sehingga kelak
dalam interpretasi, obyek-obyek yang berada pada satu cluster memiliki peluang yang
cukup tinggi akan muncul bersamaan pada satu individu.
2.2.2 Konsep Dasar Dalam Analisis Cluster
Analisis cluster merupakan suatu kelas teknik, dipergunakan untuk mengklasifikasi
obyek atau kasus ke dalam kelompok yang relatif homogen, yang disebut cluster. Obyek
dalam setiap kelompok cenderung mirip satu sama lain dan berbeda jauh (tidak sama)
dengan obyek dari cluster lainnya.
Pengelompokkan dilakukan berdasarkan kemiripan (similarity) antar
obyek.Kemiripan diperoleh dengan meminimalkan jarak antar obyek dalam kelompok
(within-cluster) dan memaksimalkan jarak antar kelompok (between-cluster).
2.2.3 Proses Analisis Cluster
Untuk melakukan analisis cluster ada beberapa proses yang harus dilakukan . Proses
analisis cluster tersebut meliputi :
1. Menentukan ukuran ketakmiripan antar dua objek.
Sesuai prinsip daftar cluster yaitu mengelompokkan objek yang mempunyai
kemiripan, maka proses pertama adalah mengukur seberapa jauh ada kesamaan antar
objek. Dengan memiliki sebuah ukuran kuantitatif untuk mengatakan bahwa dua obyek
tertentu lebih mirip dibandingkan dengan obyek lain, akan menghilangkan kebingungan
dan mempermudah proses formal dalam pengclusteran. Salah satu yang jelas bisa
menjadi ukuran ketakmiripan adalah fungsi jarak antara objek a dan b, yang biasa
dinotasikan dengan d(a,b).
Sifat – sifat ukuran ketakmiripan adalah :
1) d(a.b) ≥ 0
2) d(a,a) = 0
3) d(a,b) = d(b,a)
269
4) (a,b) meningkat seiring semakin tidak mirip kedua objek a dan b.
5) d(a,c) ≤ d(a,b) + d(b,c) (Sartono, 2003:216).
Jarak yang paling umum digunakan adalah jarak euclidean.Ukuran jarak atau
ketidaksamaan antar obyek ke-i dengan obyek ke-h, disimbolkan dengan d . Nilai d
ih ih
diperoleh melalui perhitungan jarak kuadrat Euclidean sebagai berikut :
𝑝
𝑑𝑖ℎ = ∑(𝑥𝑖𝑗 − 𝑑𝑖ℎ)2

𝑗=1
dimana:
d = jarak kuadrat Euclidean antar obyek ke-i dengan obyek ke-h.
ih
p = jumlah variabel cluster.
x = nilai atau data dari obyek ke-i pada variabel ke-j.
ij
x = nilai atau data dari obyek ke-h pada variabel ke-j (Everitt).
hj
2. Membuat Cluster
Proses cluster atau pengelompokan data bisa dilakukan dengan dua metode:
a. Metode Hirarki
Metode ini memulai pengelompokan dengan dua atau lebih objek yang
mempunyai kesamaan paling dekat. Kemudiaan operasi diteruskan ke objek lain
yang mempunyai kedekatan kedua. Demikian seterusnya sehingga cluster akan
membentuk semacam ‘pohon’ dimana ada hirarki (tingkatan) yang jelas antar objek,
dari yang paling mirip sampai paling tidak mirip.
Metode yang digunakan untuk proses Clustering secara hirarki adalah Single
Linkage (Pauatan Tunggal). Metode ini akan mengelompokan dua objek yang
mempunyai jarak terdekat dahulu. Jadi pada setiap tahapan, banyaknya cluster
berkurang satu. Secara formal, dua buah cluster B dan B , jarak antara B dan B
r s r s
misalkan h(B ,B ) didefinisikan sebagai :
r s
h(B ,B ) = min{d(x ,x ); x anggota B , x anggota B }
r s i j i r j s
Hasil berupa single linkage clustering dapat disajikan dalam bentuk suatu
dendogram atau diagram pohon.Cabang-cabang pohon menunjukkan
cluster/kelompok.Cabang-cabang tersebut bertemu bersama-sama (menggabung)
pada simpul yang posisinya sepanjang suatu sumbu jarak (kemiripan) menunjukkan
tingkat dimana penggabungan terjadi.
b. Metode Non-hirarki
Metode ini dimulai dengan proses penentuan jumlah cluster terlebih dahulu.
Metode Non-hirarki yang digunakan adalah k-means. Metode k-means digunakan
sebagai alternatif metode cluster untuk data dengan ukuran yang besar karena
memiliki kecepatan yang lebih tinggi dibandingkan metode hirarki.
3. Setelah cluster terbentuk, baik dengan metode hirarki maupun non hirarki, langkah
selanjutnya melakukan interpretasi terhadap cluster yang terbentuk,yang pada intinya
memberi nama spesifik untuk menggambar isi cluster tersebut.
4. Melakukan validasi cluster.
Untuk menguji validasi cluster digunakan uji parsial F.
Hipotesis:
H : variabel i bukan variabel pembeda dalam pengclusteran.
0
H : variabel i merupakan variabel pembeda dalam pengclusteran
1
Taraf signifikansi α
Statistik uji
𝑚𝑒𝑎𝑛𝑠𝑠𝑞𝑢𝑎𝑟𝑒 𝑐𝑙𝑢𝑠𝑡𝑒𝑟
F=
𝑚𝑒𝑎𝑛𝑠 𝑠𝑞𝑢𝑎𝑟𝑒 𝑒𝑟𝑟𝑜𝑟
Kriteria Uji :
Tolak H jika F > F
0 α, k-1,n-k
270
3. Metodologi Penelitian
Metode yang dipakai dalam penelitian yang tercakup dalam kerangka kerja penelitian
mulai dari mengidentifikasai masalah, menganalisa masalah, menentukan tujuan, mempelajari

literature, teknik pengumpulan data, cara mendesain sistem, teknik pengujian sistem sampai
pada teknik mengevaluasi sistem. Tahap-tahap kerangka kerja dibuat agar penelitian menjadi
terarah dan mencapai tujuan yang ditentukan dalam penelitian ini. Adapun kerangka kerja
penelitian ini dapat dilihat pada gambar berikut :
271
4.Analisa dan Pengolahan Data
4.1 Analisa Data

Analisa data merupakan tahap untuk melakukan penganalisaan terhadap data-data yang
dibutuhkan untuk perancangan sistem yang akan dibuat, dalam hal ini penulis mengambil data
melalui literature-literature yang berhubungan dengan tema penelitian, untuk mencari
informasi menyusun teori-teori yang berhubungan dengan pembahasan sehingga terjadi
perpaduan yang komplek antara yang satu dengan yang lainnya.
Pada tabel dibawah ini merupakan data dari bulan Februari-Maret yang digunakan
untuk melakukan percobaan perhitungan manual.
Tabel 4.1 Data Penjualan
Stock
Kode Frame Kaca
NO Merk Frame Kaca Mata JumlahTerjual Frame
Mata
23 34
1 BONIA JFWIE
49 53
2 NIKE JFP1E
41 57
3 PUMA JFP2E
45 67
4 DIOR JFR1E
46 70
5 CARTIER JFS1E
27 42
6 POLICE JFS2E
46 54
7 ADIDAS JFT1E
56 93
8 DIOR165 JFH1E
272
52 67
9 LEVIS JFU1E
11 32
10 MOIWA JFV1E
13 20
11 GINOS KF11E
16 35
12 CHOPARD JBK1E
13 20
13 MONANZA JBN1E
15 35
14 CAPTURE JBP1E
24 45
15 LEES KC71E
4.1.2 Analisa Proses
Dalam hal ini penulis mengambil data di toko atau gerai kacamata Optik Zal, dimana
penulis mengambil sampel datanya selama 2 bulan yaitu pada bulan Februari-Maret 2017,
data tersebut diketik ulang menggunakan Microsoft Excel karena pihak Optik Zal
memberikan data dalam bentuk hardcopy.
4.1.2.1 Metodologi Dasar Analisa K-Means Clustering
a. Tentukan nilai k sebagai jumlah klaster yang ingin dibentuk.

b. Bangkitkan k centroid (titik pusat klaster) awal secara random.
c. Hitung jarak setiap data ke masing-masing centroid menggunakan rumus korelasi
antar dua objek yaitu Euclidean Distance
d. Kelompokkan setiap data berdasarkan jarak terdekat antara data dengan
centroidnya.
e. Tentukan posisi centroid baru (Ck ) dengan cara menghitung nilai rata-rata dari
data-data yang ada pada centroid yang sama.
Dimana nk adalah jumlah dokumen dalam cluster k dan di adalah dokumen dalam
cluster k.
f. Kembali kelangkah 3 jika posisi centroid baru dengan centroid lama tidak sama.
Pada table dibawah ini merupakan sampel data dari bulan Februari-Maret yang
digunakan untuk melakukan percobaan perhitungan manual.
Tabel 4.2 Data Penjualan
Stock
Merk Frame Kaca Kode Frame
NO JumlahTerjual Frame
Mata Kaca Mata
1 BONIA JFWIE 23 34
273
2 NIKE JFP1E 49 53
3 PUMA JFP2E 41 57
4 DIOR JFR1E 45 67
5 CARTIER JFS1E 46 70
6 POLICE JFS2E 27 42
7 ADIDAS JFT1E 46 54
8 DIOR165 JFH1E 56 93
9 LEVIS JFU1E 52 67
10 MOIWA JFV1E 11 32
11 GINOS KF11E 13 20
12 CHOPARD JBK1E 16 35
13 MONANZA JBN1E 13 20
14 CAPTURE JBP1E 15 35
15 LEES KC71E 24 45
Tahapan Penyelesaian Manual :
1. Tentukan pusat awal cluster “Centroid”

Untuk penetuan pusat awal diambil darinilai
 Pusat cluster ke-1 : { 25 | 45 }
 Pusat cluster ke-2 : { 20 | 40 }
2. Perhitungan jarak pusat cluster
Untuk mengukur jarak antara data dengan pusat cluster digunakan Euclidian Distance,
kemudian akan didapatkan matrik jarak sebagai berikut :
𝐷𝑒 = √(Mix − 𝐶𝑖𝑥 )2 + (𝑀𝑖𝑦 − 𝐶𝑖𝑦 )2
Iterasi Ke-1
1. Perhitungan jarak dari data terhadap pusat cluster ke-1
𝐷1 = √(23 − 25)2 + (34 − 45)2 = 11,180
𝐷12 = √(49 − 25)2 + (53 − 45)2 = 25,298
𝐷13 = √(41 − 25)2 + (57 − 45)2 = 20,000
𝐷14 = √(45 − 25)2 + (67 − 45)2 = 29,732
𝐷15 = √(46 − 25)2 + (70 − 45)2 = 32,650
𝐷16 = √(27 − 25)2 + (42 − 45)2 = 3,606

274
𝐷17 = √(46 − 25)2 + (54 − 45)2 = 22,847
𝐷18 = √(56 − 25)2 + (93 − 45)2 = 57,140
𝐷19 = √(52 − 25)2 + (67 − 45)2 = 34,828
𝐷110 = √(11 − 25)2 + (32 − 45)2 = 19,105
𝐷111 = √(13 − 25)2 + (20 − 45)2 = 27,731
𝐷112 = √(16 − 25)2 + (35 − 45)2 = 13,454
𝐷113 = √(13 − 25)2 + 20 − 45)2 = 27,731
𝐷114 = √(15 − 25)2 + (35 − 45)2 = 14,142
𝐷115 = √(24 − 25)2 + (45 − 45)2 = 1,000
2. Perhitungan jarak dari data terhadap pusat cluster ke-2
𝐷21 = √(23 − 20)2 + (34 − 40)2 = 6,708
𝐷22 = √(49 − 20)2 + (53 − 40)2 = 31,780
𝐷23 = √(41 − 20)2 + (57 − 40)2 = 27,019
𝐷24 = √(45 − 20)2 + (67 − 40)2 = 36,797
𝐷25 = √(46 − 20)2 + (70 − 40)2 = 39,699
𝐷26 = √(27 − 20)2 + (42 − 40)2 = 7,280
𝐷27 = √(46 − 20)2 + (54 − 40)2 = 29,530
𝐷28 = √(56 − 20)2 + (93 − 40)2 = 64,070
𝐷29 = √(52 − 20)2 + (67 − 40)2 = 41,869
𝐷210 = √(11 − 20)2 + (32 − 40)2 = 12,042
𝐷211 = √(13 − 20)2 + (20 − 40)2 = 21,190
𝐷212 = √(16 − 20)2 + (35 − 40)2 = 6,403
𝐷213 = √(13 − 20)2 + 20 − 40)2 = 21,190
𝐷214 = √(15 − 20)2 + (35 − 40)2 = 7,071
𝐷215 = √(24 − 20)2 + (45 − 40)2 = 6,403
275
Tabel 4.3 Iterasi 1
NO Merk Kacamata Kode Nilai C1 Nilai C2 c1 c2

11,180 6,708 0 1
1 BONIA JFWIE
25,298 31,780 1 0
2 NIKE JFP1E
20,000 27,019 1 0
3 PUMA JFP2E
29,732 36,797 1 0
4 DIOR JFR1E
32,650 39,699 1 0
5 CARTIER JFS1E
3,606 7,280 1 0
6 POLICE JFS2E
22,847 29,530 1 0
7 ADIDAS JFT1E
57,140 64,070 1 0
8 DIOR165 JFH1E
34,828 41,869 1 0
9 LEVIS JFU1E
19,105 12,042 0 1
10 MOIWA JFV1E
27,731 21,190 0 1
11 GINOS KF11E
13,454 6,403 0 1
12 CHOPARD JBK1E
27,731 21,190 0 1
13 MONANZA JBN1E
14,142 7,071 0 1
14 CAPTURE JBP1E
1,000 6,403 1 0
15 LEES KC71E
Pada pencarian iterasi pertama didapatkan hasil sebagai berikut :

{NIKE (JFP1E),PUMA (JFP2E),DIOR (JFR1E),CARTIER (JFS1E), POLICE (JFS2E), ADIDAS
(JFT1E), DIOR165 (JFH1E), LEVIS (JFU1E), LEES (KC71E) } = Anggota C1
{BONIA (JFWIE), MOIWA (JFV1E), GINOS (KF11E), CHOPARD (JBK1E), MONANZA
(JBN1E), CAPTURE(JBP1E)} = Anggota C2
Iterasi Ke-2
1. Hitung Titik Pusat Baru

Menentukan posisi centroid baru (Ck) dengan cara menghitung nilai rata-rata dari data yang ada
pada setiap centroid yang sama.
1
𝐶𝑘 = ( ) ∑ 𝑑1
𝑛𝑘
Dimana K adalah jumlah data dalam cluster 1 dan cluster 2.

49 + 41 + 45 + 46 + 27 + 46 + 56 + 52 + 24
𝐶1 = = 42,89
9
53 + 57 + 67 + 70 + 42 + 54 + 93 + 67 + 45
𝐶1 = = 60,89
9
276
Maka didapatkan nilai centroid 1 baru yakni ={42,89 | 60,89 }
23 + 11 + 13 + 16 + 13 + 15
𝐶2 = = 15,17
6
34 + 32 + 20 + 35 + 20 + 35
𝐶2 = = 29,33
6
Maka didapatkan nilai centroid 2 baru yakni={15,17 | 29,33 }
2. Perhitungan jarak dari data terhadap pusat cluster ke-1 baru
𝐷1 = √(23 − 42,89)2 + (34 − 60,89)2 = 33,447
𝐷12 = √(49 − 42,89)2 + (53 − 60,89)2 = 9,979
𝐷13 = √(41 − 42,89)2 + (57 − 60,89)2 = 4,325
𝐷14 = √(45 − 42,89)2 + (67 − 60,89)2 = 6,464
𝐷15 = √(46 − 42,89)2 + (70 − 60,89)2 = 9,626
𝐷16 = √(27 − 42,89)2 + (42 − 60,89)2 = 24,684
𝐷17 = √(46 − 42,89)2 + (54 − 60,89)2 = 7,559
𝐷18 = √(56 − 42,89)2 + (93 − 60,89)2 = 34,683
𝐷19 = √(52 − 42,89)2 + (67 − 60,89)2 = 10,969
𝐷110 = √(11 − 42,89)2 + (32 − 60,89)2 = 43,030
𝐷111 = √(13 − 42,89)2 + (20 − 60,89)2 = 50,650
𝐷112 = √(16 − 42,89)2 + (35 − 60,89)2 = 37,328
𝐷113 = √(13 − 42,89)2 + 20 − 60,89)2 = 50,650
𝐷114 = √(15 − 42,89)2 + (35 − 60,89)2 = 38,054
𝐷115 = √(24 − 42,89)2 + (45 − 60,89)2 = 24,684
𝐷21 = √(23 − 15,17)2 + (34 − 29,33)2 = 9,117
𝐷22 = √(49 − 15,17)2 + (53 − 29,33)2 = 41,288
𝐷23 = √(41 − 15,17)2 + (57 − 29,33)2 = 37,853
𝐷24 = √(45 − 15,17)2 + (67 − 29,33)2 = 48,051
𝐷25 = √(46 − 15,17)2 + (70 − 29,33)2 = 51,035
277
𝐷26 = √(27 − 15,17)2 + (42 − 29,33)2 = 17,334
𝐷27 = √(46 − 15,17)2 + (54 − 29,33)2 = 39,485
𝐷28 = √(56 − 15,17)2 + (93 − 29,33)2 = 75,637
𝐷29 = √(52 − 15,17)2 + (67 − 29,33)2 = 52,683
𝐷210 = √(11 − 15,17)2 + (32 − 29,33)2 = 4,952
𝐷211 = √(13 − 15,17)2 + (20 − 29,33)2 = 9,579
𝐷212 = √(16 − 15,17)2 + (35 − 29,33)2 = 5,730
𝐷213 = √(13 − 15,17)2 + 20 − 29,33)2 =9,579
𝐷214 = √(15 − 15,17)2 + (35 − 29,33)2 = 5,673
𝐷215 = √(24 − 15,17)2 + (45 − 29,33)2 = 17,987
Tabel 4.4 Iterasi 2
33,447 9,117 0 1
1 BONIA JFWIE
9,979 41,288 1 0
2 NIKE JFP1E
4,325 37,853 1 0
3 PUMA JFP2E
6,464 48,051 1 0
4 DIOR JFR1E
9,626 51,035 1 0
5 CARTIER JFS1E
24,684 17,334 0 1
6 POLICE JFS2E
7,559 39,485 1 0
7 ADIDAS JFT1E
34,683 75,637 1 0
8 DIOR165 JFH1E
10,969 52,683 1 0
9 LEVIS JFU1E
43,030 4,952 0 1
10 MOIWA JFV1E
50,650 9,579 0 1
11 GINOS KF11E
37,328 5,730 0 1
12 CHOPARD JBK1E
50,650 9,579 0 1
13 MONANZA JBN1E
278
38,054 5,673 0 1
14 CAPTURE JBP1E
24,684 17,987 0 1
15 LEES KC71E
Pada pencarian iterasi pertama didapatkan hasil sebagai berikut :

{NIKE (JFP1E), PUMA(JFP2E), DIOR (JFR1E), CARTIER (JFS1E), ADIDAS (JFT1E),
DIOR165 (JFH1E), LEVIS (JFU1E) }= Anggota C1
{BONIA(JFWIE), POLICE (JFS2E), MOIWA (JFV1E),GINOS (KF11E), CHOPARD (JBK1E),
MONANZA (JBN1E), CAPTURE (JBP1E), LESS (KC71E)}= Anggota C2
Karena hasil angota iterasi – 1 dan iterasi – 2 berbeda maka akan dihitung nilai centroid baru.
Iterasi-3
1. Hitung Titik Pusat Baru
Mencari nilai centroid 1 baru :
49 + 41 + 45 + 46 + 46 + 56 + 52
𝐶1 = = 47,857
7
53 + 57 + 67 + 70 + 54 + 93 + 67
𝐶1 = = 65,857
7
Maka didapatkan nilai centroid 1 baru yakni ={47,857 | 65,857}
Mencari nilai centroid 2 baru :

23 + 27 + 11 + 13 + 16 + 13 + 15 + 24
𝐶2 = = 17.750
8
34 + 42 + 32 + 20 + 35 + 20 + 35 + 45
𝐶2 = = 32,875
8
Maka didapatkan nilai centroid 2 baru yakni={47,857 | 65,857}
𝐷21 = √(23 − 47,857)2 + (34 − 65,857)2 = 40,407
𝐷22 = √(49 − 47,857)2 + (53 − 65,857)2 = 12,908
𝐷23 = √(41 − 47,857)2 + (57 − 65,857)2 = 11,201
𝐷24 = √(45 − 47,857)2 + (67 − 65,857)2 = 3,077
𝐷25 = √(46 − 47,857)2 + (70 − 65,857)2 = 4,540
𝐷26 = √(27 − 47,857)2 + (42 − 65,857)2 = 31,689
𝐷27 = √(46 − 47,857)2 + (54 − 65,857)2 = 12,002
𝐷28 = √(56 − 47,857)2 + (93 − 65,857)2 = 28,338
𝐷29 = √(52 − 47,857)2 + (67 − 65,857)2 = 4,298
𝐷210 = √(11 − 47,857)2 + (32 − 65,8577)2 = 50,047
279
𝐷211 = √(13 − 47,857)2 + (20 − 65,857)2 = 57,601
𝐷212 = √(16 − 47,857)2 + (35 − 65,857)2 = 44,351
𝐷213 = √(13 − 47,857)2 + 20 − 65,857)2 = 57,601
𝐷214 = √(15 − 47,857)2 + (35 − 65,857)2 = 45,075
𝐷215 = √(24 − 47,857)2 + (45 − 65,857)2 = 31,689
𝐷1 = √(23 − 17,75)2 + (34 − 32,875)2 = 5,369
𝐷12 = √(49 − 17,75)2 + (53 − 32,875)2 = 37,170
𝐷13 = √(41 − 17,75)2 + (57 − 32,875)2 = 33,505
𝐷14 = √(45 − 17,75)2 + (67 − 32,875)2 = 43,670
𝐷15 = √(46 − 17,75)2 + (70 − 32,875)2 = 46,651
𝐷16 = √(27 − 17,75)2 + (42 − 32,875)2 = 12,993
𝐷17 = √(46 − 17,75)2 + (54 − 32,875)2 = 35,275
𝐷18 = √(56 − 17,75)2 + (93 − 32,875)2 = 71,261
𝐷19 = √(52 − 17,75)2 + (67 − 32,875)2 = 48,349
𝐷110 = √(11 − 17,75)2 + (32 − 32,875)2 = 6,806
𝐷111 = √(13 − 17,75)2 + (20 − 32,875)2 = 13,723
𝐷112 = √(16 − 17,75)2 + (35 − 32,875)2 = 2,753
𝐷113 = √(13 − 17,75)2 + 20 − 32,875)2 = 13,723
𝐷114 = √(15 − 17,75)2 + (35 − 32,875)2 = 3,475
𝐷115 = √(24 − 17,75)2 + (45 − 32,875)2 = 13,641
Tabel 4.5 Iterasi 3

1 BONIA JFWIE 40,407 5,369 0 1
2 NIKE JFP1E 12,908 37,170 1 0
3 PUMA JFP2E 11,201 33,505 1 0
280
4 DIOR JFR1E 3,077 43,670 1 0
5 CARTIER JFS1E 4,540 46,651 1 0
6 POLICE JFS2E 31,689 12,993 0 1
7 ADIDAS JFT1E 12,002 35,275 1 0
8 DIOR165 JFH1E 28,338 71,261 1 0
9 LEVIS JFU1E 4,298 48,349 1 0
10 MOIWA JFV1E 50,047 6,806 0 1
11 GINOS KF11E 57,601 13,723 0 1
12 CHOPARD JBK1E 44,351 2,753 0 1
13 MONANZA JBN1E 57,601 13,723 0 1
14 CAPTURE JBP1E 45,075 3,475 0 1
15 LEES KC71E 31,689 13,641 0 1
Pada pencarian iterasi ketiga didapatkan hasil sebagai berikut :

{NIKE (JFP1E), PUMA (JFP2E), DIOR (JFR1E), CARTIER (JFS1E), ADIDAS (JFT1E),
DIOR165 (JFH1E), LEVIS (JFU1E) }= Anggota C1 (Tidak Laris)
{BONIA (JFWIE), POLICE (JFS2E), MOIWA (JFV1E),GINOS (KF11E), CHOPARD (JBK1E),
MONANZA (JBN1E), CAPTURE(JBP1E), LESS(KC71E)}= Anggota C2 (Laris)
Karena hasil anggota iterasi – 2 dan iterasi – 3 sama maka dalam perhitungan manual dapat
dihentikan.
Gambar 4.1 Grafik Nilai Centroid
5. Kesimpulan
281
Dari hasil penelitian, dapat disimpulkan bahwa pengolahan data penjualan pada OPTIK
Zal Padang menggunakan metode Clustering dengan algoritma K-means dapat digunakan
untuk mengelompokkan data penjualan berdasarkan merkframe kacamata.
Dari data yang diolah berdasarkan merk kacamata, diinputkan sampel data pada jumlah
perbulan sebanyak 15 data dengan atribut.harga(x) dan total penjualan perbulan yang ada
untuk dipasarkan kepada konsumen (y) diperoleh 2 (dua) kelompok data telah tercluster,
sebagai berikut:
1. Cluster 1(C1) terdiri dari tujuh merk yaitu NIKE (JFP1E), PUMA (JFP2E), DIOR
(JFR1E), CARTIER (JFS1E), ADIDAS (JFT1E), DIOR165 (JFH1E), LEVIS (JFU1E)
yang kurang laris, karna angka penjualan dalam perbulannya hanya mencapai 67 unit.
2. Cluster 2(C2) terdiri dari delapan merk yaitu BONIA (JFWIE), POLICE (JFS2E),
MOIWA (JFV1E),GINOS (KF11E), CHOPARD (JBK1E), MONANZA (JBN1E),
CAPTURE(JBP1E), LESS(KC71E) yang laris, karena angka penjualan dalam
perbulan dapat mencapai 93 unit.
Daftar Pustaka
[1]. Anik Andriani. (2012). “Penerapan Algoritma C4.5 Pada Program Klasifikasi Mahasiswa Drop
Out”
[2]. Dorina Kabakchieva. (2012). “Student Performance Prediction by Using Data Mining
Classification Algorithms”
[3]. Oscar Marban1, Gonzalo Mariscal2, Javier Segovia1. (2010). “A Data Mining and Knowledge
Discovery Process Model”
[4]. Hai-Fen Lin1, Chih-Hung Hsu2, Mao-Jiun J Wang3, Yu-Cheng Lin4. (2008). “An Application of
Data Mining Technique in Developing Sizing System For Army Soldiers in Taiwan”
[5]. Mohamed Hussain Tawarish1, Farooqui Waseemuddin2. (2013). “Analysis of Data Mining
Concepts in Higher Education With Needs to Najran University)”
[6]. Surjeet Kumar Yadav, Saurabh Pal. (2012). “A Prediction For Performance Improvement of
Engineering Students using Classification”
[7]. Kabra, Bichkar. (2011). “ Performance Prediction of Engineering Students using Decision Tree”
[8]. Padmapriya. (2012). “Prediction of Higher Education Admissibility using Classification
Algorithm”
[9]. Nesreen K Ahmed, Jennifer Neville, Ramana Kompella. (2012). “Network Sampling Designs for
Relational Classification”
[10]. Sonali Agarwal, Pandey, Tiwari. (2012). “Data Classification and Decision Tree Approach”
[11]. Tohari, Hamim. (2014).” Astah-Analisis Serta Perancangan Sistem Informasi Melalui pendekatan
UML “
282
283

128 183 1 SM

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

128 183 1 SM

Diunggah oleh

Hak Cipta:

Format Tersedia

UPI YPTK Jurnal KomTekInfo Vol. 4, No. 2, Desember 2017, Hal.

267-283 ISSN :2356-0010

Kata Kunci :K-means, Clustering, efektifitas, Software.

2.1 Pengertian Data Mining

2.1.1 Proses Data Mining

1. Pembersihan data dan integrasi data (cleaning and integration)

2.2. Analisis Cluster

2.2.1 Tujuan Analisis Cluster

𝑑𝑖ℎ = ∑(𝑥𝑖𝑗 − 𝑑𝑖ℎ)2

mulai dari mengidentifikasai masalah, menganalisa masalah, menentukan tujuan, mempelajari

4.Analisa dan Pengolahan Data

4.1 Analisa Data

Tabel 4.1 Data Penjualan

4.1.2 Analisa Proses

4.1.2.1 Metodologi Dasar Analisa K-Means Clustering

a. Tentukan nilai k sebagai jumlah klaster yang ingin dibentuk.

Tabel 4.2 Data Penjualan

Tahapan Penyelesaian Manual :

1. Tentukan pusat awal cluster “Centroid”

1. Perhitungan jarak dari data terhadap pusat cluster ke-1

𝐷1 = √(23 − 25)2 + (34 − 45)2 = 11,180

𝐷12 = √(49 − 25)2 + (53 − 45)2 = 25,298

𝐷13 = √(41 − 25)2 + (57 − 45)2 = 20,000

𝐷14 = √(45 − 25)2 + (67 − 45)2 = 29,732

𝐷15 = √(46 − 25)2 + (70 − 45)2 = 32,650

𝐷16 = √(27 − 25)2 + (42 − 45)2 = 3,606

𝐷18 = √(56 − 25)2 + (93 − 45)2 = 57,140

𝐷19 = √(52 − 25)2 + (67 − 45)2 = 34,828

𝐷110 = √(11 − 25)2 + (32 − 45)2 = 19,105

𝐷111 = √(13 − 25)2 + (20 − 45)2 = 27,731

𝐷112 = √(16 − 25)2 + (35 − 45)2 = 13,454

𝐷113 = √(13 − 25)2 + 20 − 45)2 = 27,731

𝐷114 = √(15 − 25)2 + (35 − 45)2 = 14,142

𝐷115 = √(24 − 25)2 + (45 − 45)2 = 1,000

2. Perhitungan jarak dari data terhadap pusat cluster ke-2

𝐷21 = √(23 − 20)2 + (34 − 40)2 = 6,708

𝐷22 = √(49 − 20)2 + (53 − 40)2 = 31,780

𝐷23 = √(41 − 20)2 + (57 − 40)2 = 27,019

𝐷24 = √(45 − 20)2 + (67 − 40)2 = 36,797

𝐷25 = √(46 − 20)2 + (70 − 40)2 = 39,699

𝐷26 = √(27 − 20)2 + (42 − 40)2 = 7,280

𝐷27 = √(46 − 20)2 + (54 − 40)2 = 29,530

𝐷28 = √(56 − 20)2 + (93 − 40)2 = 64,070

𝐷29 = √(52 − 20)2 + (67 − 40)2 = 41,869

𝐷210 = √(11 − 20)2 + (32 − 40)2 = 12,042

𝐷211 = √(13 − 20)2 + (20 − 40)2 = 21,190

𝐷212 = √(16 − 20)2 + (35 − 40)2 = 6,403

𝐷213 = √(13 − 20)2 + 20 − 40)2 = 21,190

𝐷214 = √(15 − 20)2 + (35 − 40)2 = 7,071

𝐷215 = √(24 − 20)2 + (45 − 40)2 = 6,403

NO Merk Kacamata Kode Nilai C1 Nilai C2 c1 c2

Pada pencarian iterasi pertama didapatkan hasil sebagai berikut :

1. Hitung Titik Pusat Baru

Dimana K adalah jumlah data dalam cluster 1 dan cluster 2.

2. Perhitungan jarak dari data terhadap pusat cluster ke-1 baru

𝐷1 = √(23 − 42,89)2 + (34 − 60,89)2 = 33,447

𝐷12 = √(49 − 42,89)2 + (53 − 60,89)2 = 9,979

𝐷13 = √(41 − 42,89)2 + (57 − 60,89)2 = 4,325

𝐷14 = √(45 − 42,89)2 + (67 − 60,89)2 = 6,464

𝐷15 = √(46 − 42,89)2 + (70 − 60,89)2 = 9,626

𝐷16 = √(27 − 42,89)2 + (42 − 60,89)2 = 24,684

𝐷17 = √(46 − 42,89)2 + (54 − 60,89)2 = 7,559

𝐷18 = √(56 − 42,89)2 + (93 − 60,89)2 = 34,683