Anda di halaman 1dari 17

UPI YPTK Jurnal KomTekInfo Vol. 4, No. 2, Desember 2017, Hal.

267-283 ISSN :2356-0010


Copyright©2017 by LPPM UPI YPTK Padang
DATA MINING DALAM MENENTUKAN PENJUALAN
KACAMATA PADA OPTIK ZAL LARIS DAN TIDAK
LARIS MENGGUNAKAN METODE CLUSTERING

Eva Rianti
UniversitasPutra Indonesia “YPTK”Padang
E-mail:evarianti28@gmail.com

Abstrak
Dalam pengolahan data konsumen pada proses penjualan, masih ada proses-proses yang dilakukan
secara manual sehingga sering terjadi kesalahan dalam pencatatan data-data yang ada dan mengurangi
efektifitas waktu dalam bekerja. Sehingga pemilik sulit menemukan informasi dari data penjualan yang
belum diolah ,dimana data tersebut berguna dalam menghasilkan laporan penjualan. Dari latar belakang
tersebut maka dibutuhkan sistem informasi yang terkomputerisasi untuk menunjang arus data dan informsi
sesuai dengan kebutuhan dari proses-proses tersebut.Masalah yang akan di teliti berkaitan dengan proses
pengolahan data penjualan tentang bagaimana menghasilkan informasi serta pengetahuan yang bermanfaat
melalui software data mining yaitu menggunakan metode clustering dengan algoritma K-Means pada data
penjualan dari optic Zal padang. Data penjualan frame kacamata di okptik Zal Padang, diharapkan dapat
membantu pimpinan perusahaan dalam menganalisadan melihat besarnya minat dan banyaknya pelanggan
yang membeli Frame Kacamata. Pemilik optic dapat mengetahui frame apa saja yang banyak diminati dan
juga yang kurang diminati sehingga bias membantu pemilik dalam pengambilan keputusan dalam pembelian
barang untuk masa yang akan dating.

Kata Kunci :K-means, Clustering, efektifitas, Software.

1. Pendahuluan
Kacamata merupakan alat bantu bagi penggunanya yang mengalami masalah dengan
indra pengelihatannya. Semakin berkembangnya teknologi khususnya benda-benda elektronik
yang menggunakan layar monitor, orang-orang di tuntut untuk sering kali melihat kelayar monitor,
contohnya di kalangan pekerja kantor, atau bahkan kalangan anak-anak yang tidak bisa lepas dari
telepon seluler mereka, seringnya terpapar dengan radiasi monitor atau telepon seluler ini membuat
daya pengelihatan terganggu, biasanya gangguan pada pengelihatan di atasi dengan cara operasi,
ini tentu mengeluarkan biaya yang tidak sedikit, alternative lainnya orang-orang memilih
menggunakan kacamata atau lensa kontak. Optik merupakan toko atau gerai yang menyediakan
kacamata dan kontak lensa.Optik Zal di Sentral Pasar Raya Plaza lantai GROUND FLOOR Blok
B1 No 1 & 2 adalah salah satu toko atau gerai yang menjual kacamata dan kontak lensa dengan
berbagai merk dan ukuran untuk memenuhi kebutuhan konsumennya, namun toko ini belum bisa
menentukan merk kacamata mana yang terlaris dan mana yang kurang diminati konsumennya,
sehingga penyediaan kacamata kurang tepat dengan yang diminati pembeli. Datamining adalah
serangkaian proses untuk menggali nilai tambah dari suatu kumpulan data berupa pengetahuan
yang selama ini tidak diketahui secara manual(Pramudiono, 2006).Proses pada pohon keputusan
adalah mengubah bentuk data (tabel)menjadi model pohon,mengubah modelpohon menjadi
rule,dan menyederhanakan rule(BasukidanSyarif, 2003).

2. LandasanTeori

2.1 Pengertian Data Mining

267
UPI YPTK Jurnal KomTekInfo Vol. 4, No. 2, Desember 2017, Hal. 267-283 ISSN :2356-0010
Copyright©2017 by LPPM UPI YPTK Padang
Data Mining merupakan sebuah analisa dari observasi data dalam jumlahbesar untuk
menemukan hubungan yang tidak diketahui sebelumnya dan metode baru untuk meringkas
data agar mudah dipahami serta kegunaanya untuk pemilik data.

2.1.1 Proses Data Mining

Data mining sesungguhnya merupakan salah satu rangkaian dari proses pencarian
pengetahuan pada database (Knowledge Discovery in Database/KDD). KDD adalah
keseluruhan proses untuk mencari dan mengidentifikasi pola(patern) dalam data, dimana pola
yang ditemukan bersifat sah, baru, dapat bermanfaat dan dimengerti. Serangkaian proses
tersebut memiliki tahap sebagai berikut(Tan, 2010):

1. Pembersihan data dan integrasi data (cleaning and integration)


Proses ini digunakan untuk membuang data yang tidak konsisten dan bersifat noise
dari data yang terdapat di berbagai basis data yang mungkin berbeda format maupun
platform yang kemudian diintegrasikan satu database datawarehouse.
2. Seleksi dan transformasi data (selection and transformation)
Data yang terdapat dalam database datawarehouse kemudian direduksi dengan
berbagai teknik. Proses reduksi diperlukan untuk mendapatkan hasil yang lebih akurat dan
mengurangi waktu komputasi terutama untuk masalah skala besar. Beberapa cara seleksi
antara lain:
1) Sampling, adalah seleksi subset representatif dari populasi data yang besar.
2) Denoising, adalah proses menghilangkan noise dari data yang akan di trasnformasikan.
3) Feature extraction, adalah proses membuka spesifikasi data yang akan signifikan dalam
konteks tertentu.

Transformasi data diperlukan sebagai tahap pre-processing, dimana data yang diolah siap
untuk ditambang. Beberapa cara transformasi sebagai berikut :

1) Centering, mengurangi setiap data dengan rata-rata dari setiap atribut yang ada.
2) Normalization, membagi setiap data yang decentering dengan standar deviasi dari
atribut bersangkutan.
3) Scaling, mengubah data sehingga berada dalam skala tertentu.
3. Penambangan data (data mining)
Data-data yang telah diseleksi dan ditransformasi ditambang dengan berbagai
teknik. Proses data mining adalah proses mencari pola atau informasi menarik dalam data
terpilih dengan menggunakan fungsi-fungsi tertentu.
4. Evaluasi pola dan presentasi pengetahuan
Tahap ini merupakan bagian dari proses pengetahuan yang mencakup pemeriksaan
apakah pola atau informasi yang ditemukan bertentangan dengan fakta atau hipotesa yang
ada sebelumnya. Langkah terakhir KDD adalah merepresentasikan pengetahuan dalam
bentuk yang mudah dipahami oleh pengguna.

2.2. Analisis Cluster

Analisis Cluster adalah teknik yang digunakan untuk mengidentifikasi objek atau
individu yang serupa dengan memperhatikan beberapa kriteria.
Analisis cluster yaitu analisis untuk mengelompokkan elemen yang mirip sebagai
objek penelitian menjadi kelompok (cluster) yang berbeda dan mutually exclusive.
Analisis cluster termasuk dalam analisis statistik multivariat metode interdependen.
Sebagai alat analisis interdependen maka tujuan analisis cluster tidak untuk menghubungkan
ataupun membedakan dengan sampel/variabel lain. Analisis cluster merupakan salah satu
alat analisis yang berguna sebagai peringkas data. Dalam meringkas data ini dapat dilakukan
dengan jalan mengelompokkan objek-objek berdasarkan kesamaan karakteristik tertentu di
antara objek-objek yang hendak diteliti (Tim Penelitian dan Pengembangan, 2012:120).
Analisis cluster adalah suatu alat untuk mengelompokkan sejumlah n obyek
berdasarkan p variat yang secara relatif mempunyai kesamaan karakteristik diantara obyek –
268
UPI YPTK Jurnal KomTekInfo Vol. 4, No. 2, Desember 2017, Hal. 267-283 ISSN :2356-0010
Copyright©2017 by LPPM UPI YPTK Padang
obyek tersebut, sehingga keragaman di dalam suatu kelompok tersebut lebih kecil
dibandingkan keragaman antar kelompok. Obyek dapat berupa barang, jasa, tumbuhan,
binatang dan orang (responden, konsumen, atau yang lainnya). Obyek tersebut akan
diklasifikasikan ke dalam satu atau lebih cluster (kelompok) sehingga obyek–obyek yang
berada dalam satu cluster akan mempunyai kemiripan atau kesamaan karakter.
Adapun ciri-ciri cluster adalah:
1. Homogenitas (kesamaan) yang tinggi antar anggota dalam satu cluster (within-cluster).
2. Heterogenitas (perbedaan) yang tinggi antar cluster yang satu dengan cluster yang lainnya
(between-cluster).
Analisis cluster mempunyai beberapa istilah penting, antara lain:
1. Skedul aglomerasi (agalomeration schedule), ialah jadwal yang memberikan informasi
tentang objek atau kasus yang akan dikelompokkan pada setiap tahap pada suatu proses
analisis cluster yang hierarkis.
2. Rata-rata cluster (cluster centroid), ialah nilai rata-rata variabel dari semua objek atau
observasi dalam cluster tertentu.
3. Pusat cluster (cluster centers), ialah titik awal dimulainya pengelompokkan di dalam cluster
nonhierarki.
4. Keanggotaan cluster (cluster membership), ialah keanggotaan yang menunjukkan cluster
untuk setiap objek yang menjadi anggotanya.
5. Dendogram, disebut juga grafik pohon, output SPSS yang memvisualisasikan hasil analisis
cluster yang dilakukan peneliti. Garis vertikal atau tegak menunjukkan cluster yang
digabung bersama. Posisi garis pada pada skala menunjukkan jarak untuk mana cluster
digabung. Dendogram harus dibaca dari kiri ke kanan.
6. Distances between cluster centers, ialah jarak yang menunjukkan bagaimana terpisahnya
pasangan individu cluster.

2.2.1 Tujuan Analisis Cluster


Setelah mengelompokkan n buah obyek pengamatan kedalam m kelompok
berdasarkan p variat dapat diketahui bahwa tujuan utama dari pengclusteran obyek adalah
untuk mendapatkan kelompok obyek yang memiliki nilai relatif sama. Sehingga kelak
dalam interpretasi, obyek-obyek yang berada pada satu cluster memiliki peluang yang
cukup tinggi akan muncul bersamaan pada satu individu.
2.2.2 Konsep Dasar Dalam Analisis Cluster
Analisis cluster merupakan suatu kelas teknik, dipergunakan untuk mengklasifikasi
obyek atau kasus ke dalam kelompok yang relatif homogen, yang disebut cluster. Obyek
dalam setiap kelompok cenderung mirip satu sama lain dan berbeda jauh (tidak sama)
dengan obyek dari cluster lainnya.
Pengelompokkan dilakukan berdasarkan kemiripan (similarity) antar
obyek.Kemiripan diperoleh dengan meminimalkan jarak antar obyek dalam kelompok
(within-cluster) dan memaksimalkan jarak antar kelompok (between-cluster).
2.2.3 Proses Analisis Cluster
Untuk melakukan analisis cluster ada beberapa proses yang harus dilakukan . Proses
analisis cluster tersebut meliputi :
1. Menentukan ukuran ketakmiripan antar dua objek.
Sesuai prinsip daftar cluster yaitu mengelompokkan objek yang mempunyai
kemiripan, maka proses pertama adalah mengukur seberapa jauh ada kesamaan antar
objek. Dengan memiliki sebuah ukuran kuantitatif untuk mengatakan bahwa dua obyek
tertentu lebih mirip dibandingkan dengan obyek lain, akan menghilangkan kebingungan
dan mempermudah proses formal dalam pengclusteran. Salah satu yang jelas bisa
menjadi ukuran ketakmiripan adalah fungsi jarak antara objek a dan b, yang biasa
dinotasikan dengan d(a,b).
Sifat – sifat ukuran ketakmiripan adalah :
1) d(a.b) ≥ 0
2) d(a,a) = 0
3) d(a,b) = d(b,a)

269
UPI YPTK Jurnal KomTekInfo Vol. 4, No. 2, Desember 2017, Hal. 267-283 ISSN :2356-0010
Copyright©2017 by LPPM UPI YPTK Padang
4) (a,b) meningkat seiring semakin tidak mirip kedua objek a dan b.
5) d(a,c) ≤ d(a,b) + d(b,c) (Sartono, 2003:216).
Jarak yang paling umum digunakan adalah jarak euclidean.Ukuran jarak atau
ketidaksamaan antar obyek ke-i dengan obyek ke-h, disimbolkan dengan d . Nilai d
ih ih
diperoleh melalui perhitungan jarak kuadrat Euclidean sebagai berikut :
𝑝

𝑑𝑖ℎ = ∑(𝑥𝑖𝑗 − 𝑑𝑖ℎ)2


𝑗=1
dimana:
d = jarak kuadrat Euclidean antar obyek ke-i dengan obyek ke-h.
ih
p = jumlah variabel cluster.
x = nilai atau data dari obyek ke-i pada variabel ke-j.
ij
x = nilai atau data dari obyek ke-h pada variabel ke-j (Everitt).
hj
2. Membuat Cluster
Proses cluster atau pengelompokan data bisa dilakukan dengan dua metode:
a. Metode Hirarki
Metode ini memulai pengelompokan dengan dua atau lebih objek yang
mempunyai kesamaan paling dekat. Kemudiaan operasi diteruskan ke objek lain
yang mempunyai kedekatan kedua. Demikian seterusnya sehingga cluster akan
membentuk semacam ‘pohon’ dimana ada hirarki (tingkatan) yang jelas antar objek,
dari yang paling mirip sampai paling tidak mirip.
Metode yang digunakan untuk proses Clustering secara hirarki adalah Single
Linkage (Pauatan Tunggal). Metode ini akan mengelompokan dua objek yang
mempunyai jarak terdekat dahulu. Jadi pada setiap tahapan, banyaknya cluster
berkurang satu. Secara formal, dua buah cluster B dan B , jarak antara B dan B
r s r s
misalkan h(B ,B ) didefinisikan sebagai :
r s
h(B ,B ) = min{d(x ,x ); x anggota B , x anggota B }
r s i j i r j s
Hasil berupa single linkage clustering dapat disajikan dalam bentuk suatu
dendogram atau diagram pohon.Cabang-cabang pohon menunjukkan
cluster/kelompok.Cabang-cabang tersebut bertemu bersama-sama (menggabung)
pada simpul yang posisinya sepanjang suatu sumbu jarak (kemiripan) menunjukkan
tingkat dimana penggabungan terjadi.
b. Metode Non-hirarki
Metode ini dimulai dengan proses penentuan jumlah cluster terlebih dahulu.
Metode Non-hirarki yang digunakan adalah k-means. Metode k-means digunakan
sebagai alternatif metode cluster untuk data dengan ukuran yang besar karena
memiliki kecepatan yang lebih tinggi dibandingkan metode hirarki.
3. Setelah cluster terbentuk, baik dengan metode hirarki maupun non hirarki, langkah
selanjutnya melakukan interpretasi terhadap cluster yang terbentuk,yang pada intinya
memberi nama spesifik untuk menggambar isi cluster tersebut.
4. Melakukan validasi cluster.
Untuk menguji validasi cluster digunakan uji parsial F.
Hipotesis:
H : variabel i bukan variabel pembeda dalam pengclusteran.
0
H : variabel i merupakan variabel pembeda dalam pengclusteran
1
Taraf signifikansi α
Statistik uji
𝑚𝑒𝑎𝑛𝑠𝑠𝑞𝑢𝑎𝑟𝑒 𝑐𝑙𝑢𝑠𝑡𝑒𝑟
F=
𝑚𝑒𝑎𝑛𝑠 𝑠𝑞𝑢𝑎𝑟𝑒 𝑒𝑟𝑟𝑜𝑟
Kriteria Uji :
Tolak H jika F > F
0 α, k-1,n-k

270
UPI YPTK Jurnal KomTekInfo Vol. 4, No. 2, Desember 2017, Hal. 267-283 ISSN :2356-0010
Copyright©2017 by LPPM UPI YPTK Padang
3. Metodologi Penelitian
Metode yang dipakai dalam penelitian yang tercakup dalam kerangka kerja penelitian

mulai dari mengidentifikasai masalah, menganalisa masalah, menentukan tujuan, mempelajari


literature, teknik pengumpulan data, cara mendesain sistem, teknik pengujian sistem sampai
pada teknik mengevaluasi sistem. Tahap-tahap kerangka kerja dibuat agar penelitian menjadi
terarah dan mencapai tujuan yang ditentukan dalam penelitian ini. Adapun kerangka kerja
penelitian ini dapat dilihat pada gambar berikut :

271
UPI YPTK Jurnal KomTekInfo Vol. 4, No. 2, Desember 2017, Hal. 267-283 ISSN :2356-0010
Copyright©2017 by LPPM UPI YPTK Padang

4.Analisa dan Pengolahan Data

4.1 Analisa Data


Analisa data merupakan tahap untuk melakukan penganalisaan terhadap data-data yang
dibutuhkan untuk perancangan sistem yang akan dibuat, dalam hal ini penulis mengambil data
melalui literature-literature yang berhubungan dengan tema penelitian, untuk mencari
informasi menyusun teori-teori yang berhubungan dengan pembahasan sehingga terjadi
perpaduan yang komplek antara yang satu dengan yang lainnya.
Pada tabel dibawah ini merupakan data dari bulan Februari-Maret yang digunakan
untuk melakukan percobaan perhitungan manual.

Tabel 4.1 Data Penjualan

Stock
Kode Frame Kaca
NO Merk Frame Kaca Mata JumlahTerjual Frame
Mata

23 34
1 BONIA JFWIE
49 53
2 NIKE JFP1E
41 57
3 PUMA JFP2E
45 67
4 DIOR JFR1E
46 70
5 CARTIER JFS1E
27 42
6 POLICE JFS2E
46 54
7 ADIDAS JFT1E
56 93
8 DIOR165 JFH1E

272
UPI YPTK Jurnal KomTekInfo Vol. 4, No. 2, Desember 2017, Hal. 267-283 ISSN :2356-0010
Copyright©2017 by LPPM UPI YPTK Padang
52 67
9 LEVIS JFU1E
11 32
10 MOIWA JFV1E
13 20
11 GINOS KF11E
16 35
12 CHOPARD JBK1E
13 20
13 MONANZA JBN1E
15 35
14 CAPTURE JBP1E
24 45
15 LEES KC71E

4.1.2 Analisa Proses

Dalam hal ini penulis mengambil data di toko atau gerai kacamata Optik Zal, dimana
penulis mengambil sampel datanya selama 2 bulan yaitu pada bulan Februari-Maret 2017,
data tersebut diketik ulang menggunakan Microsoft Excel karena pihak Optik Zal
memberikan data dalam bentuk hardcopy.

4.1.2.1 Metodologi Dasar Analisa K-Means Clustering

a. Tentukan nilai k sebagai jumlah klaster yang ingin dibentuk.


b. Bangkitkan k centroid (titik pusat klaster) awal secara random.
c. Hitung jarak setiap data ke masing-masing centroid menggunakan rumus korelasi
antar dua objek yaitu Euclidean Distance
d. Kelompokkan setiap data berdasarkan jarak terdekat antara data dengan
centroidnya.
e. Tentukan posisi centroid baru (Ck ) dengan cara menghitung nilai rata-rata dari
data-data yang ada pada centroid yang sama.

Dimana nk adalah jumlah dokumen dalam cluster k dan di adalah dokumen dalam
cluster k.
f. Kembali kelangkah 3 jika posisi centroid baru dengan centroid lama tidak sama.
Pada table dibawah ini merupakan sampel data dari bulan Februari-Maret yang
digunakan untuk melakukan percobaan perhitungan manual.

Tabel 4.2 Data Penjualan

Stock
Merk Frame Kaca Kode Frame
NO JumlahTerjual Frame
Mata Kaca Mata

1 BONIA JFWIE 23 34

273
UPI YPTK Jurnal KomTekInfo Vol. 4, No. 2, Desember 2017, Hal. 267-283 ISSN :2356-0010
Copyright©2017 by LPPM UPI YPTK Padang
2 NIKE JFP1E 49 53

3 PUMA JFP2E 41 57

4 DIOR JFR1E 45 67

5 CARTIER JFS1E 46 70

6 POLICE JFS2E 27 42

7 ADIDAS JFT1E 46 54

8 DIOR165 JFH1E 56 93

9 LEVIS JFU1E 52 67

10 MOIWA JFV1E 11 32

11 GINOS KF11E 13 20

12 CHOPARD JBK1E 16 35

13 MONANZA JBN1E 13 20

14 CAPTURE JBP1E 15 35

15 LEES KC71E 24 45

Tahapan Penyelesaian Manual :

1. Tentukan pusat awal cluster “Centroid”


Untuk penetuan pusat awal diambil darinilai
 Pusat cluster ke-1 : { 25 | 45 }
 Pusat cluster ke-2 : { 20 | 40 }
2. Perhitungan jarak pusat cluster
Untuk mengukur jarak antara data dengan pusat cluster digunakan Euclidian Distance,
kemudian akan didapatkan matrik jarak sebagai berikut :
𝐷𝑒 = √(Mix − 𝐶𝑖𝑥 )2 + (𝑀𝑖𝑦 − 𝐶𝑖𝑦 )2

Iterasi Ke-1

1. Perhitungan jarak dari data terhadap pusat cluster ke-1

𝐷1 = √(23 − 25)2 + (34 − 45)2 = 11,180

𝐷12 = √(49 − 25)2 + (53 − 45)2 = 25,298

𝐷13 = √(41 − 25)2 + (57 − 45)2 = 20,000

𝐷14 = √(45 − 25)2 + (67 − 45)2 = 29,732

𝐷15 = √(46 − 25)2 + (70 − 45)2 = 32,650

𝐷16 = √(27 − 25)2 + (42 − 45)2 = 3,606


274
UPI YPTK Jurnal KomTekInfo Vol. 4, No. 2, Desember 2017, Hal. 267-283 ISSN :2356-0010
Copyright©2017 by LPPM UPI YPTK Padang
𝐷17 = √(46 − 25)2 + (54 − 45)2 = 22,847

𝐷18 = √(56 − 25)2 + (93 − 45)2 = 57,140

𝐷19 = √(52 − 25)2 + (67 − 45)2 = 34,828

𝐷110 = √(11 − 25)2 + (32 − 45)2 = 19,105

𝐷111 = √(13 − 25)2 + (20 − 45)2 = 27,731

𝐷112 = √(16 − 25)2 + (35 − 45)2 = 13,454

𝐷113 = √(13 − 25)2 + 20 − 45)2 = 27,731

𝐷114 = √(15 − 25)2 + (35 − 45)2 = 14,142

𝐷115 = √(24 − 25)2 + (45 − 45)2 = 1,000

2. Perhitungan jarak dari data terhadap pusat cluster ke-2

𝐷21 = √(23 − 20)2 + (34 − 40)2 = 6,708

𝐷22 = √(49 − 20)2 + (53 − 40)2 = 31,780

𝐷23 = √(41 − 20)2 + (57 − 40)2 = 27,019

𝐷24 = √(45 − 20)2 + (67 − 40)2 = 36,797

𝐷25 = √(46 − 20)2 + (70 − 40)2 = 39,699

𝐷26 = √(27 − 20)2 + (42 − 40)2 = 7,280

𝐷27 = √(46 − 20)2 + (54 − 40)2 = 29,530

𝐷28 = √(56 − 20)2 + (93 − 40)2 = 64,070

𝐷29 = √(52 − 20)2 + (67 − 40)2 = 41,869

𝐷210 = √(11 − 20)2 + (32 − 40)2 = 12,042

𝐷211 = √(13 − 20)2 + (20 − 40)2 = 21,190

𝐷212 = √(16 − 20)2 + (35 − 40)2 = 6,403

𝐷213 = √(13 − 20)2 + 20 − 40)2 = 21,190

𝐷214 = √(15 − 20)2 + (35 − 40)2 = 7,071

𝐷215 = √(24 − 20)2 + (45 − 40)2 = 6,403

275
UPI YPTK Jurnal KomTekInfo Vol. 4, No. 2, Desember 2017, Hal. 267-283 ISSN :2356-0010
Copyright©2017 by LPPM UPI YPTK Padang
Tabel 4.3 Iterasi 1

NO Merk Kacamata Kode Nilai C1 Nilai C2 c1 c2


11,180 6,708 0 1
1 BONIA JFWIE
25,298 31,780 1 0
2 NIKE JFP1E
20,000 27,019 1 0
3 PUMA JFP2E
29,732 36,797 1 0
4 DIOR JFR1E
32,650 39,699 1 0
5 CARTIER JFS1E
3,606 7,280 1 0
6 POLICE JFS2E
22,847 29,530 1 0
7 ADIDAS JFT1E
57,140 64,070 1 0
8 DIOR165 JFH1E
34,828 41,869 1 0
9 LEVIS JFU1E
19,105 12,042 0 1
10 MOIWA JFV1E
27,731 21,190 0 1
11 GINOS KF11E
13,454 6,403 0 1
12 CHOPARD JBK1E
27,731 21,190 0 1
13 MONANZA JBN1E
14,142 7,071 0 1
14 CAPTURE JBP1E
1,000 6,403 1 0
15 LEES KC71E

Pada pencarian iterasi pertama didapatkan hasil sebagai berikut :


{NIKE (JFP1E),PUMA (JFP2E),DIOR (JFR1E),CARTIER (JFS1E), POLICE (JFS2E), ADIDAS
(JFT1E), DIOR165 (JFH1E), LEVIS (JFU1E), LEES (KC71E) } = Anggota C1
{BONIA (JFWIE), MOIWA (JFV1E), GINOS (KF11E), CHOPARD (JBK1E), MONANZA
(JBN1E), CAPTURE(JBP1E)} = Anggota C2

Iterasi Ke-2

1. Hitung Titik Pusat Baru


Menentukan posisi centroid baru (Ck) dengan cara menghitung nilai rata-rata dari data yang ada
pada setiap centroid yang sama.
1
𝐶𝑘 = ( ) ∑ 𝑑1
𝑛𝑘

Dimana K adalah jumlah data dalam cluster 1 dan cluster 2.


49 + 41 + 45 + 46 + 27 + 46 + 56 + 52 + 24
𝐶1 = = 42,89
9
53 + 57 + 67 + 70 + 42 + 54 + 93 + 67 + 45
𝐶1 = = 60,89
9

276
UPI YPTK Jurnal KomTekInfo Vol. 4, No. 2, Desember 2017, Hal. 267-283 ISSN :2356-0010
Copyright©2017 by LPPM UPI YPTK Padang
Maka didapatkan nilai centroid 1 baru yakni ={42,89 | 60,89 }

23 + 11 + 13 + 16 + 13 + 15
𝐶2 = = 15,17
6
34 + 32 + 20 + 35 + 20 + 35
𝐶2 = = 29,33
6
Maka didapatkan nilai centroid 2 baru yakni={15,17 | 29,33 }

2. Perhitungan jarak dari data terhadap pusat cluster ke-1 baru

𝐷1 = √(23 − 42,89)2 + (34 − 60,89)2 = 33,447

𝐷12 = √(49 − 42,89)2 + (53 − 60,89)2 = 9,979

𝐷13 = √(41 − 42,89)2 + (57 − 60,89)2 = 4,325

𝐷14 = √(45 − 42,89)2 + (67 − 60,89)2 = 6,464

𝐷15 = √(46 − 42,89)2 + (70 − 60,89)2 = 9,626

𝐷16 = √(27 − 42,89)2 + (42 − 60,89)2 = 24,684

𝐷17 = √(46 − 42,89)2 + (54 − 60,89)2 = 7,559

𝐷18 = √(56 − 42,89)2 + (93 − 60,89)2 = 34,683

𝐷19 = √(52 − 42,89)2 + (67 − 60,89)2 = 10,969

𝐷110 = √(11 − 42,89)2 + (32 − 60,89)2 = 43,030

𝐷111 = √(13 − 42,89)2 + (20 − 60,89)2 = 50,650

𝐷112 = √(16 − 42,89)2 + (35 − 60,89)2 = 37,328

𝐷113 = √(13 − 42,89)2 + 20 − 60,89)2 = 50,650

𝐷114 = √(15 − 42,89)2 + (35 − 60,89)2 = 38,054

𝐷115 = √(24 − 42,89)2 + (45 − 60,89)2 = 24,684

3. Perhitungan jarak dari data terhadap pusat cluster ke-2 baru

𝐷21 = √(23 − 15,17)2 + (34 − 29,33)2 = 9,117

𝐷22 = √(49 − 15,17)2 + (53 − 29,33)2 = 41,288

𝐷23 = √(41 − 15,17)2 + (57 − 29,33)2 = 37,853

𝐷24 = √(45 − 15,17)2 + (67 − 29,33)2 = 48,051

𝐷25 = √(46 − 15,17)2 + (70 − 29,33)2 = 51,035

277
UPI YPTK Jurnal KomTekInfo Vol. 4, No. 2, Desember 2017, Hal. 267-283 ISSN :2356-0010
Copyright©2017 by LPPM UPI YPTK Padang
𝐷26 = √(27 − 15,17)2 + (42 − 29,33)2 = 17,334

𝐷27 = √(46 − 15,17)2 + (54 − 29,33)2 = 39,485

𝐷28 = √(56 − 15,17)2 + (93 − 29,33)2 = 75,637

𝐷29 = √(52 − 15,17)2 + (67 − 29,33)2 = 52,683

𝐷210 = √(11 − 15,17)2 + (32 − 29,33)2 = 4,952

𝐷211 = √(13 − 15,17)2 + (20 − 29,33)2 = 9,579

𝐷212 = √(16 − 15,17)2 + (35 − 29,33)2 = 5,730

𝐷213 = √(13 − 15,17)2 + 20 − 29,33)2 =9,579

𝐷214 = √(15 − 15,17)2 + (35 − 29,33)2 = 5,673

𝐷215 = √(24 − 15,17)2 + (45 − 29,33)2 = 17,987

Tabel 4.4 Iterasi 2

NO Merk Kacamata Kode Nilai C1 Nilai C2 c1 c2

33,447 9,117 0 1
1 BONIA JFWIE
9,979 41,288 1 0
2 NIKE JFP1E
4,325 37,853 1 0
3 PUMA JFP2E
6,464 48,051 1 0
4 DIOR JFR1E
9,626 51,035 1 0
5 CARTIER JFS1E
24,684 17,334 0 1
6 POLICE JFS2E
7,559 39,485 1 0
7 ADIDAS JFT1E
34,683 75,637 1 0
8 DIOR165 JFH1E
10,969 52,683 1 0
9 LEVIS JFU1E
43,030 4,952 0 1
10 MOIWA JFV1E
50,650 9,579 0 1
11 GINOS KF11E
37,328 5,730 0 1
12 CHOPARD JBK1E
50,650 9,579 0 1
13 MONANZA JBN1E
278
UPI YPTK Jurnal KomTekInfo Vol. 4, No. 2, Desember 2017, Hal. 267-283 ISSN :2356-0010
Copyright©2017 by LPPM UPI YPTK Padang
38,054 5,673 0 1
14 CAPTURE JBP1E
24,684 17,987 0 1
15 LEES KC71E

Pada pencarian iterasi pertama didapatkan hasil sebagai berikut :


{NIKE (JFP1E), PUMA(JFP2E), DIOR (JFR1E), CARTIER (JFS1E), ADIDAS (JFT1E),
DIOR165 (JFH1E), LEVIS (JFU1E) }= Anggota C1
{BONIA(JFWIE), POLICE (JFS2E), MOIWA (JFV1E),GINOS (KF11E), CHOPARD (JBK1E),
MONANZA (JBN1E), CAPTURE (JBP1E), LESS (KC71E)}= Anggota C2
Karena hasil angota iterasi – 1 dan iterasi – 2 berbeda maka akan dihitung nilai centroid baru.

Iterasi-3
1. Hitung Titik Pusat Baru
Mencari nilai centroid 1 baru :

49 + 41 + 45 + 46 + 46 + 56 + 52
𝐶1 = = 47,857
7
53 + 57 + 67 + 70 + 54 + 93 + 67
𝐶1 = = 65,857
7
Maka didapatkan nilai centroid 1 baru yakni ={47,857 | 65,857}

Mencari nilai centroid 2 baru :


23 + 27 + 11 + 13 + 16 + 13 + 15 + 24
𝐶2 = = 17.750
8
34 + 42 + 32 + 20 + 35 + 20 + 35 + 45
𝐶2 = = 32,875
8
Maka didapatkan nilai centroid 2 baru yakni={47,857 | 65,857}

2. Perhitungan jarak dari data terhadap pusat cluster ke-1 baru

𝐷21 = √(23 − 47,857)2 + (34 − 65,857)2 = 40,407

𝐷22 = √(49 − 47,857)2 + (53 − 65,857)2 = 12,908

𝐷23 = √(41 − 47,857)2 + (57 − 65,857)2 = 11,201

𝐷24 = √(45 − 47,857)2 + (67 − 65,857)2 = 3,077

𝐷25 = √(46 − 47,857)2 + (70 − 65,857)2 = 4,540

𝐷26 = √(27 − 47,857)2 + (42 − 65,857)2 = 31,689

𝐷27 = √(46 − 47,857)2 + (54 − 65,857)2 = 12,002

𝐷28 = √(56 − 47,857)2 + (93 − 65,857)2 = 28,338

𝐷29 = √(52 − 47,857)2 + (67 − 65,857)2 = 4,298

𝐷210 = √(11 − 47,857)2 + (32 − 65,8577)2 = 50,047

279
UPI YPTK Jurnal KomTekInfo Vol. 4, No. 2, Desember 2017, Hal. 267-283 ISSN :2356-0010
Copyright©2017 by LPPM UPI YPTK Padang
𝐷211 = √(13 − 47,857)2 + (20 − 65,857)2 = 57,601

𝐷212 = √(16 − 47,857)2 + (35 − 65,857)2 = 44,351

𝐷213 = √(13 − 47,857)2 + 20 − 65,857)2 = 57,601

𝐷214 = √(15 − 47,857)2 + (35 − 65,857)2 = 45,075

𝐷215 = √(24 − 47,857)2 + (45 − 65,857)2 = 31,689

3. Perhitungan jarak dari data terhadap pusat cluster ke-2 baru

𝐷1 = √(23 − 17,75)2 + (34 − 32,875)2 = 5,369

𝐷12 = √(49 − 17,75)2 + (53 − 32,875)2 = 37,170

𝐷13 = √(41 − 17,75)2 + (57 − 32,875)2 = 33,505

𝐷14 = √(45 − 17,75)2 + (67 − 32,875)2 = 43,670

𝐷15 = √(46 − 17,75)2 + (70 − 32,875)2 = 46,651

𝐷16 = √(27 − 17,75)2 + (42 − 32,875)2 = 12,993

𝐷17 = √(46 − 17,75)2 + (54 − 32,875)2 = 35,275

𝐷18 = √(56 − 17,75)2 + (93 − 32,875)2 = 71,261

𝐷19 = √(52 − 17,75)2 + (67 − 32,875)2 = 48,349

𝐷110 = √(11 − 17,75)2 + (32 − 32,875)2 = 6,806

𝐷111 = √(13 − 17,75)2 + (20 − 32,875)2 = 13,723

𝐷112 = √(16 − 17,75)2 + (35 − 32,875)2 = 2,753

𝐷113 = √(13 − 17,75)2 + 20 − 32,875)2 = 13,723

𝐷114 = √(15 − 17,75)2 + (35 − 32,875)2 = 3,475

𝐷115 = √(24 − 17,75)2 + (45 − 32,875)2 = 13,641

Tabel 4.5 Iterasi 3

NO Merk Kacamata Kode Nilai C1 Nilai C2 c1 c2


1 BONIA JFWIE 40,407 5,369 0 1

2 NIKE JFP1E 12,908 37,170 1 0

3 PUMA JFP2E 11,201 33,505 1 0

280
UPI YPTK Jurnal KomTekInfo Vol. 4, No. 2, Desember 2017, Hal. 267-283 ISSN :2356-0010
Copyright©2017 by LPPM UPI YPTK Padang
4 DIOR JFR1E 3,077 43,670 1 0

5 CARTIER JFS1E 4,540 46,651 1 0

6 POLICE JFS2E 31,689 12,993 0 1

7 ADIDAS JFT1E 12,002 35,275 1 0

8 DIOR165 JFH1E 28,338 71,261 1 0

9 LEVIS JFU1E 4,298 48,349 1 0

10 MOIWA JFV1E 50,047 6,806 0 1

11 GINOS KF11E 57,601 13,723 0 1

12 CHOPARD JBK1E 44,351 2,753 0 1

13 MONANZA JBN1E 57,601 13,723 0 1

14 CAPTURE JBP1E 45,075 3,475 0 1

15 LEES KC71E 31,689 13,641 0 1

Pada pencarian iterasi ketiga didapatkan hasil sebagai berikut :


{NIKE (JFP1E), PUMA (JFP2E), DIOR (JFR1E), CARTIER (JFS1E), ADIDAS (JFT1E),
DIOR165 (JFH1E), LEVIS (JFU1E) }= Anggota C1 (Tidak Laris)
{BONIA (JFWIE), POLICE (JFS2E), MOIWA (JFV1E),GINOS (KF11E), CHOPARD (JBK1E),
MONANZA (JBN1E), CAPTURE(JBP1E), LESS(KC71E)}= Anggota C2 (Laris)
Karena hasil anggota iterasi – 2 dan iterasi – 3 sama maka dalam perhitungan manual dapat
dihentikan.

Gambar 4.1 Grafik Nilai Centroid

5. Kesimpulan

281
UPI YPTK Jurnal KomTekInfo Vol. 4, No. 2, Desember 2017, Hal. 267-283 ISSN :2356-0010
Copyright©2017 by LPPM UPI YPTK Padang
Dari hasil penelitian, dapat disimpulkan bahwa pengolahan data penjualan pada OPTIK
Zal Padang menggunakan metode Clustering dengan algoritma K-means dapat digunakan
untuk mengelompokkan data penjualan berdasarkan merkframe kacamata.
Dari data yang diolah berdasarkan merk kacamata, diinputkan sampel data pada jumlah
perbulan sebanyak 15 data dengan atribut.harga(x) dan total penjualan perbulan yang ada
untuk dipasarkan kepada konsumen (y) diperoleh 2 (dua) kelompok data telah tercluster,
sebagai berikut:
1. Cluster 1(C1) terdiri dari tujuh merk yaitu NIKE (JFP1E), PUMA (JFP2E), DIOR
(JFR1E), CARTIER (JFS1E), ADIDAS (JFT1E), DIOR165 (JFH1E), LEVIS (JFU1E)
yang kurang laris, karna angka penjualan dalam perbulannya hanya mencapai 67 unit.
2. Cluster 2(C2) terdiri dari delapan merk yaitu BONIA (JFWIE), POLICE (JFS2E),
MOIWA (JFV1E),GINOS (KF11E), CHOPARD (JBK1E), MONANZA (JBN1E),
CAPTURE(JBP1E), LESS(KC71E) yang laris, karena angka penjualan dalam
perbulan dapat mencapai 93 unit.

Daftar Pustaka
[1]. Anik Andriani. (2012). “Penerapan Algoritma C4.5 Pada Program Klasifikasi Mahasiswa Drop

Out”

[2]. Dorina Kabakchieva. (2012). “Student Performance Prediction by Using Data Mining

Classification Algorithms”

[3]. Oscar Marban1, Gonzalo Mariscal2, Javier Segovia1. (2010). “A Data Mining and Knowledge

Discovery Process Model”

[4]. Hai-Fen Lin1, Chih-Hung Hsu2, Mao-Jiun J Wang3, Yu-Cheng Lin4. (2008). “An Application of

Data Mining Technique in Developing Sizing System For Army Soldiers in Taiwan”

[5]. Mohamed Hussain Tawarish1, Farooqui Waseemuddin2. (2013). “Analysis of Data Mining

Concepts in Higher Education With Needs to Najran University)”

[6]. Surjeet Kumar Yadav, Saurabh Pal. (2012). “A Prediction For Performance Improvement of

Engineering Students using Classification”

[7]. Kabra, Bichkar. (2011). “ Performance Prediction of Engineering Students using Decision Tree”

[8]. Padmapriya. (2012). “Prediction of Higher Education Admissibility using Classification

Algorithm”

[9]. Nesreen K Ahmed, Jennifer Neville, Ramana Kompella. (2012). “Network Sampling Designs for

Relational Classification”

[10]. Sonali Agarwal, Pandey, Tiwari. (2012). “Data Classification and Decision Tree Approach”

[11]. Tohari, Hamim. (2014).” Astah-Analisis Serta Perancangan Sistem Informasi Melalui pendekatan

UML “

282
UPI YPTK Jurnal KomTekInfo Vol. 4, No. 2, Desember 2017, Hal. 267-283 ISSN :2356-0010
Copyright©2017 by LPPM UPI YPTK Padang

283

Anda mungkin juga menyukai