128 183 1 SM
128 183 1 SM
Eva Rianti
UniversitasPutra Indonesia “YPTK”Padang
E-mail:evarianti28@gmail.com
Abstrak
Dalam pengolahan data konsumen pada proses penjualan, masih ada proses-proses yang dilakukan
secara manual sehingga sering terjadi kesalahan dalam pencatatan data-data yang ada dan mengurangi
efektifitas waktu dalam bekerja. Sehingga pemilik sulit menemukan informasi dari data penjualan yang
belum diolah ,dimana data tersebut berguna dalam menghasilkan laporan penjualan. Dari latar belakang
tersebut maka dibutuhkan sistem informasi yang terkomputerisasi untuk menunjang arus data dan informsi
sesuai dengan kebutuhan dari proses-proses tersebut.Masalah yang akan di teliti berkaitan dengan proses
pengolahan data penjualan tentang bagaimana menghasilkan informasi serta pengetahuan yang bermanfaat
melalui software data mining yaitu menggunakan metode clustering dengan algoritma K-Means pada data
penjualan dari optic Zal padang. Data penjualan frame kacamata di okptik Zal Padang, diharapkan dapat
membantu pimpinan perusahaan dalam menganalisadan melihat besarnya minat dan banyaknya pelanggan
yang membeli Frame Kacamata. Pemilik optic dapat mengetahui frame apa saja yang banyak diminati dan
juga yang kurang diminati sehingga bias membantu pemilik dalam pengambilan keputusan dalam pembelian
barang untuk masa yang akan dating.
1. Pendahuluan
Kacamata merupakan alat bantu bagi penggunanya yang mengalami masalah dengan
indra pengelihatannya. Semakin berkembangnya teknologi khususnya benda-benda elektronik
yang menggunakan layar monitor, orang-orang di tuntut untuk sering kali melihat kelayar monitor,
contohnya di kalangan pekerja kantor, atau bahkan kalangan anak-anak yang tidak bisa lepas dari
telepon seluler mereka, seringnya terpapar dengan radiasi monitor atau telepon seluler ini membuat
daya pengelihatan terganggu, biasanya gangguan pada pengelihatan di atasi dengan cara operasi,
ini tentu mengeluarkan biaya yang tidak sedikit, alternative lainnya orang-orang memilih
menggunakan kacamata atau lensa kontak. Optik merupakan toko atau gerai yang menyediakan
kacamata dan kontak lensa.Optik Zal di Sentral Pasar Raya Plaza lantai GROUND FLOOR Blok
B1 No 1 & 2 adalah salah satu toko atau gerai yang menjual kacamata dan kontak lensa dengan
berbagai merk dan ukuran untuk memenuhi kebutuhan konsumennya, namun toko ini belum bisa
menentukan merk kacamata mana yang terlaris dan mana yang kurang diminati konsumennya,
sehingga penyediaan kacamata kurang tepat dengan yang diminati pembeli. Datamining adalah
serangkaian proses untuk menggali nilai tambah dari suatu kumpulan data berupa pengetahuan
yang selama ini tidak diketahui secara manual(Pramudiono, 2006).Proses pada pohon keputusan
adalah mengubah bentuk data (tabel)menjadi model pohon,mengubah modelpohon menjadi
rule,dan menyederhanakan rule(BasukidanSyarif, 2003).
2. LandasanTeori
267
UPI YPTK Jurnal KomTekInfo Vol. 4, No. 2, Desember 2017, Hal. 267-283 ISSN :2356-0010
Copyright©2017 by LPPM UPI YPTK Padang
Data Mining merupakan sebuah analisa dari observasi data dalam jumlahbesar untuk
menemukan hubungan yang tidak diketahui sebelumnya dan metode baru untuk meringkas
data agar mudah dipahami serta kegunaanya untuk pemilik data.
Data mining sesungguhnya merupakan salah satu rangkaian dari proses pencarian
pengetahuan pada database (Knowledge Discovery in Database/KDD). KDD adalah
keseluruhan proses untuk mencari dan mengidentifikasi pola(patern) dalam data, dimana pola
yang ditemukan bersifat sah, baru, dapat bermanfaat dan dimengerti. Serangkaian proses
tersebut memiliki tahap sebagai berikut(Tan, 2010):
Transformasi data diperlukan sebagai tahap pre-processing, dimana data yang diolah siap
untuk ditambang. Beberapa cara transformasi sebagai berikut :
1) Centering, mengurangi setiap data dengan rata-rata dari setiap atribut yang ada.
2) Normalization, membagi setiap data yang decentering dengan standar deviasi dari
atribut bersangkutan.
3) Scaling, mengubah data sehingga berada dalam skala tertentu.
3. Penambangan data (data mining)
Data-data yang telah diseleksi dan ditransformasi ditambang dengan berbagai
teknik. Proses data mining adalah proses mencari pola atau informasi menarik dalam data
terpilih dengan menggunakan fungsi-fungsi tertentu.
4. Evaluasi pola dan presentasi pengetahuan
Tahap ini merupakan bagian dari proses pengetahuan yang mencakup pemeriksaan
apakah pola atau informasi yang ditemukan bertentangan dengan fakta atau hipotesa yang
ada sebelumnya. Langkah terakhir KDD adalah merepresentasikan pengetahuan dalam
bentuk yang mudah dipahami oleh pengguna.
Analisis Cluster adalah teknik yang digunakan untuk mengidentifikasi objek atau
individu yang serupa dengan memperhatikan beberapa kriteria.
Analisis cluster yaitu analisis untuk mengelompokkan elemen yang mirip sebagai
objek penelitian menjadi kelompok (cluster) yang berbeda dan mutually exclusive.
Analisis cluster termasuk dalam analisis statistik multivariat metode interdependen.
Sebagai alat analisis interdependen maka tujuan analisis cluster tidak untuk menghubungkan
ataupun membedakan dengan sampel/variabel lain. Analisis cluster merupakan salah satu
alat analisis yang berguna sebagai peringkas data. Dalam meringkas data ini dapat dilakukan
dengan jalan mengelompokkan objek-objek berdasarkan kesamaan karakteristik tertentu di
antara objek-objek yang hendak diteliti (Tim Penelitian dan Pengembangan, 2012:120).
Analisis cluster adalah suatu alat untuk mengelompokkan sejumlah n obyek
berdasarkan p variat yang secara relatif mempunyai kesamaan karakteristik diantara obyek –
268
UPI YPTK Jurnal KomTekInfo Vol. 4, No. 2, Desember 2017, Hal. 267-283 ISSN :2356-0010
Copyright©2017 by LPPM UPI YPTK Padang
obyek tersebut, sehingga keragaman di dalam suatu kelompok tersebut lebih kecil
dibandingkan keragaman antar kelompok. Obyek dapat berupa barang, jasa, tumbuhan,
binatang dan orang (responden, konsumen, atau yang lainnya). Obyek tersebut akan
diklasifikasikan ke dalam satu atau lebih cluster (kelompok) sehingga obyek–obyek yang
berada dalam satu cluster akan mempunyai kemiripan atau kesamaan karakter.
Adapun ciri-ciri cluster adalah:
1. Homogenitas (kesamaan) yang tinggi antar anggota dalam satu cluster (within-cluster).
2. Heterogenitas (perbedaan) yang tinggi antar cluster yang satu dengan cluster yang lainnya
(between-cluster).
Analisis cluster mempunyai beberapa istilah penting, antara lain:
1. Skedul aglomerasi (agalomeration schedule), ialah jadwal yang memberikan informasi
tentang objek atau kasus yang akan dikelompokkan pada setiap tahap pada suatu proses
analisis cluster yang hierarkis.
2. Rata-rata cluster (cluster centroid), ialah nilai rata-rata variabel dari semua objek atau
observasi dalam cluster tertentu.
3. Pusat cluster (cluster centers), ialah titik awal dimulainya pengelompokkan di dalam cluster
nonhierarki.
4. Keanggotaan cluster (cluster membership), ialah keanggotaan yang menunjukkan cluster
untuk setiap objek yang menjadi anggotanya.
5. Dendogram, disebut juga grafik pohon, output SPSS yang memvisualisasikan hasil analisis
cluster yang dilakukan peneliti. Garis vertikal atau tegak menunjukkan cluster yang
digabung bersama. Posisi garis pada pada skala menunjukkan jarak untuk mana cluster
digabung. Dendogram harus dibaca dari kiri ke kanan.
6. Distances between cluster centers, ialah jarak yang menunjukkan bagaimana terpisahnya
pasangan individu cluster.
269
UPI YPTK Jurnal KomTekInfo Vol. 4, No. 2, Desember 2017, Hal. 267-283 ISSN :2356-0010
Copyright©2017 by LPPM UPI YPTK Padang
4) (a,b) meningkat seiring semakin tidak mirip kedua objek a dan b.
5) d(a,c) ≤ d(a,b) + d(b,c) (Sartono, 2003:216).
Jarak yang paling umum digunakan adalah jarak euclidean.Ukuran jarak atau
ketidaksamaan antar obyek ke-i dengan obyek ke-h, disimbolkan dengan d . Nilai d
ih ih
diperoleh melalui perhitungan jarak kuadrat Euclidean sebagai berikut :
𝑝
270
UPI YPTK Jurnal KomTekInfo Vol. 4, No. 2, Desember 2017, Hal. 267-283 ISSN :2356-0010
Copyright©2017 by LPPM UPI YPTK Padang
3. Metodologi Penelitian
Metode yang dipakai dalam penelitian yang tercakup dalam kerangka kerja penelitian
271
UPI YPTK Jurnal KomTekInfo Vol. 4, No. 2, Desember 2017, Hal. 267-283 ISSN :2356-0010
Copyright©2017 by LPPM UPI YPTK Padang
Stock
Kode Frame Kaca
NO Merk Frame Kaca Mata JumlahTerjual Frame
Mata
23 34
1 BONIA JFWIE
49 53
2 NIKE JFP1E
41 57
3 PUMA JFP2E
45 67
4 DIOR JFR1E
46 70
5 CARTIER JFS1E
27 42
6 POLICE JFS2E
46 54
7 ADIDAS JFT1E
56 93
8 DIOR165 JFH1E
272
UPI YPTK Jurnal KomTekInfo Vol. 4, No. 2, Desember 2017, Hal. 267-283 ISSN :2356-0010
Copyright©2017 by LPPM UPI YPTK Padang
52 67
9 LEVIS JFU1E
11 32
10 MOIWA JFV1E
13 20
11 GINOS KF11E
16 35
12 CHOPARD JBK1E
13 20
13 MONANZA JBN1E
15 35
14 CAPTURE JBP1E
24 45
15 LEES KC71E
Dalam hal ini penulis mengambil data di toko atau gerai kacamata Optik Zal, dimana
penulis mengambil sampel datanya selama 2 bulan yaitu pada bulan Februari-Maret 2017,
data tersebut diketik ulang menggunakan Microsoft Excel karena pihak Optik Zal
memberikan data dalam bentuk hardcopy.
Dimana nk adalah jumlah dokumen dalam cluster k dan di adalah dokumen dalam
cluster k.
f. Kembali kelangkah 3 jika posisi centroid baru dengan centroid lama tidak sama.
Pada table dibawah ini merupakan sampel data dari bulan Februari-Maret yang
digunakan untuk melakukan percobaan perhitungan manual.
Stock
Merk Frame Kaca Kode Frame
NO JumlahTerjual Frame
Mata Kaca Mata
1 BONIA JFWIE 23 34
273
UPI YPTK Jurnal KomTekInfo Vol. 4, No. 2, Desember 2017, Hal. 267-283 ISSN :2356-0010
Copyright©2017 by LPPM UPI YPTK Padang
2 NIKE JFP1E 49 53
3 PUMA JFP2E 41 57
4 DIOR JFR1E 45 67
5 CARTIER JFS1E 46 70
6 POLICE JFS2E 27 42
7 ADIDAS JFT1E 46 54
8 DIOR165 JFH1E 56 93
9 LEVIS JFU1E 52 67
10 MOIWA JFV1E 11 32
11 GINOS KF11E 13 20
12 CHOPARD JBK1E 16 35
13 MONANZA JBN1E 13 20
14 CAPTURE JBP1E 15 35
15 LEES KC71E 24 45
Iterasi Ke-1
275
UPI YPTK Jurnal KomTekInfo Vol. 4, No. 2, Desember 2017, Hal. 267-283 ISSN :2356-0010
Copyright©2017 by LPPM UPI YPTK Padang
Tabel 4.3 Iterasi 1
Iterasi Ke-2
276
UPI YPTK Jurnal KomTekInfo Vol. 4, No. 2, Desember 2017, Hal. 267-283 ISSN :2356-0010
Copyright©2017 by LPPM UPI YPTK Padang
Maka didapatkan nilai centroid 1 baru yakni ={42,89 | 60,89 }
23 + 11 + 13 + 16 + 13 + 15
𝐶2 = = 15,17
6
34 + 32 + 20 + 35 + 20 + 35
𝐶2 = = 29,33
6
Maka didapatkan nilai centroid 2 baru yakni={15,17 | 29,33 }
277
UPI YPTK Jurnal KomTekInfo Vol. 4, No. 2, Desember 2017, Hal. 267-283 ISSN :2356-0010
Copyright©2017 by LPPM UPI YPTK Padang
𝐷26 = √(27 − 15,17)2 + (42 − 29,33)2 = 17,334
33,447 9,117 0 1
1 BONIA JFWIE
9,979 41,288 1 0
2 NIKE JFP1E
4,325 37,853 1 0
3 PUMA JFP2E
6,464 48,051 1 0
4 DIOR JFR1E
9,626 51,035 1 0
5 CARTIER JFS1E
24,684 17,334 0 1
6 POLICE JFS2E
7,559 39,485 1 0
7 ADIDAS JFT1E
34,683 75,637 1 0
8 DIOR165 JFH1E
10,969 52,683 1 0
9 LEVIS JFU1E
43,030 4,952 0 1
10 MOIWA JFV1E
50,650 9,579 0 1
11 GINOS KF11E
37,328 5,730 0 1
12 CHOPARD JBK1E
50,650 9,579 0 1
13 MONANZA JBN1E
278
UPI YPTK Jurnal KomTekInfo Vol. 4, No. 2, Desember 2017, Hal. 267-283 ISSN :2356-0010
Copyright©2017 by LPPM UPI YPTK Padang
38,054 5,673 0 1
14 CAPTURE JBP1E
24,684 17,987 0 1
15 LEES KC71E
Iterasi-3
1. Hitung Titik Pusat Baru
Mencari nilai centroid 1 baru :
49 + 41 + 45 + 46 + 46 + 56 + 52
𝐶1 = = 47,857
7
53 + 57 + 67 + 70 + 54 + 93 + 67
𝐶1 = = 65,857
7
Maka didapatkan nilai centroid 1 baru yakni ={47,857 | 65,857}
279
UPI YPTK Jurnal KomTekInfo Vol. 4, No. 2, Desember 2017, Hal. 267-283 ISSN :2356-0010
Copyright©2017 by LPPM UPI YPTK Padang
𝐷211 = √(13 − 47,857)2 + (20 − 65,857)2 = 57,601
280
UPI YPTK Jurnal KomTekInfo Vol. 4, No. 2, Desember 2017, Hal. 267-283 ISSN :2356-0010
Copyright©2017 by LPPM UPI YPTK Padang
4 DIOR JFR1E 3,077 43,670 1 0
5. Kesimpulan
281
UPI YPTK Jurnal KomTekInfo Vol. 4, No. 2, Desember 2017, Hal. 267-283 ISSN :2356-0010
Copyright©2017 by LPPM UPI YPTK Padang
Dari hasil penelitian, dapat disimpulkan bahwa pengolahan data penjualan pada OPTIK
Zal Padang menggunakan metode Clustering dengan algoritma K-means dapat digunakan
untuk mengelompokkan data penjualan berdasarkan merkframe kacamata.
Dari data yang diolah berdasarkan merk kacamata, diinputkan sampel data pada jumlah
perbulan sebanyak 15 data dengan atribut.harga(x) dan total penjualan perbulan yang ada
untuk dipasarkan kepada konsumen (y) diperoleh 2 (dua) kelompok data telah tercluster,
sebagai berikut:
1. Cluster 1(C1) terdiri dari tujuh merk yaitu NIKE (JFP1E), PUMA (JFP2E), DIOR
(JFR1E), CARTIER (JFS1E), ADIDAS (JFT1E), DIOR165 (JFH1E), LEVIS (JFU1E)
yang kurang laris, karna angka penjualan dalam perbulannya hanya mencapai 67 unit.
2. Cluster 2(C2) terdiri dari delapan merk yaitu BONIA (JFWIE), POLICE (JFS2E),
MOIWA (JFV1E),GINOS (KF11E), CHOPARD (JBK1E), MONANZA (JBN1E),
CAPTURE(JBP1E), LESS(KC71E) yang laris, karena angka penjualan dalam
perbulan dapat mencapai 93 unit.
Daftar Pustaka
[1]. Anik Andriani. (2012). “Penerapan Algoritma C4.5 Pada Program Klasifikasi Mahasiswa Drop
Out”
[2]. Dorina Kabakchieva. (2012). “Student Performance Prediction by Using Data Mining
Classification Algorithms”
[3]. Oscar Marban1, Gonzalo Mariscal2, Javier Segovia1. (2010). “A Data Mining and Knowledge
[4]. Hai-Fen Lin1, Chih-Hung Hsu2, Mao-Jiun J Wang3, Yu-Cheng Lin4. (2008). “An Application of
Data Mining Technique in Developing Sizing System For Army Soldiers in Taiwan”
[5]. Mohamed Hussain Tawarish1, Farooqui Waseemuddin2. (2013). “Analysis of Data Mining
[6]. Surjeet Kumar Yadav, Saurabh Pal. (2012). “A Prediction For Performance Improvement of
[7]. Kabra, Bichkar. (2011). “ Performance Prediction of Engineering Students using Decision Tree”
Algorithm”
[9]. Nesreen K Ahmed, Jennifer Neville, Ramana Kompella. (2012). “Network Sampling Designs for
Relational Classification”
[10]. Sonali Agarwal, Pandey, Tiwari. (2012). “Data Classification and Decision Tree Approach”
[11]. Tohari, Hamim. (2014).” Astah-Analisis Serta Perancangan Sistem Informasi Melalui pendekatan
UML “
282
UPI YPTK Jurnal KomTekInfo Vol. 4, No. 2, Desember 2017, Hal. 267-283 ISSN :2356-0010
Copyright©2017 by LPPM UPI YPTK Padang
283