Anda di halaman 1dari 6

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA)

85
Vol. 5, No. 2, Oktober 2016, ISSN : 2089-9033

PENERAPAN DATA MINING PADA DATA PENJUALAN SEPATU


UNTUK MEMBENTUK SEGMENTASI DISTRIBUTOR DI CV. XYZ
MENGGUNAKAN METODE CLUSTERING
Ririn Patmawati Sari1, Adam Mukharil Bachtiar2
1,2
Universitas Komputer Indonesia
Jalan Dipatiukur No. 112-116, Bandung 40132, Indonesia
E-mail : rfatmawatisari@gmail.com1, adam@email.unikom.ac.id2

ABSTRAK pendistribusian produk akan dilakukan setelah


distributor meminta kepada CV. XYZ, distributor
CV. XYZ merupakan produsen sepatu bermotif meminta produk apabila persediaan produk di
etnik yang memasarkan produknya pada distributor- distributor telah habis atau hanya tersisa sedikit.
distributor yang tersebar di beberapa wilayah di Setelah melakukan permintaan kepada pihak CV.
Indonesia. Pendistribusian sepatu saat ini kurang XYZ, sepatu akan didistribusikan ke distributor dan
maksimal karena tidak sesuai dengan kebutuhan sepatu yang didistribusikan tersebut tergantung
produk di distributor. Dampaknya yaitu banyaknya persediaan yang ada di gudang. Proses
distributor yang menukarkan sepatu dan proses pendistribusian tersebut dirasa kurang maksimal.
distribusi untuk sampai ke tangan konsumen Hal tersebut dikarenakan pendistribusian sepatu
terkadang terhambat. Solusi dari permasalahan tidak sesuai dengan kebutuhan produk di distributor.
tersebut adalah dengan membentuk segmentasi Dampaknya yaitu banyaknya distributor yang
distributor berdasarkan data penjualan. Segmentasi menukarkan sepatu dan proses distribusi untuk
distributor tersebut dapat menjadi pengetahuan sampai ke tangan konsumen terkadang terhambat.
dengan menganalisis karakteristik atau perilaku yang Berdasarkan masalah yang telah dipaparkan
berbeda yang mungkin membutuhkan produk atau sebelumnya, solusi yang mungkin dilakukan adalah
pemasaran yang berbeda dari setiap segmennya. dengan membentuk segmentasi distributor sehingga
Pembentukan segmentasi distributor dapat dilakukan karakteristik kebutuhan produk dari setiap
dengan memanfaatkan data mining metode segmennya dapat terlihat. Kebutuhan dari setiap
clustering dengan menggunakan algoritma AHC. kelompoknya dapat terlihat berdasarkan data
Algoritma AHC membentuk cluster berdasarkan penjualan yang telah dilakukan. Maka dari itu
kedekatan jarak di setiap clusternya. Berdasarkan segmentasi akan dilakukan berdasarkan data
hasil pengujian dapat disimpulkan bahwa penelitian penjualan. Segmentasi distributor tersebut dapat
ini dapat membantu pihak pemasaran CV. XYZ menjadi pengetahuan dengan menganalisis
untuk melakukan pemasaran dan strategi bisnis yang karakteristik atau perilaku yang berbeda yang
tepat untuk setiap segmen distributor sesuai dengan mungkin membutuhkan produk atau pemasaran yang
karakteristik di setiap segmennya. berbeda dari setiap segmennya. Sehingga diharapkan
dapat memaksimalkan proses pemasaran dan
Kata Kunci : segmentasi distributor, data mining, pendistribusian sepatu di CV. XYZ.
clustering, agglomerative hierarchical clustering, Dikarenakan jumlah distributor dan data
AHC penjualan yang cukup banyak mengakibatkan
diperlukannya metode yang tepat untuk membentuk
segmentasi distributor. Metode yang dapat
1. PENDAHULUAN digunakan dalam menganalisis data yang sangat
banyak adalah metode data mining, yaitu metode
CV. XYZ merupakan produsen sepatu bermotif yang digunakan untuk melihat pola atau set data
etnik yang memasarkan produknya pada distributor- yang berukuran besar [1]. Dalam data mining
distributor yang tersebar di beberapa wilayah di terdapat beberapa metode yang dapat digunakan
Indonesia. Distributor-distributor tersebut yang tergantung dari tujuan yang akan dicapai. Salah satu
melayani pelanggan secara langsung, sehingga metode yang dapat digunakan adalah metode
keberadaan dari distributor-distributor ini memiliki clustering, yaitu metode yang memisahkan data ke
peran yang sangat penting untuk menentukan dalam sejumlah kelompok (cluster) menurut
strategi bisnis ke depannya. kemiripan karakteristik dari data tersebut.
Setelah melakukan wawancara dengan pihak CV.
XYZ, didapatkan informasi bahwa proses
Jurnal Ilmiah Komputer dan Informatika (KOMPUTA)
86
Vol. 5, No. 2, Oktober 2016, ISSN : 2089-9033

Maka dari itu CV. XYZ memerlukan penerapan data 2.2.2 Penjelasan Data
mining dengan metode clustering untuk membentuk Data awal yang telah dikumpulkan akan
segmentasi distributor berdasarkan data penjualan. dijelaskan pada tahap ini. Pada data terdapat 127
atribut, yaitu No, Tanggal, ID distributor, nama
2. ISI PENELITIAN distributor, alamat, serta penjualan dari setiap motif
Pada bagian ini akan dibahas mengenai tahapan dan nomor sepatu. Setiap motif memiliki 10 ukuran
penelitian yang dilakukan. sepatu yaitu 35 – 44 dan terdapat 12 motif yaitu TS,
2.1 Pemahaman Bisnis BR, PR, SP, RV, GP, QZ, HD, YN, HB, PD dan
Tujuan bisnis dari CV. XYZ adalah menjadi RN.
brand sepatu handmade terbesar di Indonesia. 2.2.3 Eksplorasi Data
Faktor penting agar tujuan bisnis CV. XYZ tercapai Tahapan eksplorasi data dapat membantu tujuan
yaitu dengan menjaga hubungan baik dengan dari data mining. Dalam penelitian ini eksplorasi
distributor, dan terus meningkatkan pelayanan data meliputi analisis deskriptif. Data yang akan
terhadap distributor dalam penyediaan dan digunakan untuk tahap eksplorasi data ini adalah
pendistribusian produk yang sesuai dengan data penjualan sepatu berdasarkan motif dan ukuran
permintaan pasar. pada data penjualan bulan Januari 2016.
Penentuan sasaran data mining terdiri dari tujuan 1. Analisis Deskriptif
dan kriteria sukses data mining. Berikut ini Analisis deskriptif ini dilakukan untuk
merupakan tujuan dan kriteria sukses data mining : mendeskripsikan atau menjelaskan kelompok data.
1. Tujuan data mining Atribut yang akan digunakan dalam analisis
Tujuan dari penerapan data mining dalam deskriptif ini adalah atribut jumlah penjualan sepatu
penelitian ini yaitu untuk membentuk kelompok berdasarkan motif dan ukuran. Analisa dilakukan
distributor di CV. XYZ. Kelompok ini akan pada atribut tersebut karena atribut pengelompokan
digunakan oleh bagian pemasaran CV. XYZ sebagai yang akan dilakukan berdasarkan pada jumlah
pertimbangan strategi pendistribusian produk kepada penjualan sepatu berdasarkan motif dan ukuran. Ada
distributor. beberapa nilai yang akan dicari dalam analisis
2. Kriteria sukses data mining deskriptif ini, yaitu :
Kriteria sukses dalam penelitian ini yaitu apabila a. Nilai Minimum
mampu membantu bagian pemasaran CV. XYZ Nilai minimum digunakan untuk mengetahui
dalam mengelompokkan distributor yang memiliki berapa jumlah penjualan yang paling sedikit.
karakteristik yang sama dalam penjualan produk. Dengan mengetahui nilai minimum akan
2.2 Pemahaman Data memberikan gambaran berapa nilai terkecil dari
Tahap pemahaman data merupakan tahapan data penjualan produk sebelum dilakukan
kedua yang di dalamnya terdapat beberapa tugas, proses data mining.
yaitu : b. Nilai Maksimum
2.2.1 Pengumpulan Data Awal Nilai maksimum digunakan untuk mengetahui
Data awal yang telah dikumpulkan adalah data berapa jumlah penjualan yang paling banyak.
penjualan dari bulan Januari sampai April 2016. Dengan mengetahui nilai maksimum akan
Data yang digunakan untuk pemodelan pada memberikan gambaran berapa nilai terbesar dari
penelitian ini adalah data penjualan pada bulan data penjualan produk sebelum dilakukan
Januari 2016. Data penjualan yang akan digunakan proses data mining.
tersebut berupa file yang memiliki format *.xls atau c. Nilai Rata-rata
*.xlsx. Berikut ini merupakan sebagian data awal Nilai rata-rata digunakan untuk mengetahui
yang merupakan data penjualan pada bulan Januari berapa jumlah rata-rata penjualan produk.
2016 : Dengan mengetahui nilai rata-rata ini akan
No Tanggal
ID
Dis tributor
Distributor Alamat
TS
35 36 37 38 39 40
Total Total Harga memberikan gambaran berapa nilai rata-rata
1 5-Jan-16 1 Rani Majalengka 0 1 0 0 0 0 26 2,444,000.00 dari data penjualan produk sebelum dilakukan
2 8-Jan-16 2 Kurniawan Bandung Barat 0 0 0 2 0 0 54 5,076,000.00
3 9-Jan-16 3 Wulandari Medan 0 0 0 1 0 0 24 2,256,000.00 proses data mining. Nilai rata-rata didapatkan
4 13-Jan-16 4 Eni Surabaya 0 0 1 0 1 0 53 4,982,000.00
5 15-Jan-16 5 Poppy Bandung 0 0 3 0 0 0 23 2,162,000.00 dengan menggunakan persamaan berikut :
6 15-Jan-16 6 Renny Jakarta Barat 0 0 0 0 0 0 47 4,418,000.00

7
8
16-Jan-16
18-Jan-16
7
8
Hani
Endri
Bandung
Yogyakarta
0 5 2 2 0 0
3 0 0 0 0 0
55
28
5,170,000.00
2,632,000.00
= (1)
9
10
18-Jan-16
21-Jan-16
9
10
Ibeth
Eerstiana
Tangerang
Tangerang
0 0 0 0 0 0
0 0 0 0 3 0
...
21
17
1,974,000.00
1,598,000.00 d. Standar Deviasi
11
12
22-Jan-16
23-Jan-16
11
12
Jay Ezah
Heppi
Brunei Darussalam
Lombok
0 7 5 4 0 0
0 5 2 2 0 0
58
59
5,452,000.00
5,546,000.00
Standar deviasi ini digunakan untuk
13
14
25-Jan-16
25-Jan-16
13
14
Zulaikha
Cut Opie
Bogor
Lhoksemawe
0 0 0 0 0 0
1 8 3 4 0 0
16
64
1,504,000.00
6,016,000.00
menggambarkan bagaimana penyebaran data
15
16
27-Jan-16
27-Jan-16
15
16
Ema
Lina
Lamongan
Sidoarjo
0 0 0 0 0 0
0 0 0 0 0 0
22
15
2,068,000.00
1,410,000.00
dari rata-rata jumlah. Dengan mengetahui nilai
17 27-Jan-16 17 Misrah Cimahi 0 0 0 0 0 0 16 1,504,000.00 standar deviasi ini maka akan memberikan
18 27-Jan-16 18 Dewi Soreang 0 0 0 1 0 0 23 2,162,000.00
19 28-Jan-16 19 Mike Sariang Situbondo 0 0 0 2 0 0 50 4,700,000.00 bagaimana simpangan rata-rata dari data yang
20 29-Jan-16 20 Syanah Serang 0 0 0 0 0 0 41 3,854,000.00
akan diteliti sebelum proses data mining.
Gambar 1. Data Penjualan Bulan Januari 2016
Jurnal Ilmiah Komputer dan Informatika (KOMPUTA)
87
Vol. 5, No. 2, Oktober 2016, ISSN : 2089-9033

Standar deviasi dicari menggunakan persamaan ID Distributor TS_35 TS_36 TS_37 TS_38 TS_39 TS_40
1 0 1 0 0 0 0
RN_42 RN_43 RN_44
1 5 2
berikut ini : 2 0 0 0 2 0 0 0 3 4
3 0 0 0 1 0 0 0 0 0
∑( ̅) 4 0 0 1 0 1 0 0 1 2
= (2) 5 0 0 3 0 0 0 0 0 0
6 0 0 0 0 0 0 0 0 0
e. Nilai Kuartil dan IQR (Interquartile Range) 7 0 5 2 2 0 0 0 0 0
8 3 0 0 0 0 0 0 4 0
Nilai kuartil ini dapat digunakan untuk 9 0 0 0 0 0 0 0 0 0
mendeteksi nilai outlier. Nilai kuartil dan IQR 10 0 0 0 0 3 0 ... 0 0 0
11 0 7 5 4 0 0 0 0 0
dapat dicari dengan menggunakan persamaan 12 0 5 2 2 0 0 0 0 0
berikut ini : 13
14
0
1
0
8
0
3
0
4
0
0
0
0
0
0
0
3
0
2
( )
= (3) 15
16
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
2.2.4 Evaluasi Kualitas Data 17
18
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
Evaluasi kualitas data dilakukan terhadap atribut 19 0 0 0 2 0 0 0 3 3
20 0 0 0 0 0 0 0 0 0
jumlah pembelian berdasarkan motif dan ukuran.
Gambar 2. Penyiapan Data Awal
Berikut ini merupakan hasil evaluasi dari atribut-
atribut tersebut :
2.4 Pemodelan
a. Missing value mungkin saja ditemukan pada
Pada tahap ini akan dilakukan pemodelan, pada
data penjualan tetapi pada data penjualan bulan
tahap ini memiliki beberapa tugas yaitu pemilihan
Januari 2016 yang terdapat pada lampiran F,
teknik pemodelan, penjelasan mekanisme model,
tidak terdapat missing value.
serta pengujian model pada data yang telah
b. Berdasarkan data penjualan bulan Januari 2016
disiapkan sebelumnya.
akan dilihat apakah terdapat outlier atau tidak,
2.4.1 Teknik Pemodelan
persamaan berikut ini merupakan cara yang
Teknik pemodelan yang akan digunakan yaitu
dapat dilakukan untuk menemukan data
menggunakan hierarchical clustering, dan model
outlier:
yang akan digunakan yaitu algoritma Agglomerative
ℎ= + (3 × ) (4)
Hierarchical Clustering (AHC).
= + (6 × ) (5)
2.4.2 Mekanisme Pemodelan
2.3 Persiapan Data
Tahap ini menjelaskan mengenai mekanisme
Tahapan ini mencakup semua kegiatan yang
dari model yang akan digunakan serta asumsi awal
diperlukan untuk membangun data set akhir (data
dari model. Model algoritma agglomerative
yang akan dimasukkan ke dalam pemodelan),
hierarchical clustering memiliki tahapan sebagai
terdapat beberapa tugas dalam tahap ini, yaitu:
berikut:
2.3.1 Pemilihan Data
1. Setiap objek data dianggap sebagai cluster. Jika
Pemilihan data memiliki tugas meliputi
n = jumlah data dan k = jumlah cluster, maka k
pemilihan atribut. Atribut yang dipilih untuk
= n.
melakukan proses pengelompokan (clustering).
2. Menghitung matriks jarak antar cluster
Atribut yang akan dipakai dalam proses clustering
(menggunakan euclidean distance yang terdapat
antara lain, ID distributor dan jumlah penjualan
pada persamaan (2.6)).
sepatu berdasarkan motif dan ukuran.
3. Cari dua cluster yang mempunyai jarak paling
2.3.2 Pembersihan Data
dekat (single linkage yang terdapat pada
Pada proses ini dilakukan proses pembersihan
persamaan (2.7)) lalu gabungkan dua cluster
data, berdasarkan hasil evaluasi kualitas diperoleh
tersebut, sehingga k = k-1.
hasil sebagai berikut:
4. Jika k > 1, ulangi langkah 2 dan 3.
1. Pada data penjualan bulan Januari 2016 missing
5. Jika k = 1, perulangan selesai.
value tidak ditemukan, tetapi jika terdapat missing
6. Menghasilkan cluster dengan memotong
value, maka nilai yang hilang tersebut akan diisi
dendrogram pada tingkat yang tepat.
dengan nilai default yaitu 0.
2.4.3 Analisis Pengujian Model
2. Nilai yang bersifat outlier akan tetap diproses,
Data yang digunakan untuk melakukan
karena algoritma yang digunakan tidak terlalu
pemodelan ini adalah data penjualan pada bulan
terpengaruh oleh outlier.
Januari 2016. Jumlah data yang akan digunakan
2.3.3 Penyiapan Data Awal
adalah sebanyak 20 record, seperti terlihat pada
Pada proses penyiapan data awal akan disiapkan
Tabel 3.12. Kasus yang akan diuji dengan
data yang akan digunakan di tahap pemodelan. Data
menggunakan algoritma AHC adalah sebagai
yang akan digunakan dalam tahapan pemodelan
berikut:
adalah data penjualan bulan Januari 2016 yang telah
1. Ubah setiap data menjadi cluster
mengalami proses perubahan atribut untuk motif dan
Inisialisasi cluster awal adalah sebanyak 20 cluster
nomor sepatu yang digabungkan dengan tanda
karena data (n) = cluster (k), kemudian dihitung
underscore.
jarak antara cluster dengan cluster yang ada dengan
menggunakan persamaan Euclidean Distance.
Jurnal Ilmiah Komputer dan Informatika (KOMPUTA)
88
Vol. 5, No. 2, Oktober 2016, ISSN : 2089-9033

2. Menghitung jarak antar data


Dalam tahap ini setiap cluster akan dihitung jarak
dengan dirinya sendiri dan jarak dengan cluster
lainnya. Euclidean distance dihitung menggunakan
persamaan berikut :
= ∑ ( ) (6)
Berikut ini merupakan proses perhitungan jarak
antar cluster dengan menggunakan persamaan
Euclidean Distance. Berikut ini contoh perhitungan
jarak berdasarkan ukuran :
(0 0) + (1 1) + (0 0) + (0 0) + (0 0)
+(0 0) + (0 0) + (0 0) + (0 0) + (0 0)
(1,1) = = 0

+(0 0) +(0 0) +(0 0) +(0 0) +(0 0)

(0 0) + (1 0) + (0 0) + (0 2)
+(0 0) + (0 0) + (0 0) + (0 0)
(1,2) = = 12.49

+(0 3) +(0 0) +(0 0) +(0 0)
Gambar 3. Hasil Akhir Dendrogram
6. Menghasilkan cluster dengan memotong
Dengan cara yang sama yaitu dengan
dendrogram pada tingkat yang tepat
menggunakan persamaan Euclidean Distance
Berdasarkan dendrogram yang telah dibentuk,
dilakukan perhitungan terhadap seluruh data. Dari
tingkat yang tepat atau jumlah cluster terbaik akan
proses perhitungan Euclidean Distance maka akan
ditentukan dengan melihat selisih jarak dari setiap
dihasilkan matriks jarak.
cluster yang terbentuk. Untuk mengetahui jumlah
3. Mencari dua cluster yang saling berdekatan
cluster terbaik salah satu caranya dapat
Pada tahapan ini akan dihitung jarak antara dua
menggunakan agglomeration schedule.
cluster dengan menggunakan single linkage
(persamaan 2.7), dengan metode ini akan mencari Kombinasi Cluter Iterasi Kom binasi Cluster sebelumnya Iterasi
Iterasi Koofisien
jarak yang paling dekat dari dua cluster. Cluster 1 Cluster 2 Cluster 1 Cluster 2 Selanjutnya
1 2 19 2.00 0 0 3
Iterasi ke-1 : 2 6 20 3.16 0 0 5

( , ) = min ( , ) , ( , ) = min(18.73, 15.49)


3 2 4 5.20 1 0 14
4 7 12 5.48 0 0 5
= 15.49 5 6 7 7.21 2 4 9

sampai dengan : 6
7
10
16
13
17
7.42
7.55
0
0
0
0
8
8

( , ) = min ( , ) , ( , ) 8 10 16 7.81 6 7 10
9 6 11 8.19 5 0 19
Dengan metode single linkage pada setiap iterasi dua 10 10 18 8.43 8 0 11

cluster yang memiliki jarak paling kecil akan 11 5 10 8.72 0 10 13


12 9 15 9.00 0 0 15
digabungkan. Jika cluster(n,n) dan euclidean 13 5 8 9.11 11 0 16

distance = 0, maka nilai euclidean distance tersebut 14 2 14 9.38 3 0 18


15 3 9 9.43 0 12 16
tidak dinyatakan sebagai yang terkecil dan pencarian 16 3 5 9.49 15 13 17
jarak terkecil akan dilanjutkan. Misalkan 17 1 3 9.95 0 16 18
18 1 2 11.75 17 14 19
cluster(1,1), cluster(2,2), cluster(3,3), dan 19 1 6 12.00 18 9 0
seterusnya. Gambar 4. Agglomeration Schedule
Pada saat pengelompokan, iterasi pertama jarak yang Pada tahap pertama, cluster yang digabungkan
paling dekat adalah cluster 2 dan cluster 19 dengan adalah cluster 2 dan cluster 19, karena memiliki
nilai jarak yaitu 2.00. Maka cluster tersebut akan jarak yang paling kecil yaitu 2.00.
digabungkan menjadi satu cluster dan jumlah cluster Cluster yang telah digabungkan pada iterasi
baru yang terbentuk sebanyak 19 cluster. pertama akan digabungkan kembali pada iterasi ke-
4. Jika k > 1, ulangi langkah 2 dan 3 3. Pada iterasi ke-3, cluster yang telah digabungkan
Langkah ke-2 dan ke-3 terus dilakukan dan akan pada iterasi ke-1 dan cluster 4 akan digabungkan
berhenti ketika jumlah cluster yang terbentuk sama kembali. Cluster yang akan dihasilkan berikutnya
dengan 1. Untuk mendapatkan 1 cluster, dalam akan muncul pada iterasi ke-3. Begitu seterusnya
kasus ini perlu dilakukan sebanyak 19 iterasi. hingga iterasi ke-19.
5. Jika k = 1, perulangan selesai Jumlah cluster yang terbaik dapat dilihat dari
Jumlah cluster akan berjumlah 1 saat perulangan ke- selisih koofisien dari setiap iterasinya.
19. Berikut ini merupakan dendrogram dari hasil
pengelompokan.

Gambar 5. Selisih Setiap Iterasi


Jurnal Ilmiah Komputer dan Informatika (KOMPUTA)
89
Vol. 5, No. 2, Oktober 2016, ISSN : 2089-9033

Selisih terbesar yaitu 1.80 sehingga jumlah Dari hasil pengelompokan distributor
cluster terbaik adalah 3 cluster. Maka, dendrogram berdasarkan penjualan sepatu didapatkan hasil
hasil pengelompokan berdasarkan ukuran akan penjualan tertinggi dari setiap cluster yaitu sebagai
dipotong seperti berikut : berikut :
Tabel 4. Penjualan Tertinggi Pada Setiap Cluster
Motif dan
Cluster Ukuran Jumlah
Cluster 1 QZ_40 28
HB_38 16
Cluster 2 HB_39 16
PD_39 16
RV_42 10
Cluster 3
HB_40 10

Pada cluster 1 penjualan tertinggi yang sepatu


dengan motif QZ dengan nomor 40. Pada cluster 2
penjualan tertinggi yaitu motif HB dengan nomor
Gambar 6. Pemotongan Dendrogram sepatu 38 dan 39 serta motif PD dengan nomor
Hasil akhir dari pengelompokan ini terbentuk 3 sepatu 39. Sedangkan pada cluster 3 penjualan
cluster, masing-masing kelompok sebagai berikut : tertinggi yaitu motif RV dengan nomor 42 dan motif
Tabel 1. Anggota Cluster 1 HB dengan nomor 40.

ID Distributor Distributor 3. PENUTUP


6 Renny
7 Hani Hasil dari penelitian yang dilakukan diperoleh
11 Jay Ezah kesimpulan bahwa aplikasi pembentukan kelompok
distributor yang telah dibangun, dapat membantu
12 Heppi manajer pemasaran untuk membentuk kelompok
20 Syanah distributor yang sesuai dengan kemiripan penjualan
produk sehingga dapat dijadikan acuan untuk
Tabel 2. Anggota Cluster 2 pendistribusian dan strategi bisnis yang tepat.
Ada beberapa saran yang dapat dilakukan untuk
ID Distributor Distributor
pengembangan aplikasi pembentukan kelompok
2 Kurniawan distributor ini, antara lain :
4 Eni 1. Pembuatan motif baru dilakukan CV. XYZ
dalam jangka waktu yang cukup lama. Maka dari
14 Cut Opie
itu, untuk mengantisipasinya perlu penambahan fitur
19 Mike Sariang pengaturan atribut, sehingga jika terdapat motif baru
pembentukan kelompok dapat disesuaikan dengan
Tabel 3. Anggota Cluster 3 penambahan motif baru.
ID Distributor Distributor 2. Metode pengelompokan dapat dikembangkan
lagi dengan menggunakan algoritma lain atau
1 Rani menggabungkan 2 algoritma yang berbeda, seperti
3 Wulandari menggabungkan algoritma AHC (agglomerative
5 Poppy hierarchical clustering) dengan algoritma K-Means,
sehingga dapat dibandingkan mana algoritma yang
8 Endri lebih baik dalam melakukan pengelompokan.
9 Ibeth
10 Eerstiana
13 Zulaikha
15 Ema
16 Lina
17 Misrah
18 Dewi
Jurnal Ilmiah Komputer dan Informatika (KOMPUTA)
90
Vol. 5, No. 2, Oktober 2016, ISSN : 2089-9033

DAFTAR PUSTAKA
[1] S. B, Data Mining Teknik Pengumpulan Data [8] B. Susanto, “Data Preprocessing,” Versi 1.2,
Untuk Keperluan Bisnis, Yogyakarta: Graha 2013.
Ilmu, 2007. [9] P. Berkhin, “Survey of Clustering Data Mining
[2] “CRISP-DM 1.0 Step-by-step data mining Techniques”.
guide,” 2000. [10] F. A. Hermawati, Data Mining, Yogyakarta:
[3] Fathansyah, Basis Data, Informatika, 2015. Andi, 2013.
[4] R. Ramakrishnan dan J. Gehrke, Database [11] R. Xu dan D. Wunsch, Clustering.
Management System Third Edition, Singapore, [12] M. Caccam dan J. Refran, “Cluster Analysis”.
2003. [13] A. Nugroho, Rekayasa Perangkat Lunak
[5] J. Han dan M. Kamber, Data Mining : Concepts Berorientasi Objek dengan Motode USDP,
and Techniques, 2006. Yogyakarta: Andi, 2010.
[6] T. Badriyah, “Penanganan Missing Value dan [14] Suryana, Model Prakatis Penelitian Kuantitatif
Outlier”. dan Kualitatif, 2010.
[7] Sunitha, M.BalRaju, J.Sasikiran dan V. R. ,
“Automatic Outlier Identification in Data
Mining Using IQR in Real-Time Data,”
International Journal of Advanced Research in
Computer and Communication Engineering,
vol. 3, no. 6, 2014.

Anda mungkin juga menyukai