LAPORAN AKHIR
PENELITIAN DIPA KOPERTIS V YOGYAKARTA
KetuaPeneliti
Menyetujui,
NIDN:0416088003
ABSTRAK
Saat ini persaingan usaha semakin ketat, demikian juga dengan usaha yang
dilakukan di dunia maya Internet yang sering disebut sebagai e-Commerce. Salah
satu jenis e-Commerce yang berkembang saat ini adalah marketplace. Marketplace
merupakan sebuah tempat secara maya dimana penjual atau seller dapat membuat
akun dan menjual barang dagangannya tanpa perlu membuat situs atau toko online
pribadi. Tokopedia merupakan salah satu marketplace yang saat ini berkembang pesat
di Indonesia. Pengguna Tokopedia atau biasa disebut toppers berasal dari seluruh
wilayah Indonesia dengan karakteristik yang berbeda-beda. Pemetaan pengguna
marketplace untuk mengetahui karakteristik toppers berdasarkan jumlah beli, total
bayar transaksi dan wilayah pengiriman dapat memberi manfaat untuk seller agar
dapat memperlakukan penggunanya lebih baik, sehingga diharapkan dapat
meningkatkan penjualan. Untuk memetakan pengguna marketplace dalam penelitian
ini digunakan metode K-Means. Dan untuk mengatasi kelemahan metode K-
Means yaitu dalam penentuan jumlah cluster digunakan Indeks Xie Beni dengan
mencari nilai optimum yaitu nilai terkecil yang diperoleh. Data yang digunakan
adalah data transaksi penjualan di marketplace Tokopedia dengan seller Ragam
Jogja. Atribut yang digunakan adalah ID Cust, Jumlah_beli, Jumlah_bayar dan
Kirim. Dari penelitian ini didapatkan nilai Indeks Xie Beni terkecil pada jumlah
cluster / kelompok 3. Cluster menghasilkan 3 kelompok dengan masing-masing
anggota cluster 1 ada 63 dengan pusat cluster (1,231 ; 75,262 ; 3,338), cluster 2
ada 23 anggota dengan pusat cluster (2,217; 155,739; 3,87) dan cluster 3
mempunyai 6 anggota dengan pusat cluster (9,667; 354,167; 5,167).
iv
KATA PENGANTAR
1. Bapak Syamsul Bahri, M.M., M.Kom, selaku Direktur AMIK BSI Yogyakarta
2. Ibu Diah Praditianingtyas, S.E.,M.Sc, selaku Ketua LPPM AMIK BSI
Yogyakarta
3. Rekan Dosen di lingkungan AMIK BSI Yogyakarta
4. Semua pihak yang telah membantu pelaksanaan penelitian ini yang tidak dapat
kami sebutkan satu per satu
Peneliti menyadari bahwa penelitian ini masih jauh sekali dari sempurna,
untuk itu penelitian mohon kritik dan saran yang bersifat membangun demi
kesempurnaan penelitian yang penulis hasilkan untuk masa yang akan datang.
Akhir kata semoga penelitian ini dapat bermanfaat bagi peneliti pada khususnya
dan bagi para pembaca pada umumnya.
v
DAFTAR ISI
HALAMAN SAMPUL ............................................................................................ i
HALAMAN PENGESAHAN ................................................................................. ii
ABSTRAK ............................................................................................................. iv
KATA PENGANTAR ............................................................................................ v
DAFTAR ISI .......................................................................................................... vi
DAFTAR TABEL ................................................................................................ viii
DAFTAR GAMBAR ............................................................................................. ix
BAB 1. PENDAHULUAN ..................................................................................... 1
1.1 Latar Belakang ............................................................................................. 1
1.2 Identifikasi Masalah ................................................................................ 2
1.3 Pembatasan Masalah ............................................................................... 2
1.4 Perumusan Masalah ................................................................................ 2
1.5 Signifikansi Penelitian ............................................................................ 3
1.6 Kajian Riset Sebelumnya ........................................................................ 3
BAB 2. TINJAUAN PUSTAKA ............................................................................ 6
2.1 Data Mining ................................................................................................. 6
2.2 Metode K-Means .......................................................................................... 7
2.2.2 Algortitma Metode K-Means ................................................................ 8
2.2.3 Optimasi Cluster Indeks Xie Beni ........................................................ 9
2.3 Marketplace Tokopedia ............................................................................... 9
2.4 Software RapidMiner ................................................................................. 11
BAB 3. METODE PENELITIAN......................................................................... 13
3.1 Tujuan Penelitian ................................................................................ 13
3.2 Tempat dan Waktu Penelitian .................................................................... 13
3.3 Metode Pengumpulan Data ........................................................................ 15
3.4 Populasi dan Teknik Pengambilan Sampel ................................................ 15
3.5 Metode Analisis ......................................................................................... 15
BAB 4. HASIL DAN PEMBAHASAN................................................................ 22
4.1 Penerapan Metode K-Means dengan RapidMiner .............................. 22
4.2 Optimasi Indeks Xie Beni ........................................................................... 26
4.3 Hasil Pemetaan Pengguna Marketplace Tokopedia ................................... 27
vi
BAB 5. KESIMPULAN DAN SARAN ............................................................... 29
1. Kesimpulan ................................................................................................ 29
2. Saran ........................................................................................................... 30
LAMPIRAN-LAMPIRAN.................................................................................... 33
vii
DAFTAR TABEL
viii
DAFTAR GAMBAR
ix
BAB 1. PENDAHULUAN
1
mining. Teknik data mining yang akan digunakan pada penelitian ini adalah
metode K-Means dan software pendukung yang digunakan untuk pengolahan data
adalah RapidMiner. Pengukuran untuk melakukan optimasi jumlah cluster yang
paling baik digunakan Indeks Xie Beni. Penelitian diharapkan dapat menghasilkan
pemetaan toppers menjadi beberapa kelompok dengan lebih akurat sehingga dapat
memaksimalkan strategi pemasaran atau promosi penjualan yang lebih baik yang
pada akhirnya akan meningkatkan penjualan. Hal ini tentunya akan memberikan
efek positif bagi perkembangan seller di marketplace Tokopedia pada khususnya
dan perkembangan e-Commerce di Indonesia pada umumnya.
2
1. Berdasarkan data historis transaksi penjualan seller di Tokopedia yang
digunakan untuk penentuan pemetaan toppers, maka atribut apa saja yang
dapat dijadikan acuan dalam proses pengolahan data dengan metode K-
Means dengan optimasi jumlah cluster menggunakan Indeks Xie Beni.
2. Apakah metode K-Means dengan optimasi jumlah cluster menggunakan
Indeks Xie Beni dalam penentuan pemetaan kelompok atau cluster toppers
memberikan hasil yang lebih akurat dibanding penentuan secara manual?
a. Penelitian ini diharapkan dapat digunakan oleh pelaku usaha yaitu seller
yang menjual produknya di marketplace Tokopedia dalam memetakan
toppers agar dapat memberikan perlakukan yang sesuai karena hubungan
yang baik antara toppers dan seller dapat meningkatkan keberhasilan
bisnis seller di marketplace.
3
Indikator Indeks Pembangunan Manusia)”. Penelitian ini bertujuan
mengelompokkan kabupaten atau kota di Jawa Tengah berdasarkan
indikator Indeks Pembangunan Manusia (IPM) dengan metode Fuzzy C-
Means dan jumlah optimum dari kelompok yang diperoleh dari nilai
minimum Xie Beni. Variabel yang digunakan dalam penelitian ini adalah
indikator IPM pada tahun 2012 terdiri dari: Nilai Harapan Hidup (tahun),
Angka Melek Huruf (persen), rata-rata Panjang Sekolah (tahun), dan
Purchasing Power Parity (ribu rupiah). Hasil dari penelitian ini adalah
Euclidean memberikan jarak dengan kualitas lebih baik dan cluster
optimal diberikan ketika jumlah cluster lima dengan nilai terkecil dari Xie
Beni adalah 0,50778.
4
diusulkan algoritma cluster dinamik yang mencari jumlah cluster yang
dijalankan berdasarkan kualitas cluster keluaran. Hasil segmentasi yang
terbentuk dievaluasi menggunakan Davies-Bouldin(DB) Index yang
merupakan metode validasi cluster dari hasil clustering dan purity yang
merupakan nilai kesesuaian antara cluster dengan cluster ideal, dimana
semakin besar nilai purity, maka semakin baik kualitas cluster. Hasil
penelitian menunjukkan bahwa metode K-Means dengan algoritma cluster
dinamik terbukti dapat meningkatkan akurasi model yang terbentuk.
5
BAB 2. TINJAUAN PUSTAKA
Ada banyak metode atau fungsi data mining yang bisa digunakan untuk
menemukan, menggali dan menambang pengetahuan, namun menurut (Larose,
2005), (Moertini, 2002) dan (Susanto & Suryadi, 2010) ada enam fungsi utama
data mining, yaitu :
6
1. Description (deskripsi), untuk memberi gambaran secara ringkas bagi
sekumpulan data yang jumlahnya sangat besar dan banyak jenisnya.
Termasuk dalam fungsi ini adalah metode Decision Tree, Neural Network,
dan Exploratory Data Analysis.
2. Estimation (estimasi), untuk menerka sebuah nilai yang belum diketahui,
misal menerka penghasilan seseorang ketika informasi mengenai orang
tersebut diketahui. Metode yang digunakan antara lain Point Estimation
dan Confidence Interval Estimations, Simple Linear Regression dan
Correlation, dan Multiple Regression.
3. Prediction (prediksi), untuk memperkirakan nilai masa mendatang, missal
memprediksi stok barang satu tahun ke depan. Fungsi ini mencakup
metode Neural Network, Decision Tree, dan k-Nearest Neighbor.
4. Classification (klasifikasi), merupakan proses penemuan model atau
fungsi yang menjelaskan atau membedakan konsep atau kelas data, dengan
tujuan untuk dapat memperkirakan kelas dari suatu objek yang labelnya
tidak diketahui. Metode yang digunakan antara lain Neural Network,
Decision Tree, k-Nearest Neighbor, dan Naive Bayes.
5. Clustering (pengelompokan), yaitu pengelompokan mengidentifikasi data
yang memiliki karakteristik tertentu. Metode dalam fungsi ini diantaranya
Hierarchical Clustering, metode K-Means, dan Self Organizing Map
(SOM)
6. Association (asosiasi), dinamakan juga analisis keranjang pasar dimana
fungsi ini mengidentifikasi item-item produk yang kemungkinan dibeli
konsumen bersamaan dengan produk lain. Metode atau algoritma dalam
fungsi ini adalah Apriori, Generalized Sequential Pattern (GSP), FP-
Growth dan GRI algorithm
7
2.2.1 Pengertian K-Means
K-Means adalah salah satu metode data clustering non hirarki yang
mempartisi data ke dalam bentuk satu atau lebih cluster atau kelompok, sehingga
data yang memiliki karakteristik yang sama dikelompokkan dalam satu cluster
yang sama dan data yang memiliki karakteristik berbeda dikelompokkan ke dalam
kelompok lain (Agusta, 2007). Tujuan proses pengelompokan atau clustering
adalah meminimalkan terjadinya objective function yang diset dalam proses
clustering, yang pada umumnya digunakan untuk meminimalisasikan variasi
dalam suatu cluster dan memaksimalkan variasi antar cluster (Agusta, 2007).
Algoritma K-Means merupakan sebuah metode sederhana untuk membagi
suatu kumpulan data dalam suatu angka spesifik dari cluster, yaitu k. Disebutkan
bahwa metode K-Means adalah metode yang cepat dan efisien yang dapat
digunakan dalam clustering data (Larose, 2005). Sedangkan menurut (Duda et al.,
2001; Theodoridis dan Koitroumbas, 2006) dalam (Xu & Wunsch II, 2009)
menyebutkan bahwa K-Means adalah salah satu metode terbaik dan paling
popular dalam algoritma clustering dimana K-Means mencari partisi yang optimal
dari data dengan meminimalkan kriteria jumlah kesalahan kuadrat dengan
prosedur iterasi yang optimal, yang termasuk dalam kategori algoritma mendaki
bukit.
8
5. Tugaskan lagi setiap obyek memakai pusat cluster yang baru. Jika pusat
cluster sudah tidak berubah lagi, maka proses peng-cluster-an selesai.
6. Kembali ke langkah 3 sampai pusat cluster tidak berubah lagi
Secara mendasar, ada dua cara untuk pengalokasian data ke dalam masing-
masing cluster pada saat proses iterasi clustering (Agusta, 2007). Cara pertama
adalah pengalokasian dengan cara tegas (hard) yaitu data item secara tegas
dinyatakan sebagai anggota cluster yang satu dan tidak menjadi anggota cluster
lainnya. Cara kedua dengan cara fuzzy, dimana masing-masing data item diberikan
nilai kemungkinan untuk bisa bergabung ke setiap cluster yang ada.
Sehingga didapatlan rumus keakuratan suatu cluster atau Indeks Xie Beni
(S) adalah rasio dari compactnes terhadap separation, yaitu :
9
berjualan di marketplace adalah penjual tidak perlu membuat situs atau toko
online pribadi. Penjual hanya perlu menyediakan foto produk dan
mengunggahnya yang kemudian dilengkapi dengan deskripsi produk tersebut.
Selanjutnya, apabila ada pembeli yang ingin membeli produk yang ditawarkan
tersebut, pihak penjual akan diberi notifikasi oleh sistem dari e-commerce
tersebut.
Tokopedia merupakan pasar atau mal online terbesar di Indonesia yang
memungkinkan individu maupun pemilik usaha di Indonesia untuk membuka dan
mengelola toko online mereka secara mudah dan gratis, sekaligus memberikan
pengalaman berbelanja online yang lebih aman dan nyaman
(www.tokopedia.com)
10
bahwa marketplace adalah bisnis model paling indah di dunia, karena kesuksesan
sebuah marketplace hanya dapat diraih dengan membuat orang lain sukses.
Layanan Tokopedia telah memungkinkan ratusan ribu UKM di Indonesia
mengirimkan jutaan produk per bulannya kepada pelanggannya di seluruh
Indonesia. Para merchant atau seller Tokopedia telah berhasil membuka ribuan
lapangan pekerjaaan baru di Indonesia.
Tokopedia merupakan perusahaan internet pertama asal Asia Tenggara
yang berhasil mendapatkan kepercayaan pendanaan sebesar 100 juta
Dollar dari SoftBank dan Sequoia Capital. SoftBank merupakan investor di balik
kesuksesan Alibaba, sementara Sequoia Capital merupakan investor di balik
kesuksesan Apple & Google. Kepercayaan yang didapat Tokopedia
menjadi milestone penting karena Indonesia tidak lagi dipandang sebagai negara
pasar, namun telah dianggap mampu menjadi produsen, melahirkan perusahaan
kelas dunia yang mampu bersaing secara global.
11
3. Process
Jendela proses menampilkan semua proses yang ada. Sebuah gambaran
pada jendela ini yang menjadi sangat besar bisa dilihat lengkapnya pada
tab overview.
4. Problems, Log dan System Monitor
Tab ini berisi pesan possible log, masalah dan informasi tentang beban
system.
5. Parameters, tab ini berisi parameter dari operator yang digunakan.
6. Help, berisi informasi tentang operator
12
BAB 3. METODE PENELITIAN
13
3.3 Kerangka Pemikiran Penelitian
Masalah
Penentuan pemetaan pengguna atau toppers untuk memaksimalkan strategi
pemasaran dan promosi penjualan kurang akurat
Pendekatan
Metode K-Means
Pengembangan
RapidMiner
Penerapan
Obyek Penelitian : Teknik Sampling :
Seller Marketplace Tokopedia Simple Random Sampling
Pengukuran
Prppppp Indeks Xie Beni
Hasil
Penentuan pemetaan pengguna atau toppers lebih akurat dengan Metode K-
Means dan optimasi cluster dengan Indeks Xie Beni
14
3.4 Metode Pengumpulan Data
Berdasarkan sumber data yang digunakan pada penelitian ini, maka
metode pengumpulan data yang digunakan adalah sebagai berikut,
1. Wawancara
Wawancara adalah metode pengumpulan data melalui kegiatan tanya
jawab langsung dengan person yang ada pada objek penelitian.
2. Dokumentasi
Dokumentasi adalah metode pengumpulan data dengan mengumpulkan
catatan-catatan atau dokumen-dokumen. Data yang telah didapatkan dari
metode wawancara, penulis kumpulkan menjadi satu sehingga menjadi
sebuah dokumen yang siap digunakan untuk kepentingan penelitian.
3. Studi Pustaka
Studi pustaka adalah mempelajari karya ilmiah, buku ilmiah, dan sumber
ilmiah lainnya yang sesuai dengan penelitian dan memiliki hubungan
dengan masalah yang diteliti. Referensi ilmiah yang penulis gunakan
adalah sumber-sumber yang terdapat dalam daftar kepustakaan.
15
1. Tahap Domain Understanding dan KDD Goals
Berdasarkan pengamatan, seller marketplace menentukan pemetaan
toppers-nya yang dilakukan secara manual hasilnya tidak akurat dan
mengakibatkan strategi pemasaran dan promosi penjulan yang dijalankan
tidak maksimal
16
3. Tahap Preprocessing dan Data Cleansing.
Preprocessing pada tahap ini adalah mengubah data primer menjadi data
sekunder yang siap di olah. Selain itu pada tahapan ini juga dilakukan
pembersihan data yang dianggap tidak mewakili. Dari jumlah data 110
transaksi kemudian dihasilkan 94 data yang akan digunakan dalam
penelitian.
4. Tahap Transformation.
Proses transformasi data dengan cara memberikan kode kepada toppers
yang telah melakukan trasaksi online di seller. Dan penentuan atribut yang
digunakan dalam penelitian yaitu adalah ID Cust (Kode_Cust), Jumlah
Item Barang (Jml_Beli), Total Transaksi (Jml_Bayar dalam ribuan) dan
Wilayah Pengiriman (Kirim). Untuk atribut Kirim dari data Wilayah
Pengiriman, dalam penelitian ini wilayah dikategorikan dalam beberapa
kelompok yaitu :
Tabel 1. Kategori Wilayah Pengiriman
Wilayah Kelompok
Jabodetabek 1
Jawa Tengah dan DI Yogyakarta 2
Jawa Barat dan Banten 3
Jawa Timur 4
Bali, Nusa Tenggara Timur, Nusa Tenggara Barat 5
Sumatera 6
Sulawesi 7
Kalimantan 8
17
Data lengkap ditampilkan pada tabel berikut :
Tabel 2. Data Penelitian
Jml_Bayar
No Kode_Cust Jml_Beli Kirim
(ribuan)
1 C01 1 95 3
2 C02 1 65 3
3 C03 2 81 8
4 C04 1 42 1
5 C05 1 95 3
6 C06 1 65 1
7 C07 1 42 3
8 C08 2 109 8
9 C09 2 60 3
10 C10 1 95 3
11 C11 1 55 4
12 C12 1 70 2
13 C13 1 190 6
14 C14 2 105 1
15 C15 3 175 1
16 C16 1 65 3
17 C17 2 84 3
18 C18 1 65 1
19 C19 1 70 1
20 C20 1 42 2
21 C21 2 78 5
22 C22 2 140 4
23 C23 1 48 2
24 C24 1 50 3
25 C25 1 65 5
26 C26 3 125 5
27 C27 2 110 8
28 C28 2 195 7
29 C29 3 126 7
30 C30 1 65 3
31 C31 2 130 3
32 C32 1 95 4
33 C33 1 100 3
34 C34 3 205 6
35 C35 1 185 1
36 C36 1 95 3
37 C37 1 95 3
38 C38 1 95 6
18
39 C39 1 125 2
40 C40 1 125 1
41 C41 2 190 1
42 C42 1 125 4
43 C43 1 100 4
44 C44 2 133 3
45 C45 1 65 1
46 C46 1 125 7
47 C47 6 307 3
48 C48 1 95 3
49 C49 1 100 4
50 C50 1 65 8
51 C51 1 95 1
52 C52 1 95 3
53 C53 5 305 2
54 C54 1 65 3
55 C55 3 134 7
56 C56 3 180 4
57 C57 2 130 2
58 C58 2 160 2
59 C59 11 419 6
60 C60 1 55 3
61 C61 1 78 3
62 C62 1 65 1
63 C63 1 100 3
64 C64 1 65 1
65 C65 1 78 4
66 C66 1 95 4
67 C67 1 110 3
68 C68 1 65 1
69 C69 1 70 3
70 C70 2 97 4
71 C71 1 42 8
72 C72 1 55 3
73 C73 1 50 2
74 C74 11 520 5
75 C75 3 150 3
76 C76 1 50 3
77 C77 1 57 6
78 C78 1 70 3
79 C79 1 95 2
80 C80 1 95 3
81 C81 1 78 1
19
82 C82 1 95 4
83 C83 1 65 1
84 C84 3 290 8
85 C85 2 200 3
86 C86 2 42 8
87 C87 6 81 6
88 C88 1 35 1
89 C89 1 95 3
90 C90 5 160 2
91 C91 1 50 6
92 C92 3 174 8
93 C93 2 78 2
94 C94 22 284 7
8. Tahap Evaluation.
Pada tahap ini dilakukan evaluasi terhadap sampel data yang dihasilkan
mengenai penentuan pemetaan toppers. Dari hasil yang sudah diketahui,
maka pengukuran jumlah cluster optimal menggunakan Indeks Xie Beni.
20
9. Tahap Discovered Knowledge ( Visualization dan Integration)
Penggunaan pengetahuan yang diperoleh. Pada tahap ini, penerapan
metode K-Means dengan optimasi jumlah cluster dengan Indeks Xie Beni
untuk penentuan pemetaan kelompok toppers.
21
BAB 4. HASIL DAN PEMBAHASAN
a. Cluster 2
Tabel 3. Pusat Data dan Anggota Jumlah Cluster 2
Atribut Cluster 1 Cluster 2
Jml_beli 1,489 9,667
Jml_bayar 96,295 354,167
Kirim 3,477 5,167
Jml Anggota 88 6
b. Cluster 3
Tabel 4. Pusat Data dan Anggota Jumlah Cluster 3
Atribut Cluster 1 Cluster 2 Cluster 3
Jml_beli 1,231 2,217 9,667
Jml_bayar 75,262 155,739 354,167
Kirim 3,338 3,87 5,167
Jml Anggota 65 23 6
c. Cluster 4
Tabel 5. Pusat Data dan Anggota Jumlah Cluster 4
Atribut Cluster 1 Cluster 2 Cluster 3 Cluster 4
Jml_beli 4,308 1,268 11 1,553
Jml_bayar 221,538 61,854 469,5 111,684
Kirim 4,385 3,195 5,5 3,632
Jml Anggota 13 41 2 38
22
d. Cluster 5
Tabel 6. Pusat Data dan Anggota Jumlah Cluster 5
Atribut Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5
Jml_beli 1,061 2 1,406 9,667 2,455
Jml_bayar 57,576 130,667 93,5 354,167 183,091
Kirim 3 4 3,688 5,167 3,727
Jml Anggota 33 12 32 6 11
e. Cluster 6
Tabel 7. Pusat Data dan Anggota Jumlah Cluster 6
Atribut Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5 Cluster 6
Jml_beli 1,406 9 2,455 2 1,061 11
Jml_bayar 93,5 296,5 183,091 130,667 57,576 469,5
Kirim 3,688 5 3,727 4 3 5,5
Jml
Anggota 32 4 11 12 33 2
f. Cluster 7
Tabel 8. Pusat Data dan Anggota Jumlah Cluster 7
Cluster Cluster Cluster Cluster Cluster Cluster Cluster
Atribut 1 2 3 4 5 6 7
Jml_beli 1,167 9 2,455 2 1,75 1,069 11
Jml_bayar 98,167 296,5 183,091 130,667 76,333 55,862 469,5
Kirim 3,583 5 3,727 4 3,417 3,103 5,5
Jml
Anggota 24 4 11 12 12 29 2
23
g. Cluster 8
Tabel 9. Pusat Data dan Anggota Jumlah Cluster 8
Atribut Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5 Cluster 6 Cluster 7 Cluster 8
Jml_beli 2,455 9 2 2,125 1,071 11 1,167 1,053
Jml_bayar 183,091 296,5 130,667 79,5 47 469,5 98,167 65,368
Kirim 3,727 5 4 4 3,5 5,5 3,583 2,632
Jml Anggota 11 4 12 8 14 2 24 19
h. Cluster 9
Tabel 10. Pusat Data dan Anggota Jumlah Cluster 9
Atribut Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5 Cluster 6 Cluster 7 Cluster 8 Cluster 9
Jml_beli 1,061 2,125 1,071 2,455 2 1,375 1,053 11 9
Jml_bayar 95,125 79,5 47 183,09 130,67 104,25 65,368 469,5 296,5
Kirim 3,25 4 3,5 3,272 4 4,25 2,632 5,5 5
Jml
Anggota 16 8 14 11 12 8 19 2 4
24
i. Cluster 10
Tabel 11. Pusat Data dan Anggota Jumlah Cluster 10
Cluster Cluster Cluster Cluster Cluster Cluster Cluster Cluster
Atribut Cluster 2 Cluster 10
1 3 4 5 6 7 8 9
Jml_beli 1.100 1.167 1.833 1.200 2 1.333 11 9 3.200 ?
Jml_bayar 53 40.833 194.167 97.600 130.667 69.875 469.500 296.500 169.800 ?
Kirim 3.500 3.833 4 3.560 4 2.917 5.500 5 3.400 ?
Jml
Anggota 10 6 6 25 12 24 2 4 5 0
25
Karena pada pengelompokan dengan jumlah cluster 10 diketahui bahwa
untuk nilai pusat data pada cluster 10 tidak didapatkan nilai atau null, maka untuk
penghitungan selanjutnya yaitu untuk mencari nilai Indekx Xie Beni dilakukan
hanya sampe pada jumlah cluster 9.
Dengan :
S = Indeks Xie Beni
c = banyaknya cluster / kelompok (dari 2 sampe 9)
n = banyaknya objek penelitian
Uij = nilai keanggotaan objek ke-j dengan pusat kelompok i (nilai = 1)
m = fuzzifier (nilai = 2)
||Xj – Vi|| = jarak Euclidean titil data (Xj) dengn pusat kelompok Vi
||Vi – Vj|| = jarak Euclidean antar pusat kelompok
Tabel 12. Nilai Indeks Xie Beni
Jumlah Cluster Nilai Indeks Xie Beni
2 19,80894
3 1,808776
4 105,7117
5 39,61912704
6 60,20462
7 67,63894
8 75,22157
9 81,4437
10 -
26
Dari hasil perhitungan nilai Indeks Xie Beni diperoleh bahwa hasil nilai
terkecil terdapat pada jumlah cluster 3. Maka optimasi untuk pengambilan jumlah
cluster terbaik dan yang disarankan adalah menggunakan jumlah kelompok atau
cluster 3 dalam pemetaan pelanggan marketplace Tokopedia.
27
3. Cluster 3 : 6 anggota pelanggan yaitu C47, C53, C59, C74, C84, C94.
Pusat cluster kelompok ini adalah (9,667 ; 354,167 ; 5,167). Kelompok ini
memiliki jumlah beli dan jumlah bayar yang besar. Anggota kelompok ini
merupakan pengguna marketplace atau pelanggan yang tersebar rata dari
wilayah Jawa Tengah dan DI Yogyakarta, Jawa Barat dan Banten, Bali
dan Nusa Tenggara Timur/Barat, Sumatera, Sulawesi dan Kalimantan.
28
BAB 5. KESIMPULAN DAN SARAN
1. Kesimpulan
Berdasarkan hasil yang dicapai terkait dengan penelitian Optimasi Pemetaan
Pengguna Marketplace Tokopedia dengan Indeks Xie Beni didapatkan beberapa
kesimpulan :
1. Berdasarkan pengolahan data yang dilakukan dengan perhitungan jumlah
cluster 2 sampe 10, hanya didapatkan nilai untuk perhitungan jumlah
cluster 2 sampe 9, karena pada pengelompokkan jumlah cluster 10, pusat
cluster 10 bernilai kosong atau null.
2. Perhitungan optimasi dengan Indeks Xie Beni ditemukan nilai terkecil
untuk pengelompokkan jumlah cluster 3, dimana cluster pertama
beranggotakan 63, cluster 2 beranggotaan 23 dan cluster 3 mempunyai 6
anggota. Kelompok 1 memiliki jumlah beli dan jumlah bayar yang
cenderung kecil. Kelompok 1 memiliki jumlah beli dan jumlah bayar yang
cenderung kecil dengan wilayah pengiriman meliputi Jawa Barat dan
Banten, kemudian diikuti wilayah Jabodetabek dan Jawa Timur.
Kelompok 2 memiliki jumlah beli dan jumlah bayar yang sedang dengan
wilayah pengiriman meliputi Jabodetabek, Jawa Tengah dan DI
Yogyakarta, Jawa Barat dan Banten dan Sulawesi. Kelompok 3 memiliki
jumlah beli dan jumlah bayar yang besar dengan wilayah pengiriman
meliputi Jabodetabek, Jawa Tengah dan DI Yogyakarta, Jawa Barat dan
Banten dan Sulawesi.
3. Hasil penelitian diharapkan bisa digunakan untuk melakukan pemasaran
atau marketing yang lebih baik terutama cara memperlakukan pengguna
pada marketplace Tokopedia yang berkaitan dengan atribut jumlah beli,
jumlah bayar dan wilayah pengiriman sehingga seller bisa berkembang
baik dan penjualan produk bisa meningkat.
29
2. Saran
1. Pada penelitian berikutnya bisa dipertimbangkan untuk menggunakan
atribut kode barang agar hasil lebih detail dan bisa diketahui produk atau
barang yang paling diminati konsumen.
2. Untuk penelitian selanjutnya, diharapkan bisa dikomparasi dengan
menggunakan metode optimasi lainnya untuk menghasilkan suatu
penelitian yang lebih baik
3. Penelitian berikutnya bisa dikembangkan untuk menghasilkan suatu
program aplikasi sehingga lebih mudah digunakan..
30
Agusta, Y. (2007). K-Means - Penerapan, Permasalahan dan Metode Terkait.
Jurnal Sistem dan Informatika , 3, 47-60.
Moertini, V. S. (2002). Data Mining Sebagai Solusi Bisnis. Integral , 7 (No. 1).
Prasetyo, E. (2012). Data Mining Konsep dan Aplikasi Menggunakan Matlab.
Yogyakarta : Penerbit ANDI.
Rudy, Wahyudiarti, R., Megaputri, V., & Wihardini, R. (2008). Analisis Dan
Perancangan E-Commerce (Studi Kasus : Roemah Soetera Batik Dan
Bordir). Seminar Nasional Informatika 2008 (semnasIF 2008) UPN
"Veteran" Yogyakarta. Yogyakarta.
Setiawan, F. H. (2011). Penerapan Fuzzy C-Means Dan Apriori Untuk
Rekomendasi Promosi Produk Berdasarkan Segmentasi Konsumen.
Semarang. Universitas Dian Nuswantoro, Semarang.
Suprihatin. (2011). Klastering K-Means untuk Penentuan Nilai Ujian. JUSI Vol. I,
No. I , 53-62.
Susanto, S., & Suryadi, D. (2010). Pengantar Data Mining : Menggali
Pengetahuan dari Bongkahan Data. Yogyakarta: Penerbit ANDI.
31
Ustadiyanto, R. (2001). Framework e-Commerce. Yogyakarta: Penerbit Andi.
Widiarini., & Wahono., R.S., (2015). Algoritma Cluster Dinamik untuk Optimasi
Cluster pada Algoritma K-Means dalam Pemetaan Nasabah Potensial.
Journal of Intelligent Systems, Vol. 1, No. 1
Xu, R., & Wunsch II, D. C. (2009). Clustering. Kanada: IEEE Press.
32
LAMPIRAN-LAMPIRAN
33
34
35
36
Rekapitulasi Anggaran
Laporan Akhir Penelitian DIPA Kopertis V Yogyakarta
Judul Penelitian : Optimasi Cluster Metode K-Means dengan Indeks Xie Beni
untuk Pemetaan Pengguna Marketplace Tokopedia
37
MATERIAL 9 SOLASI KECIL 2 PCS 2.500,- 5.000,-
MATERIAL 10 SOLASI BESAR 2 PAKET 5.000,- 10.000,-
MATERIAL 11 AMPLOP BESAR 7 UNIT 5.000,- 35.000,-
MATERIAL 12 AMPLOP KECIL 2 UNIT 2.500,- 5.000,-
MATERIAL 13 STAPLES SEDANG 1 UNIT 8.000,- 8.000,-
MATERIAL 14 MAP PLASTIK 5 UNIT 15.000,- 75.000,-
SUB TOTAL (RP) 810.000,-
3. PERJALANAN
HARGA JUMLAH
JUSTIFIKASI KUANTITA
MATERIAL SATUAN PERJALAN
PERJALANAN S
(RP) AN (RP)
PERJALANAN PERJALANAN UNTUK
LOKAL SURVEI DAN 2 KALI 50.000,- 100.000,-
PENGAMBILAN DATA DI
LAPANGAN
PERJALANAN KONSULTASI
LOKAL PENELITIAN DAN 2 KALI 150.000,- 300.000,-
LAPORAN
PERJALANAN PERJALANAN
1 KALI 300.000,- 300.000,-
KE LUAR KOTA MENGIKUTI SEMINAR
SUBTOTAL (RP) 700.000,-
4. LAIN-LAIN
MATERIAL JUMLAH
HARGA
JUSTIFIKASI LAIN-LAIN KUANTITAS LAIN-LAIN
SATUAN (RP)
(RP)
PUBLIKASI PROCEEDING SEMINAR 1 PAKET 750.000,- 750.000,-
LAPORAN BIAYA JILID LAPORAN 5 PAKET 10.000,- 50.000,-
SUB TOTAL (RP) 800.000,-
5.000.000,
TOTAL ANGGARAN
-
38
NOTA-NOTA
Surat Setoran Pajak (SSP) PPh ps. 21 Honorarium Peneliti
39
40
41
Pemakaian Internet
42
43
Pembelian Peralatan Penunjang
44
Pembelian Bahan Habis Pakai
45
Biaya Perjalanan
46
Lain-lain
Hasil penelitian akan dipublikasikan pada Seminar Nasional Teknologi Informasi
dan Multimedia 2017 STMIK AMIKOM Yogyakarta.
47
48