Elly Muningsih AMIK BSI Yogyakarta2016

HALAMAN SAMPUL
LAPORAN AKHIR
PENELITIAN DIPA KOPERTIS V YOGYAKARTA
OPTIMASI CLUSTER METODE K-MEANS DENGAN INDEKS XIE BENI

UNTUK PEMETAAN PENGGUNA MARKETPLACE TOKOPEDIA
Elly Muningsih, M.Kom

NIDN. 0615097901
Dibiayai DIPA Kopertis Wilayah V Yogyakarta Tahun Anggaran 2016

Nomor : SP.DIPA-042.03.2.401243
AMIK BSI YOGYAKARTA

2016
HALAMAN PENGESAHAN
PENELITIAN DIPA KOPERTIS V YOGYAKARTA
Judul Penelitian Optimasi Cluster Metode K-Means dengan

Indeks Xie Beni untuk Pemetaan Pengguna
Marketplace Tokopedia
KodelNlama Rumpun Ilmu l23lllmu Komputer
Ketua Peneliti
a. Nama Lengkap Elly Muningsih, M.Kom
b. NIDN 061 5097901
c. JabatanFungsional Asisten Ahli 150

d. Program Studi Manajemen Informatika
e. Nomor HP 08222t15 3116
f. Alamat surel (e-mail)
Biaya Penelitian - diusulkan ke Kopertis Rp. 5.000.000,-
- dana internal PT Rp 0
- dana institusi lain Rp 0
Yogyakarta, 10 Oktober 2016

Mengetahui,
KetuaPeneliti
Elly Muningsih. M.Kom

NIDN:0615097901
Menyetujui,
NIDN:0416088003
ABSTRAK
Saat ini persaingan usaha semakin ketat, demikian juga dengan usaha yang
dilakukan di dunia maya Internet yang sering disebut sebagai e-Commerce. Salah
satu jenis e-Commerce yang berkembang saat ini adalah marketplace. Marketplace
merupakan sebuah tempat secara maya dimana penjual atau seller dapat membuat
akun dan menjual barang dagangannya tanpa perlu membuat situs atau toko online
pribadi. Tokopedia merupakan salah satu marketplace yang saat ini berkembang pesat
di Indonesia. Pengguna Tokopedia atau biasa disebut toppers berasal dari seluruh
wilayah Indonesia dengan karakteristik yang berbeda-beda. Pemetaan pengguna
marketplace untuk mengetahui karakteristik toppers berdasarkan jumlah beli, total
bayar transaksi dan wilayah pengiriman dapat memberi manfaat untuk seller agar
dapat memperlakukan penggunanya lebih baik, sehingga diharapkan dapat
meningkatkan penjualan. Untuk memetakan pengguna marketplace dalam penelitian
ini digunakan metode K-Means. Dan untuk mengatasi kelemahan metode K-
Means yaitu dalam penentuan jumlah cluster digunakan Indeks Xie Beni dengan
mencari nilai optimum yaitu nilai terkecil yang diperoleh. Data yang digunakan
adalah data transaksi penjualan di marketplace Tokopedia dengan seller Ragam
Jogja. Atribut yang digunakan adalah ID Cust, Jumlah_beli, Jumlah_bayar dan
Kirim. Dari penelitian ini didapatkan nilai Indeks Xie Beni terkecil pada jumlah
cluster / kelompok 3. Cluster menghasilkan 3 kelompok dengan masing-masing
anggota cluster 1 ada 63 dengan pusat cluster (1,231 ; 75,262 ; 3,338), cluster 2
ada 23 anggota dengan pusat cluster (2,217; 155,739; 3,87) dan cluster 3
mempunyai 6 anggota dengan pusat cluster (9,667; 354,167; 5,167).
Kata kunci : e-commerce, marketplace, metode K-Means, Indeks Xie Beni
iv
KATA PENGANTAR
Puji syukur alhamdulillah, kami panjatkan kehadirat Allah SWT yang

telah melimpahkan rahmat dan karunia-Nya, sehingga pada akhirnya penelitian
kami dengan judul Optimasi Cluster Metode K-Means dengan Indeks Xie Beni
Untuk Pemetaan Pengguna Marketplace Tokopedia dapat terlaksana dengan baik.
Kami menyadari bahwa tanpa bimbingan dan dukungan dari semua pihak
dalam penelitian, maka peneliti tidak dapat menyelesaikan penelitian ini tepat
pada waktunya. Untuk itu ijinkanlah peneliti mendapatkan kesempatan ini untuk
mengucapkan ucapan terima kasih yang sebesar-besarnya kepada :
1. Bapak Syamsul Bahri, M.M., M.Kom, selaku Direktur AMIK BSI Yogyakarta
2. Ibu Diah Praditianingtyas, S.E.,M.Sc, selaku Ketua LPPM AMIK BSI
Yogyakarta
3. Rekan Dosen di lingkungan AMIK BSI Yogyakarta
4. Semua pihak yang telah membantu pelaksanaan penelitian ini yang tidak dapat
kami sebutkan satu per satu
Peneliti menyadari bahwa penelitian ini masih jauh sekali dari sempurna,
untuk itu penelitian mohon kritik dan saran yang bersifat membangun demi
kesempurnaan penelitian yang penulis hasilkan untuk masa yang akan datang.
Akhir kata semoga penelitian ini dapat bermanfaat bagi peneliti pada khususnya
dan bagi para pembaca pada umumnya.
v
DAFTAR ISI
HALAMAN SAMPUL ............................................................................................ i
HALAMAN PENGESAHAN ................................................................................. ii
ABSTRAK ............................................................................................................. iv
KATA PENGANTAR ............................................................................................ v
DAFTAR ISI .......................................................................................................... vi
DAFTAR TABEL ................................................................................................ viii
DAFTAR GAMBAR ............................................................................................. ix
BAB 1. PENDAHULUAN ..................................................................................... 1
1.1 Latar Belakang ............................................................................................. 1
1.2 Identifikasi Masalah ................................................................................ 2
1.3 Pembatasan Masalah ............................................................................... 2
1.4 Perumusan Masalah ................................................................................ 2
1.5 Signifikansi Penelitian ............................................................................ 3
1.6 Kajian Riset Sebelumnya ........................................................................ 3
BAB 2. TINJAUAN PUSTAKA ............................................................................ 6
2.1 Data Mining ................................................................................................. 6
2.2 Metode K-Means .......................................................................................... 7
2.2.2 Algortitma Metode K-Means ................................................................ 8
2.2.3 Optimasi Cluster Indeks Xie Beni ........................................................ 9
2.3 Marketplace Tokopedia ............................................................................... 9
2.4 Software RapidMiner ................................................................................. 11
BAB 3. METODE PENELITIAN......................................................................... 13
3.1 Tujuan Penelitian ................................................................................ 13
3.2 Tempat dan Waktu Penelitian .................................................................... 13
3.3 Metode Pengumpulan Data ........................................................................ 15
3.4 Populasi dan Teknik Pengambilan Sampel ................................................ 15
3.5 Metode Analisis ......................................................................................... 15
BAB 4. HASIL DAN PEMBAHASAN................................................................ 22
4.1 Penerapan Metode K-Means dengan RapidMiner .............................. 22
4.2 Optimasi Indeks Xie Beni ........................................................................... 26
4.3 Hasil Pemetaan Pengguna Marketplace Tokopedia ................................... 27
vi
BAB 5. KESIMPULAN DAN SARAN ............................................................... 29
1. Kesimpulan ................................................................................................ 29
2. Saran ........................................................................................................... 30
LAMPIRAN-LAMPIRAN.................................................................................... 33
vii
DAFTAR TABEL
Tabel 1. Kategori Wilayah Pengiriman ............................................................... 17

Tabel 2. Data Penelitian.................................….………………………….……. 18
Tabel 3. Pusat Data dan Anggota Jumlah Cluster 2………………………..…… 22
Tabel 10. Pusat Data dan Anggota Jumlah Cluster 9……………………..…….. 24
Tabel 11. Pusat Data dan Anggota Jumlah Cluster 10…………………...…….. .25
Tabel 12. Nilai Indeks Xie Beni ................................…………………...…….. .26
viii
DAFTAR GAMBAR
Gambar 2.1 Tahapan proses KDD dalam database .............................................. 6

Gambar 2.2 . Tampilan Home Marketplace Tokopedia...………………………. 10
Gambar 2.3. Graphical User Interface RapidMiner........................................... .12
Gambar 3.1 Kerangka Pemikiran Penelitian........................................................14
Gambar 3.2 Data Primer Seller di Marketplace Tokopedia.................................16
ix
BAB 1. PENDAHULUAN
1.1 Latar Belakang

Saat ini teknologi Internet berkembang sangat pesat terutama dalam dunia
bisnis atau usaha, yang dapat dilihat dengan munculnya electronic commerce (e-
Commerce) (Ustadiyanto, 2001). E-Commerce memberikan manfaat besar bagi
perusahaan dan menjadikannya memiliki keunggulan kompetitif untuk perusahaan
yang mengaplikasikannya. (Rudy, Wahyudiarti, Megaputri, & Wihardini, 2008).
Salah satu jenis e-commerce yang berkembang saat ini adalah marketplace.
Marketplace merupakan sebuah pasar atau mal online terbesar di Indonesia yang
memungkinkan pemilik usaha atau individu di Indonesia untuk membuka dan
mengelola toko online mereka secara mudah dan gratis, sekaligus memberikan
pengalaman berbelanja online yang lebih aman dan nyaman
(www.tokopedia.com). Salah satu marketplace yang berkembang pesat di
Indonesia adalah Tokopedia. Layanan Tokopedia telah memungkinkan ratusan
ribu UKM Indonesia mengirimkan jutaan produk per bulannya kepada para
pelanggannya di seluruh Indonesia, dimana pelanggan atau pengguna Tokopedia
ini biasa disebut sebagai toppers.
Toppers menjadi ujung tombak sukses atau tidaknya merchant atau seller
marketplace Tokopedia. Toppers inilah yang melakukan transaksi pembelian ke
seller yang ada di Tokopedia dengan membuat akun terlebih dahulu.
Permasalahan yang terjadi saat ini pada seller adalah mereka kesulitan untuk
memetakan toppers dengan mengetahui karakteristiknya sesuai wilayah
pengiriman menjadi beberapa kelompok berdasarkan transaksi penjualan.
Penentuan yang dilakukan selama ini adalah secara manual dan hasil yang di
dapat tidak akurat. Untuk dapat mengatasi permasalahan yang terjadi, maka seller
membutuhkan suatu metode untuk mengidentifikasi dan memetakan toppers
menjadi beberapa cluster atau kelompok.
Pemetaan kelompok toppers yang kurang akurat karena tidak berdasarkan
pengetahuan dari jumlah data transaksi penjualan yang besar (Setiawan, 2011).
Karena hal itu, untuk mendapatkan pengetahuan tersebut maka diperlukan suatu
proses pengolahan data historis transaksi besar diperlukan suatu teknik data
1
mining. Teknik data mining yang akan digunakan pada penelitian ini adalah
metode K-Means dan software pendukung yang digunakan untuk pengolahan data
adalah RapidMiner. Pengukuran untuk melakukan optimasi jumlah cluster yang
paling baik digunakan Indeks Xie Beni. Penelitian diharapkan dapat menghasilkan
pemetaan toppers menjadi beberapa kelompok dengan lebih akurat sehingga dapat
memaksimalkan strategi pemasaran atau promosi penjualan yang lebih baik yang
pada akhirnya akan meningkatkan penjualan. Hal ini tentunya akan memberikan
efek positif bagi perkembangan seller di marketplace Tokopedia pada khususnya
dan perkembangan e-Commerce di Indonesia pada umumnya.
1.2 Identifikasi Masalah

Membahas tentang clustering pengguna marketplace Tokopedia atau
toppers dapat melibatkan beberapa permasalahan, diantaranya adalah :
a. Penentuan pemetaan toppers secara manual belum akurat karena toppers
berasal dari seluruh wilayah Indonesia dengan karakteristik yang berbeda-
beda.
b. Pemetaan toppers yang dilakukan tidak akurat karena tidak
memperhatikan data historis transaksi penjualan.
1.3 Pembatasan Masalah

Berdasarkan identifikasi masalah maka penelitian ini membatasi
permasalahan hanya pada penentuan pemetaan pengguna atau toppers
marketplace Tokopedia agar lebih akurat dengan cara mengelompokan toppers
menjadi beberapa kelompok atau cluster menggunakan metode K-Means dan
optimasi jumlah cluster menggunakan Indeks Xie Beni. Sedangkan software
pendukung pengolahan data dalam penelitian ini dengan menggunakan
RapidMiner.
1.4 Perumusan Masalah

Sesuai dengan hubungan yang telah dibatasi maka dibangun rumusan
masalah sebagai berikut :
2
1. Berdasarkan data historis transaksi penjualan seller di Tokopedia yang
digunakan untuk penentuan pemetaan toppers, maka atribut apa saja yang
dapat dijadikan acuan dalam proses pengolahan data dengan metode K-
Means dengan optimasi jumlah cluster menggunakan Indeks Xie Beni.
2. Apakah metode K-Means dengan optimasi jumlah cluster menggunakan
Indeks Xie Beni dalam penentuan pemetaan kelompok atau cluster toppers
memberikan hasil yang lebih akurat dibanding penentuan secara manual?
1.5 Signifikansi Penelitian

Penelitian ini diharapkan dapat bermanfaat sebagai berikut :
a. Penelitian ini diharapkan dapat digunakan oleh pelaku usaha yaitu seller
yang menjual produknya di marketplace Tokopedia dalam memetakan
toppers agar dapat memberikan perlakukan yang sesuai karena hubungan
yang baik antara toppers dan seller dapat meningkatkan keberhasilan
bisnis seller di marketplace.
b. Hasil penelitian ini diharapkan dapat memberikan sumbangan bagi

penelitian yang berkaitan dengan metode clustering khususnya dalam
menentukan pemetaan kelompok menggunakan metode K-Means dan
optimasi jumlah cluster dengan Indeks Xie Beni.
c. Penelitian ini diharapkan dapat memberikan hasil yang lebih akurat

sehingga dapat memberikan manfaat lebih bagi kemajuan pelaku usaha
yang bersangkutan yaitu seller Ragam Jogja.
1.6 Kajian Riset Sebelumnya

Beberapa peneliti telah melakukan proses penelitian yang terkait,
diantaranya :
1. Penelitian (Purnamasari, Yasin & Wuryandari, 2014) dengan judul

“Pemilihan Cluster Optimum Pada Fuzzy C-Means (Studi Kasus:
Pengelompokan Kabupaten/Kota Di Provinsi Jawa Tengah Berdasarkan
3
Indikator Indeks Pembangunan Manusia)”. Penelitian ini bertujuan
mengelompokkan kabupaten atau kota di Jawa Tengah berdasarkan
indikator Indeks Pembangunan Manusia (IPM) dengan metode Fuzzy C-
Means dan jumlah optimum dari kelompok yang diperoleh dari nilai
minimum Xie Beni. Variabel yang digunakan dalam penelitian ini adalah
indikator IPM pada tahun 2012 terdiri dari: Nilai Harapan Hidup (tahun),
Angka Melek Huruf (persen), rata-rata Panjang Sekolah (tahun), dan
Purchasing Power Parity (ribu rupiah). Hasil dari penelitian ini adalah
Euclidean memberikan jarak dengan kualitas lebih baik dan cluster
optimal diberikan ketika jumlah cluster lima dengan nilai terkecil dari Xie
Beni adalah 0,50778.
2. Penelitian (Afrisawati, 2013) dengan judul “Implementasi Data Mining

Pemilihan Pelanggan Potensial Menggunakan Algoritma K-Means ”.
Penelitian ini dilatar belakangi oleh persaingan bisnis yang sangat ketat
antara perusahaan-perusahaan retail. CV Cahaya Sejati yang menyadari
hal tersebut berusaha untuk mempertahankan pelanggannya agar tidak
berpindah ke perusahaan lain. Hubungan yang baik antara perusahaan dan
pelanggan loyal sangat penting untuk keberhasilan perusahaan Penelitian
ini menggunakan metode clustering K-Means untuk mengelompokkan
pelanggan potensialnya. Dari penelitian ini didapatkan hasil cluster atau
kelompok 2 yang pelanggannya paling potensial.
3. Penelitian (Widiarini & Wahono, 2015) dengan judul “Algoritma Cluster

Dinamik untuk Optimasi Cluster pada Algoritma K-Means dalam
Pemetaan Nasabah Potensial”. Latar belakang penelitian ini adalah
pemahaman tentang pentingnya pelanggan yang merupakan sumber
keuntungan perusahaan untuk mengetahui nilai potensialnya. Nilai
potensial pelanggan yang diukur menggunakan metode RFM (Recency,
Frequency, Monetary). Penelitian ini melakukan segmentasi pelanggannya
dengan metode clustering K-Means. Untuk mengatasi kelemahan metode
K-Means yaitu sensistifitas pada partisi awal jumlah cluster(k), maka
4
diusulkan algoritma cluster dinamik yang mencari jumlah cluster yang
dijalankan berdasarkan kualitas cluster keluaran. Hasil segmentasi yang
terbentuk dievaluasi menggunakan Davies-Bouldin(DB) Index yang
merupakan metode validasi cluster dari hasil clustering dan purity yang
merupakan nilai kesesuaian antara cluster dengan cluster ideal, dimana
semakin besar nilai purity, maka semakin baik kualitas cluster. Hasil
penelitian menunjukkan bahwa metode K-Means dengan algoritma cluster
dinamik terbukti dapat meningkatkan akurasi model yang terbentuk.
5
BAB 2. TINJAUAN PUSTAKA
2.1 Data Mining

Menurut Tan (2006) dalam Prasetyo (2012) data mining dijelaskan
sebagai proses untuk memperoleh suatu informasi dari gudang basis data yang
sangat besar atau pengekstrakan informasi baru dari bongkahan data yang sangat
besar yang digunakan untuk membantu pengambilan keputusan. Data mining
merupakan sebuah inti dari proses Knowledge Discovery in Database (KDD),
meliputi dugaan algoritma yang mengeksplor data, membangun model dan
menemukan pola yang belum diketahui. KDD bersifat otomatis, dapat
didefinisikan sebagai pengorganisasian proses untuk pengidentifikasian yang
benar, berguna dan penemuan pola dari kumpulan data yang besar dan kompleks
dan tahapan KDD digambarkan sebagai berikut (Maimon & Rokach, 2010) :
Gambar 2.1. Tahapan proses KDD dalam database

(Sumber : Maimon & Rokach, 2010)
Ada banyak metode atau fungsi data mining yang bisa digunakan untuk
menemukan, menggali dan menambang pengetahuan, namun menurut (Larose,
2005), (Moertini, 2002) dan (Susanto & Suryadi, 2010) ada enam fungsi utama
data mining, yaitu :
6
1. Description (deskripsi), untuk memberi gambaran secara ringkas bagi
sekumpulan data yang jumlahnya sangat besar dan banyak jenisnya.
Termasuk dalam fungsi ini adalah metode Decision Tree, Neural Network,
dan Exploratory Data Analysis.
2. Estimation (estimasi), untuk menerka sebuah nilai yang belum diketahui,
misal menerka penghasilan seseorang ketika informasi mengenai orang
tersebut diketahui. Metode yang digunakan antara lain Point Estimation
dan Confidence Interval Estimations, Simple Linear Regression dan
Correlation, dan Multiple Regression.
3. Prediction (prediksi), untuk memperkirakan nilai masa mendatang, missal
memprediksi stok barang satu tahun ke depan. Fungsi ini mencakup
metode Neural Network, Decision Tree, dan k-Nearest Neighbor.
4. Classification (klasifikasi), merupakan proses penemuan model atau
fungsi yang menjelaskan atau membedakan konsep atau kelas data, dengan
tujuan untuk dapat memperkirakan kelas dari suatu objek yang labelnya
tidak diketahui. Metode yang digunakan antara lain Neural Network,
Decision Tree, k-Nearest Neighbor, dan Naive Bayes.
5. Clustering (pengelompokan), yaitu pengelompokan mengidentifikasi data
yang memiliki karakteristik tertentu. Metode dalam fungsi ini diantaranya
Hierarchical Clustering, metode K-Means, dan Self Organizing Map
(SOM)
6. Association (asosiasi), dinamakan juga analisis keranjang pasar dimana
fungsi ini mengidentifikasi item-item produk yang kemungkinan dibeli
konsumen bersamaan dengan produk lain. Metode atau algoritma dalam
fungsi ini adalah Apriori, Generalized Sequential Pattern (GSP), FP-
Growth dan GRI algorithm
2.2 Metode K-Means

Dibawah ini akan dijelaskan pengertian dan algoritma dari metode K-
Means :
7
2.2.1 Pengertian K-Means
K-Means adalah salah satu metode data clustering non hirarki yang
mempartisi data ke dalam bentuk satu atau lebih cluster atau kelompok, sehingga
data yang memiliki karakteristik yang sama dikelompokkan dalam satu cluster
yang sama dan data yang memiliki karakteristik berbeda dikelompokkan ke dalam
kelompok lain (Agusta, 2007). Tujuan proses pengelompokan atau clustering
adalah meminimalkan terjadinya objective function yang diset dalam proses
clustering, yang pada umumnya digunakan untuk meminimalisasikan variasi
dalam suatu cluster dan memaksimalkan variasi antar cluster (Agusta, 2007).
Algoritma K-Means merupakan sebuah metode sederhana untuk membagi
suatu kumpulan data dalam suatu angka spesifik dari cluster, yaitu k. Disebutkan
bahwa metode K-Means adalah metode yang cepat dan efisien yang dapat
digunakan dalam clustering data (Larose, 2005). Sedangkan menurut (Duda et al.,
2001; Theodoridis dan Koitroumbas, 2006) dalam (Xu & Wunsch II, 2009)
menyebutkan bahwa K-Means adalah salah satu metode terbaik dan paling
popular dalam algoritma clustering dimana K-Means mencari partisi yang optimal
dari data dengan meminimalkan kriteria jumlah kesalahan kuadrat dengan
prosedur iterasi yang optimal, yang termasuk dalam kategori algoritma mendaki
bukit.
2.2.2 Algortitma Metode K-Means

Algoritma dasar clustering data menggunakan metode K-Means dapat
dilakukan dengan cara (Agusta, 2007), (Suprihatin, 2011) :
1. Tentukan jumlah cluster
2. Inisialisai k sebagai pusat cluster (beri nilai-nilai random)
3. Alokasikan setiap data atau obyek ke cluster terdekat. Kedekatan dua
obyek ditentukan berdasarkan jarak antar kedua obyek tersebut. Jarang
paling dekat antara satu data dengan satu cluster tertentu akan
menentukan suatu data masuk ke dalam cluster yang mana.
4. Hitung kembali pusat cluster dengan anggota cluster yang sekarang. Pusat
cluster adalah rata-rata semua data atau obyek dalam cluster.
8
5. Tugaskan lagi setiap obyek memakai pusat cluster yang baru. Jika pusat
cluster sudah tidak berubah lagi, maka proses peng-cluster-an selesai.
6. Kembali ke langkah 3 sampai pusat cluster tidak berubah lagi
Secara mendasar, ada dua cara untuk pengalokasian data ke dalam masing-
masing cluster pada saat proses iterasi clustering (Agusta, 2007). Cara pertama
adalah pengalokasian dengan cara tegas (hard) yaitu data item secara tegas
dinyatakan sebagai anggota cluster yang satu dan tidak menjadi anggota cluster
lainnya. Cara kedua dengan cara fuzzy, dimana masing-masing data item diberikan
nilai kemungkinan untuk bisa bergabung ke setiap cluster yang ada.
2.2.3 Optimasi Cluster Indeks Xie Beni

Menurut Wang (2003) dalam (Megawati, Mukid & Rahmawati, 2013),
ukuran keakuaratan clustering merupakan proses evaluasi kualitas algoritma
clustering karena metode clustering merupakan metode tanpa pengawasan. Untuk
mengukur keakuratan suatu cluster (S), ada dua jenis kriteria yang digunakan,
yaitu :
1. Compactnes, yaitu ukuran kedekatan antar anggota pada tiap cluster
2. Separation, yaitu ukuran keterpisahan antar cluster satu dengan cluster
lainnya.
Sehingga didapatlan rumus keakuratan suatu cluster atau Indeks Xie Beni
(S) adalah rasio dari compactnes terhadap separation, yaitu :
Semakin kecil nilai S, maka peng-clusteran tersebut semakin akurat.
2.3 Marketplace Tokopedia

Marketplace merupakan sebuah tempat maya dimana penjual dapat
membuat akun dan menjajakan barang dagangannya. Salah satu keuntungan
9
berjualan di marketplace adalah penjual tidak perlu membuat situs atau toko
online pribadi. Penjual hanya perlu menyediakan foto produk dan
mengunggahnya yang kemudian dilengkapi dengan deskripsi produk tersebut.
Selanjutnya, apabila ada pembeli yang ingin membeli produk yang ditawarkan
tersebut, pihak penjual akan diberi notifikasi oleh sistem dari e-commerce
tersebut.
Tokopedia merupakan pasar atau mal online terbesar di Indonesia yang
memungkinkan individu maupun pemilik usaha di Indonesia untuk membuka dan
mengelola toko online mereka secara mudah dan gratis, sekaligus memberikan
pengalaman berbelanja online yang lebih aman dan nyaman
(www.tokopedia.com)
Gambar 2.2. Tampilan Home Marketplace Tokopedia

Sumber : www.tokopedia.com
Dikutip dari halaman web-nya yaitu www.tokopedia.com, dijelaskan

bahwa tokopedia adalah perusahaan internet yang memungkinkan setiap individu
dan pemilik bisnis di Indonesia untuk mengembangkan dan mengelola
bisnis online mereka secara mudah dan gratis, sekaligus memungkinkan
pengalaman berbelanja online yang lebih aman dan nyaman. Tokopedia percaya
10
bahwa marketplace adalah bisnis model paling indah di dunia, karena kesuksesan
sebuah marketplace hanya dapat diraih dengan membuat orang lain sukses.
Layanan Tokopedia telah memungkinkan ratusan ribu UKM di Indonesia
mengirimkan jutaan produk per bulannya kepada pelanggannya di seluruh
Indonesia. Para merchant atau seller Tokopedia telah berhasil membuka ribuan
lapangan pekerjaaan baru di Indonesia.
Tokopedia merupakan perusahaan internet pertama asal Asia Tenggara
yang berhasil mendapatkan kepercayaan pendanaan sebesar 100 juta
Dollar dari SoftBank dan Sequoia Capital. SoftBank merupakan investor di balik
kesuksesan Alibaba, sementara Sequoia Capital merupakan investor di balik
kesuksesan Apple & Google. Kepercayaan yang didapat Tokopedia
menjadi milestone penting karena Indonesia tidak lagi dipandang sebagai negara
pasar, namun telah dianggap mampu menjadi produsen, melahirkan perusahaan
kelas dunia yang mampu bersaing secara global.
2.4 Software RapidMiner

RapidMiner merupakan sebuah framework berbasis Graphical User
Interface (GUI) yang bersifat open source untuk data mining. RapidMiner
menawarkan banyak operator yang bisa diisikan pada suatu proses, dimana proses
yang dimaksud adalah menganalisa data yang diterima pada awal proses
(Jungermann, 2011). RapidMiner menyediakan banyak metode mulai dari
klasifikasi, klustering, asosiasi dan lain-lain. Selain itu, RapidMiner juga
membedakan mekanisme input dan output, bentuk metode Machine Learning
seperti fasilitas untuk pemrosesan data. Fitur transformasi ruang dan proses pada
RapidMiner diekspresikan sebagai sebuah kombinasi “operator”, yang
dihubungkan pada sebuah grafik terhubung (Arimond, 2010).
Enam area utama GUI dalam RapidMiner yaitu (Jungermann, 2011) :
1. Overview, untuk mengirimkan sebuah gambaran kecil pada jendela sebuah
proses yang lengkap.
2. Operators dan Repositories, tab ini memungkinkan untuk mengakses
operator dan repositori. Operator adalah elemen dasar membangun sebuah
proses dan repositori menyimpan set data untuk akses cepat.
11
3. Process
Jendela proses menampilkan semua proses yang ada. Sebuah gambaran
pada jendela ini yang menjadi sangat besar bisa dilihat lengkapnya pada
tab overview.
4. Problems, Log dan System Monitor
Tab ini berisi pesan possible log, masalah dan informasi tentang beban
system.
5. Parameters, tab ini berisi parameter dari operator yang digunakan.
6. Help, berisi informasi tentang operator
Gambar 2.3. Graphical User Interface RapidMiner
(Sumber : Jungermann, 2011)
12
BAB 3. METODE PENELITIAN
3.1 Tujuan Penelitian

Penelitian ini bertujuan untuk mengetahui metode clustering yaitu
metode K-Means dalam menentukan keakuratan pemetaan pengguna marketplace
Tokopedia atau toppers berdasarkan transaksi penjualan dari seller sehingga dapat
digunakan untuk memaksimalkan strategi pemasaran atau promosi penjualan yang
lebih baik yang pada akhirnya akan meningkatkan penjualan produk dan pada
gilirannya akan memberikan efek positif bagi perkembangan seller marketplace
itu sendiri. Untuk optimasi jumlah cluster digunakan Indeks Xie Beni dengan
mencari nilai terkecil.
3.2 Tempat dan Waktu Penelitian

Penelitian ini dilakukan pada marketplace Tokopedia dengan seller Ragam
Jogja yang sudah bergabung dengan Tokopedia dari tahun 2014 dengan waktu
penelitian mulai dari tanggal Mei s/d September 2016.
13
3.3 Kerangka Pemikiran Penelitian
Masalah
Penentuan pemetaan pengguna atau toppers untuk memaksimalkan strategi
pemasaran dan promosi penjualan kurang akurat
Pendekatan
Metode K-Means
Pengembangan
RapidMiner
Penerapan
Obyek Penelitian : Teknik Sampling :
Seller Marketplace Tokopedia Simple Random Sampling
Pengukuran
Prppppp Indeks Xie Beni
Hasil
Penentuan pemetaan pengguna atau toppers lebih akurat dengan Metode K-
Means dan optimasi cluster dengan Indeks Xie Beni
Gambar 3.1 Kerangka Pemikiran Penelitian
14
3.4 Metode Pengumpulan Data
Berdasarkan sumber data yang digunakan pada penelitian ini, maka
metode pengumpulan data yang digunakan adalah sebagai berikut,
1. Wawancara
Wawancara adalah metode pengumpulan data melalui kegiatan tanya
jawab langsung dengan person yang ada pada objek penelitian.
2. Dokumentasi
Dokumentasi adalah metode pengumpulan data dengan mengumpulkan
catatan-catatan atau dokumen-dokumen. Data yang telah didapatkan dari
metode wawancara, penulis kumpulkan menjadi satu sehingga menjadi
sebuah dokumen yang siap digunakan untuk kepentingan penelitian.
3. Studi Pustaka
Studi pustaka adalah mempelajari karya ilmiah, buku ilmiah, dan sumber
ilmiah lainnya yang sesuai dengan penelitian dan memiliki hubungan
dengan masalah yang diteliti. Referensi ilmiah yang penulis gunakan
adalah sumber-sumber yang terdapat dalam daftar kepustakaan.
3.5 Populasi dan Teknik Pengambilan Sampel

Populasi target dalam penelitian ini adalah data historis transaksi penjualan
bulan Maret s/d Desember 2015 dengan data master pelanggan atau toppers yang
melakukan transaksi di marketplace Tokopedia. Sampel adalah sebagian jumlah
obyek yang diteliti. Menurut Gay & Diehl (1992), “Semakin besar sampelnya
maka kecenderungan lebih representatif dan hasilnya lebih digenalisir, maka
ukuran sampel dapat diterima tergantung pada jenis dari penelitiannya. Untuk
teknik pengambilan sampel penelitian ini menggunakan Simple Random Sampling
dimana penarikan sampel menggunakan prosedur yang memungkinkan setiap
elemen dalam populasi akan memiliki peluang sama untuk dijadikan sampel.
3.6 Metode Analisis

Ada beberapa tahap dalam melakukan eksperimen ini. Penulis
menggunakan metode KDD yang terdiri dari sembilan langkah (Maimon &
Rokach, 2010) yaitu :
15
1. Tahap Domain Understanding dan KDD Goals
Berdasarkan pengamatan, seller marketplace menentukan pemetaan
toppers-nya yang dilakukan secara manual hasilnya tidak akurat dan
mengakibatkan strategi pemasaran dan promosi penjulan yang dijalankan
tidak maksimal
2. Tahap Selection dan Addition

Data historis diambil dari data transaksi penjualan seller dari bulan Maret
– Desember 2015 dengan jumlah 110 data. Data primer dari nota penjualan
seller di marketplace Tokopedia ditampilkan pada gambar dibawah ini :
Gambar 3.2 Data Primer Seller di Marketplace Tokopedia
16
3. Tahap Preprocessing dan Data Cleansing.
Preprocessing pada tahap ini adalah mengubah data primer menjadi data
sekunder yang siap di olah. Selain itu pada tahapan ini juga dilakukan
pembersihan data yang dianggap tidak mewakili. Dari jumlah data 110
transaksi kemudian dihasilkan 94 data yang akan digunakan dalam
penelitian.
4. Tahap Transformation.
Proses transformasi data dengan cara memberikan kode kepada toppers
yang telah melakukan trasaksi online di seller. Dan penentuan atribut yang
digunakan dalam penelitian yaitu adalah ID Cust (Kode_Cust), Jumlah
Item Barang (Jml_Beli), Total Transaksi (Jml_Bayar dalam ribuan) dan
Wilayah Pengiriman (Kirim). Untuk atribut Kirim dari data Wilayah
Pengiriman, dalam penelitian ini wilayah dikategorikan dalam beberapa
kelompok yaitu :
Tabel 1. Kategori Wilayah Pengiriman
Wilayah Kelompok
Jabodetabek 1
Jawa Tengah dan DI Yogyakarta 2
Jawa Barat dan Banten 3
Jawa Timur 4
Bali, Nusa Tenggara Timur, Nusa Tenggara Barat 5
Sumatera 6
Sulawesi 7
Kalimantan 8
17
Data lengkap ditampilkan pada tabel berikut :
Tabel 2. Data Penelitian
Jml_Bayar
No Kode_Cust Jml_Beli Kirim
(ribuan)
1 C01 1 95 3
2 C02 1 65 3
3 C03 2 81 8
4 C04 1 42 1
5 C05 1 95 3
6 C06 1 65 1
7 C07 1 42 3
8 C08 2 109 8
9 C09 2 60 3
10 C10 1 95 3
11 C11 1 55 4
12 C12 1 70 2
13 C13 1 190 6
14 C14 2 105 1
15 C15 3 175 1
16 C16 1 65 3
17 C17 2 84 3
18 C18 1 65 1
19 C19 1 70 1
20 C20 1 42 2
21 C21 2 78 5
22 C22 2 140 4
23 C23 1 48 2
24 C24 1 50 3
25 C25 1 65 5
26 C26 3 125 5
27 C27 2 110 8
28 C28 2 195 7
29 C29 3 126 7
30 C30 1 65 3
31 C31 2 130 3
32 C32 1 95 4
33 C33 1 100 3
34 C34 3 205 6
35 C35 1 185 1
36 C36 1 95 3
37 C37 1 95 3
38 C38 1 95 6
18
39 C39 1 125 2
40 C40 1 125 1
41 C41 2 190 1
42 C42 1 125 4
43 C43 1 100 4
44 C44 2 133 3
45 C45 1 65 1
46 C46 1 125 7
47 C47 6 307 3
48 C48 1 95 3
49 C49 1 100 4
50 C50 1 65 8
51 C51 1 95 1
52 C52 1 95 3
53 C53 5 305 2
54 C54 1 65 3
55 C55 3 134 7
56 C56 3 180 4
57 C57 2 130 2
58 C58 2 160 2
59 C59 11 419 6
60 C60 1 55 3
61 C61 1 78 3
62 C62 1 65 1
63 C63 1 100 3
64 C64 1 65 1
65 C65 1 78 4
66 C66 1 95 4
67 C67 1 110 3
68 C68 1 65 1
69 C69 1 70 3
70 C70 2 97 4
71 C71 1 42 8
72 C72 1 55 3
73 C73 1 50 2
74 C74 11 520 5
75 C75 3 150 3
76 C76 1 50 3
77 C77 1 57 6
78 C78 1 70 3
79 C79 1 95 2
80 C80 1 95 3
81 C81 1 78 1
19
82 C82 1 95 4
83 C83 1 65 1
84 C84 3 290 8
85 C85 2 200 3
86 C86 2 42 8
87 C87 6 81 6
88 C88 1 35 1
89 C89 1 95 3
90 C90 5 160 2
91 C91 1 50 6
92 C92 3 174 8
93 C93 2 78 2
94 C94 22 284 7
5. Tahap Data Mining memilih tipe data mining yang cocok.

Tipe Data Mining yang digunakan dalam penelitian ini adalah clustering
untuk pengelompokan toppers atau pengguna marketplace Tokopedia.
6. Tahap Data Mining memilih algoritma data mining.

Metode yang digunakan dalam penelitian adalah metode K-Means yang
akan memetakan atau membagi toppers menjadi beberapa kelompok.
Metode K-Means dipilih karena merupakan salah satu metode yang
banyak digunakan untuk melakukan clustering atau segmentasi dimana
algoritmanya mudah dan sederhana. Dalam penerapan metode K-Means
digunakan software pendukung RapidMiner.
Dalam melakukan penelitian ini, cluster yang diteliti adalah jumlah cluster
dari 2 sampe 10.
7. Tahap Data Mining dalam penggunaan algoritma data mining.

Pada tahap ini dilakukan implementasi dari algoritma data mining yang
telah ditentukan pada tahap sebelumnya.
8. Tahap Evaluation.
Pada tahap ini dilakukan evaluasi terhadap sampel data yang dihasilkan
mengenai penentuan pemetaan toppers. Dari hasil yang sudah diketahui,
maka pengukuran jumlah cluster optimal menggunakan Indeks Xie Beni.
20
9. Tahap Discovered Knowledge ( Visualization dan Integration)
Penggunaan pengetahuan yang diperoleh. Pada tahap ini, penerapan
metode K-Means dengan optimasi jumlah cluster dengan Indeks Xie Beni
untuk penentuan pemetaan kelompok toppers.
21
BAB 4. HASIL DAN PEMBAHASAN
4.1 Penerapan Metode K-Means dengan RapidMiner

Setelah dilakukan pengolahan data dengan software RapidMiner untuk
perhitungan jumlah cluster 2 sampe 10 maka didapatkan hasil pusat data dan
jumlah anggota untuk masing-masing cluster adalah sebagai berikut :
a. Cluster 2
Tabel 3. Pusat Data dan Anggota Jumlah Cluster 2
Atribut Cluster 1 Cluster 2
Jml_beli 1,489 9,667
Jml_bayar 96,295 354,167
Kirim 3,477 5,167
Jml Anggota 88 6
b. Cluster 3
Atribut Cluster 1 Cluster 2 Cluster 3
Jml_beli 1,231 2,217 9,667
Jml_bayar 75,262 155,739 354,167
Kirim 3,338 3,87 5,167
Jml Anggota 65 23 6
c. Cluster 4
Atribut Cluster 1 Cluster 2 Cluster 3 Cluster 4
Jml_beli 4,308 1,268 11 1,553
Jml_bayar 221,538 61,854 469,5 111,684
Kirim 4,385 3,195 5,5 3,632
Jml Anggota 13 41 2 38
22
d. Cluster 5
Atribut Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5
Jml_beli 1,061 2 1,406 9,667 2,455
Jml_bayar 57,576 130,667 93,5 354,167 183,091
Kirim 3 4 3,688 5,167 3,727
Jml Anggota 33 12 32 6 11
e. Cluster 6
Atribut Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5 Cluster 6
Jml_beli 1,406 9 2,455 2 1,061 11
Jml_bayar 93,5 296,5 183,091 130,667 57,576 469,5
Kirim 3,688 5 3,727 4 3 5,5
Jml
Anggota 32 4 11 12 33 2
f. Cluster 7
Cluster Cluster Cluster Cluster Cluster Cluster Cluster
Atribut 1 2 3 4 5 6 7
Jml_beli 1,167 9 2,455 2 1,75 1,069 11
Jml_bayar 98,167 296,5 183,091 130,667 76,333 55,862 469,5
Kirim 3,583 5 3,727 4 3,417 3,103 5,5
Jml
Anggota 24 4 11 12 12 29 2
23
g. Cluster 8
Atribut Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5 Cluster 6 Cluster 7 Cluster 8
Jml_beli 2,455 9 2 2,125 1,071 11 1,167 1,053
Jml_bayar 183,091 296,5 130,667 79,5 47 469,5 98,167 65,368
Kirim 3,727 5 4 4 3,5 5,5 3,583 2,632
Jml Anggota 11 4 12 8 14 2 24 19
h. Cluster 9
Atribut Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5 Cluster 6 Cluster 7 Cluster 8 Cluster 9
Jml_beli 1,061 2,125 1,071 2,455 2 1,375 1,053 11 9
Jml_bayar 95,125 79,5 47 183,09 130,67 104,25 65,368 469,5 296,5
Kirim 3,25 4 3,5 3,272 4 4,25 2,632 5,5 5
Jml
Anggota 16 8 14 11 12 8 19 2 4
24
i. Cluster 10
Cluster Cluster Cluster Cluster Cluster Cluster Cluster Cluster
Atribut Cluster 2 Cluster 10
1 3 4 5 6 7 8 9
Jml_beli 1.100 1.167 1.833 1.200 2 1.333 11 9 3.200 ?
Jml_bayar 53 40.833 194.167 97.600 130.667 69.875 469.500 296.500 169.800 ?
Kirim 3.500 3.833 4 3.560 4 2.917 5.500 5 3.400 ?
Jml
Anggota 10 6 6 25 12 24 2 4 5 0
25
Karena pada pengelompokan dengan jumlah cluster 10 diketahui bahwa
untuk nilai pusat data pada cluster 10 tidak didapatkan nilai atau null, maka untuk
penghitungan selanjutnya yaitu untuk mencari nilai Indekx Xie Beni dilakukan
hanya sampe pada jumlah cluster 9.
4.2 Optimasi Indeks Xie Beni

Dengan menggunakan rumus Indeks Xie Beni dihasilkan nilai untuk
masing-masing jumlah cluster dari 2 sampe 9 adalah sebagai berikut :
Dengan :
S = Indeks Xie Beni
c = banyaknya cluster / kelompok (dari 2 sampe 9)
n = banyaknya objek penelitian
Uij = nilai keanggotaan objek ke-j dengan pusat kelompok i (nilai = 1)
m = fuzzifier (nilai = 2)
||Xj – Vi|| = jarak Euclidean titil data (Xj) dengn pusat kelompok Vi
||Vi – Vj|| = jarak Euclidean antar pusat kelompok
Tabel 12. Nilai Indeks Xie Beni
Jumlah Cluster Nilai Indeks Xie Beni
2 19,80894
3 1,808776
4 105,7117
5 39,61912704
6 60,20462
7 67,63894
8 75,22157
9 81,4437
10 -
26
Dari hasil perhitungan nilai Indeks Xie Beni diperoleh bahwa hasil nilai
terkecil terdapat pada jumlah cluster 3. Maka optimasi untuk pengambilan jumlah
cluster terbaik dan yang disarankan adalah menggunakan jumlah kelompok atau
cluster 3 dalam pemetaan pelanggan marketplace Tokopedia.
4.3 Hasil Pemetaan Pengguna Marketplace Tokopedia

Dari optimasi yang dilakukan didapatkan hasil bahwa clustering terbaik
adalah dengan jumlah cluster 3. Untuk jumlah cluster 3 dihasilkan bahwa
pengguna Marketplace dibedakan menjadi 3 kelompok yaitu :
1. Cluster 1 : 65 anggota pelanggan yaitu C01, C02, C03, C04, C05, C06,
C07, C08, C09, C10, C11, C12, C14, C16, C17, C18, C19, C20, C21,
C23, C24, C25, C27, C30, C32, C33, C36, C37, C38, C43, C45, C48,
C49, C50, C51, C52, C54, C60, C61, C62, C63, C64, C65, C66, C67,
C68, C69, C70, C71, C72, C73, C76, C77, C78, C79, C80, C81, C82,
C83, C86, C87, C88, C89, C91, C93.
Pusat cluster kelompok ini adalah (1,231 ; 75,262 ; 3,338). Kelompok ini
memiliki jumlah beli dan jumlah bayar yang cenderung kecil. Anggota
kelompok ini merupakan pengguna marketplace atau pelanggan yang
paling dominan yaitu dari wilayah Jawa Barat dan Banten, kemudian
diikuti wilayah Jabodetabek dan Jawa Timur.
2. Cluster 2 : 23 anggota pelanggan yaitu C13, C15, C22, C26, C28, C29,
C31, C34, C35, C39, C40, C41, C42, C44, C46, C55, C56, C57, C58,
C75, C85, C90, C92.
memiliki jumlah beli dan jumlah bayar yang cenderung sedang. Anggota
kelompok ini merupakan pengguna marketplace atau pelanggan yang
paling dominan yaitu dari wilayah Jabodetabek, Jawa Tengah dan DI
Yogyakarta, Jawa Barat dan Banten dan Sulawesi.
27
3. Cluster 3 : 6 anggota pelanggan yaitu C47, C53, C59, C74, C84, C94.
memiliki jumlah beli dan jumlah bayar yang besar. Anggota kelompok ini
merupakan pengguna marketplace atau pelanggan yang tersebar rata dari
wilayah Jawa Tengah dan DI Yogyakarta, Jawa Barat dan Banten, Bali
dan Nusa Tenggara Timur/Barat, Sumatera, Sulawesi dan Kalimantan.
28
BAB 5. KESIMPULAN DAN SARAN
1. Kesimpulan
Berdasarkan hasil yang dicapai terkait dengan penelitian Optimasi Pemetaan
Pengguna Marketplace Tokopedia dengan Indeks Xie Beni didapatkan beberapa
kesimpulan :
1. Berdasarkan pengolahan data yang dilakukan dengan perhitungan jumlah
cluster 2 sampe 10, hanya didapatkan nilai untuk perhitungan jumlah
cluster 2 sampe 9, karena pada pengelompokkan jumlah cluster 10, pusat
cluster 10 bernilai kosong atau null.
2. Perhitungan optimasi dengan Indeks Xie Beni ditemukan nilai terkecil
untuk pengelompokkan jumlah cluster 3, dimana cluster pertama
beranggotakan 63, cluster 2 beranggotaan 23 dan cluster 3 mempunyai 6
anggota. Kelompok 1 memiliki jumlah beli dan jumlah bayar yang
cenderung kecil. Kelompok 1 memiliki jumlah beli dan jumlah bayar yang
cenderung kecil dengan wilayah pengiriman meliputi Jawa Barat dan
Banten, kemudian diikuti wilayah Jabodetabek dan Jawa Timur.
Kelompok 2 memiliki jumlah beli dan jumlah bayar yang sedang dengan
wilayah pengiriman meliputi Jabodetabek, Jawa Tengah dan DI
Yogyakarta, Jawa Barat dan Banten dan Sulawesi. Kelompok 3 memiliki
jumlah beli dan jumlah bayar yang besar dengan wilayah pengiriman
meliputi Jabodetabek, Jawa Tengah dan DI Yogyakarta, Jawa Barat dan
Banten dan Sulawesi.
3. Hasil penelitian diharapkan bisa digunakan untuk melakukan pemasaran
atau marketing yang lebih baik terutama cara memperlakukan pengguna
pada marketplace Tokopedia yang berkaitan dengan atribut jumlah beli,
jumlah bayar dan wilayah pengiriman sehingga seller bisa berkembang
baik dan penjualan produk bisa meningkat.
29
2. Saran
1. Pada penelitian berikutnya bisa dipertimbangkan untuk menggunakan
atribut kode barang agar hasil lebih detail dan bisa diketahui produk atau
barang yang paling diminati konsumen.
2. Untuk penelitian selanjutnya, diharapkan bisa dikomparasi dengan
menggunakan metode optimasi lainnya untuk menghasilkan suatu
penelitian yang lebih baik
3. Penelitian berikutnya bisa dikembangkan untuk menghasilkan suatu
program aplikasi sehingga lebih mudah digunakan..
30
Agusta, Y. (2007). K-Means - Penerapan, Permasalahan dan Metode Terkait.
Jurnal Sistem dan Informatika , 3, 47-60.
Afrisawati. (2013). Implementasi Data Mining Pemilihan Pelanggan Potensial

Menggunakan Algoritma K-Means. Pelita Informatika Budi Darma , Vol. V,
Nomor 3, 157-162.
Arimond, A. (2010). A Distributed Systemfor Pattern Recognition and Machine
Learning. Kaiserslautern.
Jungermann, F. (2011). Documentation of the Information Extraction Plugin for
RapidMiner. Dortmund, Jerman: Department of Computer Science -
Artificial Intelligent Group.
Larose, D. T. (2005). Discovering Knowledge in Data : An Introduction to Data
Mining. Hoboken, New Jersey: John Wiley & Sons, Inc.
Maimon, O., & Rokach, L. (2010). Data Mining and Knowledge Discovery
Handbook. London: Springer Science+Business Media.
Megawati, N., Mukid, M.A., & Rahmawati, R. (2013). Segmentasi Pasar Pada
Pusat Perbelanjaan Menggunakan Fuzzy C-Means (Studi Kasus: Rita
Pasaraya Cilacap). Jurnal Gaussian Vol 2, No 4, 343-350.
Moertini, V. S. (2002). Data Mining Sebagai Solusi Bisnis. Integral , 7 (No. 1).
Prasetyo, E. (2012). Data Mining Konsep dan Aplikasi Menggunakan Matlab.
Yogyakarta : Penerbit ANDI.
Purnamasari, S.B., Yasin, H., & Wuryandari, T. (2014)., Pemilihan Cluster

Optimum Pada Fuzzy C-Means (Studi Kasus: Pengelompokan
Kabupaten/Kota Di Provinsi Jawa Tengah Berdasarkan Indikator Indeks
Pembangunan Manusia). Jurnal Gaussian Vol 3, No 3, 491-198.
Rudy, Wahyudiarti, R., Megaputri, V., & Wihardini, R. (2008). Analisis Dan
Perancangan E-Commerce (Studi Kasus : Roemah Soetera Batik Dan
Bordir). Seminar Nasional Informatika 2008 (semnasIF 2008) UPN
"Veteran" Yogyakarta. Yogyakarta.
Setiawan, F. H. (2011). Penerapan Fuzzy C-Means Dan Apriori Untuk
Rekomendasi Promosi Produk Berdasarkan Segmentasi Konsumen.
Semarang. Universitas Dian Nuswantoro, Semarang.
Suprihatin. (2011). Klastering K-Means untuk Penentuan Nilai Ujian. JUSI Vol. I,
No. I , 53-62.
Susanto, S., & Suryadi, D. (2010). Pengantar Data Mining : Menggali
Pengetahuan dari Bongkahan Data. Yogyakarta: Penerbit ANDI.
31
Ustadiyanto, R. (2001). Framework e-Commerce. Yogyakarta: Penerbit Andi.
Widiarini., & Wahono., R.S., (2015). Algoritma Cluster Dinamik untuk Optimasi
Cluster pada Algoritma K-Means dalam Pemetaan Nasabah Potensial.
Journal of Intelligent Systems, Vol. 1, No. 1
Xu, R., & Wunsch II, D. C. (2009). Clustering. Kanada: IEEE Press.
32
LAMPIRAN-LAMPIRAN
33
34
35
36
Rekapitulasi Anggaran
Laporan Akhir Penelitian DIPA Kopertis V Yogyakarta
Judul Penelitian : Optimasi Cluster Metode K-Means dengan Indeks Xie Beni
untuk Pemetaan Pengguna Marketplace Tokopedia
HONOR/JAM WAKTU HONOR PER

HONOR MINGGU
(RP) (JAM/MINGGU) TAHUN (RP)
PENELITI 6.500 8 15 780.000,-
SUB TOTAL (RP) 780.000,-
1. PERALATAN PENUNJANG
HARGA
HARGA
JUSTIFIKASI KUANTIT PERALATAN
MATERIAL SATUAN
PEMAKAIAN AS PENUNJANG
(RP)
(RP)
INTERNET DIGUNAKAN UNTUK
4 BULAN 250.000,- 1.000.000,-
AKSES INTERNET
FLASH DISK DIGUNAKAN UNTUK

1 PCS 150.000,- 150.000,-
MENYIMPAN DATA
PRINTER DIGUNAKAN UNTK

1 PCS 760.000,- 760.000,-
MENCETAK DATA
SUB TOTAL (RP) 1.910.000,-

2. BAHAN HABIS PAKAI
HARGA HARGA
JUSTIFIKASI
MATERIAL KUANTITAS SATUAN BAHAN HABIS
PEMAKAIAN
(RP) PAKAI (RP)
MATERIAL 1 KERTAS HVS 2 RIM 50.000,- 100.000,-
MATERIAL 2 KERTAS FOLIO 1 RIM 55.000,- 55.000,-
MATERIAL 3 TINTA PRINT WARNA 1 PAKET 250.000,- 250.000,-
MATERIAL 4 TINTA PRINT HITAM 1 PAKET 200.000,- 200.000,-
MATERIAL 5 ALAT TULIS 1 PAKET 20.000,- 20.000,-
MATERIAL 6 MATERAI 2 LBR 6.000,- 12.000,-
MATERIAL 7 PENJEPIT KERTAS 6 UNIT 2.500,- 15.000,-
MATERIAL 8 SPIDOL WARNA KECIL 1 PAKET 20.000,- 20.000,-
37
MATERIAL 9 SOLASI KECIL 2 PCS 2.500,- 5.000,-
MATERIAL 10 SOLASI BESAR 2 PAKET 5.000,- 10.000,-
MATERIAL 11 AMPLOP BESAR 7 UNIT 5.000,- 35.000,-
MATERIAL 12 AMPLOP KECIL 2 UNIT 2.500,- 5.000,-
MATERIAL 13 STAPLES SEDANG 1 UNIT 8.000,- 8.000,-
MATERIAL 14 MAP PLASTIK 5 UNIT 15.000,- 75.000,-
3. PERJALANAN
HARGA JUMLAH
JUSTIFIKASI KUANTITA
MATERIAL SATUAN PERJALAN
PERJALANAN S
(RP) AN (RP)
PERJALANAN PERJALANAN UNTUK
LOKAL SURVEI DAN 2 KALI 50.000,- 100.000,-
PENGAMBILAN DATA DI
LAPANGAN
PERJALANAN KONSULTASI
LOKAL PENELITIAN DAN 2 KALI 150.000,- 300.000,-
LAPORAN
PERJALANAN PERJALANAN
1 KALI 300.000,- 300.000,-
KE LUAR KOTA MENGIKUTI SEMINAR
SUBTOTAL (RP) 700.000,-
4. LAIN-LAIN
MATERIAL JUMLAH
HARGA
JUSTIFIKASI LAIN-LAIN KUANTITAS LAIN-LAIN
SATUAN (RP)
(RP)
PUBLIKASI PROCEEDING SEMINAR 1 PAKET 750.000,- 750.000,-
LAPORAN BIAYA JILID LAPORAN 5 PAKET 10.000,- 50.000,-
5.000.000,
TOTAL ANGGARAN
-
38
NOTA-NOTA
Surat Setoran Pajak (SSP) PPh ps. 21 Honorarium Peneliti
39
40
41
Pemakaian Internet
42
43
Pembelian Peralatan Penunjang
44
Pembelian Bahan Habis Pakai
45
Biaya Perjalanan
46
Lain-lain
Hasil penelitian akan dipublikasikan pada Seminar Nasional Teknologi Informasi
dan Multimedia 2017 STMIK AMIKOM Yogyakarta.
47
48

Elly Muningsih AMIK BSI Yogyakarta2016

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Elly Muningsih AMIK BSI Yogyakarta2016

Diunggah oleh

Hak Cipta:

Format Tersedia

HALAMAN SAMPUL

OPTIMASI CLUSTER METODE K-MEANS DENGAN INDEKS XIE BENI

Elly Muningsih, M.Kom

Dibiayai DIPA Kopertis Wilayah V Yogyakarta Tahun Anggaran 2016

AMIK BSI YOGYAKARTA

Judul Penelitian Optimasi Cluster Metode K-Means dengan

c. JabatanFungsional Asisten Ahli 150

Yogyakarta, 10 Oktober 2016

Elly Muningsih. M.Kom

Kata kunci : e-commerce, marketplace, metode K-Means, Indeks Xie Beni

Puji syukur alhamdulillah, kami panjatkan kehadirat Allah SWT yang

Tabel 1. Kategori Wilayah Pengiriman ............................................................... 17

Gambar 2.1 Tahapan proses KDD dalam database .............................................. 6

1.1 Latar Belakang

1.2 Identifikasi Masalah

1.3 Pembatasan Masalah

1.4 Perumusan Masalah

1.5 Signifikansi Penelitian

b. Hasil penelitian ini diharapkan dapat memberikan sumbangan bagi

c. Penelitian ini diharapkan dapat memberikan hasil yang lebih akurat

1.6 Kajian Riset Sebelumnya

1. Penelitian (Purnamasari, Yasin & Wuryandari, 2014) dengan judul

2. Penelitian (Afrisawati, 2013) dengan judul “Implementasi Data Mining

3. Penelitian (Widiarini & Wahono, 2015) dengan judul “Algoritma Cluster

2.1 Data Mining

Gambar 2.1. Tahapan proses KDD dalam database

2.2 Metode K-Means

2.2.2 Algortitma Metode K-Means

2.2.3 Optimasi Cluster Indeks Xie Beni

Semakin kecil nilai S, maka peng-clusteran tersebut semakin akurat.

2.3 Marketplace Tokopedia

Gambar 2.2. Tampilan Home Marketplace Tokopedia

Dikutip dari halaman web-nya yaitu www.tokopedia.com, dijelaskan

2.4 Software RapidMiner

Gambar 2.3. Graphical User Interface RapidMiner

(Sumber : Jungermann, 2011)

3.1 Tujuan Penelitian

3.2 Tempat dan Waktu Penelitian

Gambar 3.1 Kerangka Pemikiran Penelitian

3.5 Populasi dan Teknik Pengambilan Sampel

3.6 Metode Analisis

2. Tahap Selection dan Addition

Gambar 3.2 Data Primer Seller di Marketplace Tokopedia

5. Tahap Data Mining memilih tipe data mining yang cocok.

6. Tahap Data Mining memilih algoritma data mining.

7. Tahap Data Mining dalam penggunaan algoritma data mining.

4.1 Penerapan Metode K-Means dengan RapidMiner

4.2 Optimasi Indeks Xie Beni

4.3 Hasil Pemetaan Pengguna Marketplace Tokopedia

Afrisawati. (2013). Implementasi Data Mining Pemilihan Pelanggan Potensial

Purnamasari, S.B., Yasin, H., & Wuryandari, T. (2014)., Pemilihan Cluster

HONOR/JAM WAKTU HONOR PER

FLASH DISK DIGUNAKAN UNTUK

PRINTER DIGUNAKAN UNTK

SUB TOTAL (RP) 1.910.000,-

Anda mungkin juga menyukai