Anda di halaman 1dari 14

PERBANDINGAN 3 METODE DALAM DATA MINING UNTUK MENENTUKAN

STRATEGI PENJUALAN PRODUK MAKANAN DAN MINUMAN


PADA TOSERBA LESTARI BARU GELOMONG

NASKAH PUBLIKASI

PROGRAM STUDI INFORMATIKA


FAKULTAS KOMUNIKASI DAN INFORMATIKA

Diajukan Oleh :

Deny Arga Felani

Yusuf Sulistyo Nugroho, S.T, M.Eng

PROGRAM STUDI INFORMATIKA

FAKULTAS KOMUNIKASI DAN INFORMATIKA UNIVERSITAS

MUHAMMADIYAH SURAKARTA

MARET 2015
PERBANDINGAN 3 METODE DALAM DATA MINING UNTUK MENENTUKAN
STRATEGI PENJUALAN PRODUK MAKANAN DAN MINUMAN
PADA TOSERBA LESTARI BARU GELOMONG

Deny Arga Felani,Yusuf Sulistyo Nugroho


Program Studi Informatika, Fakultas Komunikasi dan Informatika
Universitas Muhammadiyah Surakarta
Email : argaseifer@gmail.com

Abstraksi

Toserba Lestari Baru adalah Perusahaan besar yang bergerak di bidang


penjualan. Data yang tersimpan akan dimanfaatkan menggunakan data Mining
sehingga dapat digunakan sebagai pendukung keputusan untuk mencari suatu
informasi yang berguna dalam evaluasi data yang digunakan. Berbagai metode
yang terdapat dalam data Mining, maka penulis akan melakukan perbandingan 3
metode dari data Mining tersebut.
Penggunaan metode decision tree, K-means (clustering) dan regresi linear
diimplementasikan menggunakan aplikasi RapidMiner, yang nantinya akan
dilakukan analisis dari masing-masing metode tersebut untuk menentukan strategi
penjualan pada Toserba Lestari Baru Gemolong.
Penelitian ini dilakukan dengan sekelompok data untuk mengetahui
persentase nilai precision, recall dan accuracy. Hasil dari penelitian tersebut
bahwa metode K-Means (clustering) memiliki nilai lebih baik dari metode yang
lain pada sisi precision dan accuracy, sedangkan metode Regresi Linier memiliki
nilai recall lebih baik dari metode yang lain.
Kata Kunci : Decision Tree, Clustering, Regresi linier.
PENDAHULUAN Berdasarkan permasalahan tersebut,
maka dalam penelitian ini akan
Toserba Lestari Baru adalah
dilakukan perbandingan dengan
sebuah perusahaan besar yang
menggunakan 3 algoritma dalam
berlokasi di Jl. Sukowati Gemolong
data mining untuk menentukan
dan bergerak di bidang penjualan.
metode yang terbaik dalam
Perusahaan ini setiap harinya harus
mengetahui evaluasi dalam
memenuhi kebutuhan konsumen dan
penjualan yang bisa dimanfaatkan
dituntut untuk dapat mengambil
oleh perusahaan.
keputusan yang tepat dalam
TINJAUAN PUSTAKA
menentukan strategi penjualan.
1. Data Mining
Untuk dapat melakukan hal tersebut,
Data mining adalah proses
perusahaan membutuhkan sumber
mencari pola atau informasi
informasi yang cukup banyak untuk
menarik dalam data terpilih dengan
dapat di analisis lebih lanjut.
menggunakan teknik atau metode
Pada Toserba Lestari Baru
tertentu. Pemilihan metode yang
banyak sekali transaksi yang tercatat.
tepat tergantung pada tujuan dan
Ketersediaan data penjualan yang
proses KDD (Knowledge Discovery
sangat besar cenderung hanya untuk
in Database) secara keseluruhan.
dijadikan arsip dan laporan serta
Data mining mampu menganalisis
belum dimanfaatkan secara optimal
data yang besar menjadi informasi
hal ini disebabkan belum adanya
berupa pola yang mempunyai arti
sistem pendukung keputusan dan
bagi pendukung keputusan.
metode yang dapat digunakan untuk
(Sunjaya, 2010)
merancang sebuah strategi bisnis
2. Algoritma C.4.5
dalam meningkatkan penjualan.
Algoritma C4.5 merupakan
Dengan melakukan data
algoritma yang digunakan untuk
mining, ada beberapa metode yang
membentuk pohon keputusan.
dapat digunakan untuk melakukan
Sedang pohon keputusan dapat
perbandingan dalam kasus diatas,
diartikan suatu cara untuk
diantaranya menggunakan algoritma
mengklarifikasi yang sangat kuat.
C.45, K-Means dan Regresi linier.
Pohon keputusan dapat membagi Penggunaan data mining
kumpulan data yang besar menjadi untuk menentukan strategi penjualan
himpunan-himpunan record yang adalah masalah yang harus
lebih kecil dengan menerapkan diselesaikan, untuk mengetahui
serangkaian aturan keputusan. faktor yang mempengaruhi.
(Kusrini dan Luthfi, 2009) Metode yang digunakan ada
3. Algoritma K-Means beberapa, dari hal tersebut nanti akan
K-Means merupakan salah dilakukan perbandingan dari
satu metode pengelompokan data non beberapa metode tersebut untuk
hierarki yang berusaha mempartisi menentukan metode yang paling
data yang ada ke dalam bentuk dua baik dalam menangani masalah
atau lebih kelompok. Metode ini tersebut.
mempartisi data kedalam kelompok 2. Analisis Kebutuhan
sehingga data yang berkarakteristik Analisis kebutuhan adalah
berbeda dikelompok-kan ke dalam menentukan kebutuhan apa yang
kelompok yang lain. (Prasetyo, 2012). diperlukan seperti perangkat keras,
4. Regresi Linier perangkat lunak dan materi yang
Analisis regresi adalah teknik mendukung.
statistik untuk permodelan dan Adapun tahap yang diperlukan
investigasi hubungan dua atau lebih dalam penelitian antara lain :
variabel. Yang sering dipakai adalah a. Analisis data untuk pemilihan atribut
regresi linear sederhana. Dalam yang diperlukan dalam melakukan
analisis regresi satu atau lebih penelitian.
variabel independent / predictor Tabel 1. Data Atribut
yang biasa diwakili dengan notasi x Atribut Variabel
dan satu variabel respon yang biasa Jumlah terjual Y
diwakili dengan notasi y. (Santosa, Kategori Produk X1
2007) Harga X2
METODE PENELITIAN Bulan X3
1. Identifikasi Masalah Tempat X4
HASIL DAN PEMBAHASAN
Penelitian yang dilakukan
bertujuan melakukan perbandingan
metode dalam data mining untuk
mengklasifikasikan data penjualan
pada Toserba Lestari Baru
Gemolong menggunakan variabel-
variabel yang sudah ditentukan.
1. Hasil Implementasi Decision Tree
pada Rapid Miner.
Gambar 1. Rancangan Decision
Pada implementasi data Tree
mining ini untuk menganalisa
Hasil gambar 1 kemudian
penentuan kalsifikasi penjualan pada
dieksekusi dan dilihat menggunakan
Toserba Lestari Baru menggunakan
Scatter Plot dilihat pada gambar 2.
aplikasi Rapid Miner 5. Dalam
analisa pohon keputusan (Decision
Tree) tersebut.
Rancangan proses dengan metode
Decision Tree menggunakan aplikasi
RapidMiner 5 ditunjukkan pada
Gambar 1.

Gambar 2. Hasil RapidMiner pada metode Decision Tree


2. Hasil Implementasi K-means
(Clutering) pada Rapid Miner
Pada implementasi data
mining ini untuk menganalisa
penentuan klasifikasi penjualan pada
Toserba Lestari Baru menggunakan
aplikasi RapidMiner. Dalam analisa
Clustering tersebut,
Gambar 3. Rancangan Clustering
Rancangan proses dengan metode
Hasil gambar 3 kemudian
Clustering menggunakan aplikasi
dieksekusi dan dilihat menggunakan
Rapid Miner 5 ditunjukkan pada
Scatter Plot dilihat pada gambar 4.
Gambar 3.

Gambar 4. Hasil RapidMiner pada metode K-Means (Clustering)


3. Hasil Implementasi Regresi Linear
pada Rapid Miner

Pada implementasi data


mining ini untuk menganalisa
penentuan kalsifikasi penjualan pada
Toserba Lestari Baru menggunakan
aplikasi RapidMiner.

Rancangan proses dengan


metode Regresi Linear
menggunakan aplikasi RapidMiner Gambar 5. Rancangan Regresi
ditunjukkan pada gambar 5. Linier
Kemudian dieksekusi untuk
melihat hasil dari scatter plot, hasil
dilihat pada gambar 6.

Gambar 6. Hasil RapidMiner pada metode Regresi Linier


ANALISA DAN PEMBAHASAN nilai sebesar 2,194 bits dan berhak
menduduki internal node pada pohon
1. Implementasi Decision Tree
keputusan.
Berikut tahap-tahap implementasi pada c. Menentukan Leaf node
metode decision tree : Hasil Information Gain dari variabel harga

a. Menentukan Root yang berupa harga≤3000 dan bulan Januari


diperoleh seperti dalam tabel 4.
Hasil Information Gain masing-masing
Tabel 4. Hasil leaf node
variabel pada tabel 2.
Variabel Keterangan Gain
Tabel 2. Hasil root node X1 Kategori 0,000

Variabel Keterangan Gain X4 Tempat 0,000

X1 Kategori 0,560
Berdasarkan perhitungan tabel 4 didapat
X2 Harga 0,659
nilai Information Gain sama-sama
X3 Bulan 0,292
memiliki hasil 0,000 bits, sehingga untuk
X4 Tempat 0,012
internal node selanjutnya diambil dari
salah satu variabel. Contohnya adalah
Berdasarkan perhitungan tabel 2 didapat
variabel Kategori.
nilai Information Gain tertinggi berupa
2. Implementasi K-means (custering)
variabel harga, dimana memiliki nilai
Pada metode ini dilakukan perhitungan
sebesar 0,659 bits dan berhak menduduki
dengan berbagai tahap, diantaranya :
posisi root (akar).
a. Menentukan cluster
b. Menentukan Internal node Pada tahap ini menggunakan 5 cluster
Hasil Information Gain dilihat dalam tabel b. Menentukan Centroid
3. Tabel 5. Data Centroid
Tabel 3. Hasil Internal node Centroid
Variabel Keterangan Gain Cluster
X1 X2 X3 X4
X1 Kategori 0,639
X3 Bulan 2,194 1-60 5,4 6,2 52,4 0
X4 Tempat 0,058 61-120 6,2 7 59,2 9,4
121-180 21,2 22,8 76,8 5
Berdasarkan hasil perhitungan tabel 3 181-240 33,6 36,8 75,6 9,6
didapat nilai Information Gain tertinggi 241-302 47,6 37,8 77,6 6,2
berupa variabel Bulan, dimana memiliki
c. Menentukan Ecludian distance Pada perbandingan Tabel 6 menunjukkan
Pada tahap ini menggunakan rumus bahwa K-Means (Clustering) merupakan
ecludian distance untuk mencari jarak metode yang memiliki tingkat precision
antar data dalam melakukan dan accuracy yang lebih tinggi dari
pengelompokan. metode yang lain, kemudian pada recall
3. Implementasi Regresi Linier regresi linear memiliki nilai lebih tinggi
Pada metode ini menggunakan hasil daripada metode yang lain.
rumus yang dihasilkan oleh RapidMiner. KESIMPULAN
a. - 0.065 * Kategori - 0.725
Berdasarkan hasil penelitian, maka dapat
b. - 0.239 * Kategori + 0.130 * Harga -
ditarik kesimpulan bahwa :
0.496
1. Berdasarkan hasil perbandingan dari 3
c. - 0.169 * Kategori + 0.091 * Harga -
metode yaitu Decision tree, K-means
0.642
dan Regresi Linear, variabel yang
d. 0.136 * Kategori - 0.236 * Harga -
paling berpengaruh terhadap hasil
0.421
penjualan adalah variabel harga.
e. 0.194 * Kategori - 0.949
2. Berdasarkan dari nilai precision dan
f. 0.131 * Kategori + 0.028 * Harga
accuracy, metode K-Means memiliki
PERBANDINGAN METODE
nilai lebih tinggi daripada algoritma
Setelah semua metode dianalisa maka
yang lain dengan nilai precision
selanjutnya melakukan perbandingan 3
sebesar 42,60% dan nilai accuracy
metode tersebut dalam hitungan Precision,
sebesar 41,40%.
Recall, dan Accuracy.
3. Berdasarkan nilai recall, regresi linier
Tabel 6. Data Perbandingan.
memiliki nilai lebih tinggi
Metode Precision Recall Accuracy
dibandingkan dengan metode yang lain
Decision 32,94% 45.90% 25,50%
dengan nilai recall sebesar 49,18% .
Tree

K-Means 42,60% 40,31% 41,40%

Regresi 32,35% 49,18% 29,47%


Linier
DAFTAR PUSTAKA

Kusrini dan Luthfi, E.T, 2009, Algoritma Data Mining¸ Andi Offset, Yogyakarta

Prasetyo, Eko.2012. Data Mining Konsep dan Aplikasi Menggunakan


Matlab.Yogyakarta: Andi
Santoso, Budi. 2007. Data Mining:Teknik Pemanfaatan data untuk keperluan
bisnis, Yogyakarta : Graha Ilmu.
Santoso, S. 2010. Statistik Multivariat. Jakarta : Elex Media Komputindo.
Sunjaya. 2010. Aplikasi Mining Data Mahasiswa dengan Metode Klasifikasi
DecisionTree. Seminar Nasional Aplikasi Teknologi Informasi 2010.
Yogyakarta.
BIODATA PENULIS

Nama : Deny Arga Felani


NIM : L200110149
Tempat, Tanggal Lahir : Surakarta, 21 Desember 1993
Jenis Kelamin : Laki-laki
Agama : Islam
Pendidikan : S1
Fakultas : Informatika
Universitas : Universitas Muhammadiyah Surakarta
Alamat : Jl. A. Yani Tromol Pos 1 Pabelan, Kartasura
Telp./Fax : (0271)717417, 719483 / (0271)714448

Alamat Rumah : Karangjati, Kalijambe, Sragen


Nomor HP : 085642188421
Email : argaseifer@gmail.com

Anda mungkin juga menyukai