NASKAH PUBLIKASI
Diajukan Oleh :
MUHAMMADIYAH SURAKARTA
MARET 2015
PERBANDINGAN 3 METODE DALAM DATA MINING UNTUK MENENTUKAN
STRATEGI PENJUALAN PRODUK MAKANAN DAN MINUMAN
PADA TOSERBA LESTARI BARU GELOMONG
Abstraksi
X1 Kategori 0,560
Berdasarkan perhitungan tabel 4 didapat
X2 Harga 0,659
nilai Information Gain sama-sama
X3 Bulan 0,292
memiliki hasil 0,000 bits, sehingga untuk
X4 Tempat 0,012
internal node selanjutnya diambil dari
salah satu variabel. Contohnya adalah
Berdasarkan perhitungan tabel 2 didapat
variabel Kategori.
nilai Information Gain tertinggi berupa
2. Implementasi K-means (custering)
variabel harga, dimana memiliki nilai
Pada metode ini dilakukan perhitungan
sebesar 0,659 bits dan berhak menduduki
dengan berbagai tahap, diantaranya :
posisi root (akar).
a. Menentukan cluster
b. Menentukan Internal node Pada tahap ini menggunakan 5 cluster
Hasil Information Gain dilihat dalam tabel b. Menentukan Centroid
3. Tabel 5. Data Centroid
Tabel 3. Hasil Internal node Centroid
Variabel Keterangan Gain Cluster
X1 X2 X3 X4
X1 Kategori 0,639
X3 Bulan 2,194 1-60 5,4 6,2 52,4 0
X4 Tempat 0,058 61-120 6,2 7 59,2 9,4
121-180 21,2 22,8 76,8 5
Berdasarkan hasil perhitungan tabel 3 181-240 33,6 36,8 75,6 9,6
didapat nilai Information Gain tertinggi 241-302 47,6 37,8 77,6 6,2
berupa variabel Bulan, dimana memiliki
c. Menentukan Ecludian distance Pada perbandingan Tabel 6 menunjukkan
Pada tahap ini menggunakan rumus bahwa K-Means (Clustering) merupakan
ecludian distance untuk mencari jarak metode yang memiliki tingkat precision
antar data dalam melakukan dan accuracy yang lebih tinggi dari
pengelompokan. metode yang lain, kemudian pada recall
3. Implementasi Regresi Linier regresi linear memiliki nilai lebih tinggi
Pada metode ini menggunakan hasil daripada metode yang lain.
rumus yang dihasilkan oleh RapidMiner. KESIMPULAN
a. - 0.065 * Kategori - 0.725
Berdasarkan hasil penelitian, maka dapat
b. - 0.239 * Kategori + 0.130 * Harga -
ditarik kesimpulan bahwa :
0.496
1. Berdasarkan hasil perbandingan dari 3
c. - 0.169 * Kategori + 0.091 * Harga -
metode yaitu Decision tree, K-means
0.642
dan Regresi Linear, variabel yang
d. 0.136 * Kategori - 0.236 * Harga -
paling berpengaruh terhadap hasil
0.421
penjualan adalah variabel harga.
e. 0.194 * Kategori - 0.949
2. Berdasarkan dari nilai precision dan
f. 0.131 * Kategori + 0.028 * Harga
accuracy, metode K-Means memiliki
PERBANDINGAN METODE
nilai lebih tinggi daripada algoritma
Setelah semua metode dianalisa maka
yang lain dengan nilai precision
selanjutnya melakukan perbandingan 3
sebesar 42,60% dan nilai accuracy
metode tersebut dalam hitungan Precision,
sebesar 41,40%.
Recall, dan Accuracy.
3. Berdasarkan nilai recall, regresi linier
Tabel 6. Data Perbandingan.
memiliki nilai lebih tinggi
Metode Precision Recall Accuracy
dibandingkan dengan metode yang lain
Decision 32,94% 45.90% 25,50%
dengan nilai recall sebesar 49,18% .
Tree
Kusrini dan Luthfi, E.T, 2009, Algoritma Data Mining¸ Andi Offset, Yogyakarta