Akdm Bigpro

LAPORAN BIG PROJECT
Analisis Keputusan dan Data Mining
Disusun Oleh:
Dela Sriwahyuni (19522096)
Nur Azizah Rahmi (19522156)
Dosen Pengampu:
Annisa Uswatun Khasanah, S.T., M.Sc
PROGRAM STUDI TEKNIK INDUSTRI

FAKULTAS TEKNOLOGI INDUSTRI
UNIVERSITAS ISLAM INDONESIA
YOGYAKARTA
2021
TAHAP 1
A. Menjelaskan Variabel yang Digunakan Berdasarkan Referensi

Berikut ini adalah variabel-variabel yang akan digunakan dalam penelitian dan
penjelasan dari masing-masing variabel:
1. Usia
Kebutuhan sehari-hari masing-masing customer pun berbeda tiap usianya.
Kebutuhan dan keinginan pelanggan berubah sesuai dengan usia, tidak heran
jika apa yang digemari anak muda berbeda dengan orang tua (Prastyawan, et
al., 2018).
2. Pendapatan/Uang Saku
Pendapatan tergantung pada situasi ekonomi, mereka yang baik secara
finansial memiliki banyak pilihan, sedangkan mereka yang tidak baik secara
finansial memiliki pilihan yang terbatas (Hanum dan Hidayat, 2017).
Pendapatan/uang saku akan berdampak pada consumer pooling karena ketika
konsumen memiliki pendapatan/uang saku yang cukup atau bahkan lebih, hal
ini menyebabkan pola konsumsi tinggi dan sebaliknya. Jadi supermarket
mendapat manfaat dari ini.
3. Domisili
Tempat tinggal atau domisili yang berkaitan dengan lokasi yang strategis akan
mendorong konsumen untuk membeli dari lokasi tersebut (Oliver, 2013).
Perusahaan dapat mempertimbangkan faktor-faktor seperti tempat tinggal
pelanggan dan jarak ke toko terdekat karena konsumen memiliki
kecenderungan akan sering berbelanja di tempat atau toko yang dekat dengan
rumahnya.
4. Nominal Tiap Transaksi
Monetary merupakan nilai dari besarnya nominalnya dalam tiap transaksi
pelanggan, seorang pelanggan yang cenderung melakukan transaksi dengan
nilai monetary tinggi cenderung memberikan keuntungan yang besar bagi
perusahaan (Hadi, F., et al, 2017). Total biaya yang dikeluarkan dalam sekali
belanja dapat mempengaruhi pengelompokkan konsumen dikarenakan
pengeluaran setiap konsumen berbeda-beda seperti konsumen yang sudah
memiliki rumah tangga dengan konsumen yang tinggal sendiri, kebutuhan
konsumen yang berumah tangga akan konsumsi, peralatan rumah tangga, dan
lain-lain akan lebih besar sehingga total biaya yang dikeluarkan dalam sekali
belanja pun cenderung akan lebih besar.
5. Frekuensi Kedatangan
Frekuensi menunjukan seberapa sering pelanggan melakukan transaksi,
semakin sering pelanggan melakukan transaksi maka akan berdampak pada
semakin besarnya keuntungan perusahaan, namun hal ini juga bergantung pada
nilai nominal transaksi pelanggan tersebut (Hadi, F., et al, 2017).
B. Menjelaskan langkah-langkah AHP

Berikut merupakan pengolahan data berdasarkan langkah-langkah dengan metode
Analytical Hierarchy Process (AHP) :
a. Mendefinisikan masalah dan menentukan solusi untuk mencapai sebuah
tujuan.
PT ABC ingin meningkatkan daya saing agar dapat tetap bertahan dan
berkembang dan berharap untuk dapat selalu menciptakan strategi yang dapat
meningkatkan penjualan. Untuk itu hal pertama yang dilakukan oleh PT ABC
adalah mengenali konsumen mereka dengan melakukan customer
segmentation.
b. Membuat struktur hierarki yang diawali dengan tujuan utama.
Gambar 1. Struktur Hierarki

Pada struktur AHP, level paling tinggi atau paling atas adalah tujuan,
yang dimana disini tujuannya adalah strategi meningkatkan penjualan. Level
selanjutnya adalah kriteria, yang terdiri dari kriteria usia, nominal tiap
transaksi, pendapatan/uang saku, jarak tempat tinggal, dan frekuensi
kedatangan.
c. Membentuk Matriks Perbandingan Berpasangan.
Perbandingan dilakukan berdasarkan kebijakan pembuat keputusan dengan
memberikan bobot untuk menilai tingkat kepentingan satu elemen terhadap
elemen lainnya. Berikut pembobotan terhadap kriteria telah ditentukan:
Gambar 2. Perbandingan Antar Kriteria

Berdasarkan Gambar 2. diketahui perbandingan bobot nilainya adalah sebagai
berikut:
- Usia & Pendapatan/Uang Saku
Usia diantara tidak sedikit lebih penting dan tidak lebih penting dari
Pendapatan/Uang Saku (bobot Usia = 1/4)
- Usia & Jarak Tempat Tinggal
Usia diantara tidak sedikit lebih penting dan tidak lebih penting dari Jarak
Tempat Tinggal (bobot Usia = 1/4)
- Usia & Nominal Tiap Transaksi
Usia tidak lebih penting dari Nominal Tiap Transaksi (bobot Usia = 1/5)
- Usia & Frekuensi Kedatangan
Usia diantara tidak lebih penting dan tidak lebih mutlak penting dari
Frekuensi Kedatangan (bobot Usia = 1/6)
- Pendapatan/Uang Saku & Jarak Tempat Tinggal
Pendapatan/Uang Saku diantara sedikit lebih penting dan lebih penting
dari Jarak Tempat Tinggal (bobot Pendapatan/Uang Saku = 4)
- Pendapatan/Uang Saku & Nominal Tiap Transaksi
Pendapatan/Uang Saku diantara sama pentingnya dan sedikit lebih penting
dari Nominal Tiap Transaksi (bobot Pendapatan/Uang Saku = 2)
- Pendapatan/Uang Saku & Frekuensi Kedatangan
Pendapatan/Uang Saku diantara tidak sama pentingnya dan tidak sedikit
lebih penting dari Frekuensi Kedatangan (bobot Pendapatan/Uang Saku =
1/2)
- Jarak Tempat Tinggal & Nominal Tiap Transaksi
Jarak Tempat Tinggal tidak sedikit lebih penting dari Nominal Tiap
Transaksi (bobot Jarak Tempat Tinggal = 1/3)
- Jarak Tempat Tinggal & Frekuensi Kedatangan

Jarak Tempat Tinggal tidak lebih penting dari Frekuensi Kedatangan
(bobot Jarak Tempat Tinggal = 1/5)
- Nominal Tiap Transaksi & Frekuensi Kedatangan
Nominal Tiap Transaksi tidak lebih penting dari Frekuensi Kedatangan
(bobot Total Transaksi = 1/5)
d. Melakukan uji konsistensi
Berikut merupakan hasil perhitungan nilai konsistensi untuk perbandingan
antar kriteria:
Dari perhitungan tersebut didapatkan hasil konsistensi indeks (CI) sebesar

0,0941 dan uji konsistensi (CR) sebesar 0,0840. Hal ini menunjukkan bahwa
perbandingan berpasangan antar kriteria sudah konsisten dikarenakan nilai dari
hasil uji konsistensi <= 0,1.
e. Kesimpulan
Berdasarkan perhitungan yang telah dilakukan, diketahui urutan variabel
prioritas dengan berdasarkan nilai eugen vektor untuk kriteria adalah sebagai
berikut:
1. Frekuensi Kedatangan (eugen vector = 0,4494)
2. Pendapatan/Uang Saku (eugen vector = 0,2456)
3. Nominal Tiap Transaksi (eugen vector = 0,1631)
4. Jarak Tempat Tinggal (eugen vector = 0,0948)
5. Usia (eugen vector = 0,0471)
TAHAP 2
1. Rekapitulasi Data Kuesioner

Pada tahap ini dilakukan survey terhadap pelanggan Supermarket Mirota Jakal
KM 6 dengan tujuan dapat mengetahui perilaku konsumen pada saat berbelanja.
Berikut merupakan rekapitulasi data kuesioner:
Setelah melakukan rekap data kuesioner kami melakukan preprocessing data
berupa cleaning data secara keseluruhan untuk ketiga metode, sehingga nantinya
data yang akan diolah menggunakan ketiga metode sudah bebas dari data
incomplete, inkonsisten, dan noise. Selanjutnya dalam proses pengolahan data untuk
tiap metode dapat dilanjutkan dengan melakukan proses preprocessing data lainnya
yang dibutuhkan sesuai dengan proses yang dilakukan. Berikut merupakan hasil
cleaning data secara keseluruhan:
Berdasarkan hasil cleaning data, terdapat 16 data noise sehingga data tersebut
dibuang, sehingga diperoleh data yang nantinya akan digunakan dalam tahap data
mining berjumlah 150 data.
2. Pengolahan Data
A. Tugas 1 : Pengelompokan Konsumen
Pada tahap ini digunakan metode clustering dengan algoritma K-Means. Menurut
Agusta, Clustering adalah metode penganalisaan data, yang sering dimasukkan
sebagai salah satu metode data mining, yang tujuannya adalah untuk
mengelompokkan data dengan karakteristik yang sama ke suatu “wilayah‟ yang
sama dan data dengan karakteristik yang berbeda ke “wilayah‟ yang lain. Salah
satu sub kategori data mining dan merupakan proses di mana sampel yang sama
dibagi menjadi kelompok-kelompok yang disebut cluster. Setiap cluster termasuk
sampel dimana anggota yang mirip satu sama lain dan berbeda dengan sampel
yang tersedia dari kelompok lain. Clustering juga merupakan pengelompokan,
pengamatan, dan pembentukan data berdasarkan kelas data tertentu ke dalam
kelas objek yang memiliki kemiripan. Semakin besar kemiripan objek dalam
suatu kluster akan bernilai maksimal dan semakin besar perbedaan tiap kluster
maka kualitas analisis cluster bernilai minimal.
1. Preprocessing Data
Adapun rekapitulasi data dan preprocessing data dari hasil pengisian
kuesioner terkait produk yang sering dibeli secara bersamaan yaitu sebagai
berikut:
a. Rekapitulasi Data
Berikut merupakan data kuesioner yang telah melalui tahap cleaning data
dan reduksi data atau tahapan yang menghilangkan data yang salah atau
data yang tidak dibutuhkan dalam penelitian ini:
A. Output dan Analisis Clustering
Berikut merupakan tahapan dalam metode cluster dengan algoritma K-Means:
1. Descrptive Statistics
Sebelum melakukan tahap clustering perlu dilakukan adanya descriptive
statistics untuk melihat jumlah data yang digunakan pada variabelnya yaitu
berjumlah 150 dan untuk usia dapat dilihat usia terendah yaitu 15 dan usia
tertinggi 42 dengan rata rata usia 21 dan standar deviasinya 3,36956. Untuk
minimum uang saku sebesar 500.000 dan maximumnya 10.000.000, meannya
sebesar 2.191.000 dengan standar deviasi sebesar 1545007,873. Untuk Jarak
tempat tinggal terdekat berjarak 1 km dan terjauh 17 km dengan rata – rata
jaraknya 5,7 km dengan standar deviasinya 2,56020. Untuk nominal transaksi
paling sedikit sebanyak Rp.2.500 dan terbanyak Rp.1.000.000 dengan rata –
rata transaksinya sebanyak Rp.1.15.710 dan standar deviasinya sebesar
169579,3282. Untuk Frekuensi Kedatangan paling sedikit sebanyak 1 kali
dalam sebulan dan paling banyak 6 kali dalam sebulan dengan rata rata
frekuensi kedatangan sebanyak 2 kali dalam sebulan dengan nilai standar
deviasinya 1,16826.
2. Initial Cluster Centers
Sebelum dilakukan iterasi akan ditunjukkan tampilan proses sementara data

clustering dalam bentuk Initial Cluster Centers. Berikut merupakan analisis
pada setiap cluster-nya :
Cluster 1
 Zscore (Usia) menunjukkan nilai dominan Zscore pada variabel usia sebesar
5,57342
 Zscore (Pendapatan/Uang Saku) menunjukkan nilai dominan Zscore pada
variabel Pendapatan/Uang Saku sebesar 5,05434
 Zscore (Jarak Tempat Tinggal) menunjukkan nilai dominan Zscore pada
variabel jarak tempat tinggal sebesar 0,51558
 Zscore (Nominal Tiap Transaksi) menunjukkan nilai dominan Zscore pada
variabel Nominal Tiap Transaksi sebesar - 0,5644
 Zscore (Frekuensi Kedatangan) menunjukkan nilai dominan Zscore pada
variabel frekuensi kedatangan sebesar 0,65054
Cluster 2
 Zscore (Usia) menunjukkan nilai dominan Zscore pada variabel usia sebesar
1,12181
variabel Pendapatan/Uang Saku sebesar 1,17087
variabel jarak tempat tinggal sebesar – 0,26560
variabel Nominal Tiap Transaksi sebesar 5,21461
variabel frekuensi kedatangan sebesar – 1,06141
Cluster 3
 Zscore (Usia) menunjukkan nilai dominan Zscore pada variabel usia sebesar –
1,84594
variabel Pendapatan/Uang Saku sebesar – 0,83559
variabel jarak tempat tinggal sebesar – 0,90618
variabel Nominal Tiap Transaksi sebesar – 0,38749
variabel frekuensi kedatangan sebesar 3,21846
3. Iteration History
Iteration history merupakan langkah atau tahapan untuk mengetahui seberapa
banyak iterasi yang harus dilakukan untuk mendapatkan cluster yang tepat dan
untuk melihat berapa kali data itu diolah. Pada penelitian ini terdapat 4 kali
pengolahan data untuk mendapatkan cluster yang tepat. Disini didapatkan nilai
jarak minimum antar cluster-nya sebesar 7,994
4. Jumlah anggota masing - masing Cluster yang terbentuk

Berikut merupakan output dari Number of Cases in each Cluster:
Berdasarkan output dari Number of Cases in each Cluster menunjukkan

bahwa jumlah anggota setiap cluster yang terbentuk yaitu:
- Cluster 1 terdiri dari 9 anggota
5. Final Cluster Centers
Berikut merupakan hasil output dari final cluster centers:
Berikut analisis final cluster centers pada setiap cluster:
- Cluster 1
Dalam cluster 1 terdiri dari member dengan karakteristik usia dominan
diatas rata - rata total, pendapatan atau uang saku dominan diatas rata -
rata total, jarak tempat tinggal dominan berada di atas rata - rata total,
nominal tiap transaksi dominan berada pada rata - rata total dan
frekuensi kedatangan dominan berada diatas rata - rata total. sehingga
cluster 1 termasuk cluster yang paling potensial.
- Cluster 2
diatas rata - rata total, pendapatan atau uang saku dominan diatas rata -
rata total, jarak tempat tinggal dominan berada di atas rata - rata total,
nominal tiap transaksi dominan berada diatas rata - rata total dan
frekuensi kedatangan dominan berada dibawah rata - rata total. sehingga
cluster 2 termasuk cluster yang cukup potensial.
- Cluster 3
dibawah rata - rata total, pendapatan atau uang saku dominan dibawah
rata - rata total, jarak tempat tinggal dominan berada dibawah rata - rata
total, nominal tiap transaksi dominan berada dibawah rata - rata total dan
frekuensi kedatangan dominan berada diatas rata - rata total. sehingga
cluster 3 termasuk cluster yang kurang potensial.
B. Analisis Hasil Crosstab Menggunakan Metode Non Hierarchy
Berdasarkan gambar Final Cluster diatas menunjukkan bahwa nilai dari setiap
variabel yang dominan pada setiap cluster-nya.
C. Tugas 2 : Penentuan pola pembelian konsumen dengan mengetahui produk

yang sering dibeli secara bersamaan.
Pada tahap ini digunakan metode Association Rule dengan penerapan Market
Basket Analysis serta menggunakan algoritma FP-Growth. Association Rule
dikenal sebagai salah satu teknik data mining yang menjadi dasar dari berbagai
teknik data mining lainnya (Maulana & Fajrin, 2018). Menurut Wijayanti (2017)
Association rules merupakan salah satu teknik data mining untuk menemukan
suatu hubungan antar Item dalam suatu dataset yang besar yang telah ditentukan.
Aplikasi Association Rule berguna untuk menganalisa isi keranjang belanja di
pasar swalayan, karena itu juga Association Rule sering disebut dengan istilah
Market Basket Analysis (Laboratorium SIOP, 2019). Berikut merupakan tahapan
dalam metode AR-MBA dengan algoritma FP-Growth:
kuesioner terkait produk yang sering dibeli secara bersamaan yaitu sebagai
berikut:
b. Rekapitulasi Data
c. Pembagian Departemen
Berikut merupakan pembagian departemen berdasarkan dari jenis-jenis
produknya:
d. Data Integrasi
Berikut merupakan data integrasi yang telah dibagi-bagi berdasarkan
departemennya:
e. Data Transformasi
Melakukan transformasi data ke dalam bentuk bilangan biner, dengan
angka 1 merepresentasikan bahwa suatu departemen terbeli di transaksi
tersebut dan angka 0 merepresentasikan departemen yang tidak terbeli di
transaksi tersebut. Berikut merupakan data yang telah ditransformasikan:
Transaks
i DEPT 1 DEPT 2 DEPT 3 DEPT 4 DEPT 5 DEPT 6 DEPT 7 DEPT 8 DEPT 9
1 1 0 1 0 0 0 0 0 0
2 1 0 1 1 0 0 0 0 0
3 1 0 0 0 1 0 0 0 0
4 1 0 1 1 0 1 0 0 0
5 1 0 1 0 0 1 0 0 0
6 1 0 1 0 1 0 0 0 0
7 1 0 1 0 1 0 0 0 0
8 1 0 1 0 0 0 0 0 0
9 1 0 0 1 0 1 0 0 0
10 1 0 0 1 0 0 0 0 0
11 0 0 1 1 0 0 0 0 0
12 1 1 1 0 1 0 0 0 0
13 1 0 0 0 1 1 0 0 0
14 1 0 1 0 0 0 1 0 0
15 1 0 1 1 0 0 0 0 0
16 1 0 0 0 1 1 0 0 0
17 1 0 1 0 0 0 1 0 0
18 1 0 0 1 1 0 0 0 0
19 1 0 1 1 0 0 0 0 0
20 1 0 1 0 0 0 0 0 0
Transaks
21 1 0 0 1 0 0 0 0 0
22 0 0 0 0 1 1 0 0 0
23 0 0 0 1 1 0 0 0 0
24 0 0 1 1 0 0 0 0 0
25 1 0 1 0 0 0 0 0 0
26 1 0 1 0 0 0 0 0 0
27 0 0 0 1 0 1 0 0 0
28 1 0 1 0 0 0 0 0 0
29 1 0 1 0 0 0 0 0 0
30 1 0 1 0 0 0 1 0 0
31 1 0 1 1 0 0 0 0 0
32 1 0 1 0 0 0 0 0 0
33 0 1 0 1 0 0 0 0 0
34 1 0 1 1 0 0 0 0 0
35 0 0 1 0 0 1 0 0 0
36 1 0 0 1 0 0 0 0 0
37 0 0 0 1 0 1 0 0 0
38 1 0 0 0 1 0 0 0 0
39 1 0 1 0 1 0 0 0 0
40 0 0 0 1 1 0 0 0 0
41 0 0 0 1 1 1 0 0 0
42 0 0 0 1 1 1 0 0 0
43 0 0 0 1 0 1 0 0 0
44 1 0 0 1 0 0 0 0 0
45 1 0 1 0 0 0 0 0 0
46 0 0 0 1 1 1 0 0 0
47 1 0 0 0 1 0 0 0 0
48 0 0 0 1 1 0 0 0 0
49 0 0 1 0 0 1 0 0 0
50 0 0 0 1 0 1 0 0 0
51 1 0 1 0 0 0 0 0 0
52 1 0 0 0 1 1 0 0 0
53 1 0 0 0 1 1 0 0 0
54 1 0 0 0 1 0 0 0 0
55 0 0 1 0 1 0 0 0 0
56 1 0 0 0 1 0 0 0 0
57 0 0 0 1 1 0 0 0 0
58 0 0 0 0 1 1 0 0 0
59 1 0 1 0 1 0 0 0 0
60 1 0 0 1 1 0 0 0 0
61 0 0 1 0 1 0 0 0 0
62 0 0 1 0 1 0 0 0 0
63 0 0 0 0 1 0 1 0 0
64 0 0 0 1 0 1 0 0 0
65 1 0 0 0 1 1 0 0 0
66 1 0 0 1 0 0 0 0 0
67 1 0 1 0 0 0 0 0 1
68 0 0 1 1 0 0 0 0 0
69 0 0 1 1 0 0 0 0 0
70 1 0 1 0 0 0 0 0 0
71 1 0 0 0 0 0 1 0 0
72 1 0 0 0 1 0 0 0 0
73 0 0 0 1 1 0 0 0 0
Transaks
74 1 0 0 1 1 0 0 0 0
75 1 0 0 0 1 0 0 0 0
76 1 0 1 0 0 0 0 0 0
77 1 0 1 0 0 0 0 0 0
78 0 0 1 0 1 0 0 0 0
79 1 0 0 0 0 0 1 0 0
80 1 0 0 0 0 1 1 0 0
81 0 0 0 0 1 0 1 0 0
82 0 0 1 0 1 0 1 0 0
83 0 0 0 1 0 1 0 0 0
84 0 0 0 1 0 1 0 0 0
85 1 0 0 0 0 0 1 0 0
86 1 0 0 0 1 0 0 0 0
87 1 0 0 0 0 1 0 0 0
88 0 0 0 1 0 1 0 0 0
89 1 0 1 0 0 1 0 0 0
90 0 0 0 1 0 1 0 0 0
91 1 0 0 1 1 0 0 0 0
92 0 0 1 1 1 0 0 0 0
93 0 0 1 0 1 0 0 0 0
94 1 0 1 0 0 0 0 0 0
95 1 0 0 1 0 0 0 0 0
96 1 0 0 0 0 0 0 0 1
97 0 0 0 1 1 0 0 0 0
98 1 0 1 0 0 0 0 0 0
99 1 0 0 1 0 0 0 0 0
100 1 0 0 0 1 0 0 0 0
101 1 0 0 0 1 1 0 0 0
102 1 0 0 1 0 0 1 0 0
103 1 0 0 0 1 0 1 0 0
104 1 0 0 1 1 0 0 0 0
105 0 0 0 1 1 0 1 0 0
106 0 0 0 0 1 1 0 0 0
107 1 0 0 0 1 1 0 0 0
108 0 0 0 1 1 0 1 0 0
109 1 0 1 0 1 0 0 0 0
110 1 0 1 0 0 1 0 0 0
111 1 0 1 0 1 0 0 0 0
112 1 0 0 1 0 0 0 0 0
113 1 0 0 0 1 0 1 0 0
114 1 0 1 1 1 0 0 0 0
115 1 0 1 1 0 0 0 0 0
116 1 0 0 1 1 0 0 0 0
117 1 0 1 0 0 0 0 0 0
118 1 0 0 0 1 0 0 0 0
119 1 0 1 0 0 0 0 0 0
120 1 1 0 0 0 0 1 0 0
121 1 0 1 0 1 0 0 0 0
122 0 0 0 1 1 0 0 1 0
123 1 0 1 0 1 0 0 0 0
124 0 0 1 0 1 1 0 0 0
125 1 1 1 0 0 0 0 0 0
126 0 1 0 1 1 0 0 0 0
Transaks
127 1 0 0 1 1 0 0 0 0
128 1 0 1 0 1 0 0 0 0
129 0 0 0 0 1 1 0 0 0
130 1 0 0 1 1 0 0 0 0
131 1 0 0 0 0 1 0 0 0
132 1 0 1 0 0 0 0 0 0
133 1 0 1 0 0 0 1 0 0
134 1 0 1 0 0 0 0 0 0
135 0 0 1 1 0 0 1 0 0
136 1 0 1 0 0 0 0 0 0
137 0 0 1 1 1 0 0 0 0
138 0 0 0 0 1 0 0 1 0
139 1 0 1 1 0 0 0 0 0
140 1 0 0 0 1 0 0 1 0
141 1 0 1 0 0 0 0 1 0
142 0 0 1 0 0 1 0 0 0
143 0 0 1 1 1 0 0 0 0
144 0 1 0 1 0 0 1 0 0
145 1 0 0 0 1 0 0 1 0
146 0 0 0 0 1 0 1 1 0
147 0 0 0 1 1 0 1 0 0
148 1 0 1 0 0 0 0 0 0
149 1 0 0 0 1 1 0 0 0
150 1 0 1 0 0 1 0 0 0
3. Analisis Menggunakan Software Rapid Miner

Data yang telah ditransformasikan akan dianalisis menggunakan software
Rapid Miner. Berikut merupakan output dari analisis data menggunakan
software Rapid Miner dengan menggunakan nilai minimal support sebesar
10% dan nilai minimal confidence sebesar 50%:
Berdasarkan gambar di atas, dapat dilihat terdapat 3 rules yang

dihasilkan dari analisis dengan menggunakan software Rapid Miner, dimana
dengan 2 data valid dan 1 data tidak valid. Data yang tidak valid adalah rule
2 dikarenakan nilai lift ratio < 1, sehingga rule 2 tidak dapat digunakan.
Berikut merupakan 2 rules yang valid atau rule yang dapat digunakan:
- Rule 1 mempunyai nilai lift ratio > 1 yaitu sebesar 1.120 sehingga rule
ini termasuk valid, dimana jika customer membeli produk dalam DEPT
1 yang berisi produk berupa minuman,susu, atau yogurt, maka terdapat
51,5% (confidence) kemungkinan produk dalam DEPT 3 (snack) akan
terbeli juga. Aturan ini cukup signifikan karena mewakili 10% (support)
dari keseluruhan data transaksi yang ada.
- Rule 3 mempunyai nilai lift ratio > 1 yaitu sebesar 1.120 sehingga rule
ini termasuk valid, dimana jika customer membeli produk dalam DEPT
3 yang berisi produk berupa berupa snack, maka terdapat 73,9%
(confidence) kemungkinan produk dalam DEPT 1 (minuman,susu,dan
yogurt) akan terbeli juga. Aturan ini cukup signifikan karena mewakili
10% (support) dari keseluruhan data transaksi yang ada.
D. Tugas 3 : Predikasi Apakah Konsumen akan Datang Kembali atau Tidak

Pada tahap ini digunakan metode Klasifikasi dengan menggunakan algoritma
Decision Tree untuk memprediksi konsumen akan datang kembali atau tidak.
Klasifikasi memiliki fungsi untuk menemukan sekumpulan model yang
menjelaskan dan membedakan kelas-kelas data, sehingga model tersebut dapat
digunakan untuk memprediksi nilai suatu kelas yang belum diketahui pada
sebuah objek (Gorunescu, 2011). Klasifikasi adalah proses penemuan model
(atau fungsi) yang menggambarkan dan membedakan kelas data atau konsep
yang bertujuan agar bisa digunakan untuk memprediksi kelas dari objek yang
label kelasnya tidak diketahui (Kamber, 2006). Klasifikasi merupakan proses
membedakan data ke dalam kelas - kelas berdasarkan jenisnya. Contohnya pada
variabel pendapatan dapat di kelompokkan atau dikategorikan menjadi tiga yaitu
pendapatan tinggi, pendapatan sedang, dan pendapatan rendah. Berikut
merupakan tahapan dalam metode klasifikasi dengan algoritma decision tree:
kuesioner terkait apakah konsumen akan datang kembali yaitu sebagai berikut:
a. Rekapitulasi Data
Frekuensi apakah
Nominal
Usia Pendapatan Jarak Kedatangan akan
No Tiap
(tahun) (per bulan) (km) (dalam 1 berbelanja
transaksi
bulan) kembali?
1 21 2000000 6 15000 5 Ya
2 20 3000000 8 20000 2 Ya
3 15 900000 8 50000 6 Ya
4 20 1000000 9 10000 3 Ya
5 21 1200000 9 150000 4 Ya
6 21 1500000 9 200000 2 Ya
7 20 4500000 17 750000 1 Tidak
8 20 500000 8,5 20000 1 Tidak
9 18 1500000 7 130000 2 Ya
10 20 1500000 7 300000 1 Ya
11 20 1000000 8 50000 1 Ya
12 20 1500000 9 100000 1 Ya
13 20 1000000 8 150000 1 Ya
14 20 1300000 9 145000 2 Ya
15 18 1000000 7 300000 2 Ya
16 26 2000000 8 50000 2 Ya
17 22 2000000 9 70000 1 Ya
18 25 2000000 5 45000 2 Ya
19 18 1000000 6 100000 2 Ya
20 22 2000000 9 50000 4 Ya
21 21 2500000 9 10000 1 Ya
22 20 3000000 8,5 23000 1 Ya
23 23 3650000 3 250000 2 Ya
24 22 2500000 10 600000 1 Tidak
25 20 2500000 7 75000 1 Ya
26 19 1500000 7 15000 2 Ya
27 21 500000 8 10000 1 Ya
28 20 1500000 9 250000 3 Ya
29 20 500000 8 100000 1 Ya
30 19 2500000 6 1000000 1 Ya
31 20 2000000 7 15000 1 Ya
32 20 1500000 3 9500 2 Ya
33 19 2000000 9,5 12000 3 Ya
34 21 9000000 9 5000 1 Tidak
35 19 1800000 7 7500 2 Ya
36 21 2000000 6 10000 1 Ya
37 20 2500000 8 10000 1 Ya
38 20 1500000 2 5000 1 Ya
39 20 1500000 1 3000 1 Ya
40 19 1000000 6,5 25000 1 Ya
41 18 1000000 6,5 2500 1 Ya
42 22 2500000 4 15000 2 Ya
43 21 2000000 3 12000 3 Ya
44 21 1500000 4 170000 2 Ya
45 20 2500000 2 15000 4 Ya
46 20 2000000 1 80000 5 Ya
47 19 1500000 2 30000 1 Ya
48 19 1500000 3 25000 2 Ya
49 21 2000000 2,5 20000 2 Ya
50 19 2000000 4 30000 1 Ya
51 21 2000000 5 35000 2 Ya
52 21 1500000 1 13000 4 Ya
53 20 1000000 7 40000 1 Ya
54 20 2000000 8 40000 1 Ya
55 21 1400000 3 20000 2 Ya
56 22 2500000 5 35000 1 Ya
57 20 1400000 4 25000 1 Ya
58 20 2500000 2 15000 3 Ya
59 20 1700000 7 40000 1 Ya
60 20 1600000 2 15000 3 Ya
61 21 2000000 6 35000 1 Ya
62 20 1200000 1 10000 4 Ya
63 20 1800000 2 12000 3 Ya
64 22 2000000 4 20000 2 Ya
65 21 2000000 4 20000 3 Ya
66 20 1200000 9 200000 4 Ya
67 18 1000000 5 50000 2 Ya
68 19 2500000 10 200000 2 Ya
69 25 4000000 5 1000000 1 Ya
70 22 2200000 7 25000 2 Ya
71 23 3000000 6 500000 3 Ya
72 26 6000000 2 1000000 1 Ya
73 25 5500000 6 300000 2 Ya
74 24 3500000 4 15000 3 Ya
75 31 4500000 4 300000 3 Ya
76 20 2400000 4 200000 2 Ya
77 19 1400000 6 100000 2 Ya
78 20 1500000 5 100000 3 Ya
79 22 2000000 3 80000 4 Ya
80 19 1600000 7 200000 2 Ya
81 21 1800000 4 120000 4 Ya
82 24 3700000 4 250000 2 Ya
83 23 2000000 5 130000 3 Ya
84 24 3100000 4,5 220000 2 Ya
85 23 2500000 9,5 140000 3 Ya
86 19 1700000 2 90000 3 Ya
87 25 2200000 7 160000 3 Ya
88 22 1600000 2 120000 2 Ya
89 21 2400000 6 10000 3 Ya
90 20 1500000 1 50000 4 Ya
91 22 2400000 4 150000 2 Ya
92 20 2000000 4 200000 1 Ya
93 23 1600000 9 150000 1 Ya
94 21 2100000 8 150000 1 Ya
95 20 2000000 8 10000 2 Ya
96 17 900000 4 50000 2 Ya
97 22 1600000 4 85000 2 Ya
98 20 1500000 9 50000 1 Ya
99 19 1500000 9 10000 1 Tidak
10
0 20 1000000 2 20000 1 Tidak
10
1 20 2000000 8 20000 1 Ya
10
2 20 1200000 1 100000 4 Ya
10
3 21 2500000 4 15000 2 Ya
10
4 20 2000000 3 30000 1 Tidak
10
5 21 2000000 8 20000 1 Ya
10
6 20 1500000 4 20000 2 Ya
10
7 19 1500000 5 20000 1 Ya
10
8 22 2000000 8 30000 1 Ya
10
9 21 2000000 7 25000 2 Ya
11
0 20 1500000 6 20000 1 Ya
11
1 21 1500000 6 15000 3 Ya
11
2 22 3500000 5 20000 2 Ya
11
3 18 1000000 5 30000 2 Ya
11
4 18 1500000 10 50000 1 Ya
11
5 17 1000000 7 40000 2 Ya
11
6 20 1000000 5 20000 5 Ya
11
7 40 10000000 7 20000 3 Tidak
11 42 7000000 7 50000 4 Ya
8
11
9 22 1500000 6 155000 3 Ya
12
0 20 3000000 4 160000 4 Ya
12
1 19 1500000 6 110000 2 Ya
12
2 23 2100000 5 120000 3 Ya
12
3 25 3800000 3 200000 4 Ya
12
4 20 1500000 6 100000 3 Ya
12
5 23 2000000 7 140000 3 Ya
12
6 22 1700000 10 250000 2 Ya
12
7 24 2200000 4 150000 5 Ya
12
8 20 900000 3 150000 1 Ya
12
9 21 1100000 5 120000 2 Ya
13
0 21 1600000 6 60000 4 Ya
13
1 21 1200000 7 70000 3 Ya
13
2 23 700000 5 70000 1 Ya
13
3 19 3000000 7 210000 4 Ya
13
4 21 1300000 4 160000 2 Ya
13
5 21 1500000 4 75000 3 Ya
13
6 20 1000000 5 50000 1 Ya
13
7 21 1500000 7 87000 5 Ya
13
8 22 2600000 4 180000 3 Ya
13
9 23 1700000 6 170000 3 Ya
14
0 27 7000000 1 100000 1 Ya
14
1 21 1800000 3 100000 4 Ya
14
2 21 5000000 5 130000 4 Ya
14
3 21 10000000 6 25000 2 Tidak
14
4 35 5000000 8 500000 2 Ya
14
5 19 2500000 4 250000 3 Ya
14
6 17 1200000 4 150000 2 Ya
14
7 19 1700000 4 100000 3 Ya
14
8 30 4500000 4 200000 3 Ya
14
9 20 2000000 4 20000 4 Tidak
15
0 21 1500000 6 100000 2 Ya
b. Data Transformasi
Transformasi data ini mengubah data numerik menjadi data kategori sesuai
dengan aturan transformasi yang telah dibuat. Berikut merupakan aturan
transformasi yang telah dibuat:
ATURAN TRANSFORMASI
Dewasa > 25
Usia (tahun) Remaja 18-25
Muda < 18
Tinggi > Rp5 juta
Pendapatan (per
Sedang Rp1 - Rp5 juta
bulan)
Rendah < Rp1 juta
Jauh > 10
Jarak (km) Sedang 5-10
Dekat <5
Banyak > Rp100.000
Nominal Tiap
Sedang Rp50.000 - Rp100.000
Transaksi
Sedikit < Rp50000
Frekuensi Sering >3
Kedatangan (dalam 1 Sedang 2-3
bulan) Jarang <2
Berikut merupakan hasil dari transformasi data:

Frekuensi Apakah
Nominal
No Tiap
transaksi
bulan) kembali?
1 Remaja Sedang Sedang Sedikit Sering Ya
Frekuensi Apakah
Nominal
No Tiap
transaksi
bulan) kembali?
2 Remaja Sedang Sedang Sedikit Sedang Ya
3 Muda Rendah Sedang Sedang Sering Ya
5 Remaja Sedang Sedang Banyak Sering Ya
6 Remaja Sedang Sedang Banyak Sedang Ya
7 Remaja Sedang Jauh Banyak Jarang Tidak
8 Remaja Rendah Sedang Sedikit Jarang Tidak
10 Remaja Sedang Sedang Banyak Jarang Ya
11 Remaja Sedang Sedang Sedang Jarang Ya
16 Dewasa Sedang Sedang Sedang Sedang Ya
19 Remaja Sedang Sedang Sedang Sedang Ya
20 Remaja Sedang Sedang Sedang Sering Ya
21 Remaja Sedang Sedang Sedikit Jarang Ya
23 Remaja Sedang Dekat Banyak Sedang Ya
24 Remaja Sedang Sedang Banyak Jarang Tidak
27 Remaja Rendah Sedang Sedikit Jarang Ya
29 Remaja Rendah Sedang Sedang Jarang Ya
32 Remaja Sedang Dekat Sedikit Sedang Ya
34 Remaja Tinggi Sedang Sedikit Jarang Tidak
38 Remaja Sedang Dekat Sedikit Jarang Ya
Frekuensi Apakah
Nominal
No Tiap
transaksi
bulan) kembali?
45 Remaja Sedang Dekat Sedikit Sering Ya
46 Remaja Sedang Dekat Sedang Sering Ya
72 Dewasa Tinggi Dekat Banyak Jarang Ya
73 Remaja Tinggi Sedang Banyak Sedang Ya
75 Dewasa Sedang Dekat Banyak Sedang Ya
81 Remaja Sedang Dekat Banyak Sering Ya
Frekuensi Apakah
Nominal
No Tiap
transaksi
bulan) kembali?
86 Remaja Sedang Dekat Sedang Sedang Ya
92 Remaja Sedang Dekat Banyak Jarang Ya
96 Muda Rendah Dekat Sedang Sedang Ya
99 Remaja Sedang Sedang Sedikit Jarang Tidak
10
0 Remaja Sedang Dekat Sedikit Jarang Tidak
10
10
10
10
4 Remaja Sedang Dekat Sedikit Jarang Tidak
10
10
10
10
10
11
11
11
Frekuensi Apakah
Nominal
No Tiap
transaksi
bulan) kembali?
11
11
11
5 Muda Sedang Sedang Sedikit Sedang Ya
11
6 Remaja Sedang Sedang Sedikit Sering Ya
11
7 Dewasa Tinggi Sedang Sedikit Sedang Tidak
11
8 Dewasa Tinggi Sedang Sedang Sering Ya
11
12
12
12
12
12
12
12
12
12
8 Remaja Rendah Dekat Banyak Jarang Ya
12
13
13
13
2 Remaja Rendah Sedang Sedang Jarang Ya
13
13
Frekuensi Apakah
Nominal
No Tiap
transaksi
bulan) kembali?
5
13
13
13
13
14
0 Dewasa Tinggi Dekat Sedang Jarang Ya
14
14
14
3 Remaja Tinggi Sedang Sedikit Sedang Tidak
14
4 Dewasa Sedang Sedang Banyak Sedang Ya
14
14
6 Muda Sedang Dekat Banyak Sedang Ya
14
14
8 Dewasa Sedang Dekat Banyak Sedang Ya
14
9 Remaja Sedang Dekat Sedikit Sering Tidak
15
c. Reduksi Data
Pada tahap ini dilakukan reduksi data dengan menghapus data yang tidak
dibutuhkan atau tidak ada hubungan dalam penelitian.. Data reduksi ini
didapatkan dari proses Uji Chi-Square Independent menggunakan software
SPSS. Berikut merupakan hasil dan analisis uji independensi (chi-square)
pada software SPSS untuk setiap atribut:
1) Usia
Berikut merupakan output dari uji independensi pada atribut usia:
Berdasarkan hasil chi-square test dapat dilihat hasil Asymptotic
Significance (2-sided) adalah 0,695 > 0,05 yang artinya atribut usia tidak
memiliki hubungan dengan tujuan penelitian ini, sehingga atribut usia
direduksi.
2) Pendapatan
Berikut merupakan output dari uji independensi pada atribut pendapatan:

Significance (2-sided) adalah 0,000 < 0,05 yang artinya atribut
pendapatan memiliki hubungan dengan tujuan penelitian ini, sehingga
atribut pendapatan tidak direduksi.
3) Jarak
Berikut merupakan output dari uji independensi pada atribut jarak:
Significance (2-sided) adalah 0,001 < 0,05 yang artinya atribut jarak
memiliki hubungan dengan tujuan penelitian ini, sehingga atribut jarak
tidak direduksi.
4) Nominal Tiap Transaksi
Berikut merupakan output dari uji independensi pada atribut nominal
tiap transaksi:

Significance (2-sided) adalah 0,042 < 0,05 yang artinya atribut nominal
tiap transaksi memiliki hubungan dengan tujuan penelitian ini, sehingga
atribut nominal tiap transaksi tidak direduksi.
5) Frekuensi Kedatangan
Berikut merupakan output dari uji independensi pada atribut frekuensi
kedatangan:
Significance (2-sided) adalah 0,032 < 0,05 yang artinya atribut frekuensi
kedatangan memiliki hubungan dengan tujuan penelitian ini, sehingga
atribut frekuensi kedatangan tidak direduksi.
Berdasarkan analisis uji independensi (chi-square) pada software SPSS
diketahui atribut yang tidak memiliki hubungan dengan tujuan penelitian
adalah atribut usia, sehingga atribut usia direduksi. Berikut merupakan
hasil dari reduksi data:
Frekuensi Apakah
Nominal
Pendapatan Jarak Kedatangan akan
No Tiap
(per bulan) (km) (dalam 1 berbelanja
transaksi
bulan) kembali?
1 Sedang Sedang Sedikit Sering Ya
2 Sedang Sedang Sedikit Sedang Ya
3 Rendah Sedang Sedang Sering Ya
5 Sedang Sedang Banyak Sering Ya
6 Sedang Sedang Banyak Sedang Ya
7 Sedang Jauh Banyak Jarang Tidak
8 Rendah Sedang Sedikit Jarang Tidak
10 Sedang Sedang Banyak Jarang Ya
11 Sedang Sedang Sedang Jarang Ya
16 Sedang Sedang Sedang Sedang Ya
20 Sedang Sedang Sedang Sering Ya
21 Sedang Sedang Sedikit Jarang Ya
Frekuensi Apakah
Nominal
No Tiap
transaksi
bulan) kembali?
23 Sedang Dekat Banyak Sedang Ya
24 Sedang Sedang Banyak Jarang Tidak
27 Rendah Sedang Sedikit Jarang Ya
29 Rendah Sedang Sedang Jarang Ya
32 Sedang Dekat Sedikit Sedang Ya
34 Tinggi Sedang Sedikit Jarang Tidak
38 Sedang Dekat Sedikit Jarang Ya
45 Sedang Dekat Sedikit Sering Ya
46 Sedang Dekat Sedang Sering Ya
Frekuensi Apakah
Nominal
No Tiap
transaksi
bulan) kembali?
72 Tinggi Dekat Banyak Jarang Ya
73 Tinggi Sedang Banyak Sedang Ya
81 Sedang Dekat Banyak Sering Ya
86 Sedang Dekat Sedang Sedang Ya
92 Sedang Dekat Banyak Jarang Ya
96 Rendah Dekat Sedang Sedang Ya
99 Sedang Sedang Sedikit Jarang Tidak
10
0 Sedang Dekat Sedikit Jarang Tidak
Frekuensi Apakah
Nominal
No Tiap
transaksi
bulan) kembali?
1
10
10
10
10
10
10
10
10
11
11
11
11
11
11
11
11
7 Tinggi Sedang Sedikit Sedang Tidak
11
8 Tinggi Sedang Sedang Sering Ya
11
12
12
12
12
Frekuensi Apakah
Nominal
No Tiap
transaksi
bulan) kembali?
12
12
12
12
12
8 Rendah Dekat Banyak Jarang Ya
12
13
13
13
13
13
13
13
13
13
13
14
0 Tinggi Dekat Sedang Jarang Ya
14
14
14
14
14
Frekuensi Apakah
Nominal
No Tiap
transaksi
bulan) kembali?
6
14
14
14
9 Sedang Dekat Sedikit Sering Tidak
15
d. Pembagian Training Set

Pada pembagian training set, peneliti membagi data menjadi 75 data yang
akan digunakan untuk data latihan, yang mana nantinya akan digunakan
untuk menghitung nilai entropi, informasi, dan information gain
menggunakan software Rapid Miner. Berikut merupakan pembagian dari
training set:
Frekuensi Apakah
Nominal
No Tiap
transaksi
bulan) kembali?
3 Rendah Sedang Sedang Sering Ya
7 Sedang Jauh Banyak Jarang Tidak
8 Rendah Sedang Sedikit Jarang Tidak
Frekuensi Apakah
Nominal
No Tiap
transaksi
bulan) kembali?
24 Sedang Sedang Banyak Jarang Tidak
27 Rendah Sedang Sedikit Jarang Ya
34 Tinggi Sedang Sedikit Jarang Tidak
Frekuensi Apakah
Nominal
No Tiap
transaksi
bulan) kembali?
72 Tinggi Dekat Banyak Jarang Ya
73 Tinggi Sedang Banyak Sedang Ya
e. Pembagian Testing Set

Pada pembagian testing set, peneliti membagi data menjadi 75 data yang
akan digunakan untuk data uji, yang mana nantinya dengan menggunakan
software Rapid Miner, data testing akan digunakan untuk menghitung
evaluasi pada perhitungan atau untuk mengukur tingkat akurasi klasifikasi.
Berikut merupakan pembagian dari testing set:
Frekuensi Apakah
Nominal
No Tiap
transaksi
bulan) kembali?
Frekuensi Apakah
Nominal
No Tiap
transaksi
bulan) kembali?
92 Sedang Dekat Banyak Jarang Ya
96 Rendah Dekat Sedang Sedang Ya
99 Sedang Sedang Sedikit Jarang Tidak
10
10
10
10
10
10
10
10
10
10
11
11
11
11
11
11
Frekuensi Apakah
Nominal
No Tiap
transaksi
bulan) kembali?
11
7
11 Tinggi Sedang Sedang Sering Ya
8
9
0
1
2
3
4
5
6
7
12 Rendah Dekat Banyak Jarang Ya
8
9
0
1
2
3
4
5
6
7
Frekuensi Apakah
Nominal
No Tiap
transaksi
bulan) kembali?
8
13
14
0 Tinggi Dekat Sedang Jarang Ya
14
14
14
14
14
14
14
14
14
9 Sedang Dekat Sedikit Sering Tidak
15
2. Analisis Menggunakan Software Rapid Miner

Algortimat yang digunakan peneliti disini adalah decision tree, berikut
merupakan decision tree yang dihasilkan melalui analisis menggunakan Rapid
Miner:
a. Decision Tree
Berdasarkan decision tree di atas, diketahui rules yang terbentuk adalah
sebagai berikut:
- R1: IF Jarak (km) = Dekat THEN Keputusan = Ya
- R2: IF Jarak (km) = Jauh THEN Keputusan = Tidak
- R3: IF Jarak (km) = Sedang dan Pendapatan (per bulan) = Rendah dan
Nominal tiap transaksi = Sedang THEN Keputusan = Ya
- R4: IF Jarak (km) = Sedang dan Pendapatan (per bulan) = Rendah dan
Nominal tiap transaksi = Sedikit THEN Keputusan = Ya
- R5: IF Jarak (km) = Sedang dan Pendapatan (per bulan) = Sedang dan
Nominal tiap transaksi = Banyak dan Frekuensi kedatangan (dalam 1
bulan) = Jarang THEN Keputusan = Ya
bulan) = Sedang THEN Keputusan = Ya
bulan) = Sering THEN Keputusan = Ya
Nominal tiap transaksi = Sedang THEN Keputusan = Ya
Nominal tiap transaksi = Sedikit THEN Keputusan = Ya
- R10: IF Jarak (km) = Sedang dan Pendapatan (per bulan) = Tinggi dan
Nominal tiap transaksi = Banyak THEN Keputusan = Ya
- R10: IF Jarak (km) = Sedang dan Pendapatan (per bulan) = Tinggi dan
Nominal tiap transaksi = Sedikit THEN Keputusan = Tidak
b. Confusion Matrix
Confusion matrix digunakan untuk mengevaluasi performansi model yang
dibangun oleh algoritma klasifikasi dan kualitas model klasifikasi
(classifier). Berikut merupakan confusion matrix yang didapat dari analasis
klasifikasi menggunakan software Rapid Miner:
Berdasarkan confusion matrix di atas, dapat diketahui:

- Accuracy
Nilai akurasi didapat sebesar 89,33% yang diperoleh dari nilai pada
baris pred. Ya dan kolom true Ya yaitu sebesar 67 dijumlahkan dengan
nilai pada baris pred. Tidak dan kolom true Tidak yaitu sebesar 0,
kemudian dibagi dengan total nilai yang diuji yaitu 75, sehingga
dihasilkan nilai akurasi sebesar 89,33% atau dapat dikatakan
kemampuan model untuk memprediksi secara benar adalah sebesar
89,33%.
- Precision
Nilai presisi untuk pred. Ya didapat sebesar 91,78% yang diperoleh
dari nilai pada baris pred. Ya dan kolom true Ya yaitu sebesar 67
dibagi dengan penjumlahan antara pada baris pred. Ya dan kolom true
Ya yaitu sebesar 67 dan nilai pada baris pred. Ya dan kolom true Tidak
yaitu sebesar 6, sehingga dihasilkan nilai presisi sebesar 91,78%. Nilai
presisi dari label pred. Ya ini merupakan ukuran dari ketepatan
(measure of exactness) yang menunjukkan berapa persentase kelas
berlalbel sebagai label positif sebenarnya.
- Recall
Nilai sensitivitas/recall untuk Ya didapat sebesar 97,10% yang
diperoleh dari nilai pada baris pred. Ya dan kolom ture Ya yaitu
sebesar 67, dibagi dengan penjumlahan antara nilai pada baris pred. Ya
dan kolom ture Ya yaitu sebesar 67 dan nilai pada baris pred. Tidak
dan kolom ture Ya yaitu sebesar 2, sehingga dihasilkan nilai
sensitivitas/recall sebesar 97,10%. Nilai recall ini merupakan ukuran
dari kelengkapan (measure of completeness) yang menunjukkan berapa
persentase kelas yang diberi label positif.
E. Tugas 4: Penentuan Strategi Pemasaran Yang Menarik Menggunakan

Knowledge Dari Hasil Tugas 1, 2 dan 3
Berdasarkan pengolahan data yang telah digunakan dengan menggunakan
Metode Cluster, AR-MBA, dan Klasifikasi, dapat diberikan rekomendasi
penentuan strategi pemasaran bagi Mirota Jakal 6 sebagai berikut:
a. Metode Cluster
Dapat diketahui berdasarkan perhitungan menggunakan SPPS analisis
metode Cluster dengan algoritma K-Means bahwa usia rata – rata pelanggan
Mirota Jakal 6 berusia 21 tahun, berpendapatan atau uang saku perbulan
sebesar Rp.2.191.000, dan jarak tempat tinggal rata – rata pelanggan Mirota
Jakal 6 yaitu 5,7 km dengan nominal transaksi rata – rata Rp. 115.710 dan
frekuensi kedatangan rata – ratanya sebanyak 2 kali dalam sebulan.
Didapatkan hasil bahwa cluster 1 termasuk cluster yang paling potensial
dimana cluster 1 semua kriterianya mendapatkan nilai di angka positif yang
berarti berada pada rata – rata total. Untuk cluster 2 termasuk cluster yang
cukup potensial dimana ada 1 nilai kriteria yaitu frekuensi kedatangan
dengan nilai negative yang menandakan berada dibawah rata – rata total.
Dan untuk cluster 3 sendiri termasuk cluster yang kurang potensial karena
hampir semua nilai nya negative dan hanya 1 yang bernilai positif.
b. Metode AR-MBA
Berdasarkan analisis menggunakan metode AR-MBA dengan algoritma FP-
Growth, dapat dilakukan perbaikan layout toko dan pembuatan katalog baru
dengan menggunakan rules 3. Dimana pihak Mirota Jakal 6 dapat
menempatkan produk pada DEPT 3 (snack) berdekatan dengan produk pada
DEPT 1 (minuman, susu, yogurt). Sementara untuk pembuatan katalog baru,
pihak Mirota Jakal 6 dapat menggabungkan produk dari departemen yang
jarang terbeli secara bersamaan dengan membuat promo paket. Seperti
promo paket untuk produk tisu pada DEPT 6 (kebutuhan dan pembersih
rumah) digabung dengan produk minyak goreng pada DEPT 5 (bumbu
masak, bahan makanan) karena kedua departemen tersebut jarang terbeli
secara bersamaan, dan dengan membuat promo paket ini dapat membuat
konsumen lebih tertarik untuk membeli produk tersebut.
c. Metode Klasifikasi
Berdasarkan analisis rules yang terbentuk dari algoritma decision tree,
diketahui bahwa kriteria jarak merupakan kriteria yang paling menentukan
keputusan konsumen untuk kembali berbelanja di Mirota Jakal 6 atau tidak.
Sehingga sebaiknya pihak Mirota Jakal 6 melakukan pertimbangan terkait
lokasi tempat/toko yang strategis dimana lokasinya dekat dengan customer
yang dituju atau target pasarnya.
DAFTAR PUSTAKA
M.I. Darwansyah 2018), Penerapan Data Mining Pada Penjualan Sepeda Motor di PT.
Tunas Dwipa Matra Palembang Menggunakan Metode Clustering
eprints.polsri.ac.id
Maulana, A. & Fajrin, A. A., 2018. Penerapan Data Mining untuk Analisis Pola
Pembelian Konsumen dengan Algoritma FP-Growth pada Data Transaksi
Penjualan Spare Part Motor. Kumpulan Jurnal Ilmu Komputer, 1
Februari.Volume 5.
Mardi, Yuli. 2019. Data Mining: Klasifikasi Menggunakan Algoritma C4.5. Jurnal
Edik Informatika.
LAMPIRAN
https://forms.gle/NXzCAJD9dkh5EbFY7

Akdm Bigpro

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Akdm Bigpro

Diunggah oleh

Hak Cipta:

Format Tersedia

LAPORAN BIG PROJECT

Analisis Keputusan dan Data Mining

PROGRAM STUDI TEKNIK INDUSTRI

A. Menjelaskan Variabel yang Digunakan Berdasarkan Referensi

B. Menjelaskan langkah-langkah AHP

Gambar 1. Struktur Hierarki

Gambar 2. Perbandingan Antar Kriteria

- Jarak Tempat Tinggal & Frekuensi Kedatangan

Dari perhitungan tersebut didapatkan hasil konsistensi indeks (CI) sebesar

1. Rekapitulasi Data Kuesioner

Sebelum dilakukan iterasi akan ditunjukkan tampilan proses sementara data

4. Jumlah anggota masing - masing Cluster yang terbentuk

Berdasarkan output dari Number of Cases in each Cluster menunjukkan

C. Tugas 2 : Penentuan pola pembelian konsumen dengan mengetahui produk

3. Analisis Menggunakan Software Rapid Miner

Berdasarkan gambar di atas, dapat dilihat terdapat 3 rules yang

D. Tugas 3 : Predikasi Apakah Konsumen akan Datang Kembali atau Tidak

Berikut merupakan hasil dari transformasi data:

Berdasarkan hasil chi-square test dapat dilihat hasil Asymptotic

Berdasarkan hasil chi-square test dapat dilihat hasil Asymptotic

d. Pembagian Training Set

e. Pembagian Testing Set

2. Analisis Menggunakan Software Rapid Miner

Berdasarkan confusion matrix di atas, dapat diketahui:

E. Tugas 4: Penentuan Strategi Pemasaran Yang Menarik Menggunakan

Anda mungkin juga menyukai