Akdm Bigpro
Akdm Bigpro
Disusun Oleh:
Dela Sriwahyuni (19522096)
Nur Azizah Rahmi (19522156)
Dosen Pengampu:
Annisa Uswatun Khasanah, S.T., M.Sc
2. Pengolahan Data
A. Tugas 1 : Pengelompokan Konsumen
Pada tahap ini digunakan metode clustering dengan algoritma K-Means. Menurut
Agusta, Clustering adalah metode penganalisaan data, yang sering dimasukkan
sebagai salah satu metode data mining, yang tujuannya adalah untuk
mengelompokkan data dengan karakteristik yang sama ke suatu “wilayah‟ yang
sama dan data dengan karakteristik yang berbeda ke “wilayah‟ yang lain. Salah
satu sub kategori data mining dan merupakan proses di mana sampel yang sama
dibagi menjadi kelompok-kelompok yang disebut cluster. Setiap cluster termasuk
sampel dimana anggota yang mirip satu sama lain dan berbeda dengan sampel
yang tersedia dari kelompok lain. Clustering juga merupakan pengelompokan,
pengamatan, dan pembentukan data berdasarkan kelas data tertentu ke dalam
kelas objek yang memiliki kemiripan. Semakin besar kemiripan objek dalam
suatu kluster akan bernilai maksimal dan semakin besar perbedaan tiap kluster
maka kualitas analisis cluster bernilai minimal.
1. Preprocessing Data
Adapun rekapitulasi data dan preprocessing data dari hasil pengisian
kuesioner terkait produk yang sering dibeli secara bersamaan yaitu sebagai
berikut:
a. Rekapitulasi Data
Berikut merupakan data kuesioner yang telah melalui tahap cleaning data
dan reduksi data atau tahapan yang menghilangkan data yang salah atau
data yang tidak dibutuhkan dalam penelitian ini:
A. Output dan Analisis Clustering
Berikut merupakan tahapan dalam metode cluster dengan algoritma K-Means:
1. Descrptive Statistics
Sebelum melakukan tahap clustering perlu dilakukan adanya descriptive
statistics untuk melihat jumlah data yang digunakan pada variabelnya yaitu
berjumlah 150 dan untuk usia dapat dilihat usia terendah yaitu 15 dan usia
tertinggi 42 dengan rata rata usia 21 dan standar deviasinya 3,36956. Untuk
minimum uang saku sebesar 500.000 dan maximumnya 10.000.000, meannya
sebesar 2.191.000 dengan standar deviasi sebesar 1545007,873. Untuk Jarak
tempat tinggal terdekat berjarak 1 km dan terjauh 17 km dengan rata – rata
jaraknya 5,7 km dengan standar deviasinya 2,56020. Untuk nominal transaksi
paling sedikit sebanyak Rp.2.500 dan terbanyak Rp.1.000.000 dengan rata –
rata transaksinya sebanyak Rp.1.15.710 dan standar deviasinya sebesar
169579,3282. Untuk Frekuensi Kedatangan paling sedikit sebanyak 1 kali
dalam sebulan dan paling banyak 6 kali dalam sebulan dengan rata rata
frekuensi kedatangan sebanyak 2 kali dalam sebulan dengan nilai standar
deviasinya 1,16826.
2. Initial Cluster Centers
Cluster 2
Zscore (Usia) menunjukkan nilai dominan Zscore pada variabel usia sebesar
1,12181
Zscore (Pendapatan/Uang Saku) menunjukkan nilai dominan Zscore pada
variabel Pendapatan/Uang Saku sebesar 1,17087
Zscore (Jarak Tempat Tinggal) menunjukkan nilai dominan Zscore pada
variabel jarak tempat tinggal sebesar – 0,26560
Zscore (Nominal Tiap Transaksi) menunjukkan nilai dominan Zscore pada
variabel Nominal Tiap Transaksi sebesar 5,21461
Zscore (Frekuensi Kedatangan) menunjukkan nilai dominan Zscore pada
variabel frekuensi kedatangan sebesar – 1,06141
Cluster 3
Zscore (Usia) menunjukkan nilai dominan Zscore pada variabel usia sebesar –
1,84594
Zscore (Pendapatan/Uang Saku) menunjukkan nilai dominan Zscore pada
variabel Pendapatan/Uang Saku sebesar – 0,83559
Zscore (Jarak Tempat Tinggal) menunjukkan nilai dominan Zscore pada
variabel jarak tempat tinggal sebesar – 0,90618
Zscore (Nominal Tiap Transaksi) menunjukkan nilai dominan Zscore pada
variabel Nominal Tiap Transaksi sebesar – 0,38749
Zscore (Frekuensi Kedatangan) menunjukkan nilai dominan Zscore pada
variabel frekuensi kedatangan sebesar 3,21846
3. Iteration History
Iteration history merupakan langkah atau tahapan untuk mengetahui seberapa
banyak iterasi yang harus dilakukan untuk mendapatkan cluster yang tepat dan
untuk melihat berapa kali data itu diolah. Pada penelitian ini terdapat 4 kali
pengolahan data untuk mendapatkan cluster yang tepat. Disini didapatkan nilai
jarak minimum antar cluster-nya sebesar 7,994
d. Data Integrasi
Berikut merupakan data integrasi yang telah dibagi-bagi berdasarkan
departemennya:
e. Data Transformasi
Melakukan transformasi data ke dalam bentuk bilangan biner, dengan
angka 1 merepresentasikan bahwa suatu departemen terbeli di transaksi
tersebut dan angka 0 merepresentasikan departemen yang tidak terbeli di
transaksi tersebut. Berikut merupakan data yang telah ditransformasikan:
Transaks
i DEPT 1 DEPT 2 DEPT 3 DEPT 4 DEPT 5 DEPT 6 DEPT 7 DEPT 8 DEPT 9
1 1 0 1 0 0 0 0 0 0
2 1 0 1 1 0 0 0 0 0
3 1 0 0 0 1 0 0 0 0
4 1 0 1 1 0 1 0 0 0
5 1 0 1 0 0 1 0 0 0
6 1 0 1 0 1 0 0 0 0
7 1 0 1 0 1 0 0 0 0
8 1 0 1 0 0 0 0 0 0
9 1 0 0 1 0 1 0 0 0
10 1 0 0 1 0 0 0 0 0
11 0 0 1 1 0 0 0 0 0
12 1 1 1 0 1 0 0 0 0
13 1 0 0 0 1 1 0 0 0
14 1 0 1 0 0 0 1 0 0
15 1 0 1 1 0 0 0 0 0
16 1 0 0 0 1 1 0 0 0
17 1 0 1 0 0 0 1 0 0
18 1 0 0 1 1 0 0 0 0
19 1 0 1 1 0 0 0 0 0
20 1 0 1 0 0 0 0 0 0
Transaks
i DEPT 1 DEPT 2 DEPT 3 DEPT 4 DEPT 5 DEPT 6 DEPT 7 DEPT 8 DEPT 9
21 1 0 0 1 0 0 0 0 0
22 0 0 0 0 1 1 0 0 0
23 0 0 0 1 1 0 0 0 0
24 0 0 1 1 0 0 0 0 0
25 1 0 1 0 0 0 0 0 0
26 1 0 1 0 0 0 0 0 0
27 0 0 0 1 0 1 0 0 0
28 1 0 1 0 0 0 0 0 0
29 1 0 1 0 0 0 0 0 0
30 1 0 1 0 0 0 1 0 0
31 1 0 1 1 0 0 0 0 0
32 1 0 1 0 0 0 0 0 0
33 0 1 0 1 0 0 0 0 0
34 1 0 1 1 0 0 0 0 0
35 0 0 1 0 0 1 0 0 0
36 1 0 0 1 0 0 0 0 0
37 0 0 0 1 0 1 0 0 0
38 1 0 0 0 1 0 0 0 0
39 1 0 1 0 1 0 0 0 0
40 0 0 0 1 1 0 0 0 0
41 0 0 0 1 1 1 0 0 0
42 0 0 0 1 1 1 0 0 0
43 0 0 0 1 0 1 0 0 0
44 1 0 0 1 0 0 0 0 0
45 1 0 1 0 0 0 0 0 0
46 0 0 0 1 1 1 0 0 0
47 1 0 0 0 1 0 0 0 0
48 0 0 0 1 1 0 0 0 0
49 0 0 1 0 0 1 0 0 0
50 0 0 0 1 0 1 0 0 0
51 1 0 1 0 0 0 0 0 0
52 1 0 0 0 1 1 0 0 0
53 1 0 0 0 1 1 0 0 0
54 1 0 0 0 1 0 0 0 0
55 0 0 1 0 1 0 0 0 0
56 1 0 0 0 1 0 0 0 0
57 0 0 0 1 1 0 0 0 0
58 0 0 0 0 1 1 0 0 0
59 1 0 1 0 1 0 0 0 0
60 1 0 0 1 1 0 0 0 0
61 0 0 1 0 1 0 0 0 0
62 0 0 1 0 1 0 0 0 0
63 0 0 0 0 1 0 1 0 0
64 0 0 0 1 0 1 0 0 0
65 1 0 0 0 1 1 0 0 0
66 1 0 0 1 0 0 0 0 0
67 1 0 1 0 0 0 0 0 1
68 0 0 1 1 0 0 0 0 0
69 0 0 1 1 0 0 0 0 0
70 1 0 1 0 0 0 0 0 0
71 1 0 0 0 0 0 1 0 0
72 1 0 0 0 1 0 0 0 0
73 0 0 0 1 1 0 0 0 0
Transaks
i DEPT 1 DEPT 2 DEPT 3 DEPT 4 DEPT 5 DEPT 6 DEPT 7 DEPT 8 DEPT 9
74 1 0 0 1 1 0 0 0 0
75 1 0 0 0 1 0 0 0 0
76 1 0 1 0 0 0 0 0 0
77 1 0 1 0 0 0 0 0 0
78 0 0 1 0 1 0 0 0 0
79 1 0 0 0 0 0 1 0 0
80 1 0 0 0 0 1 1 0 0
81 0 0 0 0 1 0 1 0 0
82 0 0 1 0 1 0 1 0 0
83 0 0 0 1 0 1 0 0 0
84 0 0 0 1 0 1 0 0 0
85 1 0 0 0 0 0 1 0 0
86 1 0 0 0 1 0 0 0 0
87 1 0 0 0 0 1 0 0 0
88 0 0 0 1 0 1 0 0 0
89 1 0 1 0 0 1 0 0 0
90 0 0 0 1 0 1 0 0 0
91 1 0 0 1 1 0 0 0 0
92 0 0 1 1 1 0 0 0 0
93 0 0 1 0 1 0 0 0 0
94 1 0 1 0 0 0 0 0 0
95 1 0 0 1 0 0 0 0 0
96 1 0 0 0 0 0 0 0 1
97 0 0 0 1 1 0 0 0 0
98 1 0 1 0 0 0 0 0 0
99 1 0 0 1 0 0 0 0 0
100 1 0 0 0 1 0 0 0 0
101 1 0 0 0 1 1 0 0 0
102 1 0 0 1 0 0 1 0 0
103 1 0 0 0 1 0 1 0 0
104 1 0 0 1 1 0 0 0 0
105 0 0 0 1 1 0 1 0 0
106 0 0 0 0 1 1 0 0 0
107 1 0 0 0 1 1 0 0 0
108 0 0 0 1 1 0 1 0 0
109 1 0 1 0 1 0 0 0 0
110 1 0 1 0 0 1 0 0 0
111 1 0 1 0 1 0 0 0 0
112 1 0 0 1 0 0 0 0 0
113 1 0 0 0 1 0 1 0 0
114 1 0 1 1 1 0 0 0 0
115 1 0 1 1 0 0 0 0 0
116 1 0 0 1 1 0 0 0 0
117 1 0 1 0 0 0 0 0 0
118 1 0 0 0 1 0 0 0 0
119 1 0 1 0 0 0 0 0 0
120 1 1 0 0 0 0 1 0 0
121 1 0 1 0 1 0 0 0 0
122 0 0 0 1 1 0 0 1 0
123 1 0 1 0 1 0 0 0 0
124 0 0 1 0 1 1 0 0 0
125 1 1 1 0 0 0 0 0 0
126 0 1 0 1 1 0 0 0 0
Transaks
i DEPT 1 DEPT 2 DEPT 3 DEPT 4 DEPT 5 DEPT 6 DEPT 7 DEPT 8 DEPT 9
127 1 0 0 1 1 0 0 0 0
128 1 0 1 0 1 0 0 0 0
129 0 0 0 0 1 1 0 0 0
130 1 0 0 1 1 0 0 0 0
131 1 0 0 0 0 1 0 0 0
132 1 0 1 0 0 0 0 0 0
133 1 0 1 0 0 0 1 0 0
134 1 0 1 0 0 0 0 0 0
135 0 0 1 1 0 0 1 0 0
136 1 0 1 0 0 0 0 0 0
137 0 0 1 1 1 0 0 0 0
138 0 0 0 0 1 0 0 1 0
139 1 0 1 1 0 0 0 0 0
140 1 0 0 0 1 0 0 1 0
141 1 0 1 0 0 0 0 1 0
142 0 0 1 0 0 1 0 0 0
143 0 0 1 1 1 0 0 0 0
144 0 1 0 1 0 0 1 0 0
145 1 0 0 0 1 0 0 1 0
146 0 0 0 0 1 0 1 1 0
147 0 0 0 1 1 0 1 0 0
148 1 0 1 0 0 0 0 0 0
149 1 0 0 0 1 1 0 0 0
150 1 0 1 0 0 1 0 0 0
b. Data Transformasi
Transformasi data ini mengubah data numerik menjadi data kategori sesuai
dengan aturan transformasi yang telah dibuat. Berikut merupakan aturan
transformasi yang telah dibuat:
ATURAN TRANSFORMASI
Dewasa > 25
Usia (tahun) Remaja 18-25
Muda < 18
Tinggi > Rp5 juta
Pendapatan (per
Sedang Rp1 - Rp5 juta
bulan)
Rendah < Rp1 juta
Jauh > 10
Jarak (km) Sedang 5-10
Dekat <5
Banyak > Rp100.000
Nominal Tiap
Sedang Rp50.000 - Rp100.000
Transaksi
Sedikit < Rp50000
Frekuensi Sering >3
Kedatangan (dalam 1 Sedang 2-3
bulan) Jarang <2
c. Reduksi Data
Pada tahap ini dilakukan reduksi data dengan menghapus data yang tidak
dibutuhkan atau tidak ada hubungan dalam penelitian.. Data reduksi ini
didapatkan dari proses Uji Chi-Square Independent menggunakan software
SPSS. Berikut merupakan hasil dan analisis uji independensi (chi-square)
pada software SPSS untuk setiap atribut:
1) Usia
Berikut merupakan output dari uji independensi pada atribut usia:
Berdasarkan hasil chi-square test dapat dilihat hasil Asymptotic
Significance (2-sided) adalah 0,695 > 0,05 yang artinya atribut usia tidak
memiliki hubungan dengan tujuan penelitian ini, sehingga atribut usia
direduksi.
2) Pendapatan
Berikut merupakan output dari uji independensi pada atribut pendapatan:
a. Metode Cluster
Dapat diketahui berdasarkan perhitungan menggunakan SPPS analisis
metode Cluster dengan algoritma K-Means bahwa usia rata – rata pelanggan
Mirota Jakal 6 berusia 21 tahun, berpendapatan atau uang saku perbulan
sebesar Rp.2.191.000, dan jarak tempat tinggal rata – rata pelanggan Mirota
Jakal 6 yaitu 5,7 km dengan nominal transaksi rata – rata Rp. 115.710 dan
frekuensi kedatangan rata – ratanya sebanyak 2 kali dalam sebulan.
Didapatkan hasil bahwa cluster 1 termasuk cluster yang paling potensial
dimana cluster 1 semua kriterianya mendapatkan nilai di angka positif yang
berarti berada pada rata – rata total. Untuk cluster 2 termasuk cluster yang
cukup potensial dimana ada 1 nilai kriteria yaitu frekuensi kedatangan
dengan nilai negative yang menandakan berada dibawah rata – rata total.
Dan untuk cluster 3 sendiri termasuk cluster yang kurang potensial karena
hampir semua nilai nya negative dan hanya 1 yang bernilai positif.
b. Metode AR-MBA
Berdasarkan analisis menggunakan metode AR-MBA dengan algoritma FP-
Growth, dapat dilakukan perbaikan layout toko dan pembuatan katalog baru
dengan menggunakan rules 3. Dimana pihak Mirota Jakal 6 dapat
menempatkan produk pada DEPT 3 (snack) berdekatan dengan produk pada
DEPT 1 (minuman, susu, yogurt). Sementara untuk pembuatan katalog baru,
pihak Mirota Jakal 6 dapat menggabungkan produk dari departemen yang
jarang terbeli secara bersamaan dengan membuat promo paket. Seperti
promo paket untuk produk tisu pada DEPT 6 (kebutuhan dan pembersih
rumah) digabung dengan produk minyak goreng pada DEPT 5 (bumbu
masak, bahan makanan) karena kedua departemen tersebut jarang terbeli
secara bersamaan, dan dengan membuat promo paket ini dapat membuat
konsumen lebih tertarik untuk membeli produk tersebut.
c. Metode Klasifikasi
Berdasarkan analisis rules yang terbentuk dari algoritma decision tree,
diketahui bahwa kriteria jarak merupakan kriteria yang paling menentukan
keputusan konsumen untuk kembali berbelanja di Mirota Jakal 6 atau tidak.
Sehingga sebaiknya pihak Mirota Jakal 6 melakukan pertimbangan terkait
lokasi tempat/toko yang strategis dimana lokasinya dekat dengan customer
yang dituju atau target pasarnya.
DAFTAR PUSTAKA
M.I. Darwansyah 2018), Penerapan Data Mining Pada Penjualan Sepeda Motor di PT.
Tunas Dwipa Matra Palembang Menggunakan Metode Clustering
eprints.polsri.ac.id
Maulana, A. & Fajrin, A. A., 2018. Penerapan Data Mining untuk Analisis Pola
Pembelian Konsumen dengan Algoritma FP-Growth pada Data Transaksi
Penjualan Spare Part Motor. Kumpulan Jurnal Ilmu Komputer, 1
Februari.Volume 5.
Mardi, Yuli. 2019. Data Mining: Klasifikasi Menggunakan Algoritma C4.5. Jurnal
Edik Informatika.
LAMPIRAN
https://forms.gle/NXzCAJD9dkh5EbFY7