Anda di halaman 1dari 11

PROYEK DATA MINING

Implementasi Algoritma Apriori untuk Mencari Asosiasi Barang yang Dijual di


E-commerce

Mawan eko wiranto


1810651104

PROGRAM STUDI TEKNIK INFORMATIKA


FAKULTAS TEKNIK

UNIVERSITAS MUHAMMADIYAH JEMBER


2021
BAB I
PENDAHULUAN
1.1 Latar Belakang

Data mining merupakan suatu langkah dalam knowlegde discovery in databases


(KDD) yang memiliki teknik menganalisa data untuk digali informasi tersembunyi dalam
jumlah besar dan kompleks, sehingga menghasilkan output berupa karakteristik atau pola
dari data tersebut. Salah satu teknik analisa Data Mining adalah analisis kelompok (cluster
analysis) yang lebih dikenal dengan Clustering. Clustering merupakan metode analisis data
yang tujuannya mengelompokkan data dengan karakteristik yang sama ke suatu wilayah
yang sama.
Perkembangan industri telekomunikasi saat ini sangat pesat karena telekomunikasi
sudah menjadi kebutuhan utama bagi masyarakat sehingga banyak perusahaan yang bergerak
di industry telekomunikasi. Banyaknya industry Telekomunikasi menuntut para pengembang
untuk menemukan strategi atau suatu pola yang dapat meningkatkan penjualan dan
pemasaran produk, salah satu strateginya adalah dengan memanfaatkan data transaksi. Paket
data merupakan produk dibidang telekomunikasi. Proses Clustering saat ini masih di lakukan
secara manual sehingga membutuhkan waktu, proses perhitungan dan ketelitian yang tinggi.
Database penjualan menyimpan jumlah record transaksi penjualan yang besar. Setiap
record memberikan daftar item barang yang dibeli oleh pelanggan dalam setiap transaksi
penjualan. Pimpinan akan tertarik untuk mengetahui jika ada beberapa kelompok item barang
secara konsisten dibeli secara bersama. Pimpinan dapat menggunakan data tersebut dalam
pengaturan layout toko untuk meletakkan item barang secara optimal dengan keterkaitan satu
dengan lainnya, dapat pula digunakan dalam promosi, atau dalam design katalog dan untuk
mengidentifikasi. Salah satu cara yang dapat diterapkan adalah dengan menerapkan
penggunaan Data Mining, Karena di dalam data mining sendiri terdapat cara dan teknik
dalam pemenuhan kebutuhan salah satunya adalah kebutuhan informasi yang luas, dan dari
informasi yang kita dapat bila kita gunakan sebagai suatu keputusan atau menentukan sebuah
kualitas dalam menentukan suatu keputusan.
analisa data mining dilakukan dengan menggunakan metode K-Means clustering.
Dengan menggunakan metode ini, data-data yang telah didapatkan dapat dikelompokan
kedalam beberapa cluster berdasarkan kemiripan dari data-data tersebut, sehingga data-data
yang memiliki karakteristik yang sama dikelompokan dalam satu cluster dan yang memliki
karakteristik yang berbeda dikelompokan dalam cluster yang lain yang memiliki karakteristik
yang sama. Teknik preprocessing data sering diterapkan pada kumpulan data agar lebih
bersih, konsisten dan bebas dari kebisingan. Normalisasi digunakan untuk menghilangkan
data yang berlebihan dan memastikan bahwa cluster kualitas baik dihasilkan yang dapat
meningkatkan efisiensi algoritma clustering.
1.2 Metode Asosiasi

Metode asosiasi adalah metode yang menemukan suatu kombinasi item yang muncul
bersamaan. Dalam dunia bisnis, sering disebut dengan affinity Analysis atau Market Basket
Analysis. Aturan Association rules biasanya menggunakan pola “jika (if) “ mewakili antecendent
dan “maka (then)” mewkili consequent, bersamaan dengan pengukuran support (converage) dan
confidence (accuration) yang terasosiasi dalam aturan. Fungsi Association rules sering kali
disebut dengan “Market Basket Analysis”, yang digunakan untuk menentukan kombinasi
diantara himpunan itemitem. Market Basket Analysis adalah kebiasaan membeli konsumen
dengan mencari asosiasi dan kombinasi antara item-item berbeda.

Pembentukan Aturan Asosiasi


Setelah semua pola frekuensi tinggi ditemukan, barulah dicari aturan assosiatif yang memenuhi
syarat minimum untuk confidence dengan menghitung confidence aturan assosiatif A_B. Nilai
confidence dari aturan A_B diperoleh dari rumus berikut:

Aturan Asosiasi Final


Dari analisis yang telah di lakukan dalam tahap ini akan terlihat asosiasi yang
terbentuk dengan menggunakan perhitungan algoritma apriori.

Implementasi Algoritma Apriori pada


RapidMiner
Setelah hasil perhitungan algoritma apriori di dapat dengan perhitungan manual maka
akan lebih akurat dengan software RapidMiner. Dengan cara menginput tabel tabular ke
dalam Ms.Excel yang kemudian di masukan ke software RapidMiner.

1.3 HASIL DAN PEMBAHASAN

Data transaksi penjualan produk akan terus bertambah setiap harinya dan menyebabkan penyimpanan
data yang sangat besar. Kebanyakan data transaksi penjualan produk hanya dijadikan sebagai arsip
saja tanpa dimanfaatkan dengan baik, maka diperlukan sebuah metode atau teknik yang dapat
merubah data-data yang menumpuk tersebut menjadi informasi yang bermanfaat untuk pengambilan
keputusan dengan menggunakan algoritma apriori untuk menghitung data penjualan produk
kosmetik.
1.4 Daftar Produk ( Kategori Kosmetik )

Berikut ini adalah daftar produk berdasarkan kategori kosmetik yang akan dianalisis, dapat dilihat
pada tabel dibawah ini :

NO Deskripsi Kuantitas CustomerID


PACK OF 60 PINK PAISLEY CAKE
1 CASES 3 14688
2 60 TEATIME FAIRY CAKE CASES 4 14688
TOMATO CHARLIE+LOLA COASTER
3 SET 6 14688
CHARLIE & LOLA WASTEPAPER BIN
4 FLORA 8 14688
RED CHARLIE+LOLA PERSONAL
5 DOORSIGN 6 14688
6 GIRLY PINK TOOL SET 5 15311
7 AIRLINE LOUNGE,METAL SIGN 2 15311
WHITE SPOT RED CERAMIC DRAWER
15311
8 KNOB 6
9 ANTIQUE GLASS DRESSING TABLE POT 8 16098
10 ALARM CLOCK BAKELIKE GREEN 4 16098
11 3 TIER CAKE TIN GREEN AND CREAM 2 16098
12 3 TIER CAKE TIN RED AND CREAM 2 16098
13 SET 3 WICKER OVAL BASKETS W LIDS 4 16098
WOOD BLACK BOARD ANT WHITE
18074
14 FINISH 3
15 HANGING MEDINA LANTERN SMALL 6 18074
16 WHITE LOVEBIRD LANTERN 6 18074
17 SET 3 WICKER OVAL BASKETS W LIDS 1 17420
18 JAM MAKING SET PRINTED 2 17420
19 JAM MAKING SET WITH JARS 6 17420
20 JUMBO BAG DOLLY GIRL DESIGN 1 17420
21 TRADITIONAL CHRISTMAS RIBBONS 2 17420
22 FIVE HEART HANGING DECORATION 6 17420
23 HANGING METAL HEART LANTERN 2 17420
24 CHRISTMAS LIGHTS 10 REINDEER 6 12431
VINTAGE UNION JACK CUSHION
12431
25 COVER 8

Table 2 dengan menggunakan data set:


Pencarian kuantitas dan jumlah data set pada customerID

Pemilihan Data Set


CustomerID Kuantitas
14688 3 4 6 8
15311 6 5 2
16098 4 8 2
18074 3 6
17420 6 2 1
12431 6 8
Jumlah Customer ID 7

Langkah selanjutnya pencarian frekuensi data set:


Pencarian frekuensi data set dengan total dan prioritas data costumerID

Pencarian Frekuensi Data Set

Customer ID 3 4 6 8 5 2 1
14688 1 1 1 1 0 0 0
15311 0 0 1 0 1 1 0
16098 0 1 0 1 0 1 0
18074 1 0 1 0 0 0 0
17420 0 0 1 0 0 1 1
12431 0 0 1 1 0 0 0
Total 2 2 5 3 1 3 1
Prioritas 4 5 1 2 6 3 7

Pencarian Frekuensi Data Set

Customer ID 6 8 2 3 4 5 1
14688 1 1 0 1 1 0 0
15311 1 0 1 0 0 1 0
16098 0 1 1 0 1 0 0
18074 1 0 0 1 0 0 0
17420 1 0 1 0 0 0 1
12431 1 1 0 0 0 0 0
Total 5 3 3 2 2 1 1
Prioritas 1 2 3 4 5 6 7

Pembentukan Item set:

Pembentukan Item Set


1.K=2 2.K=3
No Kombinasi No Kombinasi
1 6 8 1 6 8 2
2 6 2 2 6 8 3
3 6 3 3 6 8 4
4 6 4 4 6 8 5
5 6 5 5 6 8 1
6 6 1 6 8 2 3
7 8 2 7 8 2 4
8 8 3 8 8 2 5
9 8 4 9 8 2 1
10 8 5 10 2 3 4
11 8 1 11 2 3 5
12 2 3 12 2 3 1
13 2 4 13 3 4 5
14 2 5 14 3 4 1
15 2 1 15 4 5 1
16 3 4
17 3 5
18 3 1
19 4 5
20 4 1
21 5 1

Hitung support count :

Hitung Support Count = 4

1.K=2 2.K=3
No Kombinasi No Kombinasi
1 6 8 2 1 6 8 2 1
2 6 2 2 2 6 8 3 0
3 6 3 1 3 6 8 4 0
4 6 4 1 4 6 8 5 0
5 6 5 4 5 6 8 1 0
6 6 1 4 6 8 2 3 0
7 8 2 2 7 8 2 4 0
8 8 3 1 8 8 2 5 0
9 8 4 2 9 8 2 1 0
10 8 5 3 10 2 3 4 0
11 8 1 3 11 2 3 5 0
12 2 3 2 12 2 3 1 0
13 2 4 1 13 3 4 5 0
14 2 5 3 14 3 4 1 0
15 2 1 3 15 4 5 1 0
16 3 4 1
17 3 5 2
18 3 1 2
19 4 5 2
20 4 1 2
21 5 1 4

Hitung covidance:

Hitung Confidence ©

1.K=2 2.K=3
No Kombinasi support Confidance No Kombinasi support Confidance
1 6 8 2 29% 40% 1 6 8 2 1 14% 33%
2 6 2 2 29% 40% 2 6 8 3 0 0% 0%
3 6 3 1 14% 20% 3 6 8 4 0 0% 0%
4 6 4 1 14% 20% 4 6 8 5 0 0% 0%
5 6 5 4 57% 80% 5 6 8 1 0 0% 0%
6 6 1 4 57% 80% 6 8 2 3 0 0% 0%
7 8 2 2 29% 40% 7 8 2 4 0 0% 0%
8 8 3 1 14% 20% 8 8 2 5 0 0% 0%
9 8 4 2 29% 40% 9 8 2 1 0 0% 0%
10 8 5 3 43% 60% 10 2 3 4 0 0% 0%
11 8 1 3 43% 60% 11 2 3 5 0 0% 0%
12 2 3 2 29% 40% 12 2 3 1 0 0% 0%
13 2 4 1 14% 20% 13 3 4 5 0 0% 0%
14 2 5 3 43% 60% 14 3 4 1 0 0% 0%
15 2 1 3 43% 60% 15 4 5 1 0 0% 0%
16 3 4 1 14% 20%
17 3 5 2 29% 40%
18 3 1 2 29% 40%
19 4 5 2 29% 40%
20 4 1 2 29% 40%
21 5 1 4 57% 80%

Confidance = 80%
Artinya kuantitas dari angka 5,1 = 57%
Hitung support:

Hitung Support (S)

1.K=
2 2.K=3
No Kombinasi support No Kombinasi support
1 6 8 2 29% 1 6 8 2 1 14%
2 6 2 2 29% 2 6 8 3 0 0%
3 6 3 1 14% 3 6 8 4 0 0%
4 6 4 1 14% 4 6 8 5 0 0%
5 6 5 4 57% 5 6 8 1 0 0%
6 6 1 4 57% 6 8 2 3 0 0%
7 8 2 2 29% 7 8 2 4 0 0%
8 8 3 1 14% 8 8 2 5 0 0%
9 8 4 2 29% 9 8 2 1 0 0%
10 8 5 3 43% 10 2 3 4 0 0%
11 8 1 3 43% 11 2 3 5 0 0%
12 2 3 2 29% 12 2 3 1 0 0%
13 2 4 1 14% 13 3 4 5 0 0%
14 2 5 3 43% 14 3 4 1 0 0%
15 2 1 3 43% 15 4 5 1 0 0%
16 3 4 1 14%
17 3 5 2 29%
18 3 1 2 29%
19 4 5 2 29%
20 4 1 2 29%
21 5 1 4 57%

Support {6,1}= 57%

Artinya kuantitas dari angka 6,1 =57%

Menentukan minimum cinfidance 40%:

Tentukan Minimum Confidance = 40%

1.K=2 2.K=3
No Kombinasi support Confidance No Kombinasi support Confidance
1 6 8 2 29% 40% 1 6 8 2 1 14% 33%
2 6 2 2 29% 40% 2 6 8 3 0 0% 0%
3 6 3 1 14% 20% 3 6 8 4 0 0% 0%
4 6 4 1 14% 20% 4 6 8 5 0 0% 0%
5 6 5 4 57% 80% 5 6 8 1 0 0% 0%
6 6 1 4 57% 80% 6 8 2 3 0 0% 0%
7 8 2 2 29% 40% 7 8 2 4 0 0% 0%
8 8 3 1 14% 20% 8 8 2 5 0 0% 0%
9 8 4 2 29% 40% 9 8 2 1 0 0% 0%
10 8 5 3 43% 60% 10 2 3 4 0 0% 0%
11 8 1 3 43% 60% 11 2 3 5 0 0% 0%
12 2 3 2 29% 40% 12 2 3 1 0 0% 0%
13 2 4 1 14% 20% 13 3 4 5 0 0% 0%
14 2 5 3 43% 60% 14 3 4 1 0 0% 0%
15 2 1 3 43% 60% 15 4 5 1 0 0% 0%
16 3 4 1 14% 20%
17 3 5 2 29% 40%
18 3 1 2 29% 40%
19 4 5 2 29% 40%
20 4 1 2 29% 40%
21 5 1 4 57% 80%
Artinya kuantitas dari angka 6,8 =11%
Artinya kuantitas dari angka 6,2 =
11%
Artinya kuantitas dari angka 6,3 = 3%
Artinya kuantitas dari angka 6,4 = 3%
Artinya kuantitas dari angka 6,5 =
46%
Artinya kuantitas dari angka 6,1 =
46%
Artinya kuantitas dari angka 8,2 =11%
Artinya kuantitas dari angka 8,3 = 3%
Artinya kuantitas dari angka 8,4 =
11%
Artinya kuantitas dari angka 8,5 =
26%
Artinya kuantitas dari angka 8,1 =
26%
Artinya kuantitas dari angka 2,3 =
11%
Artinya kuantitas dari angka 2,4 = 3%
Artinya kuantitas dari angka 2,5 =
26%
Artinya kuantitas dari angka 2,1 =
26%
Artinya kuantitas dari angka 3,4 = 3%
Artinya kuantitas dari angka 3,5 =11%
Artinya kuantitas dari angka 3,1 =
11%
Artinya kuantitas dari angka 4,5 =
11%
Artinya kuantitas dari angka 4,1 =
11%
Artinya kuantitas dari angka 5,1 =
46%
KESIMPULAN

Setelah melakukan pengujian dengan cara perhitungan manual, dapat diketahui bahwa hasil
yang diperoleh dari perhitungan manual sama dengan perhitungan menggunakan software
RapidMiner. Pola asosiasi yang terbentuk dengan nilai minimum support 40% dan nilai
minimum confidence 0% menghasilkan 8 aturan asosiasi. Dengan diketahui produk yang
sering dibeli maka perusahaan dapat mengembangkan strategi pemasaran dan mengatur
stok barang agar tidak terjadi penumpukan. Penggunaan algoritma apriori dengan metode
FP- Growth dapat membantu pihak manajemen untuk meletakkan barang yang biasa dibeli
oleh konsumen, sehingga memudahkan konsumen untuk dapat membeli barang tersebut.

Anda mungkin juga menyukai