LAPORAN UAS
DISUSUN OLEH :
ARWINSYAH PUTRA
201631090
ARWINSYAH PUTRA
I
DAFTAR ISI
II
BAB 1
PENDAHULUAN
1.1.Latar Belakang
1.2.Permasalahan Metode
Association rule mining merupakan teknik data mining untuk menemukan aturan asosiatif antara suatu
kombinasi item.contohnya Analisis pembelian di suatu pasar swalayan, dapat diketahui brp besar
kemungkinan seorang pelanggan membeli roti bersamaan dengan susu. Dengan kondisi tersebut pemilik
swalayan dpt mengatur penempatan barangnya, atau merancang promosi pemasaran dengan memakai kupon
diskon utk kombinasi barang tertentu.
Association Rule menjadi terkenal karena aplikasinya untuk menganalisis isi keranjang belanja pelanggan
di pasar swalayan, Makanya itu sering disebut Market Basket Analysis.
Association Rule juga dikenal salah satu teknik Data Mining yang menjadi dasar dari berbagai teknik Data
Mining lainnya.
Salah satu tahap analisis asosiasi yang menarik perhatian banyak peneliti untuk menghasilkan algoritma
yang efisien adalah analisis pola frekuensi tinggi (frequent pattern mining). Penting tidaknya suatu aturan
asosiatif dapat diketahui dgn dua parameter :
1.3.Sistematika Penulisan
1
Sistematika penulisan laporan ini dibagi menjadi 4 (empat) bab yaitu sebagai berikut:
BAB 1 : Pendahuluan
Bab ini berisi tentang latar belakang, permasalahan metode, dan sistematika penulisan.
BAB 2 : Landasan Teori
Bab ini membahas tentang konsep dasar dan teori-teori yang mendukung pembahasan
yang berhubungan dengan sistem yang akan dibuat.
BAB 3 : Pembahasan
Bab ini membahas mengenai analisa data yang akan diproses berdasarkan analisis
asosiasi dengan algoritma apriori.
BAB 4 : Kesimpulan
Bab ini berisi tentang kesimpulan dari hasil pembahasan.
2
BAB 2
LANDASAN TEORI
A. Data Mining
Data mining adalah proses yang memperkerjakan satu atau lebih teknik pembelajaran
komputer (machine learning) untuk menganalisis dan mengekstrasi pengetahuan (knowledge)
secara otomatis. Data mining merupakan proses iterative dan interaktif untuk menemukan pola
atau model baru yang sahih (sempurna), bermanfaat dan dapat dimengerti dalam suatu
database yang besar (Hermawati, 2013).Hal penting yang terkait dengan data mining (Kusrini,
2009) adalah :
1. Data mining merupakan suatu proses otomatis terhadap data yang sudah ada.
2. Data yang akan diproses berupa data yang sangat besar.
3. Tujuan data mining adalah untuk mendapatkan hubungan atau pola yang mungkin
memberikan indikasi yang bermanfaat. B. Tahapan Data Mining
3
5. Fase Evaluasi (Evaluation Phase)
6. Fase Penyebaran (Deployment Phase) (Sumber : Kusrini, 2009)
C. Aturan Asosiasi
Ketersediaan database mengenai catatan transaksi pembelian para pelanggan suatu
supermarket atau tempat lain, telah mendorong pengembangan teknik-teknik yang secara
otomatis menemukan asosiasi produk atau item-item yang tersimpan dalam database
tersebut.sebagai contoh adalah data mengenai transaksi pada supermarket. Data transaksi
mendaftar semua item yang dibeli oleh pelanggan dalam suatu transaksi pembelian tunggal.
Para manajer ingin tahu apakah suatu kelompok item selalu dibeli secara bersama-ama. Para
manajer tersebut bisa menggunakan informasi tersebut untuk membuat layout supermarket,
sehingga penyusunan item-item tersebut bisa optimal satu sama lain atau untuk keperluan
promosi, segmentasi pembeli, pembuatan katalog produk, atau melihat pola belanja. Aturan
asosiasi ingin memberikan informasi tersebut dalam bentuk hubungan “if-then” atau “jika-
maka” yang dihitung dari data yang sifatnya probabilistik. Ide dari aturan asosiasi adalah untuk
memeriksa semua kemungkinan hubungan if-then antar item dan memilih hanya yang paling
mungkin (most likely) sebagai indikator dari hubungan ketergantungan antar item. Biasanya
digunakan istilah antedecent untuk mewakili bagian “jika” dan consequent untuk mewakili
bagian “maka”. Dalam analisis ini. Antedecent dan consequent adalah sekelompok item yang
tidak punya hubungan secara bersama (Santosa, 2007). Metodologi dasar aturan asosiasi
terbagi menjadi dua tahap (Kusrini, 2009) yaitu :
1. Analisis pola frekuensi tinggi
Tahap ini mencari kombinasi item yang memenuhi syarat minimum dari nilai support
dalam database. Nilai support (penunjang) yaitu persentase item atau kombinasi item yang
ada pada database. Nilai support sebuah item diperoleh dengan rumus berikut :
4
D. Algoritma Apriori
Algoritma apriori adalah satu algoritma dasar yang diusulkan oleh Agrawal dan Srikan
pada tahun 1994 untuk menemukan frequent itemsets pada aturan asosiasi Boolean. Ide utama
pada algoritma apriori adalah : pertama, mencari frequent itemset (himpunan item-item yang
memenuhi minimum support.) dari basis data transaksi, kedua – menghilangkan itemset degaan
frekuensi yang rendah berdasarkan level minimum support yang telah ditentukan sebelumnya.
Selanjutnya membangun aturan asosiasi dari itemset yang memenuhi nilai minimum
confidence dalam basis data (Agrawal & Srikant, 1994). Untuk membentuk kandidat itemset
ada dua proses utama yang dilakukan algoritma apriori (Han & kamber, 2006) :
1. Join Step (Penggabungan)
Pada proses ini setiap item dikombinasikan dengan item lainnya sampai tidak
terbentuk kombinasi lagi.
2. Prune Step (Pemangkasan)
Pada proses ini, hasil dari item yang dikombinasikan tadi kemudian dipangkas
dengan menggunakan minimum support yang telah ditentukan oleh user.
5
BAB 3
PEMBAHASAN
Data berikut merupakan data penjualan selama 20 minggu dari suatu Toko Ali
Tentukan 3 barang apa yang muncul bersamaan dengan minSupp 50% dan minCoff=75%
Pada soal diatas dapat dilihat data selama 20 minggu hasil penjualan yang dilakukan toko ali,
dimana dari data diatas kita akan mencari barang dengan minimum support sebesar = 50%
dan minimum confidence = 75%. Ada beberapa step yang akan dilakukan dalam proses ini
Step 1 :
Dataset diatas kita konver dahulu kedalam bentuk text, dalam hal ini saya melakukan convert
online yang banyak tersedia di internet
ID TRANSAKSI PENJUALAN ,BARANG
M1 ,B1,B3,136,B8,B12,B8,B12,B16
M2 ,B2,B4,B7,B10,B12,B16,B19,B20
M3 ,B3,B6,B9,B11,B14,B18,B19
M4 ,B2,B5,B8,B10,B17
M5 ,B2,B10,B13,B16,B19,B20
M6 ,B1,B3,B13,B14
M7 ,B1,B3,B5,B9,B12,B15,B18,B20
M8 ,B4,B7,B11,B13,B16,B18
M9 ,B2,B3,B8,B12,B15,B19
M10 ,B3,B7,B9,B13,B16,B17,B18
M11 ,B2,B8,B11,B12,B13,B18
6
M12 ,B1,B3,B6,B10,B17,B20
M13 ,B4,B8,B11,B14,B20
M14 ,B1,B2,B3,B6,B9,B12,B15,B18
M15 ,B7,B8,B15,B20
M16 ,B4,B6,B13,B16,B17
M17 ,B2,B5,B8,B11,B12,B19
M18 ,B2,B5,B10,B13
M19 ,B5,B10,B12,B13
M20 ,B1,B3,B4,B9,B15,B16,B19,B20
Dataset diatas adalah data setelah kita convert ke text diaman masih banyak data yang tidak
beraturan, data-data tersebut lalu kita import lagi ke dalam Excel
ID TRANSAKSI PENJUALAN Column2 Column3 Column4 Column5 Column6 Column7 Column8 Column9
M1 B1 B3 B6 B8 B12 B8 B12 B16
M2 B2 B4 B7 B10 B12 B16 B19 B20
M3 B3 B6 B9 B11 B14 B18 B19
M4 B2 B5 B8 B10 B17
M5 B2 B10 B13 B16 B19 B20
M6 B1 B3 B13 B14
M7 B1 B3 B5 B9 B12 B15 B18 B20
M8 B4 B7 B11 B13 B16 B18
M9 B2 B3 B8 B12 B15 B19
M10 B3 B7 B9 B13 B16 B17 B18
M11 B2 B8 B11 B12 B13 B18
M12 B1 B3 B6 B10 B17 B20
M13 B4 B8 B11 B14 B20
M14 B1 B2 B3 B6 B9 B12 B15 B18
M15 B7 B8 B15 B20
M16 B4 B6 B13 B16 B17
M17 B2 B5 B8 B11 B12 B19
M18 B2 B5 B10 B13
M19 B5 B10 B12 B13
M20 B1 B3 B4 B9 B15 B16 B19 B20
Dataset diatas adalah data yang telah diimport kedalam excel, data yang yang tidak sesuai
dengan yang ada di dalam gambar dataset yang sebelumnya telah di perbaiki dan disesuaikan
dengan data yang ada pada gambar.
Step 2 :
Dari data set diatas kemudian kita mulai menghitung dengan menggunakan algoritma apriori
7
Gambar diatas merupakan contoh dari algoritma apriori
Dengan menggunakan rumus excel =COUNTIF(range;criteria) misal
= COUNTIF(B2:I21;”B1”) maka akan muncul berapa jumlah B1 yang ada di dalam table
tersebut
Hasil C1 :
8
Step 3 :
Mencari 3 barang yang muncul secara bersamman dengan minimum confidence
75%
Iterasi 1
BARANG B1 B2 B3 B4 B5 B6 B7 B8 B9 B10
CONFIDENCE 100% 100% 100% 100% 100% 100% 100% 100% 100% 100%
B11 B12 B13 B14 B15 B16 B17 B18 B19 B20
100% 100% 100% 100% 100% 100% 100% 100% 100% 100%
Iterasi 2
BARANG B1B2 B1B3 B1B4 B1B5 B1B6 B1B7 B1B8 B1B9 B1B10
JUMLAH 1 6 1 1 3 0 1 3 1
CONFIDENCE 17% 100% 17% 17% 50% 0% 17% 50% 17%
B1B11 B1B12 B1B13 B1B14 B1B15 B1B16 B1B17 B1B18 B1B19 B1B20 B2B3
0 3 1 1 3 2 1 1 1 3 1
0% 50% 17% 17% 50% 33% 17% 17% 17% 50% 13%
B2B4 B2B5 B2B6 B2B7 B2B8 B2B9 B2B10 B2B11 B2B12 B2B13 B2B14
1 3 0 1 4 0 4 2 4 2 0
13% 38% 0% 13% 50% 0% 50% 25% 50% 25% 0%
B2B15 B2B16 B2B17 B2B18 B2B19 B2B20 B3B4 B3B5 B3B6 B3B7 B3B8
2 2 1 2 4 2 1 1 4 1 2
25% 25% 13% 25% 50% 25% 11% 11% 44% 11% 22%
B3B9 B3B10 B3B11 B3B12 B3B13 B3B14 B3B15 B3B16 B3B17 B3B18 B3B19
5 1 1 4 2 2 4 3 2 4 3
56% 11% 11% 44% 22% 22% 44% 33% 22% 44% 33%
B3B20 B4B5 B4B6 B4B7 B4B8 B4B9 B4B10 B4B11 B4B12 B4B13 B4B14
3 0 1 2 1 1 1 2 1 2 1
33% 0% 20% 40% 20% 20% 20% 40% 20% 40% 20%
9
B4B15 B4B16 B4B17 B4B18 B4B19 B4B20 B5B6 B5B7 B5B8 B5B9 B5B10
1 4 1 1 2 3 0 0 2 1 3
20% 80% 20% 20% 40% 60% 0% 0% 40% 20% 60%
B5B11 B5B12 B5B13 B5B14 B5B15 B5B16 B5B17 B5B18 B5B19 B5B20 B6B7
1 3 2 0 1 0 1 1 1 1 0
20% 60% 40% 0% 20% 0% 20% 20% 20% 20% 0%
B6B8 B6B9 B6B10 B6B11 B6B12 B6B13 B6B14 B6B15 B6B16 B6B17 B6B18
1 2 1 1 2 1 1 1 2 2 2
20% 40% 20% 20% 40% 20% 20% 20% 40% 40% 40%
B6B19 B6B20 B7B8 B7B9 B7B10 B7B11 B7B12 B7B13 B7B14 B7B15 B7B16
1 1 1 1 1 1 1 2 0 1 3
20% 20% 25% 25% 25% 25% 25% 50% 0% 25% 75%
B7B17 B7B18 B7B19 B7B20 B8B9 B8B10 B8B11 B8B12 B8B13 B8B14 B8B15
1 2 1 2 0 2 3 4 0 1 2
25% 50% 25% 50% 0% 25% 38% 50% 0% 13% 25%
B8B16 B8B17 B8B18 B8B19 B8B20 B9B10 B9B11 B9B12 B9B13 B9B14 B9B15
1 1 1 2 2 0 1 2 1 1 3
13% 13% 13% 25% 25% 0% 20% 40% 20% 20% 60%
B9B16 B9B17 B9B18 B9B19 B9B20 B10B11 B10B12 B10B13 B10B14 B10B15 B10B16
2 1 4 2 2 1 3 3 0 0 2
40% 20% 80% 40% 40% 17% 50% 50% 0% 0% 33%
B10B17 B10B18 B10B19 B10B20 B11B12 B11B13 B11B14 B11B15 B11B16 B11B17 B11B18
2 1 2 3 2 1 2 0 1 0 3
33% 17% 33% 50% 40% 20% 40% 0% 20% 0% 60%
B11B19 B11B20 B12B13 B12B14 B12B15 B12B16 B12B17 B12B18 B12B19 B12B20 B13B14
2 1 1 0 3 2 0 3 2 2 1
40% 20% 11% 0% 33% 22% 0% 33% 22% 22% 13%
B13B15 B13B16 B13B17 B13B18 B13B19 B13B20 B14B15 B14B16 B14B17 B14B18 B14B19
0 4 2 2 1 1 0 0 0 1 1
0% 50% 25% 25% 13% 13% 0% 0% 0% 33% 33%
10
B14B20 B15B16 B15B17 B15B18 B15B19 B15B20 B16B17 B16B18 B16B19 B16B20 B17B18
1 1 0 2 2 3 2 2 3 3 1
33% 20% 0% 40% 40% 60% 29% 29% 43% 43% 25%
Iterasi 3 :
BARANG B4,B7,B16
JUMLAH 2
CONFIDENCE 100%
Pada iterasi ketiga dilakukan penggabungan 3 macam barang yang ada sehingga menjadi 3
barang dalam satu kelompok. Pada data diatas dapat dilihat bahwasannya hanya barang ke 2
dan ke 3 yang bias untuk digabung, maka barang urutan ke 1 dan ke 4 akan dihapus dengan
hasil perhitungan demikian akan didapat tiga jenis barang yang digabung yaitu B4, B7, B16.
Pengujian dilakukan dengan membuat kondisi jika B4 dan B7 dibeli maka B16 juga akan
dibeli dengan confidence sebesar = 100%
11
BAB 4
KESIMPULAN
.Dari hasil pencarian diatas minimum support sebesar = 50% tidak terpenuhi maka pencarian
dilanjutkan untuk mencari confidence sebesar 75% maka didapatkan hasil tiga barang yang
paling sering muncul bersamaan yaitu B4,B7,B16 dengan confidence = 100%.
12
DAFTAR PUSTAKA
13