Anda di halaman 1dari 36

Algoritma Asosiasi

(Association Algorithm)

Penambangan Data (KP368)

Dibuat Oleh:
Junta Zeniarja, M.Kom, M.CS
Agus Umar Hamdani, M.Kom
Contoh Kasus : Kita ingin mengetahui
keterkaitan barang-barang yang dibeli
oleh pelanggan agar dapat diatur
penempatan dari barang-barang tst.

2
Definisi Association Rules

• Kata Kunci : Mencari suatu kaidah


keterhubungan dari data.
• Diusulkan oleh Agrawal, Imielinski,
and Swami (1993).
• Penambangan data dengan fungsi
asosiatif adalah teknik menambang
data untuk menemukan aturan
assosiatif (keterhubungan) antara
suatu kombinasi item.

3
Definisi Association Rules

Association Rules Mining Adalah proses


mendeteksi kumpulan atribut-atribut yang
muncul bersamaan (co-occur) dalam
frekuensi yang sering, dan membentuk
sejumlah kaidah dari kumpulan-kumpulan
tersebut.
Association Rule Mining adalah analisa
dari kebiasaan belanja konsumen dengan
mencari asosiasi dan korelasi antara item-
item berbeda yang diletakkan konsumen
dalam keranjang belanjaannya(Yang,
2003).
Definisi Association Rules

Contoh 1 : Association rule misalnya:


"70% dari orang-orang yang membeli
mie, juice dan saus akan membeli juga
roti tawar".
Contoh 2 : 90% orang yang berbelanja
di suatu supermarket yang membeli roti
juga membeli selai, dan 60% dari semua
orang yang berbelanja membeli
keduanya.
Definisi Association Rules

Dengan kemajuan teknologi, data


penjualan dapat disimpan dalam jumlah
besar yang disebut dengan “basket
data" atau “Market Basket”
Aturan asosiasi yang didefinisikan pada
basket data tersebut, dapat digunakan
untuk menganalisa data dalam rangka :
keperluan desain katalog promosi,
proses pembuatan keputusan bisnis,
segmentasi konsumen dan
target pemasaran.
Definisi Association Rules

Fungsi Asosiasi dapat


digunakan untuk tujuan
Market Basket Analysis
(menganalisa kebiasaan
customer dengan mencari
asosiasi dan korelasi dari data
transaksi yang sering
dilakukan).
Sebagai saran penempatan
barang dalam supermarket.
Sebagai saran produk apa
yang dipakai dalam
promosi.
7
Definisi Association Rules

Keterkaitan antar itemset dapat dihitung dengan


persamaan berikut :
Body ==> Consequent [ Support , Confidence ]
• Body: mewakili data yang ditambang.
• Consequent: mewakili property yang
ditemukan untuk data yang diperiksa.
• Support: mewakili persentase nilai
support.
• Confidence: mewakili persentase nilai
confidence.
8
Definisi Association Rules

• Aturan asosiatif digunakan untuk


menunjukkan hubungan antara objek
data.
• Aturan asosiatif memiliki dua langkah
terpisah:
a. Mencari minimum support yang
diterapkan untuk menemukan semua
pengulangan itemset dalam basis data.
b. Melakukan pengulangan itemset dan
menentukan batasan minimum
confidence yang digunakan untuk
membentuk aturannya (Aher & Lobo,
2012).
9
Definisi Association Rules

• Input
• Adanya sejumlah transaksi (dataset).
• Setiap transaksi memuat kumpulan
item (recordset).

• Problema
• Bagaimana caranya menemukan
association rule yang memenuhi nilai
minimum support dan nilai minimum
confidence yang kita berikan.
10
Definisi Association Rules

• Itemset: himpunan dari item-item yang


muncul bersama-sama.
• Kaidah asosiasi: peluang bahwa item-
item tertentu hadir bersama-sama.
• Analisis Nilai Support :
• Tahapan ini untuk mencari kombinasi
item yang memenuhi syarat minimum
dari nilai support dalam dataset /
dataset.

11
Definisi Association Rules

• Nilai support sebuah item (x) diperoleh


dengan rumus :

Jumlah Transaksi Mengandung X


Support (X) =
Total Transaksi

• Sedangkan nilai support dari 2 item


diperoleh dengan rumus :
Jumlah Transaksi Mengandung X & Y
Support (X ∩ Y) =
Total Transaksi

12
Definisi Association Rules

• Analisis Nilai Confidence :


• Setelah semua pola frekuensi
tertinggi ditemukan, kemudian dicari
aturan asosiatif yang memenuhi
syarat minimum untuk confidence
dengan menghitung nilai confidence
aturan asosiatif X Y, yang dihitung
dengan rumus :
Jumlah Transaksi Mengandung X ∩ Y
Confidence = P(X|Y)=
Jumlah Transaksi Mengandung X

13
Definisi Association Rules

• Confidence (keyakinan) dari kaidah X Y, ditulis


conf(X Y) adalah :
• confidence(X Y) = support(X∩Y) / supp(X)
• Rumus confidence bisa juga didefinisikan
dalam terminologi peluang bersyarat :
confidence(X Y) = P(Y|X)
= P(X∩Y) / P(X).
• Database transaksi menyimpan data transaksi.
• Data transaksi bisa juga disimpan dalam suatu
bentuk lain dari suatu database m x n.

14
Definisi Association Rules

• Misalkan I={I1, I2, …,Im} merupakan suatu


himpunan dari literal, yang disebut item-item.
• Misalkan D={T1, T2, …, Tn} merupakan suatu
himpunan dari n transaksi, dimana untuk setiap
transaksi T∈D, T⊆I.
• ϵ : belong to / termasuk ke dalam, elemen dari...
⊆ : subset of or is contained in (bagian dari..)
• Suatu himpunan item X⊆I disebut itemset.
• Suatu transaksi T memuat suatu itemset X, jika
X⊆T.
• Setiap itemset X diasosiasikan dengan suatu
himpunan transaksi TX ={T∈D | T⊆X} yang
merupakan himpunan transaksi yang memuat
itemset
• Support dari itemset X support(X)) : |TX|/|D|
15
Contoh Studi Kasus

Transaksi A B C D Jumlah transaksi |D| = 10


T1 1 0 1 14
T2 0 0 6 0 Kemunculan item A pada
transaksi (|Ta|) sebanyak 3 kali
T3 1 0 2 4 yaitu pada T1, T3, T8.
T4 0 0 4 0
T5 0 0 3 1 Support(A) =|Ta|/|D|
= 3/10 = 0.3.
T6 0 0 1 13
T7 0 0 8 0 |Tcd| sebanyak 5 kali, yaitu pada
T8 4 0 0 7 T1, T3, T5, T6, T9.
Support(CD)=|Tcd|/|D|
T9 0 1 1 10 = 5/10 = 0.5.
T10 0 0 0 18

Frequent itemset adalah itemset yang mempunyai support >= minimum


support yang diberikan oleh user.

16
Contoh Studi Kasus
Itemset Sp
A 0.3
B 0.1 Jika minsupport diberikan oleh user sebagai
C 0.8 threshold adalah 0.2, maka frequent itemset
D 0.7 adalah semua itemset yang support-nya >= 0.2,
yakni
AB 0
A, C, D, AC, AD, CD, ACD
AC 0.2
AD 0.3 Dari frequent itemset bisa dibangun kaidah
BC 0.1 asosiasi sbb:
BD 0.1 A C C A
A D D A
CD 0.5
C D D C
ABC 0
ABD 0 A,C D A,D C C,D A
ACD 0.2
BCD 0.1
Confidence(A C) = support(A,C) / support(A)
ABCD 0 17
Algoritma FP-Growth

• Algoritma FP-Growth merupakan


pengembangan dari algoritma Apriori.
• Algoritma Frequent Pattern Growth (FP-
Growth) adalah salah satu alternatif
algoritma yang dapat digunakan untuk
menentukan himpunan data yang paling
sering muncul (frequent itemset) dalam
sebuah kumpulan data.
• Pada algoritma FP-Growth menggunakan
konsep pembangunan tree, yang biasa
disebut FP-Tree, dalam pencarian frequent
itemsets bukan menggunakan generate
candidate seperti yang dilakukan pada
algoritma Apriori.
18
Algoritma FP-Growth

• Dengan menggunakan konsep tersebut,


algoritma FP-Growth menjadi lebih cepat
daripada algoritma Apriori.
• Metode FP-Growth dibagi menjadi tiga
tahapan utama, yaitu:
1. Tahap pembangkitan conditional
pattern base,
2. Tahap pembangkitan conditional FP-
Tree, dan
3. Tahap pencarian frequent itemset.

19
Algoritma FP Growth

Langkah-langkah dalam Algoritma FP Growth


:
• Langkah 1: Simpulkan item yang sering
dipesan. Untuk item dengan frekuensi
yang sama, urutannya diberikan
berdasarkan urutan abjad.
• Langkah 2: Buat pohon FP dari data di
langkah 1.
• Langkah 3: Dari pohon FP di atas, buat
pohon bersyarat FP untuk setiap item
(atau kumpulan item).
• Langkah 4: Tentukan pola frekuensi.

20
Contoh Algoritma FP Growth

Langkah 1 :

21
Contoh Algoritma FP Growth

Langkah 2 :

22
Contoh Algoritma FP Growth

Langkah 3 :

23
Contoh Algoritma FP Growth

Langkah 3 :

24
Contoh Algoritma FP Growth

Langkah 4 :

Akhirnya, kita dapat menghasilkan semua


kumpulan item yang sering dari pohon-
pohon FP bersyarat tersebut, yaitu :
{E}, {A, D, E}, {A, E}, {D, E}, {D}, {A, D},
{ C, D}, {C}, {A, C}, {B}, {A, B}, {A}.

25
Definisi Algoritma Apriori

Algoritma Apriori pertama kali dikenalkan oleh


Agrewal, Imielinski dan Swami.
Algoritma Apriori merupakan salah satu algoritma
yang digunakan di dalam memecahkan persoalan
association rule mining.
Yang mengolah suatu database transaksi dengan
setiap transaksi adalah suatu himpunan item-item.
Kemudian mencari seluruh kaidah apriori yang
memenuhi kendala minimum support dan minimum
confidence yang diberikan user.
Algoritma Apriori dapat digunakan untuk
menemukan tren bisnis dengan menganalisa
transaksi konsumen.
Contoh:
30% dari transaksi yang memuat susu dan juga
memuat popok 5% yang artinya 30% merupakan
confidence dan 5% merupakan support dari kaidah
ini.
Definisi Algoritma Apriori

• Prinsip dasar dalam Algoritma Apriori :


Subset apapun dari suatu frequent itemset
harus memenuhi frequent.
• L = Large or Frequent
• Ln = Frequent n-itemset.
• L3 = frekuensi 3 itemset {abc, abd, acd, ace,
bcd}
• Penggabungan sendiri : L3 * L * L3
• abcd dari abc dan abd
• acde dari acd dan ace
• Pemangkasan:
• acde dibuang, sebab ade tidak dalam L3
• C4={abcd}

27
Definisi Algoritma Apriori

Pseudo-Code Apriopri Algorithm :

Ck: Kandidate itemset dari ukuran k;


Lk : Frequent itemset dari ukuran k.
L1 = {frequent items};

for (k = 1; Lk !=0; k++) do begin


Ck+1 = {kandidat dibangun dari
for each transaksi t yang dimuat dalam database do
naikkan hitungan dari seluruh kandidat dalam Ck+1 yang
dimuat dalam t
Lk+1 = {kandidat dalam Ck+1 dengan
min_support}
end
return .k Lk;
Contoh Algoritma Apriori

Contoh apriori dengan minim um support 50% :

29
Contoh Algoritma Apriori

Search Space Pada Apriori :

30
Contoh Algoritma Apriori

Search Space Pada Apriori :

31
Contoh Algoritma Apriori

Search Space Pada Apriori :

32
Contoh Studi Kasus

T1 {roti, selai, mentega}


• Suatu supermarkat
mempunyai sejumlah
T2 {roti, mentega} transaksi seperti
T3 {roti, susu, mentega} dalam tabel.
T4 {coklat, roti} • Buatlah association
rule dari data tersebut
T5 {coklat, susu}
dengan cara
menghitung support
dan confidence.
• Pakailah metode
apriori dengan
minimum support=0.3
dan confidence=0.8.

33
Contoh Studi Kasus
Rumus :
Nilai Support (A) = jumlah transaksi mengandung A / Total transaksi.
Nilai Support untuk 2 itemset, Support(A ∩ B) = jumlah transaksi mengandung A dan B / Total Transaksi
Nilai Confidence (A B) = jumlah transaksi mengandung A dan B (AUB) / Jumlah transaksi mengandung A

Itemset selasi tidak memenuhi


support = 0.3
Itemset Support
T1 {roti, selai, mentega} Itemset Support
{roti,mentega} 3 / 5 = 0.6
T2 {roti, mentega} {roti} 4 / 5 = 0.8
{roti,susu} 1 / 5 = 0.2
{selai} 1 / 5 = 0.2
T3 {roti, susu, mentega} {roti,coklat} 1 / 5 = 0.2
{mentega} 3 / 5 = 0.6
T4 {coklat, roti} {mentega,susu} 1 / 5 = 0.2
{susu} 2 / 5 = 0.4
{mentega,coklat} 0
T5 {coklat, susu}
{coklat} 2 / 5 = 0.4
{susu,coklat} 1 / 5 = 0.2
Σ 5

Confidence(roti mentega) = Support({roti,mentega}) / Support({roti})


= 0.6 / 0.8 = 0.75 75%
Confidence(mentega roti) = Support({mentega,roti}) / Support({mentega})
= 0.6 / 0.6 = 1 100% (Terpilih, karena nilai confidence >=80%)
34
Contoh Studi Kasus
Kesimpulan akhir :
Confidence(mentega roti) = Support({mentega,roti}) / Support({mentega})
= 0.6 / 0.6 = 1 100% (Terpilih, karena nilai confidence >=80%)

Dengan nilai support sebesar 30% dan nilai Confidence sebesar


80%, maka :
• Setiap membeli Mentega, maka akan membeli Roti.
• Setiap membeli Roti, maka akan membeli mentega.

35
36

Anda mungkin juga menyukai