Anda di halaman 1dari 8

Knowledge Discovery

in Databases (IS704)
dan Data Mining
(CS704)

Kuliah #8:
Association Rules Mining (Bagian 2)

Gunawan
Jurusan Teknik Informatika
Sekolah Tinggi Teknik Surabaya

Blok Sistem AR Mining

21 December 2022 Gunawan, Teknik Informatika STTS 2

1
Fase 1: Pencarian Large Itemsets (#1)

 Problem: Bagaimana melakukan pencarian


semua large itemsets secara efisien?
– Perhatikan bahwa: jika {beer, diaper} adalah sebuah
large itemset, maka masing-masing {diaper} dan {beer}
dapat dipastikan anggota large itemsets juga.
– Hal ini Berarti: Jika sebuah itemsets tidak large / tidak
frequent, (seperti {wine}) maka tidaklah mungkin akan
terdapat large itemset yang memuat wine seperti {beer,
wine}.

21 December 2022 Gunawan, Teknik Informatika STTS 3

Fase 1: Pencarian Large Itemsets (#2)

 Contoh: Asumsikan bahwa itemsets dengan ukuran 1


(itemsets-1) berikut telah diketahui merupakan large itemsets
dengan ukuran 1 (large itemsets-1): {Milk},{Bread},{ Butter}
 Karena {wine} bukan merupakan large itemsets-1  {wine,
Butter} tidak mungkin akan menjadi large itemsets-2.
 Hanya jika {wine} dan {Butter} keduanya adalah large
itemsets-1, maka {wine, Butter} bisa menjadi large itemsets-2.
 Sehingga logika kerjanya secara umum adalah:
– Dapatkan semua large itemsets-1.
– Untuk mendapatkan semua large itemsets-2, hitunglah
frekuensi (counting) dari itemsets-2 yang mengandung 2
dari item-item berikut: Milk, Bread, Butter.

21 December 2022 Gunawan, Teknik Informatika STTS 4

2
Contoh Input, Frequent Itemset & Output

21 December 2022 Gunawan, Teknik Informatika STTS 5

Original
Algoritma AIS
Mining Association
Rules between
Sets of Items in
Large Databases,
(Rakesh Agrawal,
Thomas Imielinski,
Arun Swami)

Proceeding of the 1993


ACM SIGMOD Conference
Wahington DC, USA,
May 1993.

21 December 2022 Gunawan, Teknik Informatika STTS 6

3
Algoritma AIS

21 December 2022 Gunawan, Teknik Informatika STTS 7

Tracing Algoritma AIS (#1)


 Input:
– Minimum support 40%
– D (transaksi database):

21 December 2022 Gunawan, Teknik Informatika STTS 8

4
Tracing Algoritma AIS (#2)
 L1 (line number, #1)

21 December 2022 Gunawan, Teknik Informatika STTS 9

Tracing Algoritma AIS (#3)


 Lt, Ct, C2, dan L2 (Iterasi pertama #3-19, k=2)

21 December 2022 Gunawan, Teknik Informatika STTS 10

5
Tracing Algoritma AIS (#3)
 Lt, Ct, C3, dan L3 (Iterasi kedua #3-19, k=3)

21 December 2022 Gunawan, Teknik Informatika STTS 11

Tracing Algoritma AIS (#3)


 Lt, Ct, dan C4 (Iterasi terakhir #3-19, k=4)
 Pada iterasi ini tidak ada L4 yang dihasilkan karena
semua anggota C4 tidak memenuhi minimum support
(40% atau 2 transaksi).

21 December 2022 Gunawan, Teknik Informatika STTS 12

6
Tracing Algoritma AIS (#4)
 Apakah semua output dari algoritma AIS
tersebut (answer) pada #20?

21 December 2022 Gunawan, Teknik Informatika STTS 13

Fase 2: Generate Strong Association Rules (#1)

 Lakukan untuk semua large itemsets-k: Dapatkan semua


rule-rule LHSRHS yang mungkin (dengan
memperhatikan semua kombinasi item yang terdapat
dalam sebuah large itemsets-k).
 Contoh: Asumsikan {Milk, Bread, Butter} adalah sebuah
large itemsets-3:
– Apakah {Milk}  {Bread, Butter} memenuhi minimum confidence?
– Bagaimana dengan pasangan-pasangan: {Bread}  {Milk, Butter},
{Butter} {Milk, Bread}, {Bread, Butter}  {Milk}, {Milk, Butter} 
{Bread}, {Milk, Bread}  {Butter}?
– Untuk menghitung confidence sebuah rule {Milk}  {Bread, Butter}:

Support {Milk, Bread, Butter}


Support {Milk}

21 December 2022 Gunawan, Teknik Informatika STTS 14

7
Fase 2: Generate Strong Association Rules (#2)

 Jika rule {Yogurt}  {Bread, Butter } diketahui telah


memenuhi minimum confidence.
 Apakah ini berarti, rule:
{Bread, Butter}{Yogurt} juga memenuhi minimum confidence?
 Penjelasan:
– Support dari {Yogurt} adalah 20%.
– Support dari {Yogurt, Bread, Butter } adalah 10% .
– Support dari {Bread and Butter } adalah 50%.
– Confidence dari {Yogurt}  {Bread, Butter} adalah
10%/20%=50%.
– Confidence dari {Bread, Butter}  {Yogurt} adalah
10%/50%=20%.

21 December 2022 Gunawan, Teknik Informatika STTS 15

Anda mungkin juga menyukai