3.3.1 Support
Support adalah probabilitas dari item atau sekumpulan item dalam sebuah ba-
sis data transaksional seperti pada persamaan (3.12)
n(X)
Support(X) = (3.12)
n
Dengan n adalah jumlah total transaksi dalam basis data, sedangkan n(X) adalah
jumlah transaksi yang mengandung itemset X, atau support count yaitu jumlah item
yang terdapat dalam transaksi.
3.3.2 Confidence
support(X ∪ Y )
Conf idence(x → y) = (3.13)
support(X)
3.3.3 FP-Tree
Frequent Pattern Tree (FP-Tree) adalah representasi pemasukan data yang di-
padatkan (Kumar, 2004). FP-Tree dibentuk dengan membaca kumpulan data pada
suatu transaksi dalam suatu waktu dan memetakan transaksi tersebut ke dalam lintas-
an FP-Tree. Transaksi yang berbeda memiliki itemset yang sama, sehingga memung-
kinkan lintasan tersebut saling menimpa. Semakin banyak lintasan yang menimpa
satu sama lain, maka proses pemadatan semakin baik. Misal I= {a1 ,a2 ,..,..,..,an } ada-
lah kumpulan dari item, dan basis data transaksi DB = {T1 ,T2 ,..,..,Tn }, dengan Ti (i
[1..n]) adalah sekumpulan transaksi yang mengandung item di I. Pada association
rule pencarian frequent itemset dapat dilakukan dengan FP-Growth dengan bantuan
dari struktur FP-Tree.
3.3.4 FP-Growth
FP-Tree yang telah dilakukan dari sekumpulan data transaksi, akan diterapk-
an algoritme FP-Growth untuk mencari frequent itemset yang memenuhi syarat. FP-
Growth menggunakan konsep pembangunan tree dalam pencarian itemset, tidak meng-
gunakan generate candidate seperti Algoritme Apriori. Hal inilah yang menyebabkan
26
Algoritme FP-Growth lebih cepat dari Algoritme Apriori. Algoritme FP-Growth di-
bagi menjadi tiga langkah utama, yaitu:
1. Tahap pembangkitan conditional pattern base
Conditional pattern base merupakan subdatabase yang berisi prefix path (lin-
tasan prefix) dan suffix pattern (pola akhiran). Pembangkitan conditional pat-
tern base didapatkan melalui FP-Tree yang telah dibangun sebelumnya.
2. Tahap pembangkitan conditional FP-Tree
Pada tahap ini, support count dari setiap item pada setiap conditional pattern
base dijumlahkan, lalu setiap item yang memiliki jumlah support count lebih
besar sama dengan minimum support count akan dibangkitkan dengan condi-
tional FP-Tree.
3. Tahap Pencarian frequent itemset
Apabila Conditional FP-Tree merupakan lintasan tunggal (single path), ma-
ka didapatkan frequent itemset dengan melakukan kombinasi item untuk setiap
conditional FP-Tree. Jika bukan lintasan tunggal, maka dilakukan pembangkit-
an FP-Growth secara rekursif.
Proses awal yang dilakukan adalah dengan membangun FP-Tree dari term
yang dihasilkan dari tahapan temu kembali dokumen. Tabel 3.1 merupakan ilustrasi
contoh term dari dokumen yang dihasilkan pada tahapan preprocessing. TID me-
rupakan kalimat yang ada di dalam dokumen teratas yang telah dilakukan tahapan
preprocessing. Sedangkan terms adalah daftar kata dalam kalimat pada dokumen
teratas.
TID Terms
1 {a,b}
2 {b,c,d}
3 {a,b,d,e}
4 {a,d,e}
5 {a,b,c}
6 {a,b,c,d}
7 {a}
8 {a,b,c}
9 {a,b,d}
10 {b,c,e}
Term hasil dari tahapan preprocessing pada Tabel 3.1 digunakan untuk pem-
27
bentukan FP-Tree. Ilustrasi pembentukan FP-Tree dapat dilihat pada Gambar 3.3
Setelah pembentukan FP-Tree, langkah berikutnya adalah penerapan algoritme FP-
Growth, untuk melakukan pencarian frequent itemset. Pada penerapan algoritme FP-
Growth dilakukan ada 3 tahapan yang akan dilakukan yaitu 1) Tahap pembangkit-
an conditional pattern base, 2) tahap pembangkitan conditional FP-Tree, 3) Tahap
Pencarian frequent itemset. Untuk menemukan frequent itemset dari Tabel 3.1, di-
tentukan terlebih dahulu lintasan yang berakhir dengan support count terkecil yaitu e
yang diikuti dengan d, c, b, dan di akhiri a. Proses pembentukan masing-masing node
dapat dilihat pada Gambar 3.4
28
Setelah dilakukan penguraian frequent itemset pada Gambar 3.4, maka dida-
patkan frequent itemset untuk beberapa akhiran (suffix) seperti pada Tabel 3.2
Ketiga tahap tersebut merupakan langkah yang akan dilakukan untuk menda-
pat frequent itemset. Algoritme FP-Growth disajikan pada Algoritme 1 (Han dkk.,
2012a).
P merupakan path atau lintasan pada tree, β merupakan kombinasi dari node
yang ada di dalam lintasan P dan ai merupakan item transakasi.