Pertemuan 6-FPGrowth

25
3.3.1 Support
Support adalah probabilitas dari item atau sekumpulan item dalam sebuah ba-
sis data transaksional seperti pada persamaan (3.12)
n(X)
Support(X) = (3.12)
n
Dengan n adalah jumlah total transaksi dalam basis data, sedangkan n(X) adalah
jumlah transaksi yang mengandung itemset X, atau support count yaitu jumlah item
yang terdapat dalam transaksi.
3.3.2 Confidence
Confidence adalah probabilitas kondisional, untuk aturan asosiasi x→ y dide-

finisikan pada persamaan (3.13)
support(X ∪ Y )
Conf idence(x → y) = (3.13)
support(X)
3.3.3 FP-Tree
Frequent Pattern Tree (FP-Tree) adalah representasi pemasukan data yang di-
padatkan (Kumar, 2004). FP-Tree dibentuk dengan membaca kumpulan data pada
suatu transaksi dalam suatu waktu dan memetakan transaksi tersebut ke dalam lintas-
an FP-Tree. Transaksi yang berbeda memiliki itemset yang sama, sehingga memung-
kinkan lintasan tersebut saling menimpa. Semakin banyak lintasan yang menimpa
satu sama lain, maka proses pemadatan semakin baik. Misal I= {a1 ,a2 ,..,..,..,an } ada-
lah kumpulan dari item, dan basis data transaksi DB = {T1 ,T2 ,..,..,Tn }, dengan Ti (i
[1..n]) adalah sekumpulan transaksi yang mengandung item di I. Pada association
rule pencarian frequent itemset dapat dilakukan dengan FP-Growth dengan bantuan
dari struktur FP-Tree.
3.3.4 FP-Growth
FP-Tree yang telah dilakukan dari sekumpulan data transaksi, akan diterapk-
an algoritme FP-Growth untuk mencari frequent itemset yang memenuhi syarat. FP-
Growth menggunakan konsep pembangunan tree dalam pencarian itemset, tidak meng-
gunakan generate candidate seperti Algoritme Apriori. Hal inilah yang menyebabkan
26
Algoritme FP-Growth lebih cepat dari Algoritme Apriori. Algoritme FP-Growth di-
bagi menjadi tiga langkah utama, yaitu:
1. Tahap pembangkitan conditional pattern base
Conditional pattern base merupakan subdatabase yang berisi prefix path (lin-
tasan prefix) dan suffix pattern (pola akhiran). Pembangkitan conditional pat-
tern base didapatkan melalui FP-Tree yang telah dibangun sebelumnya.
2. Tahap pembangkitan conditional FP-Tree
Pada tahap ini, support count dari setiap item pada setiap conditional pattern
base dijumlahkan, lalu setiap item yang memiliki jumlah support count lebih
besar sama dengan minimum support count akan dibangkitkan dengan condi-
tional FP-Tree.
3. Tahap Pencarian frequent itemset
Apabila Conditional FP-Tree merupakan lintasan tunggal (single path), ma-
ka didapatkan frequent itemset dengan melakukan kombinasi item untuk setiap
conditional FP-Tree. Jika bukan lintasan tunggal, maka dilakukan pembangkit-
an FP-Growth secara rekursif.
Proses awal yang dilakukan adalah dengan membangun FP-Tree dari term
yang dihasilkan dari tahapan temu kembali dokumen. Tabel 3.1 merupakan ilustrasi
contoh term dari dokumen yang dihasilkan pada tahapan preprocessing. TID me-
rupakan kalimat yang ada di dalam dokumen teratas yang telah dilakukan tahapan
preprocessing. Sedangkan terms adalah daftar kata dalam kalimat pada dokumen
teratas.
Tabel 3.1 Contoh term hasil dari tahapan preprocessing
TID Terms
1 {a,b}
2 {b,c,d}
3 {a,b,d,e}
4 {a,d,e}
5 {a,b,c}
6 {a,b,c,d}
7 {a}
8 {a,b,c}
9 {a,b,d}
10 {b,c,e}
Term hasil dari tahapan preprocessing pada Tabel 3.1 digunakan untuk pem-
27
bentukan FP-Tree. Ilustrasi pembentukan FP-Tree dapat dilihat pada Gambar 3.3
Setelah pembentukan FP-Tree, langkah berikutnya adalah penerapan algoritme FP-
Growth, untuk melakukan pencarian frequent itemset. Pada penerapan algoritme FP-
Growth dilakukan ada 3 tahapan yang akan dilakukan yaitu 1) Tahap pembangkit-
an conditional pattern base, 2) tahap pembangkitan conditional FP-Tree, 3) Tahap
Pencarian frequent itemset. Untuk menemukan frequent itemset dari Tabel 3.1, di-
Gambar 3.3 Pembentukan FP-Tree
tentukan terlebih dahulu lintasan yang berakhir dengan support count terkecil yaitu e
yang diikuti dengan d, c, b, dan di akhiri a. Proses pembentukan masing-masing node
dapat dilihat pada Gambar 3.4
28
Gambar 3.4 Penguraian frequent itemset
Setelah dilakukan penguraian frequent itemset pada Gambar 3.4, maka dida-
patkan frequent itemset untuk beberapa akhiran (suffix) seperti pada Tabel 3.2
Tabel 3.2 Frequent Itemset
Suffix Frequent Itemset

e {e}, {d,e},{a,de} ,{e,e} {a,e}
d {d}, {c,d}, {b,c,d}, {a,c,d}, {b,d}, {a,b,d}, {a,d}
c {c}, {b,c}, {a,b,c}, {a,c}
b {b}, {a,b}
a {a}
29
Ketiga tahap tersebut merupakan langkah yang akan dilakukan untuk menda-
pat frequent itemset. Algoritme FP-Growth disajikan pada Algoritme 1 (Han dkk.,
2012a).
Algorithm 1: Algoritme FP-Growth

Input: FP-Tree Tree
Output: Pola Frequent
FP-Growth (T ree, α)
if Tree mengandung single path P then
untuk tiap kombinasi (dinotasikan β) dari node-node dalam path P;
bangkitkan pola β ∪ α dengan support_count = minimum_support
dari node-node dalam β;
else
bangkitkan pola;
bangun β = ai ∪ α dengan support_count = ai .support_count ;
if Tree β = ∅ then
panggil FP-Growth (T ree, β) ;
else
end
end
P merupakan path atau lintasan pada tree, β merupakan kombinasi dari node
yang ada di dalam lintasan P dan ai merupakan item transakasi.
3.4 Query Expansion
Query Expansion (QE) merupakan proses memodifikasi query yang diberikan

oleh pengguna dengan tujuan untuk meningkatkan performa operasi IR. Terdapat be-
berapa cara untuk melakukan QE yaitu manual, interaktif dan otomatis. Beberapa
pendekatan Query Expansion (Pal dkk., 2015) yaitu:
1. Lokal
Lokal ekspansi query memilih kandidat term yang akan digunakan pada query,
diambil dari kumpulan dokumen yang diambil dari dokumen yang dihasilkan
dari query awal. Salah satu pendekatan yang pada lokal ekspansi query adalah
Pseudo-Relevance Feedback (PRF). PRF menggunakan term yang diekstrak
dari k teratas dari dokumen yang terambil. Terkadang penggunaan PRF pa-
da query pendek, jumlah k dokumen teratas yang terambil sedikit. Hasilnya,
performa dari ekspansi query tidak jauh lebih baik dibandingkan dengan query
awal.

Pertemuan 6-FPGrowth

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Pertemuan 6-FPGrowth

Diunggah oleh

Hak Cipta:

Format Tersedia

25

Confidence adalah probabilitas kondisional, untuk aturan asosiasi x→ y dide-

Tabel 3.1 Contoh term hasil dari tahapan preprocessing

Gambar 3.3 Pembentukan FP-Tree

Gambar 3.4 Penguraian frequent itemset

Tabel 3.2 Frequent Itemset

Suffix Frequent Itemset

Algorithm 1: Algoritme FP-Growth

3.4 Query Expansion

Query Expansion (QE) merupakan proses memodifikasi query yang diberikan

Anda mungkin juga menyukai