ALGORITMA FP-GROWTH
01PS3
Nama Kelompok :
Nova susanti 8040140207
Ummy fadhilah 8040140212
Sri nurjanah 8040140251
Retno ramasati 8040140046
SISTEM INFORMASI
STIKOM DINAMIKA BANGSA
2017
LANDASAN TEORI
FP-Growth adalah salah satu alternatif algoritma yang dapat digunakan untuk
menentukan himpunan data yang paling sering muncul (frequent itemset) dalam sebuah
kumpulan data (David Samuel, 2008).
Karakteristik algoritma FP-Growth adalah struktur data yang digunakan adalah tree yang
disebut dengan FP-Tree. FP-tree dibangun dengan memetakan setiap data transaksi ke dalam
setiap lintasan tertentu dalam FP-tree. Karena dalam setiap transaksi yang dipetakan, mungkin
ada transaksi yang memiliki item yang sama, maka lintasannya memungkinkan untuk saling
menimpa. Semakin banyak data transaksi yang memiliki item yang sama, maka proses
pemampatan dengan struktur data FP-tree semakin efektif. Kelebihan dari FP-tree adalah hanya
memerlukan dua kali pemindaian data transaksi yang terbukti sangat efisien.
Dengan menggunakan FP-Tree, algoritma FP-growth dapat langsung mengekstrak
frequent Itemset dari FP-Tree. Metode FP-Growth dapat dibagi menjadi 3 tahapan utama yaitu
sebagai berikut (Han & Kamber 2006) :
1. Tahap pembangkitan conditional pattern base,
2. Tahap pembangkitan conditional FP-Tree, dan
3. Tahap pencarian frequent itemset.
Adapun FP- tree adalah sebuah pohon dengan definisi sebagai berikut:
1. FP-Tree dibentuk oleh sebuah akar yang diberi label null, sekumpulan upapohon yang
beranggotakan item-item tertentu, dan sebuah tabel frequent header.
2. Setiap simpul dalam FP-tree mengandung tiga informasi penting, yaitu label item,
menginformasikan jenis item yang direpresentasikan simpul tersebut, support count,
merepresentasikan jumlah lintasan transaksi yang melalui simpul tesebut, dan pointer
penghubung yang menghubungkan simpul-simpul dengan label item sama antar-
lintasan, dintandai dengan garis panah putus-putus.
CONTOH SOAL
Misalkan diberikan tabel data transaksi sebagai berikut, dengan minimum support count ξ=2
Setelah dilakukan pemindaian pertama didapat item yang memiliki frekuensi di atas
support count ξ=2 adalah a,b,c,d, dan e. Kelima item inilah yang akan berpengaruh dan akan
dimasukkan ke dalam FP-tree, selebihnya (r,z,g, dan h) dapat dibuang karena tidak
berpengaruh signifikan.
Tabel berikut mendata kemunculan item yang frequent dalam setiap transaksi, diurut
berdasarkan yang frekuensinya paling tinggi.
1. Langkah pertama yang dilakukan adalah membangun sebuah upapohon FP-tree dengan
hanya menyertakan lintasan yang berakhir di e.
2. Support count dari item e dihitung dan dibandingkan dengan minimum support count
ξ=3. Karena memenuhi, maka {e} termasuk frequent itemset, karena support count=2.
3. Karena item e frequent, maka perlu dipecahkan subproblem untuk menemukan frequent
itemset yang berkahiran dengan de, ce, be, dan ae. Sebelum memevahkan subproblem
ini, maka upapohon FP-tree tersebut harus diubah terlebih dahulu menjadi conditional
FP-tree. Conditional FP-tree mirip dengan FP-tree biasa, namun conditional FP-tree
dimaksudkan untuk mencari frequent itemset yang berakhiran item tertentu.
4. Conditional FP-tree dapat dibentuk dengan cara :
c. Karena nilai support count dari b adalah 1, yang berarti transaksi yang
mengandung b dan e hanya 1 transaksi, maka berdasarkan prinsip anti-monotone
heuristic, simpul b dan lintasan yang mengandung be dapat dibuang, karena jika
item b tidak frequent, maka setiap transaksi yang berakhiran be juga tidak
frequent. Terbentuk Conditional FP-tree untuk e
5. FP-tree menggunakan Conditional FP-tree untuk membangun pohon lintasan prefix
untuk menemukan frequent itemset yang berakhir dengan pasangan item de,ce, dan ae.
6. Untuk Lintasa Prefix de, yang dibentuk dari Conditional FP-tree untuk item e, dapat di
lihat pada gambar berikut
FP-tree yang terbentuk dapat memampatkan data transaksi yang memilki item yang
sama, sehingga penggunaan memori komputer lebih sedikit, dan proses pencarian frequent
itemset menjadi lebih cepat.
Dengan menggunakan Algoritma FP Growth, maka pemindaian kumpulan data
transaksi hanya dilakukan dua kali, jauh lebih efisien dibandingkan algoritma dengan
paradigma apriori
DAFTAR PUSTAKA
Ahmad Izky Al Faywaz., 2014, Materi Praktikum Analisis Keputusan dan Data Mining.
Teknologi Industri. Uversitas Islam Indonesia, Indonesia.
Budanis, D. M., & Azinar, A. W. (2015). Penentuan Pola Yang Sering Muncul Untuk
Penerima Kartu Jaminan Kesehatan Masyarakat (JAMKESMAS) Menggunakan Metode
FP-Growth. Seminar Nasional “Inovasi Dalam Desain Dan Teknologi,” 424–431.
Samuel, D. (2007). Penerapan Stuktur FP-Tree dan Algoritma FP-Growth dalam Optimasi
Penentuan Frequent Itemset. Sekolah Teknik Elektro Dan Informatika.