Anda di halaman 1dari 10

Proses FP Growth

Tujuan dari algortima ini adalah sama dengan Apriori yaitu mencair Association Rules.

Perbedaaannya adalah :

FP-Growth Apriori
Proses lebih cepat karena hanya perlu Scan Proses lama karena scan database berulang
database sekali saja kali
Menggunkan kode barang pada prosesnya Menggunakan nama barang pada prosesnya
Akurasi rules-nya  lumayan Akurasi rules-nya  lebih tinggi

Dataset
No Kode
Transaksi Barang
1401 20015838
20009722
10006861
1402 20045099
10006861
1403 10000316
10023789
10006861
14701 20009722
10023789
10006861
14702 20037766
10000316
20015838
14703 10006861
20009722
1501 20037766
20009722
1502 10006861
20009722
1503 10000316
3001 20037766

Pengantar Data Mining dan Data Warehouse


Page 1 of 10
Dengan nama barang sebagai berikut :
Hasil
No Nama barang
Transformasi
1 POCARI SWEAT,MINUMAN ISOTONIK 350mL BTL 20015838
2 POCARI SWEAT,MINUMAN ISOTONIK 500mL BTL 20009722
3 UBM,BISCUIT ARROW BRAND SQUAREPUFF 400g PCK 10006861
4 DIPLOMAT,ROKOK PREMIUM MILD FILTER 16'S BKS 20045099
5 SEDAAP MIE,MIE INSTANT GORENG 90g PCK 10023789
6 HANSAPLAST,PLESTER PLASTIK (10'S) MICKEY 20037766
7 BENG-BENG,WAFER CHOCOLATE 20g PCK 10000316

Langkah-langkah FP_Growth
1. Generate Frequent Itemset
Frekuensi
Item
Kemunculan
10006861 6
20045099 1
10000316 3
20015838 2
20009722 5
10023789 2
20037766 3
Misal telah ditentukan Min Support 20% atau Minimal 2 Transaksi
Kode barang 20045099 di eliminasi

Selanjutnya data yang memenuhi min support di urutkan berdasarakan frekuensinya.


Hasilnya seperti tabel dibawah.
Tabel tersebut biasa disebut dengan FP-List

Frekuensi
Item
Kemunculan
10006861 6
20009722 5
20037766 3
10000316 3
20015838 2
10023789 2

Pengantar Data Mining dan Data Warehouse


Page 2 of 10
2. Tambahkan Transaksi ID (TID) pada dataset yang telah di seleksi dengan Min
Support. Fungsi dari TID ini adalah untuk memberikan nomor urut pada transaksi
Setelah membuat F-List, urutkan item pada tiap transaksi berdasarkan frekuensi
paling tinggi ke paling rendah. Kemudian mulailah membuat tree secara urut
berdasarkan Transaksi ID-nya (TID).

No Frekuansi
TID Kode Barang
transaksi
1 1401 10006861 6
20009722 5
20015838 2
2 1402 10006861 6
3 1403 10006861 6
10000316 3
10023789 2
4 14701 10006861 6
5
20009722
10023789 2
5 14702 20037766 3
10000316 3
20015838 2
6 14703 10006861 6
20009722 5
7 1501 20009722 5
20037766 3
8 1502 10006861 6
20009722 5
9 1503 10000316 3
10 3001 20037766 3

3. Membentuk Frequent Pattern Tree (FP-Tree)


Fp-tree merupakan struktur penyimpanan data yang dimampatkan.
Fp-tree di bangun dengan memetakan setiap data transaksi ke dalam setiap lintasan
tertentu dalam Fp-tree. Karena dalam setiap transaksi yang dipetakan, mungkin ada
transaksi yang memiliki item yang sama, maka lintasannya memungkinkan untuk
saling menimpa.
Semakin banyak data transaksi yang memiliki item yang sama, maka proses
pemampatan dengan struktur Fp-tree semakin efektif. Kelebihan dari Fp-tree adalah
hanya memerlukan dua kali pemindaian data transaksi yang terbukti sangat efesien.
Adapun FP-Tree adalah sebuah pohon dengan definisi sebagai berikut :
1. Fp-Tree dibentuk oleh sebuah akar yang diberi label Null, sekumpulan pohon
yang beranggotakan item-item tertentu, dan sebuah tabel frequent header.

Pengantar Data Mining dan Data Warehouse


Page 3 of 10
2. Setiap simpul dalam FP-tree mengandung tiga informasi penting, yaitu label
item, menginformasian jenis item yang direpresentasikan simpul tersebut,
support count, merepresentasikan jumlah lintasan transaksi yang melalui
simpul tersebut, dan pointer penghubung yang menghubungkan simpul-simpul
dengan label item sama antar lintasan ditandai dengan garis panah putus-
putus.

Berikut ini adalah langkah-langkah membangun FP-Tree dari data


sebelumnya.
A. Pembacaan TID 1
Pada TID 1 terdapat nilai {10006861, 20009722, 20015838} yang kemudian
membentuk lintasan null → 10006861 → 20009722 → 20015838 dengan support
count awal bernilai 1.
Untuk lebih lengkapnya dapat dilihat pada gambar dibawah

Null

10006861:1

20009722:1

20015838:1

B. Pembacaan TID 2
Setelah pembacaan TID 1, maka selanjutnya membaca TID 2 yaitu {10006861}
sehingga nilai dari 10006861 akan bertambah satu sehingga menjadi 2, tetapi nilai
yang lainnya tetap karena tidak ada transaksi dengan kode barang yang sama
dengan pembacaan TID pertama.

Pengantar Data Mining dan Data Warehouse


Page 4 of 10
Null

10006861:2

20009722:1

20015838:1

Pengantar Data Mining dan Data Warehouse


Page 5 of 10
C. Pembacaan TID 3
Setelah pembacaan TID 2, maka selanjutnya membaca TID 3 yaitu {10006861,
10000316, 10023789} sehingga nilai 10006861 akan bertambah satu, sehingga
menjadi 3 dan akan membentuk cabang baru untuk kode transaksi 10000316 dan
10023789 nilai awalnya adalah 1, seperti gambar di bawah ini.

Null

10006861:3

20009722:1 10000316:1

20015838:1 10023789:1

D. Pembacaan TID 4
Setelah pembacaan TID 3, maka selanjutnya membaca TID 4 yaitu {10006861,
20009722, 10023789}. Nilai 10006861 akan bertambah 1 lagi sehingga menjadi 4,
dan nilai 20009722 akan bertambah 1 menjadi 2, dan akan membentuk akar baru
atau cabang baru untuk kode barang 10023789 dan nilai awalnya adalah 1. Untuk
lebih jelasnya dapat dilihat pada gambar

Null

10006861:4

20009722:2 10000316:1

20015838:1 10023789:1 10023789:1

Pengantar Data Mining dan Data Warehouse


Page 6 of 10
E. Pembacaan TID 5
Setelah pembacaan TID 4, maka selanjutnya membaca TID 5 yaitu {20037766,
10000316, 20015838}. Disini harus membuat lintasan baru lagi dengan nilai awal 1,
karena kode barang 20037766 belum pernah terlewati sama sekali. Lebih jelasnya
dapat di liat pada gambar

Null

10006861:4 20037766:1

20009722:2 10000316:1 20000316:1

20015838:1 10023789:1 10023789:1 20015838:1

F. Pembacaan TID 6
Setelah pembacaan TID 5, maka selanjutnya membaca TID 6 yaitu {10006861,
20009722}, nomer transaksi ini pernah di lewati dan sudah mempunyai nilai
sehingga tinggal di tambahkan saja, nilainya menjadi 10006861 : 5 dan 20009722:
3. Lebih jelasnya langsung liat gambar

Null

10006861:5 20037766:1

20009722:3 10000316:1 20000316:1

20015838:1 10023789:1 10023789:1 20015838:1

Pengantar Data Mining dan Data Warehouse


Page 7 of 10
G. Pembacaan TID 7
Setelah pembacaan TID 6, maka selanjutnya membaca TID 7 yaitu {20009722,
20037766}. Kode barang 20009722, 20037766 sama sekali belum terlewati, maka
harus membuat cabang baru dengan nilai awal 1. Lebih jelasnya langsung liat pada
gambar

20037766:1 20009722:1 Null

10006861:5 20037766:1

20009722:3 10000316:1 20000316:1

20015838:1 10023789:1 10023789:1 20015838:1

H. Pembacaan TID 8
Setelah pembacaan TID 7, maka selanjutnya membaca TID 8 yaitu {10006861,
20009722}. Kode barang 10006861 telah terlewati sebanyak 5x, dan kode barang
20009722 telah terlewati sebanyak 3x, maka langkah selanjutnya tinggal
menambahkan saja nilainya, sehingga menjadi 10006861 : 6 dan 20009722 : 4. Lebih
jelasnya dapat langsung di liat pada gambar

20009722:1 Null
20037766:1

10006861:6 20037766:1

20009722:4 10000316:1 20000316:1

20015838:1 10023789:1 10023789:1 20015838:1

Pengantar Data Mining dan Data Warehouse


Page 8 of 10
I. Pembacaan TID 9
Setelah pembacaan TID 8, maka selanjutnya membaca TID 9 yaitu {1000316}. Kode
barang 1000316 belom pernah terlewati, sehingga harus membuat lintasan baru lagi
dengan nilai awal 1. Selengkapnya dapat di liat dalam gambar

20009722:1 Null 1000316:1


20037766:1

10006861:6 20037766:1

20009722:4 10000316:1 20000316:1

20015838:1 10023789:1 10023789:1 20015838:1

J. Pembacaan TID 10
Setelah pembacaan TID 9, maka selanjutnya membaca TID 10 yaitu {20037766}.
Sebelumnya kode barang ini telah di lewati sebanyak 1x, maka langkah selanjutnya
tinggal menambahkan saja nilai nya, sehingga menjadi 2. Selengkapnya dapat di
liat pada

20009722:1 Null 1000316:1


20037766:1

10006861:6 20037766:2

20009722:4 10000316:1 20000316:1

20015838:1 10023789:1 10023789:1 20015838:1

Pembacaan TID 10 merupakan proses pembacaan tree yang terakhir dan


didapatkan hasil akhir FP-Tree

Pengantar Data Mining dan Data Warehouse


Page 9 of 10
Latihan : Bangunlah FP-Tree dari dataset berikut ini. Asumsikan nama barang
sebagai kode barangnya.

Tansaction ID Items Bought


1 Milk
Beer
Diapers
2 Bread
Butter
Milk
3 Milk
Diapers
Cookies
4 Bread
Butter
Cookies
5 Beer
Cookies
Diapers
6 Milk
Diapers
Bread
Butter
7 Bread
Butter
Diapers
8 Beer
Diapers
9 Milk
Diapers
Bread
Butter
10 Beer
Cookies

Pengantar Data Mining dan Data Warehouse


Page 10 of 10

Anda mungkin juga menyukai