Anda di halaman 1dari 11

Subject : Big Data Management and Analytics – Assignment 3

Lecturer : Prof. Dr. Anton Satria Prabuwono, S.T, S.Si, M.M


Name & ID : 1. Fadly - 2111600645
2. Edi Witono - 2111600678
3. Yusuf Virmansyah - 2111600314
Class : MKOM – Reguler 0922
Deadline : 22 November 2022

Rangkuman dan Perbandingan


Algoritma Apriori vs FP-Growth

1. Pendahuluan
Algoritma asosiasi data mining merupakan suatu bentuk algoritma yang memberikan
informasi tentang pertumbuhan item data dalam database. Salah satu pemanfaatan algoritma
asosiasi untuk proses bisnin diantaranya dalam proses penjualan. Terdapat dua algoritma
dalam asosiasi data mining yakni algoritma Apriori dan FP Growth[1] yang dalam tulisan ini
akan kami bahas secara ringkas terkait kedua algoritma tersebut.

1.1. Algoritma Apriori

Algoritma Apriori adalah salah satu algoritma pada data mining untuk mencari
frequent item/itemset pada transaksional database. Algoritma apriori pertama kali
diperkenalkan oleh R.Agarwal dan R Srikant untuk mencari frequent tertinggi dari
suatu database.
Algoritma apriori banyak digunakan pada data transaksi atau biasa disebut
keranjang belanja, misalnya sebuah swalayan memiliki keranjang belanja, dengan
adanya algoritma apriori, pemilik swalayan dapat mengetahui pola pembelian seorang
konsumen. [2]

Dewa Agung Krisna, dkk (2019) dalam jurnalnya yang berjudul Implementasi
Algoritma Apriori pada Menentukan Pola Kunjungan Wisata ke Bali menuliskan,
Algoritma Apriori merupakan salah satu metode Data Mining Based Rule-based
Assossiation yang dapat digunakan untuk mengidentifikasi pola kejadian. Apriori
adalah algoritma pengambilan data aturan asosiatif (Association rule) untuk
menentukan hubungan asosiatif dari suatu kombinasi item. Algoritma apriori akan
cocok diterapkan ketika ada beberapa item hubungan yang ingin dianalisis. Sifat
alogritma priori Setiap subset frequent-itemset harus frequent-itemset.[3]

Reza Alfianzah, dkk (2020) didalam jurnalnya yang membahas tentang


Implementasi Data Algortma Apriori, juga memberi penjelasan tentang Algoritma
Apriori. Ini merupakan algoritma penambangan data yang memberikan informasi
tentang hubungan antara item data dalam basis data. Algoritma apriori dapat digunakan
dalam proses penjualan. Data mining algoritma apriori dapat membantu dalam proses
penjualan dengan menyediakan hubungan antara data transaksi penjualan yang telah
dilakukan oleh pelanggan untuk mendapatkan pola pembelian pelanggan dan pelanggan
sering membeli atau tertarik [4].

Dari penjelasan diatas, dapat disumpulkan bahwa Algoritma Apriori merupakan


salah satu dari beberapa Algoritma Data Mining yang digunakan untuk pengambilan
data aturan asosiatif (Association rule) untuk menentukan hubungan asosiatif antara
item data dalam basis data. Algoritma ini sangat cocok digunakan, kaitannya dalam
sebuah analisis sistem penjualan.

1.2. Algoritma FP Growth


Tahir, M. dan Sitompul, N. (2021) menuliskan dalam jurnalnya, Algortima FP-
Growth adalah salah satu dari beberapa metodologi penambangan pola yang sering
berpengaruh, di mana pola (misalnya, kumpulan item, urutan, subpohon, atau
substruktur) sering terjadi jika frekuensi kemunculannya dalam database tidak kurang
dari ambang minimum support yang ditentukan. Metode pertumbuhan pola (frequent)
menambang kumpulan data dengan cara divide-and-conquer [5].

Algoritma FP-Growth merupakan pengembangan dari algoritma Apriori.


Sehingga kekurangan dari algoritma Apriori diperbaiki oleh algoritma FPGrowth.[6].
Algoritma FP Growth menemukan frekuensi itemset tanpa generasi kandidat[7].

Pada algoritma Apriori diperlukan generate candidate untuk mendapatkan


frequent itemsets. Akan tetapi, di algoritma FP-Growth generate candidate tidak
dilakukan karena FP-Growth menggunakan konsep pembangunan tree dalam pencarian
frequent itemsets. Hal tersebutlah yang menyebabkan algoritma FP-Growth lebih cepat
dari algoritma Apriori. Karakteristik algoritma FPGrowth adalah struktur data yang
digunakan adalah tree yang disebut dengan FP-Tree. Dengan menggunakan FP-Tree,
algoritma FP-Growth dapat langsung mengekstrak frequent itemset dari FP-Tree.[8]

Metode FP-growth mengubah masalah menemukan pola frekuensi panjang


menjadi pencarian pola yang lebih pendek dalam database kondisional yang jauh lebih
kecil secara rekursif (proses pengulagan terhadap diri sendiri) dan kemudian
menggabungkan sufiks. Ini menggunakan item yang paling jarang digunakan sebagai
sufiks, menawarkan selektivitas yang baik. Metode ini secara substansial mengurangi
biaya pencarian.

Ketika database besar, terkadang tidak realistis untuk membangun FP-tree


berbasis memori utama. Alternatif yang menarik adalah pertama-tama mempartisi
database menjadi satu set database yang diproyeksikan, dan kemudian membangun
pohon FP dan menambangnya di setiap database yang diproyeksikan. Proses ini dapat
diterapkan secara rekursif ke database apa pun yang diproyeksikan jika pohon FP-nya
masih tidak dapat masuk ke memori utama.

Sebuah studi tentang kinerja metode FP-growth menunjukkan bahwa metode ini
efisien dan dapat diskalakan untuk menambang pola frekuensi panjang dan pendek, dan
sekitar urutan besarnya lebih cepat daripada algoritma Apriori[9].

Dari penjelasan diatas dapat disimpulkan bahwa Algoritma FP Growth


merupakan salah satu dari beberapa metodologi penambangan pola yang dalam
menemukan frekuensi itemset tanpa generasi kandidat, berbeda dengan Apriori dimana
diperlukan generate candidate untuk mendapatkan frequent itemsets. Sehingga pada
Algoritma Apriori membutuhkan besar ruang memori karena mereka berurusan dengan
sejumlah besar kandidat generasi itemset, berbeda dengan FP Growth yang jauh lebih
kecil dalam penggunaan ruang memori, termasuk waktu eksekusi.

2. Cara Kerja
2.1. Algoritma Apriori
Apa itu Frequent Itemset?
Frequent itemset merupakan item yang nilai supportnya lebih besar dari nilai
ambang batas atau support minimum yang telah ditentukan. Sehingga ketika A & B
merupakan frequent itemset jika digunakan secara bersama-sama, maka secara
individual A dan B juga harus merupakan frequent itemset. Misalkan ada dua transaksi,
yaitu transaksi A dan B, dimana transaksi A= {1, 2, 3, 4, 5} dan transaksi B=
{2,3,6,8,9}. Maka kita bisa mengatakan bahwa 2 dan 3 merupakan frequent itemset.

a. Tentukan minimum support


b. Iterasi 1 : hitung item-item dari support(transaksi yang memuat seluruh item)
dengan men-scan database untuk 1-itemset, setelah 1-itemset didapatkan, dari 1-
itemset apakah diatas minimum support, apabila telah memenuhi minimum
support, 1-itemset tersebut akan menjadi pola frequent tinggi,
c. Iterasi 2 : untuk mendapatkan 2-itemset, harus dilakukan kombinasi dari k-
itemset sebelumnya, kemudian scan database lagi untuk hitung item-item yang
memuat support. Itemset yang memenuhi minimum support akan dipilih sebagai
pola frequent tinggi dari kandidat
d. Tetapkan nilai k-itemset dari support yang telah memenuhi minimum support dari
k-itemset
e. Lakukan proses untuk iterasi selanjutnya hingga tidak ada lagi k-itemset yang
memenuhi minimum support.

2.2. Algoritma FP Growth


Karakteristik algoritma FP-Growth adalah struktur data yang digunakan adalah
tree yang disebut dengan FP-Tree. Dengan menggunakan FP-Tree, algoritma FP-
growth dapat langsung mengekstrak frequent Itemset dari FP-Tree. Penggalian itemset
yang frequent dengan menggunakan algoritma FP-Growth akan dilakukan dengan cara
membangkitkan struktur data tree atau disebut dengan FP-Tree. Metode FP-Growth
dapat dibagi menjadi 3 tahapan utama yaitu sebagai [10]:
1. Tahap pembangkitan conditional pattern base,
2. Tahap pembangkitan conditional FP-Tree, dan
3. Tahap pencarian frequent itemset.

Ketiga tahap tersebut merupakan langkah yang akan dilakukan untuk mendapat
frequent itemset.
Input : FP-Tree Tree
Output : Rt Sekumpulan lengkap pola frequent
Methode : FP-Growth (Tree, null)
Procedure : FP-Growth (Tree, α)
{
01: if Tree mengandung single path P;
02: then untuk tiap kombinasi (dinotasikan β) dari node-node dalam path do;
03: bangkitkan pola β α dengan support dari node-node dalam path do β;
04: else untuk tiap a1 dalam header dari tree do
}
05: bangkitkan pol

3. Perbadingan
Algoritma Apriori menggunakan generasi kandidat yang melaluinya set item yang
sering dihasilkan. FP-growth (pertumbuhan pola yang sering) menggunakan struktur prefix-
tree (FP-tree) untuk menyimpan database dalam bentuk terkompresi. FP-growth mengadopsi
strategi divide-and-conquer untuk menemukan set item yang sering.Perbedaan antara kedua
algoritme tersebut adalah bahwa algoritme Apriori menghasilkan kumpulan item yang sering
kandidat dan juga algoritme pertumbuhan FP menghindari pembuatan kandidat dan
mengembangkan pohon dengan strategi 'bagi dan taklukkan' yang ekonomis dan efisien.

Algoritma FP Growth merupakan penyempurnaan dari algoritma apriori. Algoritme FP


Growth digunakan untuk menemukan kumpulan item yang sering dalam database transaksi
tanpa pembuatan kandidat. FP Growth mewakili item yang sering terdapat pada Pattern Tree
atau FP Tree [11].

Membandingkan Algoritma Apriori dan FP-Growth


Salah satu fitur terpenting dari algoritma penambangan item yang sering adalah bahwa
ia harus mengambil waktu dan memori yang lebih rendah. Mempertimbangkan hal ini, kami
memiliki banyak algoritme yang terkait dengan algoritme FIM. Kedua algoritma Apriori dan
FP-Growth ini merupakan algoritma FIM yang paling dasar. Algoritma lain di bidang ini
adalah perbaikan dari algoritma ini. Ada beberapa perbedaan mendasar antara algoritma ini,
mari kita lihat[12].

Apriori Fp-Growth
Apriori menghasilkan pola frequent dengan FP Growth menghasilkan FP-Tree untuk
membuat itemset menggunakan pairing membuat pola yang sering.
seperti single item set, double itemset, triple
itemset.
Apriori menggunakan generasi kandidat di FP-growth menghasilkan FP-Tree bersyarat
Apriori Fp-Growth
mana subset yang sering diperpanjang satu untuk setiap item dalam data.
item pada satu waktu.
Karena apriori memindai basis data di setiap FP-tree hanya membutuhkan satu scan
langkahnya, data yang jumlahnya lebih database pada langkah awal sehingga
banyak memakan waktu lama. menghabiskan lebih sedikit waktu.
Versi database yang dikonversi disimpan Kumpulan pohon FP bersyarat untuk setiap
dalam memori item disimpan dalam memori
Ini menggunakan pencarian luas-pertama Ini menggunakan pencarian mendalam-
pertama.

Tebel Jurnal Terkait Pembahasan Perbandingan Algoritma Apriori dan FP Growth


Algoritma
Author Judul Metode Hasil Penelitian
Apr FPG
Muhammad Perbandingan Komparasi : Dalam kasus √
Farhan Algoritma Apriori Data Mining perekomendasian
Dengan Algoritma Metode aturan produk bagi
Fp-Growth Untuk asosiasi dengan pelanggan di PT.
Perekomendasian Algoritma Agro Express
Produk Bagi Apriori dan FP Indonesia ini,
Pelanggan Di Pt. Growth algoritma Fp-Growth
Agro Express lebih optimal
Indonesia dibandingkan
dengan algoritma
Apriori.[13]
Abu Salam , Pencarian Pola Kompatrasi : Algortima FP- √
Junta Asosiasi Untuk Metode Data Growth dapat
Zeniarja, Penataan Barang Mining aturan menemukan aturan
Wibowo Dengan asosiasi Apriori asosiasi lebih banyak
Wicaksono, Menggunakan dan FP-Growth dari pada Apriori,
dan Lutfi Perbandingan FP-Growth tidak
Kharisma. Algoritma Apriori membutuhkan
Dan Fpgrowth beberapa iterasi pada
(Study Kasus Distro prosesnya sehingga
Epo Store Pemalang) aturan asosiasi
yang di dapat lebih
banyak. Dari segi
tingkat akuasinya,
FP-Growth lebih
besar dari pada
apriori. Secara
Proses algoritma FP-
Growth lebih cepat
Algoritma
Author Judul Metode Hasil Penelitian
Apr FPG
dari pada algoritma
apriori [14].
Luki Algoritma Apriori Kombinasi : Dengan √ √
Henando Dan Fp-Growth Metode Data menggunakan
Untuk Analisa Mining Asosiasi Algoritma Apriori
Perbandingan Data Apriori dan FB Dan FP-Growth
Penjualan Leptop Growth didapatkan hasil
Berdasarkan Merk berupa aturan
Yang Diminati (rules) yang
Konsumen (Studi merupakan
Kasus kumpulan frequent
:Indocomputer itemsetd engan nilai
Payakumbuh) confidence yang
tinggi. Dengan
didapatkannya rules
ini maka pimpinan
dapat menggunakan
aturan (rules )dalam
membuat suatu
strategi yang dapat
meningkatkan
jumlah penjualan
Laptop setiap
harinya.[15]
Mrs. Comparative Study Comparation : Kedua algoritme √
M.Kavitha on Apriori Apriori secara efisien
dan Algorithm and Fp Algorithm and menambang pola
Ms.S.T.Ta Growth Algorithm Fp Growth yang sering dari
mil Selvi with Pros and Cons basis
data. Di mana,
Apriori menemukan
frequent itemset
dengan kandidat
itemset generasi
tetapi algoritma FP
Growth menemukan
frequent itemset
tanpa kandidat
itemset generasi. Di
masa mendatang,
teknik dapat
Algoritma
Author Judul Metode Hasil Penelitian
Apr FPG
ditemukan untuk
mengurangi waktu
komputasi dan biaya
untuk algoritma
Apriori dan teknik
yang meningkatkan
efektivitas algoritma
Pertumbuhan FP
pada kumpulan data
pola yang sangat
besar[7].
Syukron Perbandingan Perbandingan : Berdasarkan hasil √
Anas, Algoritma Apriori Algoritma penelitian, algoritma
Nelson dan FP-Growth Apriori dan FP- apriori menghasilkan
Rumui, dalam Mengelola akombinasi barang
Growth Data
Andi Roy, Simpan Data dengan nilai
Pujo Hari Mining kepercayaan 98,4
Transaksi
Saputro dan nilai dukungan
98,4, dan algoritma
menghasilkan
kombinasi barang
dengan nilai support
95,2 dan nilai
confidence 95,2.
Perbandingan kedua
algoritma ini dalam
membuat asosiasi
menghasilkan waktu
eksekusi algoritma
FP-Growth lebih
cepat daripada
Apriori, dan
algoritma Apriori
menghasilkan
kombinasi itemset
yang lebih
bervariasi.[16]
Radhiatul Perbandingan Antara Perbandingan : Perbandingan ini dua √
Husna, Algoritma Apriori Antara algoritma mengarah
Yomei Dan Fp-Growth On Algoritma ke hasil yang sama
Lldikti Wilayah X dalam mana
Hendra, Apriori Dan Fp-
Model Inventaris algoritma fp-growth
Muhammad Growth Data lebih baik dari
Ketersediaan Item
Imam Mining algoritma apriori.
Akbar Menemukan aturan
itu akan perlu
Algoritma
Author Judul Metode Hasil Penelitian
Apr FPG
menemukan
pepercayaan diri dan
dukungan dari
semua item dengan
semua kemungkinan
kombinasi itemset.
Berdasarkan 22 data
transaksi, model
inventaris
direpresentasikan
sebagai biner
matriks D22x51 di
mana ada 51 item
yang
dipertimbangkan
dalam 22 transaksi
tersebut.[17]

Mrs. M.Kavitha dan Ms.S.T.Tamil Selvi (2016) Dalam tulisannya terkait Comparative
Study on Apriori Algorithm and Fp Growth Algorithm with Pros and Cons menyimpulkan
kedua perbedaan dari algoritma Apriori dan FP Growth sebagai berikut :

1. Teknik
Algoritma Apriori menggunakan properti Apriori dan bergabung, properti murni
untuk menambang pola yang sering. Pertumbuhan FP algoritma membangun pola
bersyarat bebas dan basis pola bersyarat dari database yang memenuhi dukungan
minimal.
2. Jenis Pencarian
Apriori menggunakan metode pencarian pertama yang luas dan FP Growth
menggunakan metode Divide and Conquer.
3. Pemanfaatan Memori
Algoritma Apriori membutuhkan besar ruang memori karena mereka berurusan
dengan sejumlah besar kandidat generasi itemset. Algoritma Pertumbuhan FP
membutuhkan lebih sedikit memori karena strukturnya yang ringkas, mereka
menemukan frequent itemset tanpa pembangkitan kandidat itemset.
4. No.Of.Scans:
Algoritme Apriori melakukan beberapa pemindaian untuk menghasilkan set
kandidat. Pemindaian algoritma Pertumbuhan FP database hanya dua kali.
5. Waktu:
Dalam waktu eksekusi algoritma Apriori lebih banyak terbuang dalam
menghasilkan kandidat setiap saat. Eksekusi FP Growth waktu lebih sedikit jika
dibandingkan dengan Apriori[7].
4. Kesimpulan :
Dapat disimpulkan berdasarkan beberap ajurnal terkait yang telah kami baca dan
pelajari tentang perbandingan kinerja kedua Algoritma yaitu Apriori dan FP-Growth. Bahwa
keduanya mampu memberikan kontribusi hasil yang dapat dikatakan sama, namun jika dilihat
dari aspek lain seperti metode pencarian, waktu eksekusi, Pemindaian data, dan Penggunaan
Ruang Memory, Algoritma FP-Growth masih mengungguli dibandingkan dengan Algoritma
Apiori.

5. Referensi
[1] F. Setyadi, “Asosiasi Data Mining : Algoritma Apriori dan FP Growth,” 2021.
https://flinsetyadi.com/asosiasi-data-mining-algoritma-apriori-dan-fpgrowth/.
[2] DQLAB, “Kenali Data Science Algoritma Apriori pada Machine Learning,” Website,
2022. https://dqlab.id/kenali-data-science-algoritma-apriori-pada-machine-learning.
[3] D. Agung, K. Arimbawa, I. N. A. Prabawa, and P. A. Mertasana, “Implementation of
Apriori Algorithm in Determining Tourism Visit Patterns to Bali,” Int. J. Eng. Emerg.
Technol., vol. 4, no. 1, pp. 10–14, 2019.
[4] M. Penjualan, R. Alfianzah, R. I. Handayani, S. N. Mandiri, I. Universitas, and B.
Sarana, “Implementasi Data Algoritma Apriori,” vol. 5, pp. 17–25, 2020.
[5] N. S. Muhlis Tahir, “Penerapan Algoritma Fp-Growth Dalam,” vol. 6, no. 1, pp. 56–
63, 2021.
[6] K. dan E. T. Luthfi, Algoritma Data Mining. Yogyakarta: Andi Offset, 2009.
[7] I. N. M. Kavitha and M. S. Selvi, “Studi Banding Algoritma Apriori dan Algoritma.”
[8] R. M. Anggraeni, “Perbandingan Algoritma Apriori dan Algoritma FP-Growth untuk
Perekomendasi Pada Transaksi Peminjaman Buku di Perpustakaan Universitas Dian
Nuswantoro,” Tek. Inform., pp. 1–6, 2014.
[9] H. Jiawei, M. Kamber, and J. Pei, “Third Edition : Data Mining Concepts and
Techniques,” J. Chem. Inf. Model., vol. 53, no. 9, pp. 1689–1699, 2012, [Online].
Available: http://library.books24x7.com/toc.aspx?bkid=44712.
[10] A. Ikhwan, D. Nofriansyah, and Sriani, “Penerapan Data Mining dengan Algoritma
Fp-Growth untuk Mendukung Strategi Promosi Pendidikan ( Studi Kasus Kampus
STMIK Triguna Dharma ),” Saintikom, vol. 14, no. 3, pp. 211–226, 2015.
[11] U. D. Arni, “Perbedaan dari Algoritma Apriori dan FP Growth pada Association
Rule,” Website, 2021. https://garudacyber.co.id/artikel/2223-perbedaan-dari-algoritma-
apriori-dan-fp-growth-pada-association-rule#:~:text=Perbedaan antara kedua algoritme
tersebut,taklukkan’ yang ekonomis dan efisien.
[12] Y. VERMA, “Apriori vs FP-Growth in Market Basket Analysis – A Comparative
Guide,” DEVELOPERS CORNER, 2021. https://analyticsindiamag.com/apriori-vs-fp-
growth-in-market-basket-analysis-a-comparative-guide/.
[13] M. Farhan, “Perbandingan Algoritma Apriori Dengan Algoritma Fp-Growth Untuk
Perekomendasian Produk Bagi Pelanggan Di Pt. Agro Express Indonesia,”
unikom.ac.id, 2022. https://elibrary.unikom.ac.id/id/eprint/6359/.
[14] A. Salam, J. Zeniarja, W. Wicaksono, and L. Kharisma, “Pencarian Pola Asosiasi
Untuk Penataan Barang Dengan Menggunakan Perbandingan Algoritma Apriori Dan
Fp-Growth (Study Kasus Distro Epo Store Pemalang),” Dinamik, vol. 23, no. 2, pp.
57–65, 2019, doi: 10.35315/dinamik.v23i2.7178.
[15] L. Henando, “Algoritma Apriori Dan Fp-Growth Untuk Analisa Perbandingan Data
Penjualan Leptop Berdasarkan Merk Yang Diminati Konsumen (Studi Kasus :
Indocomputer Payakumbuh),” J-Click, vol. 6, no. 2, pp. 201–207, 2019.
[16] S. Anas, N. Rumui, A. Roy, and H. Saputro, “Comparison of Apriori Algorithm and
FP-Growth in Managing Store Transaction Data,” vol. 03, no. 04, pp. 158–162, 2022.
[17] S. Atmaja, “JURNAL IPTEKS TERAPAN Research of Applied Science and
Education V9.i4 (282-293),” J. Ipteks Terap., vol. 15, no. March, pp. 68–73, 2020.

Anda mungkin juga menyukai