Anda di halaman 1dari 13

ALGORITMA APRIORI

PADA DATA MINING


Pertemun ke-9
Matakuliah Data Mining
Definisi Algoritma Apriori
(Pramudiono, 2007)  Algoritma Apriori adalah algoritma yang digunakan untuk
menemukan pola frekuensi tinggi. Pola frekuensi tinggi adalah pola-pola item di
dalam suatu database yang memiliki frekuensi atau support di atas ambang batas
tertentu disebut dengan istilah minimum support. Pola frekuensi tinggi ini
digunakan untuk menyusun aturan assosiatif dan juga beberapa teknik data mining
lainnya
(Irliana dan Vydia, 2013)  Algoritma Apriori merupakan algoritma untuk
menemukan frequent itemset atau item yang sering muncul di data transaksi
Definisi Algoritma Apriori
Algoritma Apriori digunakan agar computer dapat mempelajari aturan asosiasi,
mencari pola hubungan antar satu atau lebih item dalam suatu dataset
Contoh algoritma apriori misalnya pada sebuah swalayan memiliki market basket,
dengan adanya algoritma apriori, pemilik swalayan dapat mengetahui pola pembelian
seorang konsumen, jika seorang konsumen membeli item A, B, maka ada
kemungkinan 50% dia akan membeli item C, pola ini sangat signifikan dengan
adanya data transaksi selama ini
Cara Kerja Algoritma Apriori
Cara Kerja Algoritma Apriori :
1. Siapkan data bentuk format transaksi
2. Bentuk kombinasi 1 (satu) itemset dan hitung nilai support-nya. Kombinasi 1 (satu) itemset
yang terbentuk disebut dengan kandidat kombinasi 1 (satu) itemset
3. Tetapkan nilai support minimum. Dalam penetapan nilai support minimum tidak ada
rumus/aturan baku, hanya saja yang perlu diingat adalah semakin tinggi nilai support minimum
maka kombinasi yang terbentuk makin sedikit dan makin rendah dari nilai support minimum
yang telah ditetapkan dari awal tetap berlaku dan sama nilainya untuk semua kombinasi itemset.
4. Setelah ditetapkan nilai support minimum, maka tentukan kombinasi 1 (satu) itemset yang
memenuhi support minimum. Kombinasi tersebut disebut kombinasi 1 (satu) itemset yang
memenuhi support tersebut.
Cara Kerja Algoritma Apriori (Lanjt)
5. Bentuk kombinasi 2 (dua) itemset yang diperoleh dari kombinasi 1 (satu) itemset
yang memenuhi support minimum dan hitung nilai support-nya. Kombinasi 2 (dua)
itemset tersebut disebut kandidat kombinasi 2 (dua) itemset. Aturan dalam
pembentukan kombinasi mulai dari kombinasi 2 (dua) berlaku rumus kombinasi (AB
= BA) dan tidak berlaku rumus permutasi (AB ≠ BA)
Tentukan kombinasi 2 (dua) itemset yang memenuhi support minimum. Kombinasi
yang terpilih disebut kombinasi 2 (dua) itemset yang memenuhi support minimum
Cara Kerja Algoritma Apriori (Lanjt)
6. Bentuk kombinasi 3 (tiga) itemset yang diperoleh dari kombinasi 2 (dua) itemset
yang memenuhi support minimum dan hitung nilai support-nya. Kombinasi 3 (tiga)
itemset tersebut disebut kandidat kombinasi 3 (tiga) itemset.
Tentukan kombinasi 3 (tiga) itemset yang memenuhi support minimum. Kombinasi
yang terpilih disebut kombinasi 3 (tiga) itemset yang memenuhi support minimum
Dan begitu seterusnya. Pembentukan kombinasi itemset dapat berhenti kapan saja,
bisa saja di kombinasi 1 (satu) atau 2 (dua) dan seterusnya. Aturan berhentinya
pembentukan kombinasi adalah jika tidak ada nilai kombinasi itemset yang
memenuhi support minimum tetapi kombinasi itemset tersebut hanya 1 (satu)
sehingga tidak dapat dikombinasikan dengan kombinasi item yang lain.
Model Pembentukan Kombinasi Itemset

*lingkaran warna hitam tidak memenuhi support minimum


Nilai support yaitu nilai yang digunakan untuk mengukur kemunculan data tertentu
dibandingkan dengan total data. Rumus untuk mencari nilai support adalah sebagai
berikut :

Nilai support untuk sebuah itemset :


Kelebihan dan Kekurangan Algoritma
Apriori
Kelebihan Algoritma Apriori :
Dibandingkan dengan algoritma lainnya, algoritma apriori dapat menangani data
dalam jumlah besar.
Dapat menyederhanakan data.

Kekurangan Algoritma Apriori :


Memerlukan banyak waktu apabila memiliki banyak iterasi.
Dalam setiap iterasi memerlukan scan database.
Contoh Kasus
Pada sebuah minimarket TabananMart, data transaksi penjualan sebagai berikut :

Id Transaksi
1 Teh, Gula
2 Gula, Kopi, Roti, Odol
3 Sikat Gigi, Odol, Sabun
4 Kopi
5 Gula, Kopi
6 Roti, Odol, Teh, Kecap, Sikat Gigi
7 Gula, Kopi, Roti, Penyedap
8 Minuman, Roti
9 Gula, Kopi, Roti
Pertama  Pembentukan kandidat kombinasi 1 (satu) itemset terdiri dari semua
jenis item produk yang ada ditransaksi

Kandidat Kombinasi 1 (satu) Itemset

Itemset Jumlah Support


Teh 2 22,22
Gula 5 55,56
Kopi 5 55,56
Roti 5 55,56
Odol 3 33,33
Sikat Gigi 2 22,22
Sabun 1 11,11
Kecap 1 11,11
Penyedap 1 11,11
Minuman 1 11,11

Itemset merupakan semua jenis produk yang ada ditransaksi. Jumlah diperoleh dari jumlah setiap produk yang
ada di transaksi seperti produk Teh ada di transaksi 1 dan 6. Support diperoleh dari jumlah setiap item produk
dibagi jumlah transaksi dikali 100
Kedua  Ditetapkan support minimum adalah 30%, maka kombinasi 1 (satu) itemset yang
memenuhi support minimum adalah :
Kombinasi 1 (satu) yang memenuhi support minimum
Itemset Jumlah Support
Gula 5 55,56
Kopi 5 55,56
Roti 5 55,56
Odol 3 33,33

Ketiga  Pembentukan kombinasi 2 (dua) itemset. Pembentukan kombinasi 2 (dua) itemset


dibentuk dari kombinasi 1 (satu) itemset yang memenuhi support minimum dengan cara
mengkombinasikan itemset tersebut.
Itemset Jumlah Support Kombinasi 2 (dua) yang memenuhi support minimum (30%)
Gula , Kopi 4 44,44
Itemset Jumlah Support
Gula , Roti 3 33,33
Gula , 4 44,44
Gula , Odol 1 11,11 Kopi
Kopi , Roti 3 33,33 Gula , Roti 3 33,33
Kopi , Odol 1 11,11 Kopi , Roti 3 33,33
Roti , Odol 1 11,11
Keempat  Pembentukan kombinasi 3 (tiga) itemset. Pembentukan kombinasi
dibentuk dari 2 (dua) kombinasi yang memenuhi support minimum.
Kombinasi 3 (tiga) yang memenuhi support minimum

Itemset Jumlah Support


Kopi , Gula , Roti 3 33,33

Pembentukan kmbinasi 4 (empat) itemset tidak dapat dibentuk, karena kombinasi 3 (tiga) itemset hanya 1 (satu)
kombinasi

Informasi/pengethuan yang diperoleh dari data transaksi penjualan di supermarket TabananMart adalah
({Kopi}) , ({Gula}) , ({Roti}) merupakan kombinasi 1 (satu) itemset yang paling sering dibeli, ({Kopi , Gula}) ,
({Kopi , Roti}) , }) merupakan kombinasi 2 (dua) itemset yang paling sering dibeli, ({Kopi , Gula , Roti})
merupakan kombinasi 3 (tiga) itemset yang paling sering dibeli

Anda mungkin juga menyukai