Anda di halaman 1dari 17

JURNAL J – CLICK E-ISSN : 2541 – 2469

P-ISSN : 2355 – 7958


Jurnal Sistem Informasi Dan Manajemen Informatika

ALGORITMA APRIORI DAN FP-GROWTH UNTUK ANALISA


PERBANDINGAN DATA PENJUALAN LEPTOP BERDASARKAN
MERK YANG DIMINATI KONSUMEN
(STUDI KASUS : INDOCOMPUTER PAYAKUMBUH)

Luki Henando
Teknik Komputer, Institut Teknologi Batam,
Jl. Gajah Mada Kompleks Vitka City, Tiban Ayu – Sekupang Batam
Email : luki.hernando04@gmail.com

Abstract
Data Mining is a process in an analysis of data on a large scale or in large quantities that aims to find
patterns that have meanings in decision support. In Finding these patterns can use the Algorithm Apriori
and FP-Growth algorithm which very popular in finding frequent itemset also determine or find the rule
of large database. In this study, using two algorithms that are Algorithm Apriori and FP-Growth that
can be used in for search the itemsets and find the association rules or rule of the results of selling
Laptop in Indocomputer Payakumbuh, in determining the brand of Laptop that is dominantly liked by
consumers, so it can use as consideration in increasing sales strategy in an effective and efficient.

Keywords: Knowledge Discovery Database, Data Mining, Apriori, FP-growth, Frequent itemset, Rule.

Abstrak
Data Mining Adalah suatu proses dalam sebuah analisa data dalam skala besar atau dalam jumlah besar
yang bertujuan untuk menemukan pola-pola yang mempunyai arti dalam pendukung keputusan. Dalam
Menemukan pola-pola tersebut bisa menggunakan Algoritma Apriori dan FP-Growth kedua Algoritma
ini sangat populer dalam mencari frequent itemset juga menentukan atau menemukan rule dari basis
data yang besar. Dalam penelitian ini, menggunakan kedua Algortima tersebut yaitu Algoritma Apriori
dan FP-Growth yang bisa digunakan dalam mencari itemset dan menemukan aturan asosiasi atau rule
dari hasil penjualan Laptop di Indocomputer Payakumbuh, dalam menentukasssn merk Laptop apa yang
dominan diminti oleh konsumen, sehingga dapat digunaan sebagai pertimbangan dalam meningkatkan
strategi dalam penjualan Laptop yang efektif dan efisien.

Kata kunci : Knowledge Discovery Database, Data Mining, Apriori, FP-growth, Frequent itemset,
Rule

Vol. 6 No. 1 Juli 2019 1


JURNAL J – CLICK E-ISSN : 2541 – 2469
P-ISSN : 2355 – 7958
Jurnal Sistem Informasi Dan Manajemen Informatika

PENDAHULUAN menganalisa penjualan merk Laptop yang


Perkembangan teknologi informasi lebih akurat sebagai bahan pengambilan
telah memungkinkan proses analisa data keputusan dalam melakukan strategi,
untuk menemukan suatu pola dari promosi dan persedian stok Laptop
kumpulan data sehingga dapat dilakukan berdasarkan merk yang banyak diminati
dengan lebih cepat dan cermat. Data mining konsumen.
mampu menganalisa data yang besar Dengan Algoritma Apriori dan
menjadi informasi berupa pola yang Algoritma Fp-Growth kita dapat
mempunyai arti bagi pendukung keputusan. membandingkan kedua algoritma dalam
Indocomputer merupakan salah satu menentukan aturan asosiasi dan melakukan
perusahaan yang sudah cukup lama pengelompokan data penjualan Laptop
berkembang. Indocomputer menyediakan berdasarkan merk di Indocomputer
bermacam-macam jenis dan tipe Laptop. Payakumbuh sehingga dapat digunakan
Dengan adanya perkembangan teknologi sebagai pertimbangan dalam pengembilan
yang sangat pesat pada saat ini membuat keputusan seperti membuat strategi
banyaknya jumlah transaksi penjualan yang promosi, dan persedian stok Laptop di
diterima setiap harinya. Jumlah kenaikan Indocomputer Payakumbuh.
penjualan tentunya membawa kebaikan.
Namun dengan adanya kegiatan penjualan Knowledge Discovery in Database (KDD)
Laptop di Indocomputer membuat data Knowledge Discovery in Database
penjualan Laptop semakin lama semakin (KDD) yang semua prosesnya adalah
tambah banyak. Dan data tersebut hanya kegiatan yang meliputi pengumpulan,
berfungsi sebagai arsip saja oleh pemakaian data historis untuk menemukan
perusahaan Sehingga terjadi penumpukan keteraturan, pola atau hubungan dengan set
data yang tidak diketahui manfaatnya, data yang berukuran besar (Tacbir Hendro
Indocomputer sering kehabisan stok Laptop Pudjiantoro et al, 2011).
karena tidak terlalu meperhatikan merk Proses dalam KDD adalah proses
Laptop apa yang laris dipasaran. Dan data yang terdiri dari rangkaian proses iteratif
penjualan Laptop tersebut dapat sebagai berikut :
dimanfaatkan, diolah menjadi informasi 1. Pembersihan Data (Data Cleaning)
yang berguna untuk meningkatkan strategi Proses ini dapat digunakan untuk
penjualan juga dapat mengetahui merk membuang atau menghilangkan noise
Laptop yang laris dipasaran. Sehingga yang bersifat tidak konsisten.
Indocomputer tidak kehabisan merk Laptop 2. Integrasi Data (Data Integration)
yang banyak diminimati dikalangan Proses ini digunakan untuk
masyarakat. menggabungkan data dari sumber yang
Untuk itu diperlukan suatu penelitian berbeda format maupun platform yang
guna mengetahui bagaimana penjualan kemudaian dapat diintegrasikan dalam
Laptop dan stok yang harus disediakan oleh suatu database.
Indocomputer Payakumbuh dengan
metode Data Mining memudahkan dalam

Vol. 6 No. 1 Juli 2019 2


JURNAL J – CLICK E-ISSN : 2541 – 2469
P-ISSN : 2355 – 7958
Jurnal Sistem Informasi Dan Manajemen Informatika

3. Seleksi Data (Data Selection)


Data yang terdapat di dalam database
kemudian diseleksi atau direduksi
dengan berbagai teknik agar data yang
diambil data yang relevan dengan
tugas analis dari database.
4. Transformasi Data (Data
Transformation)
Proses ini bertugas mentransformasi
atau menggabungkan data ke dalam
bentuk yang sesuai untuk penggalian Gambar 1 Tahap - tahap Knowledge Discovery in
lewat operasi summary atau Database
aggregation.
5. Penambangan Data (Data Mining) Definisi Data Mining
Data-data yang telah ada diseleksi atau Data Mining merupakan suatu
ditransformasi ditimbang dengan metode menemukan suatu pengetahuan
berbagai teknik, proses esensial untuk dalam suatu database yang cukup besar.
mengekstrak pola dari data dengan Data Mining adalah proses menggali dan
metode cerdas.. Proses Data Mining menganalisa sejumlah data yang sangat
merupakan proses mencari pola atau besar untuk memperoleh sesuatu yang
informasi menarik dalam data dengan benar, baru, sangat bermanfaat dan
menggunakan fungsi-fungsi tertentu. akhirnya dapat dimengerti suatu corak atau
6. Evaluasi Pola dan Presentasi pola dalam data tersebut (Han & Kamber
Pengetahuan (Pattern evaluation and dalam Eko Nur Wahyudi et al, 2011).
Knowledge presentation) Saat ini, konsep Data Mining semakin
Tahap ini merupakan bagian dari dikenal sebagai tools penting dalam
proses pencarian pengetahuan yang manajemen informasi karena jumlah
mencakup pemeriksaan pola-pola, informasi yang semakin besar jumlahnya.
apakah pola atau informasi yang Data Mining sendiri sering disebut sebagai
ditemukan bertentangan dengan fakta knowledge discovery in database (KDD)
atau hipotesa yang sebelumnya. adalah kegiatan yang meliputi
Serangkaian proses dan tahap tersebut pengumpulan, pemakaian data historis
dapat dilihat pada gambar 1 yang mana untuk menemukan keteraturan, pola
tahap itu adalah sebagai berikut hubungan dalam set data berukuran besar.
Output dari Data Mining ini dapat
digunakan untuk pengambilan keputusan di
masa depan (Tahta Alfina et al, 2012).
Data mining, dikenal sebagai
Knowledge Discovery Database (KDD),
adalah ekstraksi trivial informasi implisit,
yang sebelumnya tidak diketahui dan
berpotensi yang berguna dari data dalam

Vol. 6 No. 1 Juli 2019 3


JURNAL J – CLICK E-ISSN : 2541 – 2469
P-ISSN : 2355 – 7958
Jurnal Sistem Informasi Dan Manajemen Informatika

database. Padahal, Data Mining dan (KDD) 3. Deskripsi


sering diperlakukan sebagai sinonim, Data Terkadang peneliti dan analis secara
Mining sebenarnya bagian dari proses sederhana ingin mencoba mencari cara
penemuan pengetahuan . (Despande and untuk menggambarkan pola dan
Thakare, 2010). kecenderungan yang terdapat dalam
Secara garis besar Data Mining data. Deskripsi dari pola dan
dibagi menjadi dua kategori utama, yaitu : kecenderungan sering memberikan
1. Descriptive Mining, yaitu proses untuk kemungkinan penjelasan untuk suatu
menemukan karakteristik penting dari pola atau kecenderungan.
data dalam suatu basis data. Teknik 4. Estimasi
Data Mining yang termasuk dalam Estimasi hampir sama dengan
Descriotive Mining adalah Clustering, klasifikasi, kecuali variabel target
Association, dan Sequential Mining. estimasi lebih kearah numerik daripada
2. Predictive, yaitu proses untuk ke arah kategori. Model dibangun
menemukan pola dari data dengan menggunakan record lengkap yang
menggunakan beberapa variabel lain di menyediakan nilai dari variabel target
masa depan. Salah satu teknik yang sebagai nilai prediksi. Selanjutnya, pada
terdapat dalam Predictive Mining peninjauan berikutnya estimasi nilai
adalah klasifikasi. dari variabel target dibuat berdasarkan
nilai variabel prediksi.
Teknik - Teknik Data Mining 5. Klasifikasi
Data Mining dibagi menjadi beberapa Dalam klasifikasi, terdapat target
teknik berdasarkan tugas yang dapat variabel kategori. Sebagai contoh,
dilakukan : penggolongan pendapatan dapat
1. Asosiasi dipisahkan dalam tiga kategori, yaitu
Tugas asosiasi dalam Data Mining pendapatan tinggi, pendapatan sedang,
adalah menemukan atribut yang dan pendapatan rendah.
muncul dalam satu waktu. Dalam dunia 6. Pengklusteran
bisnis lebih umum disebut analisis Pengklusteran merupakan
keranjang belanja. pengelompokan record, pengamatan,
2. Prediksi atau memperhatikan dan membentuk
Prediksi hampir sama dengan kelas objek-objek yang memiliki
klasifikasi dan estimasi, kecuali bahwa kemiripan. Kluster adalah kumpulan
dalam prediksi nilai dari hasil akan ada record yang memiliki kemiripan satu
di masa mendatang. Beberapa metode dengan yang lainnya dan memiliki
dan teknik yang digunakan dalam ketidakmiripan dengan record-record
klasifikasi dan estimasi dapat pula dalam kluster lain.
digunakan (untuk keadaan yang tepat)
untuk prediksi. Association Rule
Aturan asosiasi akan menggunakan
data latihan, sesuai dengan pengertian data

Vol. 6 No. 1 Juli 2019 4


JURNAL J – CLICK E-ISSN : 2541 – 2469
P-ISSN : 2355 – 7958
Jurnal Sistem Informasi Dan Manajemen Informatika

mining, untuk menghasilkan pengetahuan. Association rules merupakan salah


Pengetahuan untuk mengetahui item-item satu teknik yang ada di dalam Data Mining
belanja yang sering dibeli secara bersamaan untuk menentukan hubungan antar item
dalam suatu waktu. Aturan asosiasi yang dalam suatau dataset yang telah ditentukan.
berbentuk “if…then…” atau Teknik ini mencari kemungkinan
“Jika…Maka…” merupakan pengetahuan kombinasi yang sering muncul dari suatu
yang dihasilkan dari fungsi Aturan Asosiasi itemset. Dalam menggunakan metode
(Seni Susanto dan Dedy Suryadi dalam Association Rules, terdapat tiga kriteria
Kennedi et al, 2013). ukuran yaitu :
Pada transaksi yang terdapat item X 1. Support : ukuran yang menunjukkan
terdapat kemungkinan ada item Y juga di tingkas dominasi itemset dari
dalamnya, dinotasikan, di mana X dan Y keseluruhan transaksi (misalkan dari
adalah disjoint itemset, dinotasikan . seluruh transaksi yang ada, seberapa
Kumpulan dari transaksi-transaksi ini besar kemungkinan item A dan item B
disebut dengan itemset, yang dinotasikan dibeli secara bersamaan). Support
dengan Ik (k=1, 2, … m). Jika terdapat ({A,B}) = Number of Transaction
itemset yang mempunyai item sebanyak k, (A,B).
maka disebut dengan k-itemset. 2. Confidence (Probility) : ukuran yang
Association Rule adalah teknik Data menyatakan hubungan antara dua item
Mining yang berguna untuk menemukan secera conditional (misalkan seberapa
suatu korelasi atau pola yang sering item A dibeli, jika pelanggan
terpenting/menarik dari sekumpulan data membeli item B. Confidencde (A U B)
besar (Dwina Kuswardani et al , 2011). = Probability (B | A) = Support (A | B)
Association rule ini nantinya akan / Support (A).
menghasilkan rules yang menentukan 3. Improvement (Importance) : ukuran
seberapa besar hubungan antar X dan Y tadi, yang menyatakan besarnya
dan diperlukan dua ukuran untuk rules ini, kemungkinan dua item dapat dibeli
yakni support dan confidence. Support secara bersamaan. Importance ({A,B})
merupakan kemungkinan X dan Y muncul = Probability (A,B) / Probability (A) *
bersamaan yang dinotasikan( Nugroho Probability (B)).
Wandi et al, 2012 ).
Algoritma Apriori
Algoritma apriori adalah algoritma
pengambilan data dengan aturan asosiatif
(Association rule) untuk menentukan
Sedangkan confidence merupakan
kemungkinan munculnya Y ketika X juga hubungan asosiatif suatu kombinasi item.
muncul, dinotasikan Association Rule yang dimaksud dilakukan
melalui mekanisme penghitungan support
dan confidence dari suatu hubungan item.
Sebuah rule asosiasi dikatakan interesting
jika nilai support adalah lebih besar dari

Vol. 6 No. 1 Juli 2019 5


JURNAL J – CLICK E-ISSN : 2541 – 2469
P-ISSN : 2355 – 7958
Jurnal Sistem Informasi Dan Manajemen Informatika

minimum support dan juga nilai confidence 1. Join (penggabungan).


adalah lebih besar dari minimum confidence Pada proses ini setiap item
(Robi Yanto and Riri Khoiriah, 2015). dikombinasikan dengan item yang
Algoritma Apriori dibagi menjadi lainnya sampai tidak terbentuk
beberapa tahap yaitu : kombinasi lagi.
1. Pembentukan kandidat itemset. 2. Prune (pemangkasan).
2. Perhitungan Support dari tiap kandidat Pada proses ini, hasil dari item yang
ke intemset. telah dikombinasikan tadi lalu
3. Tetapkan pola frekuensi tinggi, Pola dipangkas dengan menggunakan
frekuensi tinggi yang memuat k-item Minimum Support yang telah
atau k-itemset ditetapkan dari kandidat ditentukan oleh user.
k-itemset yang support nya lebih besar
dari Minimum Support. Dua proses utama tersebut merupakan
4. Bila tidak didapat pola frekuensi tinggi langkah yang akan dilakukan untuk
maka seluruh proses dihentikan. mendapat frequent itemset, yang dapat
dilihat pada Gambar 2 berikut ini.
Proses Utama dalam Algoritma Apriori
Algoritma Apriori adalah suatu
algoritma dasar yang diusulkan oleh
Agrawal & Srikant pada tahun 1994 untuk
penentuan frequent itemsets untuk aturan
asosiasi boolean. Algoritma apriori
termasuk jenis aturan asosiasi pada Data Gambar 2 Algoritma Apriori
Mining.Aturan yang menyatakan asosiasi
antara beberapa atribut sering disebut Algoritma Fp-Growth
affinity analysis atau market basket analysis Algoritma FP-Growth merupakan
(Mohammad Badrul, 2016). salah satu alternatife algoritma yang cukup
Apriori merupakan algoritma yang efektif untuk mencari himpunan data yang
sudah sangat banyak dikenal dalam paling sering muncul (frequent itemset)
melakukan pencarian frequent itemset dalam sebuah kumpulan data yang besar.
dengan menggunakan teknik Association Algoritma FP-Growth merupakan
Rule. Algoritma Apriori menggunakan algoritma Association Rules yang cukup
knowledge mengenai frequent itemset yang sering dipakai. Algoritma FP-Growth ini
telah diketahui sebelumnya, untuk dikembangkan dari algoritma apriori.
memproses informasi selanjutnya. Algoritma apriori menghasilkan kombinasi
Algoritma Apriori menentukan kandidat- yang sangat banyak sehingga data yang
kandidat yang mungkin muncul dengan dihasilkan tidak efisien (Kezia Sumangkut,
cara memperhatikan Minimum Support. et al, 2016).
Adapun dua proses utama yang dilakukan
dalam pemrosesan algoritma Apriori,
yaitu):

Vol. 6 No. 1 Juli 2019 6


JURNAL J – CLICK E-ISSN : 2541 – 2469
P-ISSN : 2355 – 7958
Jurnal Sistem Informasi Dan Manajemen Informatika

Gambar 4. Contoh FP-tree dan Tabel Header


Gambar 3. Algoritma FP-Growth
Pembentukan Aturan Asosiasi
Pembuatan FP-Tree Setelah semua pola ditemukan,
FP-tree merupakan kompak struktur barulah dicari aturan asosiasi yang
data yang mewakali set data dalam bentuk memenuhi syarat minimum untuk
pohon yang mewakili cabang. Setiap confidence dengan menghitung confidence
transaksi dibaca dan kemudian dipetakan ke aturan asosiatif A & B. Nilai confidence
jalur FP-Tree. Hal ini dilakukan sampai dari aturan A & B diperoleh dengan rumus
semua transaksi sudah dibaca. FP-tree berikut.
merupakan struktur penyimpanan data yang
dimampatkan. FP-tree dibangun dengan
memetakan setiap data transaksi ke dalam Rumus diatas menjelaskan bahwa
setiap lintasan tertentu dalam FP-tree. nilai confidance diperoleh dengan cara
Semakin banyak data transaksi yang mencari jumlah transaksi yang
memiliki item yang sama, maka proses mengandung nilai A dan B (item pertama
pemampatan dengan struktur data FP-tree bersamaan dengan item yang lain) dibagi
semakin efektif. Adapun Pembangunan FP- dengan jumlah transaksi yang mengandung
Tree dapat dibagi menjadi tiga langkah A (Item pertama). Dan Untuk menentukan
utama, yaitu : aturan asosiasi yang akan dipilih maka
1. Scanning data set untuk menentukan harus diurutkan berdasarkan Support ×
jumlah dukungan dari setiap item. Confidence. Aturan diambil sebanyak n
2. Membuang data yang tidak perlu dan aturan yang memiliki hasil atau nilai yang
membuat order list dari item yang terbesar .
paling banyak muncul dengan urutan
menurun. Penerapan Algoritma FP-Growth
3. Scanning data menetapkan satu Algoritma Fp-Growth merupakan
transaksi pada suatu waktu FP-Tree, algoritma pencarian frequent yang efisien
membentuk jalur yang baru dan node karena menggunakan struktur data tree
baru. (FP-Tree). Algoritma FP-Grrowth
Tahapan-tahapan tersebut merupakan menentukan frequent itemset yang berakir
langkah yang akan dilakukan untuk suffix tertentu dengan menggunakan
mendapat frequent itemset, yang dapat metode divid dan conquer untuk memecah
dilihat pada Algoritma berikut : problem menjadi sub-problem yang lebih

Vol. 6 No. 1 Juli 2019 7


JURNAL J – CLICK E-ISSN : 2541 – 2469
P-ISSN : 2355 – 7958
Jurnal Sistem Informasi Dan Manajemen Informatika

kecil. Kemudian setelah tahap Tahapan ini merupakan gambaran


pembangunan FP-tree dari sekumpulan penelitian secara terstruktur yang akan
data transaksi, akan diterapkan Algoritma dilakukan dan di bab ini juga dijelaskan
FP-growth dibagi menjadi tiga langkah bagaimana tiap-tiap kegiatan penelitian
utama, yaitu : tersebut dikerjakan.. Tahap-tahap kerangka
1. Tahap Pembangkitan Conditional kerja ini dibuat agar penelitian menjadi
Pattern Base terarah.
Conditional Pattern Base merupakan
subdatabase yang berisi prefix path
(lintasan prefix) dan suffix pattern (pola
akhiran). Pembangkitan conditional
pattern base didapatkan melalui FP-
tree yang telah dibangun sebelumnya.
2. Tahap Pembangkitan Conditional
Fptree
Pada tahap ini, support count dari setiap
item pada setiap conditional pattern
base dijumlahkan, lalu setiap item yang
memiliki jumlah support count lebih
besar sama dengan minimum support
count ξ akan dibangkitkan dengan
conditional FPtree.
3. Tahap Pencarian frequent itemset
Apabila Conditional FP-tree
merupakan lintasan tunggal (single
Gambar 5. Kerangka Penelitian
path), maka didapatkan frequent itemset
dengan melakukan kombinasi item
PEMBAHASAN DAN HASIL
untuk setiap conditional FP-tree. Jika
Persiapan Data
bukan lintasan tunggal, maka dilakukan
Data utama yang digunakan dalam
pembangkitan FP-growth secara
penelitian ini adalah data penjualan Laptop
rekursif.
di Indocomputer Payakumbuh tahun 2016
merupakan data yang akan dijadikan
METODOLOGI PENELITIAN
sampel dalam penerapan Algoritma Apriori
Beberapa tahapan yang akan
dan FP - Growth untuk penentuan merk
dilakukan untuk dapat mengatasi
Laptop yang laris dipasaran. Atribut-atribut
permasalahan yang ada, menganalisa
yang digunakan dalam penelitian ini adalah
masalah, menentukan tujuan, mempelajaari
tahun penjualan dan merk Laptop.
literature, teknik pengumpulan data,
menganalisa teknik yang digunakan, cara
mendesain sistem, implementasi algoritma
apriori dan fp-Growth dan pengujian Hasil.

Vol. 6 No. 1 Juli 2019 8


JURNAL J – CLICK E-ISSN : 2541 – 2469
P-ISSN : 2355 – 7958
Jurnal Sistem Informasi Dan Manajemen Informatika

Tabel 1. Sample Data Tabel 4. Data Item Merk Laptop

Tabel 5. Jumlah Kemunculan Item Yang Sering


Muncul

Tabel 2. Bulan Penjualan

Tahapan Perhitungan Algoritma Apriori


Dalam perhitungan Algoritma
Apriori dimulai dengan mendefinisikan
masing-masing itemset. Tahapan dalam
perhitungan Algoritma Apriori untuk
menemukan association rules yaitu
menuliskan data transaksi yang terjadi
Tabel 3. Data Pembelian Laptop Setelah
dalam periode tertentu.
dikonversi berdasarkan merk Laptop yang
sering dibeli.
Mendefinisikan Masing – Masing
Itemset
Langkah Pertama adalah membuat
kombinasi 1 itemset pada setiap table dan
frekuensi masing-masing merk Laptop
Support sesuai dengan data tabular pada
Table. Pola yang didapatkan dapat dilihat
pada Table 5.
Rumus support dapat dilihat pada rumus
(1):

Vol. 6 No. 1 Juli 2019 9


JURNAL J – CLICK E-ISSN : 2541 – 2469
P-ISSN : 2355 – 7958
Jurnal Sistem Informasi Dan Manajemen Informatika

Nilai Support K01 = (jumlah data Tabel 8 Tabulasi Pola Kombinasi 2 itemset
mengandung K01/ Total data) x 100%
= 9/12 x 100% = 75
Nilai Support K02 = (jumlah data
mengandung K02/ Total data) x 100%
= 6/12 x 100% = 50 Pada tabel 8. di atas akan dipisahkan
…dan seterusnya. kandidat yang tidak termasuk ke dalam nilai
minimum support. Itemset yang memenuhi
Tabel 6. Nilai Support Untuk 1 Item Set minimum support dan perhitungan nilai
confidence dapat dilihat pada tabel 8.
Contoh perhitungan Confidence :
- Confidence (K01,K09)= s ({K01,K09})
/ s ({K01})
= 75/75 = 100 %
- Confidence (K01,K12) = s
({K01,K012}) / s ({K01})
=75/75 = 100 % …dan seterusnya.

Tabel 9. Kombinasi 2 Item Set yang Memenuhi


Minimum Support

Langkah berikutnya adalah


menentukan minimum support Dengan
Nilai ≥ 70. tentukan itemset yang memenuhi
minimum support. Hasilnya dapat
ditunjukkan pada tabel 7. Kombinasi 3 Itemsets
Tabel 7 ItemSet yang Memenuhi Minimum
Support
Berikutnya adalah kombinasi 3
itemsets pada setiap frekuensi masing-
masing kombinasi dihitung sesuai dengan
data tabular pada tabel 7. di atas. Pola
kombinasi terdapat pada tabel 10. berikut:
Tabel 10. Tabulasi Pola Kombinasi 3 itemset

Kombinasi 2 Itemset
Langkah berikutnya adalah membuat
kombinasi 2 itemsets pada setiap frekuensi
masing-masing kombinasi dihitung sesuai Dari penghitungan di atas, maka
dengan data tabular pada tabel 6 di atas. itemset yang memenuhi minimum support
Pola kombinasi yang didapatkan dapat dapat dilihat pada tabel 11. berikut :
dilihat pada tabel 8. berikut :

Vol. 6 No. 1 Juli 2019 10


JURNAL J – CLICK E-ISSN : 2541 – 2469
P-ISSN : 2355 – 7958
Jurnal Sistem Informasi Dan Manajemen Informatika

Tabel 11. Kombinasi 3 ItemSet yang Memenuhi Rule 8: {K14} → {K09}


Minimum Support c=s ({K14,K09}) /s ({K14})= 9/9 =100 %
Rule 9: {K14} → { K12 }
c=s ({K14,K12}) /s({K14}) =10/11= 90%
Rule Asosiasi Algoritma Apriori Rule 10: {K12} → { K14}
Untuk mencari aturan asosiasi c=s ({K12,K14})/s({K12}) = 10/11= 90%
diperlukan juga minimal Confidence Misal Rule 11: {K01,K12} → { K09 }
minimal confidence : 70 %, aturan asosiasi c=s({K01,K12,K09}) /s({K01,K12}) = 9/9
yang mungkin terbentuk dapat ditunjukkan = 100%
pada Tabel 12. Rule 12: {K01,K09} → { K12 }
Tabel 12. Nilai Confidence >70 % Untuk Tiap c = s ({K01,K09,K12}) / s ({K01,K09}) =
ItemSet 9/9 = 100%
Rule 13: {K01} → { K09,K12 }
c = s ({K01,K09,K12}) / s ({K01}) = 9/9
= 100%
Rule 14: {K09,K12} → { K01}
c = s ({K01,K12,K01}) / s ({K09,K12}) =
Dilihat dari hasil di atas, ternyata 9/9 = 100%
itemset yang tersisa, adalah K01,K09,K12 Rule 15: {K09} → {K01 ,K12 }
dan K14 (Lenovo AMD A8, Toshiba C840 c = s ({K01,K01,K12}) / s ({K09}) = 10/9
– I3, HP AMD A8 dan NB ASUS X 200 = 90%
MA) yang selanjutnya dapat dinyatakan Rule 16: {K12} → { K01,K09 }
sebagai frequent itemset. Langkah c = s ({K12,K01,K09}) / s (K12}) = 9/11
selanjutnya adalah dengan membentuk = 82%
association rule yang kuat berdasarkan
frequent itemset yang dihasilkan tersebut Tahapan Perhitungan Algoritma Fp-
berdasarkan nilai confidence. Growth
Rule 1: {K01} → {K09} Tabel 13. berikut mendata
c= s({K01,K09}) /s ({K01}) = 9/9= 100 % kemunculan item yang frequent dalam
Rule 2 : {K09} → {K01} setiap data penjulan Laptop , diurut
c =s ({K09,K01}) /s({K09}) = 9/10= 90 % berdasarkan frekuensi yang paling tinggi.
Rule 3: {K01} → {K12} Tabel 13. Kemunculan Item Diurut
Berdasarkan Frekuensi Tertinggi
c=s ({K01,K12}) /s ({K01}) = 9/9 =100%
Rule 4: {K12} → {K01}
c= s ({K12,K01}) /s ({K12}) = 9/9=100%
Rule 5: { K09} → { K12}
c= s({K09,K12}) /s({K09}) = 9/10 = 90%
Rule 6: { K12} → { K09}
c= s ({K12,K09}) /s ({K12})= 9/10= 90%
Rule 7: {K09} → {K14}
c=s ({K09,K14}) / s ({K09})= 9/9=100 %

Vol. 6 No. 1 Juli 2019 11


JURNAL J – CLICK E-ISSN : 2541 – 2469
P-ISSN : 2355 – 7958
Jurnal Sistem Informasi Dan Manajemen Informatika

Setelah dilakukan Pengurutan Data penjualan yang terdiri dari 12


didapat item yang memiliki frekuensi di (Dua Belas) Bulan data penjualan dengan 4
atas support count > 8 adalah jenis item seperti pada tabel 16 di atas yang
K01,K09,K14 dan K12. Ke empat item akan dipindahkan ke dalam pohon yang
inilah yang akan berpengaruh dan akan menunjukkan proses terbentuknya FP-tree
dimasukkan ke dalam FP-tree, selebihnya setiap tahun penjualan Laptop yang dibaca.
(K02,K03,K04,K05,K06,K07,K08,K10,K1 Setiap simpul pada FP-tree mengandung
1 dan K15) dapat dibuang karena tidak nama sebuah item dan counter support yang
berpengaruh signifikan. Sehingga berfungsi untuk menghitung frekuensi
menghasilkan tabel 14. kemunculan item tersebut dalam tiap
Tabel 14 Kemunculan Item Yang Memenuhi lintasan setiap tahunnya. Kumpulan data
Support Count dipindai pertama kali untuk menentukan
support count dari setiap item. Item yang
tidak frequent dibuang, sedangkan frequent
item dimasukkan dan disusun dengan
urutan menurun, seperti yang terlihat pada
Gambar dibawah ini :
Tabel 15. mendata kemunculan item Null

yang frequent dalam setiap penjualan K12=1

Laptop, diurut berdasarkan yang K14=1

frekuensinya paling tinggi dan Minimal K09=1

Support >8. K01=1

Tabel 15. Kemunculan Item Setiap Merk Laptop


Di Urut Bedasarkan Frekuensi Paling Tinggi
Gambar 6. Hasil Pembentukan FP –Tree Setelah
Pembacaan TA01(K12,K14,K09,K01)

Pemindaian kedua, yaitu pembacaan


Transaksi pertama B01{
K12,K14,K09,K01} akan membuat simpul
K12,K14,K09 dan K01, sehingga terbentuk
lintasan transaksi
Null→K12→K14→K09→K01. Support
count dari setiap simpul bernilai awal 1
Tahap Pembangunan FP-tree (satu).
Pada tahapan ini, akan dilakukan Null

pembangunan FP-Tree dengan K12=2

menggunakan data transaksi yang telah K14=2

dipangkas dan diurutkan berdasarkan nilai K09=2

support count. Dengan perolehan Frequent K01=2

Items setelah dipangkas dan diurutkan,


maka akan dibangun FP-Tree.
Gambar 7. Hasil Pembentukan FP–Tree Setelah
Pembacaan B02 (K12,K14,K09,K01)

Vol. 6 No. 1 Juli 2019 12


JURNAL J – CLICK E-ISSN : 2541 – 2469
P-ISSN : 2355 – 7958
Jurnal Sistem Informasi Dan Manajemen Informatika

Null Null

K12=3
K12=8

K14=3 K14=1
K14=8

K09=3
K09=6
K01=3 K09=1
K01=6

Gambar 8. Hasil Pembentukan FP–Tree Setelah


Pembacaan B03 (K12,K14,K09,K01) Gambar 13. Hasil Pembentukan FP –Tree
Setelah Pembacaan B09, B09 (K12,K14,K09,K01)
Null
Null
K12=4
K12=9
K14=4
K14=1
K14=9
K09=4
K09=7

K01=4 K09=1
K01=7

Gambar 9. Hasil Pembentukan FP –Tree Setelah Gambar 14. Hasil Pembentukan FP –Tree
Pembacaan B04 (K12,K14,K09,K01) Setelah Pembacaan B10, B10 (K12,K14,K09,K01)
Null

Null
K12=11
K12=5
K14=1
K14=5 K14=1 K14=11

K09=10
K09=4
K09=1
K09=1
K01=9
K01=4 K09=1

K01=1

Gambar 10. Hasil Pembentukan FP –Tree Gambar 15. Hasil Pembentukan FP –Tree
Setelah Pembacaan B06, B04 (K14,K09) Setelah Pembacaan B12, B12 (K12,K09,K01)
Null

K12=6 Tahap Pencarian Frequent Itemset


K14=6 K14=1 Untuk menemukan frequent itemset
K09=4 maka perlu ditentukan upapohon (pohon
K09=1
K01=4 yang akarnya adalah keturunan dari akar
pohon induknya) dengan lintasan yang
Gambar 11. Hasil Pembentukan FP –Tree berakhir dengan support count terkecil,
Setelah Pembacaan B07, B07 (K12,K14) yaitu K01. Berturut-turut ditentukan juga
yang berakhir di K09,K14 dan K12 .Proses
Null
pembentukan dapat dilihat pada gambar 16
K12=7

K14=7 K14=1
sampai dengan 19 berikut :
K09=5
K09=1
K01=5

Gambar 12. Hasil Pembentukan FP –Tree


Setelah Pembacaan B08 B08 (K12,K14,K09,K01)

Vol. 6 No. 1 Juli 2019 13


JURNAL J – CLICK E-ISSN : 2541 – 2469
P-ISSN : 2355 – 7958
Jurnal Sistem Informasi Dan Manajemen Informatika

Null
Dari pembangkitan FP-tree yang
K12=11
telah dilakukan maka didapatkan hasil
K14=1
K14=11 Conditional Pattern Base Seperti
K09=10
ditampilkan dalam tabel 16.
K09=1
K01=9 Tabel 16. Tabel Hasil Conditional Pattern Base
K09=1

K01=1

Gambar 16. Lintasan Yang Mengandung


Simpul K01

Dari pembangkitan conditional FP-


Tree telah dilakukan sebelumnya maka,
didapatkan hasil conditional FP-Tree dan
hasil frequent itemset yang dapat dilihat
pada tabel 17.
Tabel 17. Tabel Hasil Conditional FP-Tree dan
Frequent Itemset
Gambar 17. Lintasan Yang Mengandung
Simpul K09

Null

K12=11

K14=11 K14=1

Gambar 18. Lintasan Yang Mengandung


Simpul K14

Setelah didapatkan frequent itemset,


selanjutnya adalah membuat rule dengan
cara menghitung nilai support dan
confidence-nya. maka itemset yang dihitung
Gambar 19. Lintasan Yang Mengandung minimal berisi dua item. Maka yang akan
Simpul K12 dihitung nilai support dan confidence-nya,
yaitu: (K01,K12), (K12,K01), (K01,K09),
Rule Asosiasi Algoritma Fp-Growth (K09,K01), (K14,K12), (K12,K14),
Langkah pertama Untuk menentukan (K09,K14), (K14,K09), (K09,K12),
Rule Asosiasi Algoritma Fp-Growth adalah (K12,K09), (K01,K09,K14),
menemukan semua frequent itemset yang (K09,K12,K01), (K12,K09,K01),
berakhiran K12,K14,K09 dan K01 maka (K09,K01,K12), (K09,K12,K01),
kita harus mengecek apakah support count (K12,K09,K01).
dari K12,K14,K09 dan K01 memenuhi Dari ke-16 subsets yang dihasilkan
minimum support count >8. selanjutnya akan dihitung nilai support dan
confidence-nya. Hanya kombinasi yang

Vol. 6 No. 1 Juli 2019 14


JURNAL J – CLICK E-ISSN : 2541 – 2469
P-ISSN : 2355 – 7958
Jurnal Sistem Informasi Dan Manajemen Informatika

lebih besar sama dengan minimum association rule adalah K01 K12, yang
confidence yang akan diambil atau strong artinya jika membeli Laptop dari item K01,
association rule nya saja. Berdasarkan maka membeli Laptop dari item K12 juga.
frequent itemset di atas maka confident Berikut hasil lengkap pola-pola atau rules
yang dihasilkan adalah : yang dihasilkan:
1. Confidence({K01}{K12}) = 9/11 = 1. Rule 1: {K01 12}
82 % c = s ({K01,K12}) / s ({K09}) = 9/9 =
2. Confidence({K12}{K01}) = 9/11 = 100%
82 % 2. Rule 2: {K12 01}
3. Confidence({K01}{K09}) = c = s ({K12,K01}) / s ({K12}) = 9/9 =
9/10 = 90 % 100%
4. Confidence({K09}{ K01}) = 9/10 = 3. Rule 3: {K01 09}
90 % c = s ({K01,K09}) / s ({K09}) = 9/9=
5. Confidence({K14}{ K12}) = 11/11 100%
= 100 % 4. Rule 4: {K09 01}
6. Confidence({K12}{ K14}) = 11/11 c = s ({K09,K01}) / s ({K09}) = 9/10=
= 100 % 90%
7. Confidence({K09}{ K14}) = 10/11 5. Rule 5: {K14 12}
= 90 % c = s ({K14,K12}) / s ({K14}) = 10/11
8. Confidence({K14}{ K09}) = 10/11 = 91%
= 90 % 6. Rule 6: {K12 14}
9. Confidence({K09}{ K12}) = 10/11 c = s ({K12,K14}) / s ({K14}) = 10/11
= 90 % = 91%
10. Confidence({K12}{ K09}) = 10/11 7. Rule 7: {K09 14}
= 90 % c = s ({K09,K14}) / s ({K09}) = 9/10 =
11. Confidence({K01}{ K09,K14}) 90 %
= 9/9 = 100 % 8. Rule 8: {K14 09}
12. Confidence({K09}{K12,K01}) c = s ({K14,K09}) / s ({K14}) = 9/11 =
= 9/9 = 100 % 82 %
13. Confidence({K12}{(K09,K01}) 9. Rule 9: {K09 12}
= 9/11= 82 % c = s ({K09,K12}) / s ({K09}) = 9/10 =
14. Confidence({K12,K09}{ K01}) 90%
= 9/9 = 100 % 10. Rule 10: {K12 09}
15. Confidence({K12,K01}{K09}) c = s ({K12,K09}) / s ({K12}) = 9/11=
= 9/9 = 100% 82%
16. Confidence({K09,K01}{(K12}) 11. Rule 11: {K01 K12,K09}
= 9/11= 82 % c = s ({K01,K12,K09}) / s ({K09}) =
Jika dimisalkan minimum confidence 9/9= 100%
adalah 70 %, minimum confidence ini 12. Rule 12: {K09 K12,K01}
diambil di atas > 70% agar tingkat c = s ({K19,K12,K01}) / s ({K09}) =
akurasinya tinggi, maka yang termasuk 10/9=90%

Vol. 6 No. 1 Juli 2019 15


JURNAL J – CLICK E-ISSN : 2541 – 2469
P-ISSN : 2355 – 7958
Jurnal Sistem Informasi Dan Manajemen Informatika

13. Rule 13: {K12 K09,K01} 4. Sistem yang dibangun dapat membantu
c = s ({K12,K09,K01}) / s ({K12}) = dalam menghasilkan rule yang
11/9=82% umumnya masih dilakukan secara
14. Rule 14: {K12,K09} K01} manual. Algoritma Apriori dan
c = s ({K12,K09,K01}) / s Algorithma FP-Growth dapat
({K12,K09}) = 9/9= 100% memberikan informasi eksekutif dan
15. Rule 12: {K12,K01 K09} sistem digunakan untuk
c = s ({K12,K01,K09}) / s menggambarkan proses yang terkait
({K12,K01}) = 9/9=100% dengan menentukan merk Laptop yang
16. Rule 13: {K09,K01 K12} laris di pasaran.
c = s ({K09,K01,K12}) / s 5. Sistem asosiasi rule penjualan Laptop
({K09,K01}) = 9/9=100% berdasarkan merk menggunakan
Terhadap data penjualan Laptop di Algoritma Apriori dan Algoritma FP-
Indocomputer dapat diperoleh informasi Growth dapat digunakan dalam
merk Laptop yang paling banyak diminati pengambilan keputusan untuk mencari
oleh masyarakat yaitu : K01(Lenovo AMD alternatif merk laptop apa saja yang
A8), K09(Toshiba C840-I3), K12(HP banyak dinikmati konsumen.
AMD A8) dan K14(NB Asus x200 MA).
Hasil ini didapatkan berdasarkan DAFTAR PUSTAKA
kemunculan itemset dari data penjualan Tacbir Hendro Pudjiantoro et al, 2011,
Laptop. Konferensi Nasional Sistem dan
Informatika 2011, November 2011,
hlm. 12 “Penerapan Data Mining
SIMPULAN
Untuk Menganalisa Kemungkinan
Dari uraian yang sudah dibahas Pengunduran Diri Calon
sebelumnya dapat ditarik kesimpulan : Mahasiswa Baru”.
1. Dengan menggunakan Algoritma Han & Kamber dalam Eko Nur Wahyudi et
Apriori Dan FP-Growth dengan al, 2011. Jurnal Teknologi Informasi
bantuan software WEKA 3.7.4 DINAMIK Volume 16, No.1, Januari
didapatkan hasil berupa aturan (rules) 2011, hl, 29 – 43 “Analisa Profil
Data Mahasiswa Baru terhadap
yang merupakan kumpulan frequent
Program Studi yang dipilih di
itemset dengan nilai confidence yang perguruan tinggi swasta jawa
tinggi. Tengah dengan menggunakan
2. Dengan didapatkannya rules ini maka Teknik Data Mining”.
pimpinan dapat menggunakan aturan Tahta Alfina et al, 2012. JURNAL
(rules) dalam membuat suatu strategi TEKNIK ITS Vol. 1, Sept, 2012,
yang dapat meningkatkan jumlah Analisa Profil Data Mahasiswa
Baru terhadap Program Studi yang
penjualan Laptop setiap harinya.
dipilih di perguruan tinggi swasta
3. Penentuan Variabel yang akan jawa Tengah dengan menggunakan
digunakan dalam memprediksi juga Teknik Data Mining”.
sangat mempengaruhi rule atau Despande and Thakare, 2010. International
knowledge yang dihasilkan. Journal of Distributed and Parallel
systems (IJDPS) Vol.1, No.1,

Vol. 6 No. 1 Juli 2019 16


JURNAL J – CLICK E-ISSN : 2541 – 2469
P-ISSN : 2355 – 7958
Jurnal Sistem Informasi Dan Manajemen Informatika

September 2010. “Data Mining Apriori (Studi Kasus Badan


System And Applications: A Perpustakaan dan Kearsipan
Review”. Provinsi Jawa Timur)”.
Kennedi et al, 2013. Volume : I, Nomor : 1,
Robi Yanto and Riri Khoiriah, 2015. “
Oktober 2013. “Implementasi Data
Implementasi Data Mining dengan
Mining Algoritma Apriori Pada
Metode Algoritma Apriori dalam
Sistem Persediaan Alat-Alat Menentukan Pola Pembelian Obat”.
Kesehatan”. Mohammad Badrul, 2016. Jurnal Pilar Nusa
Dwina Kuswardani et al , 2011. Jurnal
Mandiri Vol.XII, No.2 September
Ilmiah Menuju Solusi Teknologi
2016. “Algoritma Asosiasi Dengan
Informasi, Vol.6, No. 2, Juli 2011.
Algoritma Apriori Untuk Analisa
“Metode Association Rule Untuk
Data Penjualan”.
Analisis Citra Ct Organ Pasien Kezia Sumangkut, et al, 2016. E-Journal
Kanker Ovarium”.
Teknik Informatika Vol.8, No.1,
Nugroho Wandi et al, 2012. JURNAL
April 2016. “ Analisa Pola Belanja
TEKNIK ITS Vol. 1, Sept, 2012.
Swalayan Daily Mart Untuk
“Pengembangan Sistem
Menentukan Tata Letak Barang
Rekomendasi Penelusuran Buku
Menggunakan Algoritma FP-
dengan Penggalian Association Growth”.
Rule Menggunakan Algoritma

Vol. 6 No. 1 Juli 2019 17

Anda mungkin juga menyukai