Anda di halaman 1dari 8

REVIEW JURNAL DATA MINING METODE APRIORI

Mochamad Alfin Fauzi, Fajrian Nur Adnan,M.Cs.


Program Studi Sistem Informasi
Universitas Dian Nuswantoro Semarang
alvinfauzi31@gmail.com, fajrian.nur.adnan@dsn.ac.id

Abstrak
Semakin perkembangan zaman, semakin banyak data-data. Jika
dibiarkan saja, maka data-data tersebut hanya menjadi sampah yang tidak
berarti. Dengan adanya dukungan kemajuan teknologi, pengumpulan data jadi
semakin mudah
Data mining, adalah kegiatan yang meliputi pengumpulan, pemakaian
data historis untuk menemukan keteraturan, pola atau hubungan dalam set data
berukuran besar. Keluaran dari data mining bisa dipakai untuk memperbaikin
pengambilan keputusan dimasa depan.
Algoritma apriori adalah adalah algoritma yang paling terkenal untuk
menemukan pola frekuensi tinggi. algoritma apriori dibagi menjadi beberapa
tahap yang disebut narasi atau pass Pembentukan kandidat itemset, kandidat k-
itemset dibentuk dari kombinasi (k-1)-itemset yang didapat dari iterasi
sebelumnya. Satu cara dari algoritma apriori adalah adanya pemangkasan
kandidat k-itemset yang subset-nya yang berisi k-1 item tidak termasuk dalam
pola frekuensi tinggi dengan panjang k-1
Kata kunci: Apriori Data Mining

1. Pendahuluan
Metode algoritma apriori banyak digunakan dalam berbagai bidang, Contohnya dibidang
bisnis atau perdangangan dan bidang pendidikan, dibidang bisnis misalnya implementasi data
mining algoritma apriori untuk sistem persedian tujuanya untuk membantu para pembisnis
memantau produk apa saja yang terlaris. Dan dibidang penjualan dapat membantuk pembisnis
untuk meningkatkan pendapatannya. Sedangkan dibidang pendidikan misalnya implementasi
data mining untuk menentukan range nilai siswa-siswi.
Jumlah data yang begitu besar dapat menjadi masalah bagi perusahaan tersebut jika tidak
dapat dimanfaatkan datanya. Banyak data yang sebenarnya dapat dikelola, tetapi tidak ada
petunjuk untuk menggali data menjadi sebuah informasi. Biasanya data-data yang ada hanya
di gunakan sebagai arsip bagi perusahaan. Yang menjadi kendala dalam pengolahan informasi
adalah apabila data-data yang ada dalam database dibiarkan begitu saja,
Metode algoritma apriori bertujuan untuk menemukan frequent itemset yang dijalankan
pada sekumpulan data. Masalah utama pencarian Frequent Itemset adalah banyaknya jumlah
kombinasi itemset yang harus diperiksa apakah memenuhi minimum support atau tidak.
Apriori merupakan sebuah teknik data mining untuk menemukan aturan asosiasi (Association
rules) yang berkenaan dengan studi tentang ‘apa bersama apa’ atau yang menghubungkan
suatu kombinasi barang yang di gunakan untuk menemukan pola asosiasi dengan tingkat
kepercayaan tertentu.

1
2. Kajian Pustaka dan pengembangan hipotesis
2.1. Defenisi Data Mining
Data mining, adalah kegiatan yang meliputi pengumpulan, pemakaian data
historis untuk menemukan keteraturan, pola atau hubungan dalam set data berukuran
besar. Keluaran dari data mining bisa dipakai untuk memperbaikin pengambilan
keputusan dimasa depan (Budi Santosa, 2007).
Dari defenisi-defenisi yang telah disampaikan, hal penting yang terkait
dengan data mining adalah:
1. Data mining merupakan suatu proses otomatis terhadap data yang sudah ada.
2. Data yang akan diproses berupa data yang sangat besar.
3. Tujuan data mining adalah mendapatkan hubungan atau pola yang akan mungkin
memberikan indikasi yang bermanfaat.
2.2 Pengelompokan Data Mining
Data mining dibagi menjadi beberapa kelompok berdasarkan tugas yang
dapat dilakukan, yaitu (Kusrini dan Emha Taufiq Luthfi, 2009):
1. Deskripsi
Terkadang peneliti dan analis secara sederhana ingin mencoba mencari data untuk
menggambarkan pola dan kecenderungan yang terdapat dalam data. Sebagai
contoh, petugas pengumpulan suara mungkin tidak dapat menentukan keterangan
atau fakta bahwa siapa yang tidak cukup professional akan sedikit didukung dalam
pemilihan presiden. Deskripsi dari pola dan kecenderungan sering memberikan
kemungkinan penjelesan untuk suatu pola atau kecenderungan.
2. Estimasi
Estimasi hampir sama dengan klasifikasi, kecuali variabel target estimasi lebih
kearah numerik dari pada kearah kategori. Model dibangun menggunakan record
lengkap yang menyediakan nilai dari variabel target sebagai prediksi. Selanjutnya,
pada peninjauan berikutnya estimasi nilai dari variabel target dibuat berdasarkan
nilai variabel predikasi. Sebagai contoh akan dilakukan estimasi tekanan darah
sistolik pada pasien rumah sakit berdasarkan umur pasien, jenis kelamin, indeks
berat badan, dan level sodium darah. Hubungan antara tekanan darah sistolik dan
nilai variabel prediksi dalam proses pembelajaran akan menghasilkan model
estimasi. Model estimasi yang dihasilkan dapat digunakan untuk kasus baru
lainnya.
3. Prediksi.
Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa dalam
predikasi nilai dari hasik akan ada dimasa mendatang.
Contoh prediksi bisnis dan penelitian adalah:
a. Prediksi harga beras dalam tiga bulan yang akan datang.
b. Prediksi persentasi kenaikan kecelakaan lalu lintas tahun depan jika batas
bawah kecepatan dinaikkan.
Beberapa metode dan teknik yang digunakan dalam klasifikasi dan estimasi dapat
pula digunakan (untuk keadaan yang tepat) untuk prediksi.
4. Klasifikasi

2
Dalam klasifikasi, terdapat target variabel kategori. Sebagai contoh penggolongan
pendapatan dapat dipisahkan dalam tiga kategori , yaitu pendapatan tinggi,
pendapatan sedang, dan pendapatan rendah.
Contoh lain klasifikasi dalam bisnis dan penelitian adalah:
a. Menentukan apakah suatu transaksi kartu kredit merupakan transaksi yang
curang atau tidak.
b. Memperkirakan apakah suatu pengajuan hipotek oleh nasabah merupakan
suatu kredit yang baik atau buruk.
c. Mendiagnosis penyakit seorang pasien untuk mendapatkan termasuk kategori
penyakit apa.
5. Pengklusteran
Pengkluteran merupakan pengelompokan record, pengamatan, atau
memperhatikan dan membentuk kelas objek-objek yang memiliki kemiripan.
Kluster adalah kumpulan record yang memiliki kemiripan satu dengan yang
lainnya dan memiliki ketidakmiripan dengan record-record dalam kluster lain.
Pengklusteran berbeda dengan klasifikasi yaitu tidak adanya variabel target dalam
pengklusteran. Pengklusteran tidak mencoba untuk melakukan klasifikasi,
mengestimasi, atau memprediksi nilai dari variabel target. Akan tetapi, algoritma
pengklusteran mencoba untuk melakukan pembagian terhadap keseluruhan data
menjadi kelompok-kelompok yang memiliki kemiripan (homogeny), yang mana
kemiripan dalam satu kelompok akan bernilai maksimal, sedangkan kemiripan
dengan record dalam kelompok lain akan bernilai minimal.
Contoh pengklusteran dalam bisnis dan penelitian adalah:
a. Mendapatkan kelompok-kelompok konsumen untuk target pemasaran
dari satu suatu produk bagi perusahaan yang tidak memiliki dana pemesaran
yang besar.
b. Untuk tujuan audit akuntansi, yaitu melakukan pemisahan terhadap perilaku
financial dalam baik dan mencurigakan.
c. Melakukan pengklusteran terhadap ekspresi dari gen, untuk mendapatkan
kemiripan perilaku dari gen dalam jumlah besar.
6. Asosiasi.
Tugas asosiasi dalam data mining adalah menemukan attribut yang muncul dalam
satu waktu. Dalam dunia bisnis lebih umum disebut analisis keranjang belanja.
Contoh asosiasi dalam bisnis dan penelitian adalah:
a. Meneliti jumlah pelanggan dari perusahaan telekomunikasi seluler yang
diharapkan untuk memberikan respon positif terhadap penawaran upgrade
layanan yang diberikan.
b. Menentukan barang dalam supermarket yang dibeli secara bersamaan dan
yang tidak pernah dibeli secara bersamaan.
7. Apriori
Algoritma apriori adalah adalah algoritma yang paling terkenal untuk menemukan
pola frekuensi tinggi. algoritma apriori dibagi menjadi beberapa tahap yang
disebut narasi atau pass Pembentukan kandidat itemset, kandidat k-itemset
dibentuk dari kombinasi (k-1)-itemset yang didapat dari iterasi sebelumnya. Satu
cara dari algoritma apriori adalah adanya pemangkasan kandidat k-itemset yang
subset-nya yang berisi k-1 item tidak termasuk dalam pola frekuensi tinggi
dengan panjang k-1
3
3. Metode Penelitian
Tahapan-tahapan algoritma sistem dalam proses mining data :
1. Menentukan nilai minimum support dari tiap item

2. Menentukan nilai minimum support 2 item set

3. Menentukan nilai minimum confidence


4. Pembentukan aturan asosiasi (association rules)
Setelah semua pola frequensi tinggi ditemukan, barulah dicari aturan asosiasi yang
memenuhi syarat minimum untuk confidence dengann menghitung confidence aturan
asosiatif A -> B :

4. Hasil
4.1. IMPLEMENTASI DATA MINING DALAM TRANSAKSI PENJUALAN
BARANG
4.1.1 Tabel Hasil
B1 B2 Confidence (%)
AQUA AIR MINERAL DJARUM SUPER 12 5/9*100% = 55.55555556%
1500 ML
AQUA AIR MINERAL KACANG GARUDA 8/9*100% = 88.88888889%
1500 ML TELOR
AQUA AIR MINERAL GUDANG GARAM SURYA 7/11*100% = 63.63636364%
600 ML ECERAN
DJARUM SUPER 12 KACANG GARUDA 6/11*100% = 54.54545455%
TELOR
ROTI DIM ALL ITEM ULTRA MILK COKLAT 7/8*100% = 87.5%
250ML
dan nilai confidence yang memenuhi min support 1% yaitu :

1. Jika pelanggan membeli Aqua Air Mineral 1500 Ml maka


juga membeli Djarum Super 12 dengan nilai confidence
4
55.55555556 %.
2. Jika pelanggan membeli Aqua Air Mineral 1500 Ml
maka juga membeli Kacang Garuda Telor dengan nilai
confidence 88.88888889 %
3. Jika pelanggan membeli Aqua Air Mineral 600 Ml maka juga
membeli Gudang Garam Surya Eceran dengan nilai
confidence 63.63636364 %
4. Jika pelanggan membeli Djarum Super 12 maka juga
membeli Kacang Garuda Telor dengan niai confidence
54.54545455 %
5. Jika pelanggan membeli Roti Dim All Item maka juga
membeli Ultra Milk Coklat 250ml dengan nilai confidence
87.5%.
4.1.2 Gambar
Tampilan yang muncul ketika tombol proses telah diklik adalah
berupa DBGrid yang berupa kode barang, nama barang, jumlah dan nilai support.
Dapat dilihat pada gambar 8.

Gambar 8 Tampilan Form Hasil 1-itemset (C1)

Gambar 9 Tampilan Form Hasil asosiasi dan nilai confidence (%)

5
4.2. Implementasi Data Nilai Siswa
4.2.1 Tabel Hasil
conf conf
His FIS rhs idence Lift His FIS rhs idence Lift
14.MTK=D
1.IND=B => IPS=C 80% 1.35 ,IPS=C => IND=D 83.33% 2.5
15.MTK=C
2.BING=B => IPS=C 83.33% 1.41 ,IPS=D => ING=C 100% 1.93
16.IND=C
3.IPA=D => MTK=D 85.71% 2.314 ,IPS=D => ING=C 80% 1.54
3
4.ING=B 17.ING=C
,IPA=C => IPS=C 100% 1.69 ,IPS=D => IND=C 80% 1.8
5.IND=D 18.MTK=C
=> MTK=D 80% 2.16 => IND=C 80% 1.8
,IPA=D ,IPA=C
6.IND=D 19.ING=C
,IPA=D => IPS=C 80% 1.35 ,IPA=C => IND=C 80% 1.8
20.IND=D
7.IPA=D
=> IND=D 100% 3 ,MTK=D => IPS=C 100% 1.69
,IPS=C ,IPA=D
21.IND=D
8.IPA=D
=> ING=C 100% 1.93 ,IPA=D => MTK=D 100% 2.7
,IPS=D ,IPS=C
22.MTK=D
9.ING=C
=> MTK=D 80% 2.16 ,IPA=D => IND=D 100% 3
,IPA=D ,IPS=C
23.IND=D
10.ING=C
=> IPA=D 80% 3.086 ,MTK=D => IPA=D 80% 3.09
,MTK=D ,IPS=C
11.IPA=D
,IPS=C => MTK=D 100% 2.7
12.IND=D
=> IPS=C 83.33% 1.406
,MTK=D
13.IND=D
,IPS=C => MTK=D 83.33% 2.25

4.2.2 Gambar

4.3 Implementasi Pada Persediaan Obat


4.3.1 Tabel Hasil

6
4.3.2 Gambar

Kesimpulan
Dengan algoritma apriori dan pengujian dengan aplikasi Tanagra menghasilkan
pola kombinasi itemsets dan rules sebagai ilmu pengetahuan dan informasi penting dari
data penjualan, ppersedian dan penilaian siswa.
Data mining dengan algoritma apriori memiliki kelemahan karena harus
melakukan scan database setiap kali iterasi, sehingga waktu bertambah setiap kali iterasi.

7
Banyaknya asosiasi antar data dan pola kombisi dan rules yang makin akurat, didapat
berdasarkan volume data dan level confidence dan support yang bervariasi.

Referensi
https://scholar.google.co.id/scholar?hl=en&as_sdt=0%2C5&as_vis=1&q=pengertian+metod
e+apriori+data+mining&btnG=

https://www.researchgate.net/publication/320726589_Penerapan_Algoritma_Apriori_untu
k_Transaksi_Penjualan_Obat_pada_Apotek_Azka

http://dataminingdanapriori.blogspot.com/2017/10/normal-0-false-false-false-en-us-x-
none.html

https://informatikalogi.com/algoritma-apriori-association-rule/

https://medium.com/@infharis/data-mining-definisi-dan-cara-kerja-algoritma-apriori-
untuk-pencarian-association-rule-a44a8f864a61

http://bow-masbow.blogspot.com/2010/10/algoritma-apriori-apriori-algorithm.html

Anda mungkin juga menyukai