discussions, stats, and author profiles for this publication at: https://www.researchgate.net/publication/312495968
CITATIONS READS
0 681
1 author:
Efori Buulolo
STMIK BUDI DARMA
7 PUBLICATIONS 2 CITATIONS
SEE PROFILE
Some of the authors of this publication are also working on these related projects:
All content following this page was uploaded by Efori Buulolo on 18 January 2017.
ABSTRAK
Data semakin lama akan semakin bertambah banyak. Jika dibiarkan saja, maka data-data transaksi
tersebut hanya menjadi sampah yang tidak berarti. Dengan adanya dukungan perkembangan teknologi, semakin
berkembang pula kemampuan dalam mengumpulkan dan mengolah data.
Data mining, sering juga disebut knowledge discovery in database (KDD), adalah kegiatan yang
meliputi pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola atau hubungan dalam set
data berukuran besar. Keluaran dari data mining bisa dipakai untuk memperbaikin pengambilan keputusan
dimasa depan.
Algoritma apriori adalah adalah algoritma yang paling terkenal untuk menemukan pola frekuensi
tinggi. algoritma apriori dibagi menjadi beberapa tahap yang disebut narasi atau pass Pembentukan kandidat
itemset, kandidat k-itemset dibentuk dari kombinasi (k-1)-itemset yang didapat dari iterasi sebelumnya. Satu
cara dari algoritma apriori adalah adanya pemangkasan kandidat k-itemset yang subset-nya yang berisi k-1
item tidak termasuk dalam pola frekuensi tinggi dengan panjang k-1
1.1 Pendahuluan pencarian asosiasi atau hubungan antar item data ini
Algoritma apriori pada saat ini telah diambil dari suatu basis data relasional. Proses
diimplementasikan keberbagai bidang, salah satunya tersebut menggunakan algoritma apriori.
adalah dibidang bisnis atau perdangangan dan bidang
pendidikan, dibidang bisnis misalnya implementasi 1.2 Perumusan Masalah
data mining algoritma apriori untuk sistem penjualan Berdasarkan uraian latar belakang, maka
tujuanya untuk membantu para pembisnis penulis merumuskan suatu permasalahan yaitu
meningkatkan penjualan produk, Sedangkan sebagai berikut:
dibidang pendidikan misalnya implementasi data 1. Bagaimana membentuk pola kombinasi itemsets
mining untuk menemukan pola hubungan tingkat dengan menggunakan algoritma apriori pada
kelulusan mahasiswa dengan data induk mahasiswa. sistem persediaan?
Adanya kegiatan operasional sehari-hari 2. Bagaimana menghasilkan rules dari pola
data semakin lama akan semakin bertambah banyak. kombinasi itemsets yang interesting dengan
Jika dibiarkan saja, maka data-data transaksi tersebut association rules ?
hanya menjadi sampah yang tidak berarti. Dengan
adanya dukungan perkembangan teknologi, semakin 1.3 Batasan Masalah
berkembang pula kemampuan dalam mengumpulkan Agar tidak lepas dari latar belakang dan
dan mengolah data. perumusan masalah, maka penulis membuat batasan
Persaingan di dunia bisnis, khususnya dalam masalahnya yaitu sebagai berikut :
industri apotik, menuntut para pengembang untuk 1. Menggunakan data mining algoritma apriori
menemukan suatu strategi yang dapat meningkatkan untuk menemukan pola kombinasi itemset dan
penjualan khusus penjualan obat dengan association rules untuk menghasilkan rules.
memaksimalkan pelayanan kepada konsumen. Salah 2. Data yang digunakan adalah data transaksi
satu caranya adalah dengan tetap tersediaannya penjualan (data obat keluar) dan menggunakan
berbagai jenis obat digudang apotik. Untuk aplikasi atau tools data mining Tanagra 1.4
mengetahui obat apa saja yang dibeli oleh para sebagai pengujian data.
konsumen, dapat dilakukan dengan menggunakan
teknik analisis keranjang pasar yaitu analisis dari 1.4 Tujuan Penelitian
kebiasaan membeli konsumen. Pendeteksian Beberapa tujuan yang ingin dicapai dalam
mengenai obat yang sering terbeli secara bersamaan penelitian ini yaitu sebagai berikut:
disebut association rule (aturan asosiasi). Proses
ImplementasiAlgoritmaAprioriPadaSistemPersediaanObat(StudiKasus: 71
ApotikRumahSakitEstomihiMedan).Oleh:EforiBuulolo
Pelita Informatika Budi Darma, Volume : IV, Nomor: 1, Agustus 2013 ISSN : 2301-9425
mudah dimengerti oleh pihak yang Contoh lain klasifikasi dalam bisnis dan
berkepentingan. Tahap ini merupakan bagian dari penelitian adalah:
proses KDD yang disebut interpretation. Tahap a. Menentukan apakah suatu transaksi kartu
ini mencakup pemeriksaan apakah pola atau kredit merupakan transaksi yang curang atau
informasi yang ditemukan bertentangan dangan tidak.
fakta atau hipotesis yang ada sebelumnya. b. Memperkirakan apakah suatu pengajuan
hipotek oleh nasabah merupakan suatu kredit
2.2 Pengelompokan Data Mining yang baik atau buruk.
Data mining dibagi menjadi beberapa c. Mendiagnosis penyakit seorang pasien untuk
kelompok berdasarkan tugas yang dapat dilakukan, mendapatkan termasuk kategori penyakit
yaitu (Kusrini dan Emha Taufiq Luthfi, 2009): apa.
1. Deskripsi 5. Pengklusteran
Terkadang peneliti dan analis secara sederhana Pengkluteran merupakan pengelompokan record,
ingin mencoba mencari data untuk pengamatan, atau memperhatikan dan membentuk
menggambarkan pola dan kecenderungan yang kelas objek-objek yang memiliki kemiripan.
terdapat dalam data. Sebagai contoh, petugas Kluster adalah kumpulan record yang memiliki
pengumpulan suara mungkin tidak dapat kemiripan satu dengan yang lainnya dan memiliki
menentukan keterangan atau fakta bahwa siapa ketidakmiripan dengan record-record dalam
yang tidak cukup professional akan sedikit kluster lain. Pengklusteran berbeda dengan
didukung dalam pemilihan presiden. Deskripsi klasifikasi yaitu tidak adanya variabel target
dari pola dan kecenderungan sering memberikan dalam pengklusteran. Pengklusteran tidak
kemungkinan penjelesan untuk suatu pola atau mencoba untuk melakukan klasifikasi,
kecenderungan. mengestimasi, atau memprediksi nilai dari
2. Estimasi variabel target. Akan tetapi, algoritma
Estimasi hampir sama dengan klasifikasi, kecuali pengklusteran mencoba untuk melakukan
variabel target estimasi lebih kearah numerik dari pembagian terhadap keseluruhan data menjadi
pada kearah kategori. Model dibangun kelompok-kelompok yang memiliki kemiripan
menggunakan record lengkap yang menyediakan (homogeny), yang mana kemiripan dalam satu
nilai dari variabel target sebagai prediksi. kelompok akan bernilai maksimal, sedangkan
Selanjutnya, pada peninjauan berikutnya estimasi kemiripan dengan record dalam kelompok lain
nilai dari variabel target dibuat berdasarkan nilai akan bernilai minimal.
variabel predikasi. Sebagai contoh akan Contoh pengklusteran dalam bisnis dan penelitian
dilakukan estimasi tekanan darah sistolik pada adalah:
pasien rumah sakit berdasarkan umur pasien, jenis a. Mendapatkan kelompok-kelompok
kelamin, indeks berat badan, dan level sodium konsumen untuk target pemasaran dari satu
darah. Hubungan antara tekanan darah sistolik suatu produk bagi perusahaan yang tidak
dan nilai variabel prediksi dalam proses memiliki dana pemesaran yang besar.
pembelajaran akan menghasilkan model estimasi. b. Untuk tujuan audit akuntansi, yaitu
Model estimasi yang dihasilkan dapat digunakan melakukan pemisahan terhadap perilaku
untuk kasus baru lainnya. financial dalam baik dan mencurigakan.
3. Prediksi. c. Melakukan pengklusteran terhadap ekspresi
Prediksi hampir sama dengan klasifikasi dan dari gen, untuk mendapatkan kemiripan
estimasi, kecuali bahwa dalam predikasi nilai dari perilaku dari gen dalam jumlah besar.
hasik akan ada dimasa mendatang. 6. Asosiasi.
Contoh prediksi bisnis dan penelitian adalah: Tugas asosiasi dalam data mining adalah
a. Prediksi harga beras dalam tiga bulan yang menemukan attribut yang muncul dalam satu
akan datang. waktu. Dalam dunia bisnis lebih umum disebut
b. Prediksi persentasi kenaikan kecelakaan lalu analisis keranjang belanja.
lintas tahun depan jika batas bawah Contoh asosiasi dalam bisnis dan penelitian
kecepatan dinaikkan. adalah:
Beberapa metode dan teknik yang digunakan a. Meneliti jumlah pelanggan dari perusahaan
dalam klasifikasi dan estimasi dapat pula telekomunikasi seluler yang diharapkan
digunakan (untuk keadaan yang tepat) untuk untuk memberikan respon positif terhadap
prediksi. penawaran upgrade layanan yang diberikan.
4. Klasifikasi b. Menentukan barang dalam supermarket yang
Dalam klasifikasi, terdapat target variabel dibeli secara bersamaan dan yang tidak
kategori. Sebagai contoh penggolongan pernah dibeli secara bersamaan.
pendapatan dapat dipisahkan dalam tiga kategori ,
yaitu pendapatan tinggi, pendapatan sedang, dan 2.3. Fungsi dan Tugas Data Mining
pendapatan rendah.
ImplementasiAlgoritmaAprioriPadaSistemPersediaanObat(StudiKasus: 73
ApotikRumahSakitEstomihiMedan).Oleh:EforiBuulolo
Pelita Informatika Budi Darma, Volume : IV, Nomor: 1, Agustus 2013 ISSN : 2301-9425
ImplementasiAlgoritmaAprioriPadaSistemPersediaanObat(StudiKasus: 74
ApotikRumahSakitEstomihiMedan).Oleh:EforiBuulolo
Pelita Informatika Budi Darma, Volume : IV, Nomor: 1, Agustus 2013 ISSN : 2301-9425
Setelah semua pola frekuensi tinggi 9. Untuk setiap large itemset L, kita cari himpunan
ditemukan, barulah dicari aturan assosiatif yang bagian L yang tidak kosong. Untuk setiap
memenuhi syarat minimum untuk confidence dengan himpunan bagian tersebut, dihasilkan rule dengan
menghitung confidence aturan assosiatif A bentuk aB(L-a) jika supportnya (L) dan supportnya
(a) lebih besar dari minimum support.
Nilai confidence dari aturan A diperoleh dari
rumus berikut : 2.7. Algoritma Apriori
Confidence = P(B|A) = Algoritma apriori adalah adalah algoritma
JumlahTransaksiMengandungAdanB yang paling terkenal untuk menemukan pola
JumlahTransaksiMengandungA frekuensi tinggi. algoritma apriori dibagi menjadi
beberapa tahap yang disebut narasi atau pass (Devi
2.6.2. Langkah-Langkah Proses Penghitungan dinda setiawan, 2009).
Association Rules 1. Pembentukan kandidat itemset, kandidat k-itemset
Proses perhitungan association rule terdiri dibentuk dari kombinasi (k-1)-itemset yang
dari beberapa tahap adalah sebagai berikut (Eko didapat dari iterasi sebelumnya. Satu cara dari
Wahyu Tyas d, 2008). algoritma apriori adalah adanya pemangkasan
1. Sistem men-scan database untuk mendapat kandidat k-itemset yang subset-nya yang berisi k-
kandidat 1-itemset (himpunan item yang terdiri 1 item tidak termasuk dalam pola frekuensi tinggi
dari 1 item) dan menghitung nilai supportnya. dengan panjang k-1.
Kemudian nilai supportnya tersebut dibandingkan 2. Penghitungan support dari tiap kandidat k-
dengan minimum support yang telah ditentukan, itemset. Support dari tiap kandidat k-itemset
jika nilainya lebih besar atau sama dengan didapat dengan menscan database untuk
minimum support maka itemset tersebut termasuk menghitung jumlah transaksi yang memuat semua
dalam large itemset. item didalam kandidat k-itemset tersebut. Ini
2. Itemset yang tidak termasuk dalam large itemset adalah juga ciri dari algoritma apriori dimana
tidak diikutkan dalam iterasi selanjutnya (di diperlukan penghitungan dengan cara seluruh
prune). database sebanyak k-itemset terpanjang.
3. Pada iterasi kedua sistem akan menggunakan 3. Tetapkan pola frekuensi tinggi. Pola frekuensi
hasil large itemset pada iterasi pertama (L1) tinggi yang memuat k item atau k-itemset
untuk membentuk kandidat itemset kedua (L2). ditetapkan dari kandidat k-itemset yang
Pada iterasi selanjutnya sistem akan supportnya lebih besar dari minimum support.
menggunakan hasil large itemset pada iterasi 4. Bila tidak didapat pola frekuensi tinggi baru maka
selanjutnya akan menggunakan hasil large itemset seluruh proses dihentikan. Bila tidak, maka k
pada iterasi sebelumnya (Lk-1) untuk membentuk ditambah satu dan kembali bagian 1.
kandidat itemset berikut (Lk). Sistem akan
menggabungkan (join) Lk-1 dengan Lk-1 untuk 3. Pembahasan
mendapatkan Lk, seperti pada iterasi sebelumnya Proses pembentukan pola kombinasi
sistem akan menghapus (prune) kombinasi itemsets dan pembuatan rules dimulai dari analisis
itemset yang tidak termasuk dalam large itemset. data. Data yang digunakan adalah data transaksi
4. Setelah dilakukan operasi join, maka pasangan penjualan obat, kemudian dilanjutkan dengan
itemset baru hasil proses join tersebut dihitung pembentukan pola kombinasi itemsets dan dari pola
supportnya. kombinasi itemsets yang menarik terbentuk
5. Proses pembentuk kandidat yang terdiri dari association rules.
proses join dan prune akan terus dilakukan hingga
himpunan kandidat itemsetnya null, atau sudah 3.2.1 Analisis Data
tidak ada lagi kandidat yang akan dibentuk. Dengan studi kasus pada apotik rumah sakit
6. Setelah itu, dari hasil frequent itemset tersebut Estomihi Medan, dapat dilakukan analisa terhadap
dibentuk association rule yang memenuhi nilai data khusus data penjualan (data obat keluar) dengan
support dan confidence yang telah ditentukan. salah satu tujuan adalah untuk menemukan pola
7. Pada pembentukan association rule, nilai yang kombinasi penjualan obat dan hubungan antar item
sama dianggap sebagai satu nilai. jenis obat didalam transaksi. Berikut ini adalah tabel
8. Assosiotion rule yang terbentuk harus memenuhi 1 yaitu beberapa sampel data yang akan dijadikan
nilai minimum yang telah ditentukan. sampel untuk analisis dan juga untuk pengujian.
1 2012.1.4087 Ringer Lactate Larutan,Ceftriaxone Inj 1.0g, Metronidazole Inj 5mg/ml - 100ml,
Ranitidine Inj 25mg/ml 2ml,Ketorolac 3% Inj 30 mg/ml
ImplementasiAlgoritmaAprioriPadaSistemPersediaanObat(StudiKasus: 75
ApotikRumahSakitEstomihiMedan).Oleh:EforiBuulolo
Pelita Informatika Budi Darma, Volume : IV, Nomor: 1, Agustus 2013 ISSN : 2301-9425
Data diatas adalah bentuk transaksi data transaksi penjualan, selanjut dicari jumlah setiap
penjualan (data obat keluar) real terdiri atas item yang ada pada semua data transaksi penjualan
attribute nomor slip dan nama obat. (data obat keluar). Pembentukan pola kombinasi
Tahap dalam menganalisa data dengan didasarkan pada nilai support minimal, Jika nilai
algoritma apriori pada penjualan (data obat keluar) support minimal terpenuhi dan pola kombinasi
dimulai dengan menyeleksi dan membersihkan itemsets yang ada lebih dari pada satu pola
data-data yang akan dianalisis, kemudian dicari kombinasi, maka pola kombinasi itemsets yang
semua jenis item nama obat yang ada didalam list berikutnya bisa bentuk. Setelah selesai pembuatan
ImplementasiAlgoritmaAprioriPadaSistemPersediaanObat(StudiKasus: 76
ApotikRumahSakitEstomihiMedan).Oleh:EforiBuulolo
Pelita Informatika Budi Darma, Volume : IV, Nomor: 1, Agustus 2013 ISSN : 2301-9425
Data diatas menggambar bentuk data satu didapat dari jumlah item dibagi jumlah semua
item, yang terdiri atas attribute item sebagai nama transaksi di kali seratus persen. Tabel diatas
item jenis semua obat yang ada didalam transaksi, adalah item data yang memenuhi support minimal,
support yaitu jumlah setiap item yang ada disemua nilai support minimal sama dengan 22 persen (%).
transaksi, sedangkan support (%) adalah presentasi Seperti yang terlihat pada tabel berikut ini:
jumlah item yang ada didalam transkasi, yang
ImplementasiAlgoritmaAprioriPadaSistemPersediaanObat(StudiKasus: 77
ApotikRumahSakitEstomihiMedan).Oleh:EforiBuulolo
Pelita Informatika Budi Darma, Volume : IV, Nomor: 1, Agustus 2013 ISSN : 2301-9425
Tabel 3 Keterangan Jenis Items Obat yang Ketorolac 3% Inj 30 mg/ml 17 77,27
Memenuhi Support Minimal Metronidazole Inj 5mg/ml 100ml 15 68,18
Sup
Items Sup port(%) Pitogin Inj 10 IU/ ml /sintosin 6 27,27
port
Abocath 18 5 22,73 Ringer Lactate Larutan 21 95,45
Ceftriaxone Inj 1.0g 16 72,73
3.2.3. Pembentukan Pola Kombinasi Dua memenuhi support minimal yaitu dengan cara
Itemsets mengkombinasi semua items kedalam pola dua
Pembentukan pola frekuensi dua itemsets, kombinasi, hasil pembentukan pola kombinasi dua
dibentuk dari items-items jenis obat yang itemsets yang dibentuk dari tabel 4 berikut ini:
Data diatas merupakan kombinasi dua itemsets Tabel 5 .Pola Kombinasi Dua Itemsets yang
yang merupakan hasil dari semua kombinasi semua Memenuhi Support Minimal
jenis items. Dengan menetapkan support minimal
sama dengan 22 persen (%), maka data yang
memenuhi support minimal adalah seperti pada
tabel 5 berikut ini:
ImplementasiAlgoritmaAprioriPadaSistemPersediaanObat(StudiKasus: 78
ApotikRumahSakitEstomihiMedan).Oleh:EforiBuulolo
Pelita Informatika Budi Darma, Volume : IV, Nomor: 1, Agustus 2013 ISSN : 2301-9425
Association rules dari tabel diatas merupakan yang didapat dari support empat itemsets dibagi
aturan yang terbentuk dari pola kombinasi empat oleh nilai support antecedent di kalikan seratus
item, tabel diatas terbagai atas beberapa bagian persen.
rules adalah aturan yang dihasilkan dari pola Pembentukan aturan asosiasi berikutnya
kombinasi empat itemsets, lift sebagai nilai tingkat dibentuk dari pola kombinasi lima itemsets tampak
kekuatan rules, support adalah nilai support antara pada tabel berikut ini:
ketiga items, sedangkan confidence adalah nilai
Data tabel diatas merupakan tabel calon association support sebagai nilai support item yang
rules dari pola kombinasi dengan lima itemsets, mengandung antecedent. Dengan menetapkan nilai
tabel diatas terdiri atas rules sebagai rules dari pola confidence minimal sama dengan 60 persen(%),
kombinasi lima itemsets, lift sebagai nilai tingkat maka rules yang interesting yang dihasilkan seperti
kekuatan rules, support(itemsets) sebagai nilai pada tabel berikut ini:
support antara kelima items yang berkombinasi,
Association rules dari tabel diatas merupakan menggunakan salah satu database Microsoft Exel
aturan yang terbentuk dari pola kombinasi lima dengan data dalam bentuk tabular data, maka data
itemsets, tabel diatas terbagai atas beberapa bagian transaksi penjualan (data obat keluar), di konversi
yaitu rules sebagai aturan yang dihasilkan dari pola ke dalam bentuk biner. Proses konversinya adalah
kombinasi lima itemsets, lift sebagai nilai tingkat nomor slip dari data yang akan diuji dibuat dalam
kekuatan rules, support adalah nilai support antara bentuk horizontal kebawah, sedangkan semua jenis
kelima itemsets, sedangkan confidence adalah nilai items akan menjadi attribute berbentuk vertical,
yang didapat dari support lima itemsets dibagi oleh sehingga membentuk seperti sebuah tabel,
nilai support antecedent di kalikan seratus persen. berdasarkan data real penjualan (data obat keluar)
titik ketemu antara nama jenis obat dengan nomor
3.3. Format Tabular Data Transaksi slip akan menjadi biner 1, sedangkan yang tidak
Format tabular data adalah format data menjadi titik temu akan menjadi biner 0. Hasil
dalam bentuk 1 dan 0 atau format data dalam proses konversi data transaksi penjualan ke format
bentuk biner. Berhubungan dengan aplikasi yang data dalam bentuk tabular data adalah seperti pada
digunakan dalam pengujian adalah aplikasi yang tabel berikut ini:
ImplementasiAlgoritmaAprioriPadaSistemPersediaanObat(StudiKasus: 80
ApotikRumahSakitEstomihiMedan).Oleh:EforiBuulolo
Pelita Informatika Budi Darma, Volume : IV, Nomor: 1, Agustus 2013 ISSN : 2301-9425
ImplementasiAlgoritmaAprioriPadaSistemPersediaanObat(StudiKasus: 81
ApotikRumahSakitEstomihiMedan).Oleh:EforiBuulolo
Pelita Informatika Budi Darma, Volume : IV, Nomor: 1, Agustus 2013 ISSN : 2301-9425
2. Feri Sulianto dan Dominikus Juju (2010). Data Algoritma Apriori Untuk Analisa Pola Data
Mining, Meramalkan Bisnis Perusahaan. Hasil Tangkapan Ikan.
Jakarta. Penerbit Elex Media Komputindo.19-
22. 7. M.Ikhsan, M. Dahria dan Sulindawaty (2011).
Penerapan Association Rules Dengan
3. Kusrini dan Emha Taufig Luthfi (2009). Algoritma Apriori Pada Proses
Algoritma Data Mining. Yogyakarta. Penerbit Pengelompokan Barang di Perusahaan
Andi.3-12, Retail.
4. Sani Susanto dan Dedy Suryadi (2010). 8. Dana Sulistiyo, Moch.Arief Bijaksana dan
Pengantar Data Mining. Yogyakarta. Dhinta Darmantoro (2003). Data Mining
Penerbit Andi.97. Dengan Algoritma Apriori pada RDBMS
ORACLE.
5. Devi Dinda Setiawati (2009). Penggunaan
Metode Apriori Untuk Analisa Keranjang 9. Amiruddin, Ketut Eddy Purnama dan Mauridhi
Pasar Pada Data Transaksi Penjualan Hery Purnomo (2007). Penerapan Association
Minimarket Menggunakan Java dan Mysql. Rules Mining Pada Data Nomor Unik
Pendidikan dan Tenaga Kependidikan
6. Eko Wahyu Tyas D (2008). Penerapan Untuk Menemukan Pola Sertifikasi Guru.
Metode Association Rules Menggunakan
ImplementasiAlgoritmaAprioriPadaSistemPersediaanObat(StudiKasus: 83
ApotikRumahSakitEstomihiMedan).Oleh:EforiBuulolo