Anda di halaman 1dari 9

Jurnal Pilar Nusa Mandiri Vol.XII, No.

2 September 2016 121

ALGORITMA ASOSIASI DENGAN ALGORITMA APRIORI UNTUK


ANALISA DATA PENJUALAN

Mohammad Badrul
Program Studi Sistem Informasi
Sekolah Tinggi Manajemen Informatika dan Komputer Nusa Mandiri Jakarta
Jl. Damai No. 8 Warung Jati Barat Margasatwa Jakarta Selatan.
Telp. (021) 78839513 Fax. (021) 78839421
mohammad.mbl@nusamandiri.ac.id

Abstract  Each company or organization that mining. Salah satu tahap analisis asosiasi yang
wants to survive needs to determine the right menarik perhatian banyak peneliti untuk
business strategy. Data sales of products made by menghasilkan algoritma yang efisien adalah
the company will eventually generate mountains of analisis pola frequensi tinggi (frequent pattern
data. So it is very unfortunate if not analyzed back. mining). Penting tidaknya suatu asosiasi dapat
products offered variety with a wide range of diketahui dengan dua tolak ukur , yaitu : support
products, and sometimes the brand influence dan confidence. Support (nilai penunjang) adalah
people to buy the product, to know the products persentase kombinasi item tersebut dalam
with the highest sales and the linkage of products database, sedangkan confidence (nilai kepastian)
with each laiinya needed one existing algorithms adalah kuatnya hubungan antar-item dalam
in data mining algorithms are algorithms priori to aturan asosiasi. Algoritma apriori dapat
be informed, and with the help of Tanagra membantu untuk pengembangan strategi
applications, products which appear pemasaran.
simultaneously knowable. Priori algorithms
including the type of association rules in data Kata Kunci: Asosiasi, apriori, penjualan
mining. One association analysis phase which
attracted the attention of many researchers to PENDAHULUAN
produce efficient algorithms is the analysis of
patterns of high frequency (frequent pattern Semakin banyaknya persaingan dalam
mining). Important or not an association can be dunia bisnis khususnya dalam industri penjualan
identified by the two benchmarks, namely: support menuntuk pihak manajemen untuk putar otak
and confidence. Support (support value) is the mencari peluang untuk tetap berkecimpung
percentage of the combination of these items in the dalam bisnisnya. Untuk menyiasati hal tersebut,
database, while confidence (value certainty) is a tentunya pihak manajemen harus mampu
strong relationship between the items in the rules menganalisasuatu data yang ada untuk di jadikan
of association. Priori algorithm can be helpful for bahan acuan untuk menganalisa data tersebut.
the development of marketing strategies. Ketersediaan detail informasi transaksi
pelanggan mendorong pengembangan teknik
Intisari  Setiap perusahaan maupun organisasi yang secara otomatis mencari hubungan
yang ingin tetap bertahan perlu untuk antaraitem dalam data di database. Sebagai
menentukan strategi dalam bisnis yang tepat. contoh data didapat dari scanner bar-code di
Data penjualan produk yang dilakukan oleh supermarket. Database penjualan menyimpan
perusahaan lambat laun akan menghasilkan jumlah record transaksi penjualan yang sangat
tumpukan data. Sehingga sangat disayangkan jika besar. Setiap record memberikan daftar item
tidak di analisa kembali. produk yang barang yang dibeli oleh pelanggan dalam
ditawarkan bermacam dengan berbagai macam satutransaksi. Manager mungkin akan tertarik
produk, dan terkadang merk mempengaruhi untuk mengetahui jika beberapa kelompok item
masyarakat untuk membeli produk tersebut, barang secara konsisten dibeli secarabersama.
untuk mengetahui produk dengan penjualan Manager dapat menggunakan data tersebut
terbanyak dan keterkaitan produk satu dengan dalam pengaturan layout toko untuk meletakkan
yang laiinya diperlukan salah satu algoritma yang item barang secara optimaldengan keterkaitan
ada di algoritma data mining yaitu algoritma satu dengan lainnya, dapat pula digunakan dalam
apriori untuk dapat mengetahuinya, dan dengan promosi, atau dalam design katalog dan untuk
bantuan aplikasi tanagra, produk yang muncul mengidentifikasi segmen pelanggan berdasar
secara bersamaan dapat diketahui. Algoritma pola pembelian.
apriori termasuk jenis aturan asosiasi pada data

ISSN 1978-1946 | Algoritma Asosiasi Dengan…


122 Jurnal Pilar Nusa Mandiri Vol.XII, No.2 September 2016

Menuntut para pengembang untuk basket analysis(Gunadi, 2013). Algoritma apriori


menemukan suatu strategi yang dapat adalah algoritma pengambilan data dengan
meningkatkan penjualan dan pemasaran produk aturan asosiatif (Association rule) untuk
yang dijual, salah satunya adalah dengan menentukan hubungan asosiatif suatu
pemanfaatan data penjualan produk. Dengan kombinasi item(Kusrini, 2007).
adanya kegiatan penjualan setiap hari, data Anna Celluler merupakan salah satu toko
semakin lama akan semakin bertambah banyak. yang bergerak dalam bidang penjualan perangkat
Data tersebut tidak hanya berfungsi sebagai mobile atau smartphone yang berada di daerah
arsip bagi perusahaan, data tersebut dapat Jakarta. Berbagai macam jenis perangkat celluler
dimanfaatkan dan diolah menjadi informasi yang ditawarkan di toko tersebut dengan berbagai
berguna untuk peningkatan penjualan dan macam variasi harga tergantung dari merk dan
promosi produk. spesifikasi dari produk tersebut. Proses
Proses untuk menguraikan penemuan pencatatan transaksi yang dilakukan masih
pengetahuan di dalam database seperti yang mengandalkan nota atau faktur untuk bukti
dilakukan untuk melihat keterkaitan transaksi, Data transaksi yang sudah dilakukan
penjualanantar item diatas merupakan suatu sampai pada proses pembuatan nota atau faktur
konsep yang di sebut dengan data mining. Data kemudian di rekap oleh bagian administrasi
mining merupakan konsep utama dalam business untuk dilaporkan pada pemilik toko tersebut.
intelligence (BI) serta online analytical processing Banyaknya data tersebut membutuhkan sebuah
(OLAP)(Vercellis, 2009). Terdapat banyak metode atau teknik yang dapat merubah
algoritma data mining yang jika dapat diterapkan banyaknya data agar dapat dimanfaatkan
dalam prosesbisnis, akan memberikan nilai menjadi sebuah informasi berharga atau
positif bagi peningkatan kinerja proses bisnis pengetahuan yang bermanfaat. Salah satu teknik
tersebut yang berujung pada peningkatan yang dapat mengolah informasi dari kumpulan
keuntungan dari bisnistersebut. data yang besar menggunakan data mining.
Pemanfaatan data yang ada di dalam Data mining adalah proses mengekstrasi
sistem informasi untuk menunjang kegiatan informasi atau sesuatu yang penting atau
pengambilan keputusan, tidak cukuphanya menarik dari data yang ada di dalam database
mengandalkan data operasional saja, diperlukan sehingga menghasilkan informasi yang sangat
suatu analisis data untuk menggali potensi- berharga.Data mining dapat mengolah informasi
potensi informasi yang ada. Para pengambil dari kumpulan data yang sangat besar dan dalam
keputusan berusaha untuk memanfaatkan melakukan pencarian data membentuk pola yang
gudang data yang sudah dimiliki untuk menggali biasa disebut dengan association rule/Market
informasi yang berguna membantu mengambil basket analysis(Kurniawati, 2014). Market basket
keputusan, hal ini mendorong munculnya cabang analysis adalah suatu metode analisa atas
ilmu baru untuk mengatasi masalah penggalian perilaku konsumen secara spesifik dari suatu
informasi atau pola yang penting atau menarik golongan/kelompok tertentu. Market basket
dari data dalam jumlah besar, yang disebut analysis umumnya dimanfaatkan sebagai titik
dengan data mining.Penggunaan teknik data awal pencarian pengetahuan dari suatu transaksi
mining diharapkan dapat memberikan data ketika kita tidak mengetahui pola spesifik
pengetahuan-pengetahuan yang sebelumnya apa yang kita cari(Gunadi,2012). Tehnik analisa
tersembunyi didalam gudang data sehingga keranjang pasar merupakan teknik yang
menjadi informasi yang berharga. mengadaptasi ilmu data mining. Teknik ini
Algoritma asosiasi merupakan suatu digunakan untuk merancang suatu strategi
bentuk algoritma dalam data mining yang penjualan dan pemasaran barangmelalui proses
memberikan informasi hubungan antar item data pencarian asosiasi atau hubungan antar item data
didatabase. Algoritma tersebut dapat dari suatu basis data relasional. Pencarian
dimanfaatkan secara luas dalam proses bisnis asosiasi berawal daripengolahan data transaksi
diantaranya dalam proses penjualan. Data mining pembelian barang dari setiap pembeli, kemudian
algoritma asosiasi dapat membantu dalam proses dicari hubungan antar barang-barang yang dibeli.
penjualan dengan memberikan hubungan antar Pencarian informasi ini hampir sama dengan
data penjualan yang dilakukan mencari peluang kemunculan barang yang dibeli
pelanggansehingga akan didapat pola pembelian sesuai dengan kebiasaanberbelanja masyarakat
pelanggan. Pebisnis dapat memanfaatkan dan jumlah transaksi yang ada.
informasi tersebut untuk mengambil tindakan Kebutuhan market basket analysis berawal
bisnis yang sesuai. dari keakuratan dan manfaat yang dihasilkannya
Di dalam bidang usaha retail, metode dalam wujud aturan assosiasi (association rules).
association rule mining ini lebih dikenal dengan Yang dimaksud dengan association rules adalah
istilah analisa keranjang belanja atau market pola-pola keterkaitan data dalam basis data. Data

ISSN 1978-1946 | Algoritma Asosiasi Dengan…


Jurnal Pilar Nusa Mandiri Vol.XII, No.2 September 2016 123

inilah yang nantinya akan di analisis seorang Hal ini melatarbelakangi lahirnya suatu
analisis data untuk menemukan pola dari data cabang ilmu pengetahuan baru yaitu data mining.
penjualan yang sudah terkumpul setiap hari guna Data mining adalah untuk mengekstrasikan atau
untuk melakukan proses pengambilan keputusan. “menambang” pengetahuan dari kumpulan
Association Rule yang dimaksud dilakukan banyak data(Han&Kamber, 2007). Data mining
melalui mekanisme penghitungan support dan adalah teknik yang merupakan gabungan
confidence dari suatu hubungan item. Sebuah rule metode-metode analisis data secara
asosiasi dikatakan interesting jika nilai support berkesinambungan dengan algoritma-algoritma
adalah lebih besar dari minimum support dan untuk memproses data berukuran besar. Data
juga nilai confidence adalah lebih besar dari mining merupakan proses menemukan informasi
minimum confidence(Nurcahyo,2013). Proses atau pola yang penting dalam basis data
pencarian asosiasi ini menggunakan algoritma berukuran besar dan merupakan kegiatan untuk
apriori, yang berfungsi untuk membentuk menemukan informasi atau pengetahuan yang
kandidat kombinasi item yang mungkin, lalu diuji berguna secara otomatis dari data yang
apakah kombinasi tersebut memenuhiparameter jumlahnya besar(Kusrini, 2009). Data mining,
support dan confidence minimum yang sering juga disebut knowledge discovery in
merupakan nilai ambang yang diberikan oleh database (KDD), adalah kegiatan yang meliputi
user. pengumpulan, pemakaian data historis untuk
Pada penelitian ini, penulis akan menemukan pola keteraturan, pola hubungan
melakukan analisis terhadap data transaksi yang dalam set data berukuran besar. Keluaran dari
sudah dilakukan dengan mekanisme perhitungan data mining ini dapat dijadikan untuk
nilai support dan confident dari suatu hubungan memperbaiki pengambilan keputusan di masa
item, yang nantinya hasil nilai support dan depan. Dalam data mining data disimpan secara
confident yang yang ada akan digunakan untuk elektronik dan diolah secara otomatis, atau
proses pengambilan keputusan oleh pihak setidaknya disimpan dalam komputer. Data
manajemen untuk meningkatkan strategi mining adalah tentang menyelesaikan masalah
pemasaran. dengan menganalisa data yang telah ada dalam
database (Kusrini, 2009).
BAHAN DAN METODE Siklus hidup proyek data mining menurut
Cross-Industry Standart Proses for Data
a. Data Mining Mining(CRISP-DM)yang dikembangkan tahun
Data mining telah menarik banyak 1996 terbagi dalam 6 fase (Kusrini, 2009).
perhatian dalam dunia sistem informasi dan Berikut gambar dari Siklus hidup proyek data
dalam masyarakat secara keseluruhan dalam mining
beberapa tahun terakhir, karena ketersediaan 1. Fase Pemahaman Bisnis (Business
luas dalam jumlah besar data dan kebutuhan Understanding Phase)
segera untuk mengubah data tersebut menjadi a. Penentuan tujuan proyek dan kebutuhan
informasi yang berguna dan pengetahuan(Witten, secara detail dalam lingkup bisnis atau unit
2012). Informasi dan pengetahuan yang penelitian secara keseluruhan.
diperoleh dapat digunakan untuk aplikasi mulai b. Menerjemahkan tujuan dan batasan
dari pasar analisis, deteksi penipuan, dan retensi menjadi formula dari permasalahan data
pelanggan, untuk pengendalian produksi dan mining.
ilmu pengetahuan eksplorasi(Han&Kamber, c. Menyiapkan strategi awal untuk mencapai
2007). Adanya ketersediaan data yang melimpah, tujuan.
kebutuhan akan informasi atau pengetahuan 2. Fase pemahaman data (Data Understanding
sebagai sarana pendukung dalam pengambilan Phase)
keputusan baik bagi individu, organisasi, a. Mengumpulkan data.
perusahaan dan pemerintahan. b. Menggunakan analisis penyelidikan data
Banyaknya data, ditambah dengan untuk mengenali lebih lanjut data dan
kebutuhan untuk alat analisis data yang kuat, pencarian pengetahuan awal.
telah digambarkan sebagai kaya data tapi miskin c. Mengevaluasi kualitas data.
informasi.Jumlah data yang tumbuh secara cepat, d. Jika diinginkan, pilih sebagian kecil group
dikumpulkan dan disimpan dalam repositori data data yang mungkin mengundang pola dari
yang besar dan banyak, telah jauh melampaui permasalahan.
kemampuan manusia untuk memahami data-data 3. Fase pengolahan data (Data Preparation
tesebut tanpa mampu mengelolah data tersebut. Phase)
Akibatnya, data yang dikumpulkan dalam a. Siapkan data awal, kumpulkan data yang
repositori data yang besar menjadi ”kuburan akan digunakan untuk keseluruhan fase
data” (Han&Kamber, 2007). berikutnya. Fase ini merupakan pekerjaan

ISSN 1978-1946 | Algoritma Asosiasi Dengan…


124 Jurnal Pilar Nusa Mandiri Vol.XII, No.2 September 2016

berat yang perlu dilaksanakan secara 2. Estimasi


intensif. Estimasi hampir sama dengan klasifikasi,
b. Pilih kasus dan variabel yang ingin kecuali variabel target estimasi lebih ke arah
dianalisis dan yang sesuai analisis yang numerik dari pada ke arah kategori. Model
akan dilakukan. dibangun menggunakan baris data (record)
c. Lakukan perubahan pada beberapa lengkap yang menyediakan nilai dari variabel
variabel jika dibutuhkan. target sebagai nilai prediksi. Selanjutnya, pada
d. Siapkan data awal sehingga siap untuk peninjauan berikutnya estimasi nilai dari
perangkat pemodelan. variabel target dibuat berdasarkan nilai
4. Fase Pemodelan (Modelling Phase) variabel prediksi.
a. Pilih dan aplikasikan teknik pemodelan 3. Prediksi
yang sesuai. Prediksi hampir sama dengan klasifikasi dan
b. Perlu diperhatikan bahwa beberapa teknik estimasi, kecuali bahwa dalam prediksi nilai
mungkin untuk digunakan pada dari hasil akan ada di masa mendatang.
permasalahan data mining yang sama. Beberapa metode dan teknik yang digunakan
c. Jika diperlukan, proses dapat kembali ke dalam klasifikasi dan estimasi dapat pula
fase pengolahan data untuk menjadikan digunakan (untuk keadaan yang tepat) untuk
data ke dalam bentuk yang sesuai dengan prediksi.
spesifikasi kebutuhan teknik data mining 4. Klasifikasi
tertentu. Dalam klasifikasi, terdapat target variabel
5. Fase Evaluasi kategori.Sebagai contoh, penggolongan
a. Pengevaluasi satu atau lebih model yang pendapatan dapat dipisahkan dalam tiga
digunakan dalam fase permodelan untuk kategori, yaitu pendapatan tinggi, pendapatan
mendapatkan kualitas dan efektivitas sedang, dan pendapatan rendah.
sebelum disebarkan untuk digunakan. 5. Pengklasteran (Clusterring)
b. Menetapkan apakah terdapat model yang Pengklasteran merupakan pengelompokan
memenihi tujuan pada fase awal. record, pengamatan, atau memperhatikan dan
c. Menentukan apakah terdapat membentuk kelas obyek-obyek yang memiliki
permasalahan penting dari bisnis atau kemiripan. Klaster adalah kumpulan record
penelitian yang tidak tertangani degan yang memiliki kemiripan satu dengan yang
baik. lainnya dan memiliki ketidakmiripan record
d. Mengambil keputusan yang berkaitan dalam klaster yang lain. Berbeda dengan
dengan penggunaan hasil dari data klasifikasi, pada pengklasteran tidak ada
mining. variabel target. Pengklasteran tidak
6. Fase Penyebaran melakukan klasifikasi, mengestimasi, atau
a. Menggunakan model yang dihasilkan. memprediksi nilai dari variabel target, akan
Terbentuknya model tidak menandakan tetapi, algoritma pengklasteran mencoba
telah terselesaikannya proyek. untuk melakukan pembagian terhadap
b. Contoh sederhana penyebaran: pembuatan keseluruhan data menjadi kelompok-
laporan. kelompok yang memiliki kemiripan
c. Contoh kompleks penyebaran: penerapan (homogen), yang mana kemiripan record
proses data mining secara paralel pada dalam satu kelompok akan bernilai maksimal,
department lain. sedangkan kemiripan dengan record dalam
Menurut Larose dalam bukunya yang kelompok lain akan bernilai minimal.
berjudul ”Discovering Knowledge in Data:An 6. Asosiasi
Introduction to Data Mining”, datamining dibagi Tugas asosiasi dalam data mining adalah
menjadi beberapa kelompok berdasarkan untuk menemukan atribut yangmuncul dalam
tugas/pekerjaan yang dapat dilakukan(Larose, satu waktu. Salah satuimplementasi dari
2005), yaitu : asosiasi adalah market basket analysis atau
1. Deskripsi analisiskeranjang belanja, sebagaimana yang
Terkadang peneliti dan analisis secara akan dibahas dalam penelitian ini.
sederhana ingin mencoba mencari cara untuk Dalam buku “Data Mining – Meramalkan
menggambarkan pola dan kecenderungan Bisnis Perusahaan, Feri Sulianta & Dominikus
yang terdapat dalam data. Deskripsi dari pola Juju, 2010” menyatakan bahwa secara terperinci,
kecenderungan sering memberikan ada empat tahap yang dilalui dalam Data Mining
kemungkinan penjelasan untuk suatu pola antara lain :
atau kecenderungan. 1. Tahap pertama: Precise statement of the
problem (mendefinisikan permasalahan yang
ingin diketahui). Misalnya ingin mengetahui

ISSN 1978-1946 | Algoritma Asosiasi Dengan…


Jurnal Pilar Nusa Mandiri Vol.XII, No.2 September 2016 125

apakah seorang customer berpotensi c. Analisis Pola Frekuensi


memiliki kredit macet, atau mengidentifikasi Tahap inimencari kombinasi item yang
seorang customer apakah akan pindah ke memenuhi syarat minimum dari nilai support
kompetitor bisnis kita, dan lain sebagainya. dalam basis data. Nilai support sebuah item
Setelah menemukan pertanyaan bisnis yang diperoleh dengan menggunakan rumus berikut:
perlu dijawab oleh data mining, selanjutnya
tentukan tipe tugas dasar untuk menjawab
pertanyaan bisnis tersebut. Tugas dasar yang Sementara, nilai support dari 2 item diperoleh
menjadi dasar algoritma data mining adalah dengan menggunakan rumus :
klasifikasi, regresi, segmentasi, asosiasi dan
sequence analisis.
2. Tahap kedua: Initial Exploration
(Mempersiapkan data yang menjadi sumber Frequent itemset menunjukkan itemset yang
untuk data mining termasuk data “cleaning” memiliki frekuensi kemunculan lebihdari nilai
untuk dipelajari polanya). Setelah
minimum yang ditentukan ( ).Misalkan = 2,
menentukan definisi masalah, langkah
maka semua itemsets yangfrekuensi
berikutnya adalah mencari data yang
kemunculannya lebih dari atausama dengan 2
mendukung definisi masalah. Menentukan
kali disebut frequent.Himpunan dari frequent k-
porsi data yang digunakan men-training data
itemset dilambangkan dengan Fk.
mining berdasarkan algoritma data mining
Setelah semua pola frekuensi tinggi
yang telah dibuat. Setelah persiapan data
ditemukan, barulah dicari aturan asosiasi yang
selesai dilakukan, langkah berikutnya adalah
memenuhi syarat minimum untuk confidence
memberikan sebagian data kedalam
dengan menghitung confidence aturan asosiatif A
algoritma data mining.
3. Tahap Ketiga: Model building and B. Nilai confidence dari aturan A B diperoleh
validation.Validasi apakah data mining dengan rumus berikut:
memberikan prediksi yang akurat. Setelah
training data selesai dilakukan, data mining
tersebut perlu di-“uji” atau di-validasi
keakuratannya terhadap data testing.
4. Tahap Ke-empat: Deployment. Tahap ini
memilih aplikasi yang tepat tehadap data Untuk menentukan aturan asosiasi yang akan
dipilih maka harus diurutkan berdasarkan
mining untuk membuat prediksi
Support × Confidence. Aturan diambil sebanyak n
aturan yang memiliki hasil terbesar.
b. Algoritma Apriori
Algoritma Apriori adalah suatu algoritma
d. Tanagra
dasar yang diusulkan oleh Agrawal & Srikant
Tanagra adalah software Data Mining
pada tahun 1994 untuk penentuan frequent
bebas untuk tujuan akademik dan penelitian ini
itemsets untuk aturan asosiasi boolean. Algoritma
mengusulkan beberapa metode data mining dari
apriori termasuk jenis aturan asosiasi pada data
analisis eksplorasi data, pembelajaran statistik,
mining.Aturan yang menyatakan asosiasi antara
beberapa atribut sering disebut affinity analysis pembelajaran mesin dan daerah
database.Tanagra adalah "proyek open source"
atau market basket analysis. Analisis asosiasi atau
karena setiap peneliti dapat mengakses ke kode
association rule mining adalah teknik data mining
untuk menemukan aturan suatu kombinasi sumber, dan menambahkan algoritma sendiri,
sejauh dia setuju dan sesuai dengan lisensi
item(Larose, 2005). Salah satu tahap analisis
distribusi perangkat lunak.
asosiasi yang menarik perhatian banyak peneliti
Tujuan utama dari proyek Tanagra adalah
untuk menghasilkan algoritma yang efisien
memberikan peneliti dan mahasiswa yang mudah
adalah analisis pola frequensi tinggi (frequent
untuk menggunakan perangkat lunak data
pattern mining). Penting tidaknya suatu asosiasi
mining, sesuai dengan norma-norma yang hadir
dapat diketahui dengan dua tolak ukur , yaitu :
support dan confidence. Support (nilai penunjang) dari pengembangan perangkat lunak dalam
domain ini (terutama dalam desain GUI dan cara
adalah persentase kombinasi item tersebut dalam
untuk menggunakannya), dan memungkinkan
database, sedangkan confidence (nilai kepastian)
adalah kuatnya hubungan antar-item dalam untuk menganalisis baik data yang nyata atau
sintetis.
aturan asosiasi (Kusrini, 2009).
Tujuan kedua Tanagra adalah untuk
mengusulkan kepada peneliti arsitektur yang
memungkinkan mereka untuk dengan mudah
menambahkan metode penambangan data

ISSN 1978-1946 | Algoritma Asosiasi Dengan…


126 Jurnal Pilar Nusa Mandiri Vol.XII, No.2 September 2016

mereka sendiri, untuk membandingkan kinerja mengembangkan strategi pemasaran produk


mereka. Tanagra bertindak lebih sebagai tersebut kepada konsumen.
platform eksperimental untuk membiarkan
mereka pergi ke penting dari pekerjaan mereka, 2. Pengolahan awal data
pengeluaran mereka untuk berurusan dengan Jumlah data awal yang diperoleh dari
bagian menyenangkan dalam programmation pengumpulan data dalam 3 bulan yaitu bulan Juli
semacam ini alat pengelolaan data (Julsam, sd bulan September 2015 terdiri dari banyak
2009). produk dan jumlahnya sangat besar, namun tidak
Tujuan ketiga dan terakhir, arah semua data dapat digunakan dan tidak semua
pengembang pemula, terdiri dalam menyebarkan atribut digunakan karena harus melalui beberapa
metodologi yang mungkin untuk membangun tahap pengolahan awal data (preparation data).
perangkat lunak semacam ini. Mereka harus Untuk mendapatkan datayang berkualitas,
mengambil keuntungan dari akses gratis ke kode beberapa teknik yang dilakukan yaitu(Kothari,
sumber, untuk melihat bagaimana perangkat 2004) : data validation, data integration and
lunak semacam ini dibangun, masalah untuk transformation dan data size reduction and
menghindari, langkah-langkah utama dari proyek discritization. Sehingga perlu dilakukan filtering
ini, dan alat-alat dan perpustakaan kode yang terhadap produk yang akan dilakukan analisi.
digunakan untuk. Dengan cara ini, Tanagra dapat Dalam hal ini penulis mengelompokkan barang
dianggap sebagai alat pedagogis untuk belajar yang diperjual belikan selama kurun waktu 3
teknik pemrograman bulan yang dimulai dari Juli 2015 sd September
2015.
Metode Penelitian
Penelitian adalah mencari melalui proses 1. Model yang diusulkan
yang metodis untuk menambahkan pengetahuan Model yang diusulkan pada penelitian ini
itu sendiri dan dengan yang lainnya, oleh berdasarkan state of the art tentang prediksi hasil
penemuan fakta dan wawasan tidak biasa. pemilihan umum adalah dengan menerapkan
Pengertian lainnya, penelitian adalah sebuah algoritma apriori untuk melakukan analis
kegiatan yang bertujuan untuk membuat terhadap produk yang sudah diperjualbelikan
kontribusi orisinal terhadap ilmu pengetahuan. dan melihat aturan asosiasi dari data yang sudah
Penelitian ini adalah penelitian eksperimen ada.
dengan metode penelitian sebagai berikut: 2. Eksperiment dan pengujian model
Untuk melakukan eksperiment dan pengujian
1. Pengumpulan data model, dilakukan pengelompokan data dan
Pada pengumpulan data dijelaskan tentang disesuaikan dengan data yang ada di algoritma
bagaimana dan dari mana data dalam penelitian apriori. Kemudian data di hitung nilai support
ini didapatkan, ada dua tipe dalam pengumpulan mulai dari perhitungan itemset pertama, itemset
data, yaitu pengumpulan data primer dan kedua dan seterrusnya. Selanjutnya menghitung
pengumpulan data sekunder. Data primer adalah nilai confident dari data yang ada untuk
data yang dikumpulkan pertama kali untuk mengetahui asosiasi dari data yang ada.
melihat apa yang sesungguhnya terjadi. Data
sekunder adalah data yang sebelumnya pernah HASIL DAN PEMBAHASAN
dibuat oleh seseorang baik di terbitkan atau
tidak(Vercelis, 2009). Dalam pengumpulan data Prosedur Sistem berjalan dalam penelitian
primer dalam penelitian ini menggunakan ini yaitu Pelanggan datang ke toko kemudian
metode observasi dan interview, dengan memilih barang yang tersedia berdasarkan yang
menggunakan data-data yang berhubungan ada di display toko, jika tidak ada yang cocok
dengan penjualan produk tahun 2015. Data maka pelanggan akan memilih barang yang lain
penjualan pada Anna Celluler selama ini tidak atau meninggalkan toko.
tersusun dengan baik, sehingga data penjualan A. Perhitungan Algorima Apriori
yang semakin hari semakin banyak tersebut Berdasarkan transaksi penjualan produk
hanya berfungsi sebagai arsip bagi perusahaan pada toko celluler, transaksi tersebut dapat
dan tidak dapat dimanfaatkan perusahaan untuk diakumulasikan. Akumulasi transaksi penjualan
pengembangan strategi seperti pemasaran atau produk diperoleh dari penjualan mingguan yang
yang lainnya. Oleh sebab itu perusahaan diambil dari 3 teratas laporan mingguan, dapat
memerlukan sistem untuk mengolah data yang dilihat dalam tabel dibawah ini :
dapat menghasilkan data penjualan produk yang
paling sering dibeli, sehingga produk yang paling
sering dibeli tersebut dapat menjadi acuan untuk

ISSN 1978-1946 | Algoritma Asosiasi Dengan…


Jurnal Pilar Nusa Mandiri Vol.XII, No.2 September 2016 127

Tabel 1. Pola Transaksi Penjualan smartphone Itemset Support


No. Itemset Samsung 75 %
1 Samsung, Advance, Lenovo Apple 50 %
2 Samsung, Apple, Lenovo Huawei 50 %
3 Huawei, Advance, Lenovo Advance 66.66 %
4 Samsung, Apple, Advance Lenovo 58.33 %
5 Samsung, Apple, Lenovo Sumber : Hasil Penelitian (2016)
6 Samsung, Huawei, Lenovo
7 Samsung, Apple, Lenovo Proses selanjutnya adalah pembentukan C2 atau
8 Samsung, Apple, Huawei disebut dengan 2 itemset dengan jumlah
9 Apple, Huwei, Advance minimum support = 30%. Berikut merupakan
10 Samsung, Huawei, Advance perhitungan pembentukan C2 atau 2 itemset:
11 Samsung, Advance, Lenovo S(Samsung,apple)
12 Apple, Huawei, Advance
Sumber : Anna Celluler (2016)
S(Samsung,huawei)
Format tabular data transaksi mingguan,
bila dibentuk akan tampak seperti tabel berikut
ini:
S(Samsung,Advance
Tabel 2.Tabel Format Tabular Data Transaksi
Ming Samsu App Huaw Advan Leno
gu ng le ei ce vo S(samsung,lenovo)
1 1 0 0 1 1
2 1 1 0 0 1
3 0 0 1 1 1 S(apple, huawei)
4 1 1 0 1 0
5 1 0 0 1 1
6 1 0 1 0 1
S(apple,advance)
7 1 1 0 0 1
8 1 1 1 0 0
9 0 1 1 1 0
10 1 0 1 1 0 S(apple, lenovo)
11 1 0 0 1 1
12 0 1 1 1 0
Sumbe :(Penelitian tahun 2016 ) S(huawei,
advance)
1. Analisis Pola Frekuensi Tinggi
Berikut ini adalah penyelesaian dengan contoh
k1 berdasarkan data yang sudah disediakan pada S(huawei,lenovo)
tabel berikut ini.
Proses pembentukan C1 atau disebut dengan 1
itemset dengan jumlah minimum support = 30%.
Berikut merupakan perhitungan pembentukan 1 S(advance,lenovo)
itemset:
S(samsung)

S(apple) Tabel 4. Calon 2-itemset


Itemset Jumlah Support
Samsung, Apple 4 33.33 %
S(huawei) Samsung, 2 16.66 %
Huawei
S(advance) Samsung, 5 41.66 %
Advance
S(lenovo) Samsung, 6 50 %
Lenovo
Tabel 3. Support dari tiap item Apple, Huawei 3 25 %
Apple, Advance 3 25 %

ISSN 1978-1946 | Algoritma Asosiasi Dengan…


128 Jurnal Pilar Nusa Mandiri Vol.XII, No.2 September 2016

Apple, Lenovo 2 16.66 %


Huawei, 4 33.33 %
Advance
Huawei, Lenovo 2 16.66 %
Advance, 4 33.33 %
Lenovo Sumber : Hasil Penelitian (2016)
Sumber : Hasil Penelitian (2016) Gambar 2 . tampilan support

Minimal support yang ditentukan adalah 30 2. Algoritma Confidence


%, jadi kombinasi 2 itemset yang tidak memenuhi Algoritma penentuan Confidence dapat dilihat
minimal support akan dihilangkan, terlihat pada Algoritma dibawah ini yang terdiri dari
seperti table dibawah ini: input, Output dan proses. Berikut algoritma dari
algoritma confident If support ≥ 60% then
Tabel 5. Minimal Support 2 itemset 35% min.Confidence terpenuhi Else eliminasi. Dan
Itemset Support berikut hasil dari pennerapan menggunakan
Samsung, Apple 33.33 % Tanagra
Samsung, Advance 41.66 %
Samsung, Lenovo 50 %
Huawei, Advance 33.33 %
Advance, Lenovo 33.33 %
Sumber : Hasil Penelitian (2016)

B. Perhitungan Algoritma Apriori dengan


Tanagra
Algoritma Apriori pada Tanagra dapat
terbentuk dengan algoritma atau langkah-
langkah yang telah ditentukan.
Algoritma ini terdiri dari dua algoritma yaitu: Gambar 3. Algoritma Confident
1. Algoritma Support
Algoritma penentuan Support dapat dilihat
pada Algoritma dibawah ini yang terdiri dari
input, Output dan proses. Berikut hasil
Support dari hasil analis yang penulis lakukan.

Sumber : Hasil Penelitian (2016)


Gambar 4. Hasil Algoritma Confident

PENUTUP

Algoritma Apriori dapat diterapkan untuk


mendukung strategi marketing di suatu
perusahaan atau institusi lainnya. Informasi yang
Sumber : Hasil Penelitian (2016) berkaitan dengan pelaksanaan promosi dapat
Gambar 1. Proses pengambilan data tersedia dengan cepat, sehingga pihak
manajemen dapat melakukan pengambilan
keputusan dengan cepat. Pelaksanaan strategi
promosi pada perusahaan sangat dibantu dengan
adanya penerapan algoritma Apriori ini sehingga
diharapkan efektifitas pelaksanaan strategi akan
dapat semakin ditingkatkan. Penerapan
algoritma Apriori yang dilakukan melalui
perangkat lunak yang dirancang terbukti
menujukkan hasil yang sama dibandingkan
dengan melakukan perhitungan secara manual
ataupun dengan perangkat lunak sejenis. Hal ini
dibuktikan melalui perhitungan nilai support dan

ISSN 1978-1946 | Algoritma Asosiasi Dengan…


Jurnal Pilar Nusa Mandiri Vol.XII, No.2 September 2016 129

confidence yang menunjukkan hasil yang sama. BIODATA PENULIS


Adapun saran dari hasil penelitian adalah sebagai
berikut : algoritma apriori ini dapat diterapkan Mohammad Badrul, M.Kom
dalam proses pelaksanaan strategi dan proses Penulis adalah Dosen Tetap di
lainnya yang dapat melibatkan hubungan antar STMIK Nusa Mandiri Jakarta.
beberapa item dalam lingkungan lainnya tidak Penulis Kelahiran di
hanya terbatas pada perusahaan saja seperti Bangkalan 01 Januari 1984.
misalnya pada strategi cross market analysis. Penulis menyelesaikan
Selanjutnya penulis juga menyarankan agar dapat Program Studi Strata 1 (S1) di
membandingkan metode pengambilan keputusan Kampus STMIK Nusa Mandiri
dengan menggunakan algoritma apriori ini Prodi Sistem Informasi dengan gelar S.Kom pada
dengan teknik yang lainnya tahun 2009 dan menyelesaikan progarm Srata 2
(S2) di Kampus yang sama dengan Prodi ilmu
Komputer dengan gelar M.Kom pada tahun 2012.
REFERENSI Selain mengajar, Penulis juga aktif dalam
membimbing mahasiswa yang sedang melakukan
Dawson, C. W. (2009). Projects in Computing and penelitian khususnya di tingkat Strata 1 dan
Information System A Student's Guide. penulis juga terlibat dalam tim konsorsium di
England: Addison-Wesley. Jurusan Teknik Informatika STMIK Nusa Mandiri
Gunadi - Penerapan Metode Data Mining Market untuk penyusunan bahan ajar. Saat ini penulis
Basket Analysis terhadap Penjualan Buku memiliki Jabatan Fungsional Asisten ahli di
dengan Algoritma Apriori – 2012 kampus STMIK Nusa Mandiri Jakarta. Penulis
Han, J., & Kamber, M. , 2007,Data Mining Concepts tertarik dalam bidang kelimuan Data mining,
and Technique. Morgan Kaufmann Jaringan komputer, Operating sistem khususnya
publisher open source, Database, Software engineering dan
Julsam dkk, Penambangan Data Format Text Research Metode.
Excel dengan Software Tanagra, 2009.
Kothari, C. R. (2004). Research Methology
methodes and Technique. India: New Age
Interntional.
Kusrini, dan Luthfi, E. T. (2007). Algoritma Data
mining. Yogyakarta: Andi.
Kusrini, dan Luthfi, E. T. (2009). Algoritma Data
mining. Yogyakarta: Andi.
Kurniawati - Pemetaan Pola Hubungan Program
Studi dengan Algoritma Apriori – 2014.
Larose, D. T. (2005). Discovering Knowledge in
Data. Canada: Wiley Interscience.
Nurcahyo - Penerapan Data Mining dengan
Algoritma Apriori untuk Mendukung
Strategi Promosi Pendidikan
Vercellis, C. (2009). Business Intelligence : Data
Mining and Optimization for Decision
Making. John Wiley dan Sons, Ltd
Witten, H. I., Eibe, F., dan Hall, A. M. (2011). Data
Mining Machine Learning Tools and
Techiques. Burlington: Morgan Kaufmann
Publisher.

ISSN 1978-1946 | Algoritma Asosiasi Dengan…

Anda mungkin juga menyukai