Abstrak
Setiap perusahaan maupun organisasi yang ingin tetap bertahan perlu untuk menentukan
strategi promosi yang tepat. Penentuan strategi promosi yang tepat akan dapat mengurangi biaya
promosi dan mencapai sasaran promosi yang tepat. Salah satu cara yang dapat dilakukan untuk
penentuan strategi promosi adalah dengan menggunakan teknik data mining. Teknik data mining yang
digunakan dalam hal ini adalah dengan menggunakan algoritma Apriori. Algoritma Apriori adalah
algoritma pengambilan data dengan aturan asosiatif untuk menentukan hubungan asosiatif suatu
kombinasi item. Penelitian dilakukan dengan mengamati beberapa variabel penelitian yang sering
dipertimbangkan oleh perguruan tinggi dalam menentukan sasaran promosinya yaitu asal sekolah,
daerah, jurusan, dan waktu sekolah. Hasil penelitian ini adalah berupa suatu perangkat lunak dengan
mengimplementasikan algoritma Apriori yang dapat digunakan untuk menentukan nilai support dan
confidence untuk tiap item.
Kata kunci: Data Mining, Algoritma Apriori
Abstract
Any company or organization that wants to survive needs to determine the appropriate
promotional strategies. Determination of appropriate promotional strategies will be able to reduce costs
and achieve targeted promotional campaign proper. One way that can be done to determine campaign
strategy is to use data mining techniques. Data mining techniques used in this case is to use the Apriori
algorithm. Apriori algorithm is a sampling algorithm with associative rules to determine the associative
relationships of a combination of items. The study was conducted by observing some variables that are
considered by colleges to determine the origin of the promotion targeting schools, regions, departments ,
and school time. The results are in the form of a software to implement the Apriori algorithm that can be
used to determine the value of support and confidence for each item.
Keywords: Data Mining, Apriori Algorithm
1. Pendahuluan
Data Mining adalah proses ekstraksi informasi dari kumpulan data melalui penggunaan algoritma
dan teknik yang melibatkan bidang ilmu statistik, mesin pembelajaran, dan sistem manajemen database
(Feelders, Daniels, dan Holsheimer, 2000 dalam jayanthi Ranjan, 2005). Data Mining digunakan untuk
ekstraksi informasi penting yang tersembunyi dari dataset yang besar. Dengan adanya data mining maka
akan didapatkan suatu permata berupa pengetahuan di dalam kumpulan data data yang banyak
jumlahnya.
Salah satu area penerapan data mining adalah di dalam bidang promosi. Bila sasaran promosi tidak
ditentukan secara baik, dalam arti tidak diupayakan mencari sasaran promosi yang potensial, maka hanya
akan menghabiskan banyak waktu dan biaya yang seharusnya bisa diminimalisir melalui pemilihan target
promosi yang baik. Salah satu cara yang dapat diterapkan adalah dengan menerapkan penggunaan data
mining.
Algoritma apriori adalah algoritma pengambilan data dengan aturan asosiatif (Association rule )
untuk menentukan hubungan asosiatif suatu kombinasi item (Kusrini, 2007). Association Rule yang
dimaksud dilakukan melalui mekanisme penghitungan support dan confidence dari suatu hubungan item.
Sebuah rule asosiasi dikatakan interesting jika nilai support adalah lebih besar dari minimum support dan
juga nilai confidence adalah lebih besar dari minimum confidence. Algoritma apriori ini akan cocok untuk
68
diterapkan bila terdapat beberapa hubungan item yang ingin dianalisa. Salah satunya yang bisa diterapkan
adalah di dalam bidang promosi dan penentuan strategi pemasaran.
Pada saat ini tiap perguruan tinggi pasti berusaha untuk mendapatkan strategi promosi yang efektif
dan efisien dalam mendapatkan calon mahasiswa baru ditengah ketatnya persaingan antar Perguruan
Tinggi. Untuk promosi pada Perguruan Tinggi dapat didukung dengan menggunakan algoritma Apriori
untuk menentukan target promosi yang potensial. Variabel atau item yang dapat dijadikan sebagai tolok
ukur penganalisaan data diantaranya adalah asal sekolah, daerah asal, jurusan, dan waktu sekolah. Melalui
penerapan algoritma apriori maka akan dapat disajikan suatu gambaran mengenai hubungan antara asal
sekolah, daerah asal, jurusan, dan waktu sekolah terhadap keputusan mahasiswa untuk menjadi
mahasiswa suatu perguruan tinggi. Sehingga ke depan setiap perguruan tinggi bisa lebih memfokuskan
diri terhadap target promosi yang dirasakan cukup potensial.
Agar penelitian ini lebih terarah dan tujuan yang diharapkan dapat tercapai, maka peneliti
menetapkan batasan batasan terhadap masalah yang diteliti. Dalam penelitian ini peneliti memberikan
batasan sebagai berikut : penelitian ini khusus membahas tentang strategi promosi pendidikan pada suatu
perguruan tinggi, data yang diamati diharapkan adalah data selama 6 tahun terakhir. kriteria peniliaian
yang akan dikaji adalah untuk mengkaji sasaran promosi pendidikan yang efektif bagi perguruan tinggi,
dan variabel yang dipakai di dalam penilaian ini adalah mengenai asal sekolah, Daerah asal, jurusan, dan
Waktu sekolah. Nilai confidence yang akan dihitung adalah nilai confidence untuk 2 itemset dan 3
itemset. Untuk kategori 2 itemset yang akan dijadikan tolok ukur dalam pencarian nilai support dan
confidence adalah variabel: Asal Sekolah Jurusan, Asal Sekolah Waktu, Daerah Jurusan, Daerah
Waktu, dan Jurusan Waktu. Untuk kategori 3 itemset yang akan dijadikan tolok ukur dalam pencarian
nilai support dan confidence adalah variabel: Sekolah Jurusan Waktu dan Daerah Jurusan Waktu.
2. Metodologi Penelitian
Metodologi penelitian dilakukan dengan mengumpulkan data terlebih dahulu. Proses
pengumpulan data dilakukan dengan dua cara yaitu : studi kepustakaan dan studi lapangan. Studi
kepustakaan dilakukan untuk memahami penerapan data mining seperti mengumpulkan teori-teori yang
berhubungan dengan data mining dan studi lapangan dilakukan mendapatkan data penelitian. data yang
diamati diharapkan adalah data selama 6 tahun terakhir. Data penelitian seperti : Asal Sekolah Jurusan,
Asal Sekolah Waktu, Daerah Jurusan, Daerah Waktu, dan Jurusan Waktu.
69
...................[Persamaan 1]
Total Transaksi
sedangkan nilai support dari 2 item diperoleh dari Persamaan 2.
Support (A, B) = P ( A B) =
.[Persamaan 2]
Total Transaksi
3.1.2 Pembentukan aturan assosiatif
Setelah semua pola frekuensi tinggi ditemukan, barulah dicari aturan assosiatif yang memenuhi
syarat minimum untuk confidence dengan menghitung confidence aturan assosiatif A B. Nilai
confidence dari aturan A B diperoleh dari Persamaan 3.
Confidence = P (A | B) =
..[Persama an 3]
Transaction ID
1
2
3
4
Penerapan Data Mining untuk Strategi Promosi Pendidikan (Gunadi Widi Nurcahyo)
70
Itemset
AC+BC
AC+BE
AC+CE
BC+BE
BC+CE
BE+CE
CEB
AC
CA
BC
CB
BE
EB
CE
EC
50%
50%
50%
50%
50%
75%
75%
50%
50%
50%
50%
75%
75%
75%
75%
75%
75%
75%
71
100%
100 %
66.67%
66.67%
66.67%
100%
100%
66.67%
66.67%
3.2 Hasil
Pada saat pertama kali menjalankan Perangkat Lunak Apriori ini, maka akan dijumpai tampilan
berikut ini seperti yang dapat dilihat pada Gambar 2.
Penerapan Data Mining untuk Strategi Promosi Pendidikan (Gunadi Widi Nurcahyo)
72
Mahasiswa, 1 Item set, 2 Item set, 3 Item set, dan 4 Item Set. Menu Laporan terdiri dari sub menu Nilai
Support / Confidence Total, Rule / Knowledge. Menu Setting terdiri dari sub menu Pengguna.
Terlebih dahulu diisikan data mahasiswa pada form yang sudah disediakan seperti yang diperlihatkan
pada gambar 3.
73
3.
Penerapan Data Mining untuk Strategi Promosi Pendidikan (Gunadi Widi Nurcahyo)
74
konsentrasi yang cukup dominan di SMA A adalah di bidang IPS yang memiliki nilai minimum
confidence sebesar 75%. Artinya dari keseluruhan siswa SMA A yang masuk ke suatu perguran tinggi
maka 75% nya adalah berasal dari jurusan IPS sedangkan jurusan IPA hanya mencapai 25% dari total
keseluruhan siswa SMA A yang masuk ke perguruan tinggi. Dengan adanya hasil analisis dengan
menggunakan Algoritma Apriori ini maka pihak manajemen dapat lebih memfokuskan diri pada sasaran
promosi yang paling potensial sehingga dapat lebih menghemat anggaran untuk biaya promosi.
4.
Daftar Pustaka
[1] Abdallah Alashqur, Mining Association Rule: A Database Perspective, International Journal of
Computer Science and Network Security, Vol 8 No. 12, December 2008, Page 69 74, HTTP://
paper.ijcsns.org/07_book/200812/20081211.pdf
[2] David J. Hand, Data Mining: Statistic and More?, American Statistical Association, May 1998 Vol.
52, No. 2, Page 112 118, HTTP:// amscampus.cib.unibo.it/archive/00001164/01/Hand98.pdf
[3] E.W.T. Ngai, Li Xiu, dan D.C.K. Chau, Application of Data Mining Technique in Customer
Relationship Management: A Literature Review and classification, Journal Elsevier (2009), Page
2592
2602,
HTTP://
163.17.12.2/.../Application%20of%20data%20mining%20techniques%20%20%20%20in%
[4] Jayanthi Ranjan (2007), Application of Data Mining Technique in Pharmaceutical Industry,
Journal of Theoritical and Applied Information Technology, Page 61 67, HTTP://
www.jatit.org/volumes/research-papers/Vol3No4/7vol3no4.pdf
[5] Kusrini (2007), Penerapan Algoritma Apriori pada Data Mining untuk Mengelompokkan Barang
Berdasarkan Kecenderungan Kemunculan Bersama dalam Satu Transaksi, Page 1 16, HTTP://
dosen.amikom.ac.id/.../Publikasi%20Apriori-Kusrini_Feb-07_.pdf
[6] Kusrini and Emha Taufiq Luthfi, Algoritma Data Mining, Yogyakarta: Penerbit Andi, 2009, Page
149 176
[7] Lamine, M.A, Nhien-An LK, and Tahar M.K, Distributed Frequent Itemsets Mining in
Heterogenous Platforms, Journal of Engineering, Computing, and Architecture Volume 1, Issue 2,
2007, Page 1 12, HTTP:// www.scientificjournals.org/journals2007/articles/1239.pdf
[8] Sarjon D. and Mohd Noor MD Sap (2001), Mining Association Rule From Large Databases, Jurnal
Tekologi
Maklumat
Jilid
13,
Bil.
2,
page
16
37,
HTTP://
eprints.utm.my/8764/1/MohdNoorMdSap2001_MiningAssociationRuleFromLarge.pdf
[9] U. Fayyad, Gregory P.S, and P. Smyth, From Data Mining to Knowledge Discovery in Database,
American Association for Artificial Intelligence
(1996),
Page 37
54,
HTTP://citeseer.ist.psu.edu/283224.html
[10] Yudho
Giri
Sucahyo
(2003),
Pengantar
Data
Mining,
IlmuKomputer.Com,
HTTP://ilmukomputer.com/2008/11/25 mengenal-data-mining/