Anda di halaman 1dari 8

Penerapan Data Mining dengan Algoritma Apriori untuk

Mendukung Strategi Promosi Pendidikan


Gunadi Widi Nurcahyo1
Universitas Putra Indonesia YPTK
Jl. Raya Lubuk Begalung Padang. Sumatera Barat, Telp (0751)- 775246 Fax. (0751)-71913
e-mail: gunadiwidi@yahoo.co.id

Abstrak
Setiap perusahaan maupun organisasi yang ingin tetap bertahan perlu untuk menentukan
strategi promosi yang tepat. Penentuan strategi promosi yang tepat akan dapat mengurangi biaya
promosi dan mencapai sasaran promosi yang tepat. Salah satu cara yang dapat dilakukan untuk
penentuan strategi promosi adalah dengan menggunakan teknik data mining. Teknik data mining yang
digunakan dalam hal ini adalah dengan menggunakan algoritma Apriori. Algoritma Apriori adalah
algoritma pengambilan data dengan aturan asosiatif untuk menentukan hubungan asosiatif suatu
kombinasi item. Penelitian dilakukan dengan mengamati beberapa variabel penelitian yang sering
dipertimbangkan oleh perguruan tinggi dalam menentukan sasaran promosinya yaitu asal sekolah,
daerah, jurusan, dan waktu sekolah. Hasil penelitian ini adalah berupa suatu perangkat lunak dengan
mengimplementasikan algoritma Apriori yang dapat digunakan untuk menentukan nilai support dan
confidence untuk tiap item.
Kata kunci: Data Mining, Algoritma Apriori

Abstract
Any company or organization that wants to survive needs to determine the appropriate
promotional strategies. Determination of appropriate promotional strategies will be able to reduce costs
and achieve targeted promotional campaign proper. One way that can be done to determine campaign
strategy is to use data mining techniques. Data mining techniques used in this case is to use the Apriori
algorithm. Apriori algorithm is a sampling algorithm with associative rules to determine the associative
relationships of a combination of items. The study was conducted by observing some variables that are
considered by colleges to determine the origin of the promotion targeting schools, regions, departments ,
and school time. The results are in the form of a software to implement the Apriori algorithm that can be
used to determine the value of support and confidence for each item.
Keywords: Data Mining, Apriori Algorithm

1. Pendahuluan
Data Mining adalah proses ekstraksi informasi dari kumpulan data melalui penggunaan algoritma
dan teknik yang melibatkan bidang ilmu statistik, mesin pembelajaran, dan sistem manajemen database
(Feelders, Daniels, dan Holsheimer, 2000 dalam jayanthi Ranjan, 2005). Data Mining digunakan untuk
ekstraksi informasi penting yang tersembunyi dari dataset yang besar. Dengan adanya data mining maka
akan didapatkan suatu permata berupa pengetahuan di dalam kumpulan data data yang banyak
jumlahnya.
Salah satu area penerapan data mining adalah di dalam bidang promosi. Bila sasaran promosi tidak
ditentukan secara baik, dalam arti tidak diupayakan mencari sasaran promosi yang potensial, maka hanya
akan menghabiskan banyak waktu dan biaya yang seharusnya bisa diminimalisir melalui pemilihan target
promosi yang baik. Salah satu cara yang dapat diterapkan adalah dengan menerapkan penggunaan data
mining.
Algoritma apriori adalah algoritma pengambilan data dengan aturan asosiatif (Association rule )
untuk menentukan hubungan asosiatif suatu kombinasi item (Kusrini, 2007). Association Rule yang
dimaksud dilakukan melalui mekanisme penghitungan support dan confidence dari suatu hubungan item.
Sebuah rule asosiasi dikatakan interesting jika nilai support adalah lebih besar dari minimum support dan
juga nilai confidence adalah lebih besar dari minimum confidence. Algoritma apriori ini akan cocok untuk

68

diterapkan bila terdapat beberapa hubungan item yang ingin dianalisa. Salah satunya yang bisa diterapkan
adalah di dalam bidang promosi dan penentuan strategi pemasaran.
Pada saat ini tiap perguruan tinggi pasti berusaha untuk mendapatkan strategi promosi yang efektif
dan efisien dalam mendapatkan calon mahasiswa baru ditengah ketatnya persaingan antar Perguruan
Tinggi. Untuk promosi pada Perguruan Tinggi dapat didukung dengan menggunakan algoritma Apriori
untuk menentukan target promosi yang potensial. Variabel atau item yang dapat dijadikan sebagai tolok
ukur penganalisaan data diantaranya adalah asal sekolah, daerah asal, jurusan, dan waktu sekolah. Melalui
penerapan algoritma apriori maka akan dapat disajikan suatu gambaran mengenai hubungan antara asal
sekolah, daerah asal, jurusan, dan waktu sekolah terhadap keputusan mahasiswa untuk menjadi
mahasiswa suatu perguruan tinggi. Sehingga ke depan setiap perguruan tinggi bisa lebih memfokuskan
diri terhadap target promosi yang dirasakan cukup potensial.
Agar penelitian ini lebih terarah dan tujuan yang diharapkan dapat tercapai, maka peneliti
menetapkan batasan batasan terhadap masalah yang diteliti. Dalam penelitian ini peneliti memberikan
batasan sebagai berikut : penelitian ini khusus membahas tentang strategi promosi pendidikan pada suatu
perguruan tinggi, data yang diamati diharapkan adalah data selama 6 tahun terakhir. kriteria peniliaian
yang akan dikaji adalah untuk mengkaji sasaran promosi pendidikan yang efektif bagi perguruan tinggi,
dan variabel yang dipakai di dalam penilaian ini adalah mengenai asal sekolah, Daerah asal, jurusan, dan
Waktu sekolah. Nilai confidence yang akan dihitung adalah nilai confidence untuk 2 itemset dan 3
itemset. Untuk kategori 2 itemset yang akan dijadikan tolok ukur dalam pencarian nilai support dan
confidence adalah variabel: Asal Sekolah Jurusan, Asal Sekolah Waktu, Daerah Jurusan, Daerah
Waktu, dan Jurusan Waktu. Untuk kategori 3 itemset yang akan dijadikan tolok ukur dalam pencarian
nilai support dan confidence adalah variabel: Sekolah Jurusan Waktu dan Daerah Jurusan Waktu.

2. Metodologi Penelitian
Metodologi penelitian dilakukan dengan mengumpulkan data terlebih dahulu. Proses
pengumpulan data dilakukan dengan dua cara yaitu : studi kepustakaan dan studi lapangan. Studi
kepustakaan dilakukan untuk memahami penerapan data mining seperti mengumpulkan teori-teori yang
berhubungan dengan data mining dan studi lapangan dilakukan mendapatkan data penelitian. data yang
diamati diharapkan adalah data selama 6 tahun terakhir. Data penelitian seperti : Asal Sekolah Jurusan,
Asal Sekolah Waktu, Daerah Jurusan, Daerah Waktu, dan Jurusan Waktu.

3. Analisis dan Hasil


3.1 Analisis
Data Mining adalah proses ekstraksi informasi dari kumpulan data melalui penggunaan
algoritma dan teknik yang melibatkan bidang ilmu statistik, mesin pembelajaran, dan sistem manajemen
database (Feelders, Daniels, dan Holsheimer, 2000 dalam jayanthi Ranjan, 2005). Data Mining adalah
digunakan untuk ekstraksi informasi penting yang tersembunyi dari dataset yang besar. Pada beberapa
tahun belakangan ini, kemajuan dari beberapa bidang ilmu pengetahuan seperti science, business, dan lain
lain telah melahirkan koleksi database yang terus meningkat. Kumpulan data yang demikian banyak
dapat didayagunakan untuk mendukung pengambilan keputusan (Lamine, Nhien, dan Tahar, 2007).
Menurut Jurnal Penerapan Algoritma Apriori pada Data Mining Untuk Mengelompokkan
Barang Berdasarkan Kecenderungan Kemunculan Bersama Dalam Satu Transaksi (Kusrini, 2007),
Algoritma apriori termasuk jenis aturan assosiasi pada data mining.
Analisis asosiasi atau association rule mining adalah teknik data mining untuk menemukan
aturan assosiatif antara suatu kombinasi item. Contoh dari aturan assosiatif dari analisa pembelian di
suatu pasar swalayan adalah dapat diketahuinya berapa besar kemungkinan seorang pelanggan membeli
roti bersamaan dengan susu. Dengan pengetahuan tersebut pemilik pasar swalayan dapat mengatur
penempatan barangnya atau merancang kampanye pemasaran dengan memakai kupon diskon untuk
kombinasi barang tertentu.
Karena analisis asosiasi menjadi terkenal karena aplikasinya untuk menganalisa isi keranjang
belanja di pasar swalayan, analisis asosiasi juga sering disebut dengan istilah market basket analysis.
Analisis asosiasi didefinisikan sebagai suatu proses untuk menemukan semua aturan assosiatif
yang memenuhi syarat minimum untuk support (minimum support) dan syarat minimum untuk
confidence (minimum confidence).

69

Metodologi dasar analisis asosiasi terbagi menjadi dua tahap :


3.1.1 Analisa pola frekuensi tinggi
Tahap ini mencari kombinasi item yang memenuhi syarat minimum dari nilai support dalam
database. Nilai support item diperoleh dengan Persamaan 1.
Support (A) =

Jumlah Transaksi Mengandung A

...................[Persamaan 1]

Total Transaksi
sedangkan nilai support dari 2 item diperoleh dari Persamaan 2.
Support (A, B) = P ( A B) =

Jumlah Transaksi Mengandung A dan B

.[Persamaan 2]

Total Transaksi
3.1.2 Pembentukan aturan assosiatif
Setelah semua pola frekuensi tinggi ditemukan, barulah dicari aturan assosiatif yang memenuhi
syarat minimum untuk confidence dengan menghitung confidence aturan assosiatif A B. Nilai
confidence dari aturan A B diperoleh dari Persamaan 3.
Confidence = P (A | B) =

Jumlah Transaksi Mengandung A dan B

..[Persama an 3]

Jumlah Transaksi Mengandung A


3.1.3 Contoh Algoritma Apriori untuk Pencarian Association Rule
Misalkan terdapat data transaksi seperti yang ditunjukkan pada Tabel 1

Transaction ID
1
2
3
4

Tabel 1 Data Item Transaksi


Item Set
Item A, Item C, Item D
Item B, Item C, Item E
Item A, Item B, Item C, Item E
Item B, Item E

Misalkan diinginkan minimum support : 50% (2 dari 4 transaksi)


Langkah 1: Mencari nilai support untuk masing masing itemset. Seperti yang ditunjukkan pada Tabel 2
L1={large 1-itemset}
Tabel 2 Nilai Support untuk 1 Item Set
Itemset
Support
A
50%
B
75%
C
75%
D
25%
E
75%
Langkah 2: Mencari kandidat itemset untuk L2:
2.1 : Gabungkan itemset pada L1 (algoritma apriori-gen)
{ A B, A C, A D, A E, B C, B D, B E, C D, C E, D E}
2.2 : Hapus yang tidak ada dalam itemset
Itemset { B D, DE} dihapus karena tidak ada dalam itemset
Langkah 3: Hitung nilai Support untuk masing- masing itemset. Hasilnya dapat ditunjukkan pada Tabel 3.

Penerapan Data Mining untuk Strategi Promosi Pendidikan (Gunadi Widi Nurcahyo)

70

Tabel 3 Nilai Support untuk 2 Item Set


Support
Itemset
AB
25 %
AC
50 %
AD
25 %
AE
25%
BC
50%
BE
75%
CD
25%
CE
50%
Langkah 4: tentukan item set yang memenuhi minimum support. Hasilnya dapat ditunjukkan pada tabel 4.
L2 { large 2-itemset}
Tabel 4 Anggota 2 Item Set yang Memenuhi Minimum Support
Itemset
Support
AC
50 %
BC
50%
BE
75%
CE
50%
Langkah 5 : Ulangi langkah 2-4
Langkah 5.1, Gabungkan itemset pada L2 & L2. Hasilnya dapat ditunjukkan pada Tabel 5.

Itemset
AC+BC
AC+BE
AC+CE
BC+BE
BC+CE
BE+CE

Tabel 5 Anggota 3 Item Set


Hasil Gabungan (3 itemset)
ACB
A C B, A C E, A B E
ACE
BCE
BCE
BCE

Langkah, 5. 2, Hapus yang tidak ada dalam itemset : { A C E }


Langkah 6 : Hitung support dari setiap kandidat itemset L3
Hasilnya dapat ditunjukkan pada Tabel 6
Tabel 6 Nilai Support untuk 3 Item Set
Itemset
Support
ABC
25 %
ABE
25 %
BCE
50 %
Langkah 7 : L3 { large 3-itemset } { B C E}
Langkah 8 : STOP karena sudah tidak ada lagi kandidat untuk 4-itemset.
Untuk mencari aturan asosiasi diperlukan juga minconf
Misal minconf : 75 %, aturan asosiasi yang mungkin terbentuk dapat ditunjukkan pada Tabel 7.
Aturan (X Y)
BCE
BEC

Tabel 7 Nilai confidence untuk Tiap Item Set


Sup(X)
Confidence
Sup(X Y)
50%
50%
100%
50%
75%
66.67%

CEB
AC
CA
BC
CB
BE
EB
CE
EC

50%
50%
50%
50%
50%
75%
75%
50%
50%

50%
50%
75%
75%
75%
75%
75%
75%
75%

71

100%
100 %
66.67%
66.67%
66.67%
100%
100%
66.67%
66.67%

Proses kerja dari Algoritma Apriori dapat dilihat pada gambar 1.

Gambar 1 Rancangan Umum Penerapan Algoritma Apriori


Gambar 1 memperlihatkan rancangan umum dari sistem yang menerapkan algoritma apriori
yang akan dirancang dalam mendukung strategi promosi pendidikan pada suatu perguruan tinggi. Dalam
rancangan ini dapat digambarkan bahwa proses dimulai dari pemasukan data mahasiswa, di mana atribut
utama yang akan dianalisa adalah meliputi data asal sekolah, daerah asal, jurusan, dan waktu sekolah.
Berdasarkan data data yang ada, kemudian akan dicari nilai support untuk masing masing item. Hasil
pencarian dari nilai support ini kemudian akan bisa ditentukan frequent item set. Berdasarkan pada
frequent item set yang ada kemudian akan dihitung nilai confidence untuk masing masing frequent item
set. Kemudian berdasarkan nilai support dan confidence untuk frequent item set akan dihasilkan suatu
association rule.

3.2 Hasil
Pada saat pertama kali menjalankan Perangkat Lunak Apriori ini, maka akan dijumpai tampilan
berikut ini seperti yang dapat dilihat pada Gambar 2.

Gambar 2 Tampilan Menu Utama


Menu utama pada program di atas terdiri dari menu File, Menu Data, Menu Laporan, dan Setting.
Menu File terdiri dari sub menu Log In, Log Out dan Keluar. Menu Data terdiri dari sub menu

Penerapan Data Mining untuk Strategi Promosi Pendidikan (Gunadi Widi Nurcahyo)

72

Mahasiswa, 1 Item set, 2 Item set, 3 Item set, dan 4 Item Set. Menu Laporan terdiri dari sub menu Nilai
Support / Confidence Total, Rule / Knowledge. Menu Setting terdiri dari sub menu Pengguna.
Terlebih dahulu diisikan data mahasiswa pada form yang sudah disediakan seperti yang diperlihatkan
pada gambar 3.

Gambar 3 Tampilan form pengisian data mahasiswa


Kemudian berdasarkan data mahasiswa yang telah diketikkan sebelumnya, maka dapat dianalisa nilai
support untuk 1 item set seperti yang terlihat pada gambar 4

Gambar 4 Nilai support untuk 1 item set


Langkah berikutnya, adalah menghitung nilai support untuk 2 item set berdasarkan frequent item set yang
telah diperoleh pada langkah 2. Seperti yang diperlihatkan pada gambar 5.

Gambar 5 Tampilan nilai support untuk 2 item set


Setelah dihitung nilai support untuk 2 item set, maka langkah selanjutnya adalah mencari nilai support
untuk 3 item set, berdasarkan frequent item set yang telah diperoleh pada langkah 3. Seperti yang
diperlihatkan pada gambar 6.

73

Gambar 6 Tampilan nilai support untuk 3 item set


Kemudian kita juga dapat melihat nilai support dan confidence masing masing item set seperti yang
diperlihatkan pada gambar 7 dan melihat rule yang dihasilkan seperti yang diperlihatkan pada gambar 8.

Gambar 7 Nilai Support / Confidence

Gambar 8 Tampilan Rule yang Dihasilkan

3.

Hasil dan Diskusi


Setelah dilakukan perbandingan ternyata sistem yang dirancang dengan menggunakan algoritma
apriori dapat menghasilkan keputusan promosi yang singkat dan tepat. Karena knowledge yang dihasilkan
dapat memberikan laporan yang bermanfaat untuk bagian akademik dan pihak yayasan serta pihak
pihak lain yang membutuhkannya. Dibandingkan dengan sistem lama maka sistem dengan menggunakan
algoritma Apriori ini mempunyai beberapa kelebihan sebagai berikut. Pada hal pengolahan Data,
penggunaan Algoritma Apriori untuk pengolahan data promosi pada perguruan tinggi dapat dilakukan
dengan lebih cepat dibandingkan dengan pengolahan data secara manual / tidak menggunakan suatu
teknik tertentu. Pada hal pencarian Informasi, penggunaan algoritma apriori membuat pencarian informasi
cepat, karena pada laporan yang didapat sudah disajikan suatu bentuk rule yang berisikan nilai support
dan confidence sehingga dapat semakin membantu dalam penentuan keputusan promosi. Pada sistem
yang lama pencarian informasi memakan waktu yang lama, karena bentuk laporan yang ada tidak memuat
data yang lengkap, dan tidak terperinci.
Dari rule yang ada dapat dijelaskan sebagai berikut: hasil pengujian dilakukan untuk mencari nilai
support dan confidence untuk masing masing item. Dari hasil pengujian menunjukkan bahwa tidak
terdapat perbedaan antara hasil perhitungan manual dengan hasil perhitungan dengan menggunakan
perangkat lunak. Untuk memastikan apakah hasil perhitungan dengan perangkat lunak telah mendapatkan
hasil yang diinginkan maka penulis kemudian membandingkannya dengan program algoritma hasil
unduhan yang sifatnya non customized. Berdasarkan hasil perbandingan juga tidak menunjukkan adanya
perbedaan. Nilai confidence yang dicari adalah merupakan nilai confidence untuk 2 item set dan 3 item
set. Dengan adanya nilai support dan confidence maka akan dapat membantu pihak manajemen
perguruan tinggi dalam hal pengambilan keputusan di bidang promosi pendidikan. Sebagai contoh, SMA
A menjadi target promosi yang sangat potensial karena memiliki nilai minimum support yang cukup
besar yaitu 25% artinya adalah bahwa dari seluruh mahasiswa perguruan tinggi, maka 25 % nya adalah
berasal dari SMA. Bila fokus promosi mau lebih dipertajam lagi maka kita dapat melihat bahwa

Penerapan Data Mining untuk Strategi Promosi Pendidikan (Gunadi Widi Nurcahyo)

74

konsentrasi yang cukup dominan di SMA A adalah di bidang IPS yang memiliki nilai minimum
confidence sebesar 75%. Artinya dari keseluruhan siswa SMA A yang masuk ke suatu perguran tinggi
maka 75% nya adalah berasal dari jurusan IPS sedangkan jurusan IPA hanya mencapai 25% dari total
keseluruhan siswa SMA A yang masuk ke perguruan tinggi. Dengan adanya hasil analisis dengan
menggunakan Algoritma Apriori ini maka pihak manajemen dapat lebih memfokuskan diri pada sasaran
promosi yang paling potensial sehingga dapat lebih menghemat anggaran untuk biaya promosi.

4.

Kesimpulan dan Saran


Adapun kesimpulan dari hasil penelitian adalah sebagai berikut. algoritma Apriori dapat
diterapkan untuk mendukung strategi promosi pendidikan pada Perguruan Tinggi. Informasi yang
berkaitan dengan pelaksanaan promosi dapat tersedia dengan cepat, sehingga pihak manajemen dapat
melakukan pengambilan keputusan dengan cepat. Pelaksanaan promosi pendidikan pada perguruan tinggi
sangat dibantu dengan adanya penerapan algoritma Apriori ini sehingga diharapkan efektifitas
pelaksanaan promosi pendidikan akan dapat semakin ditingkatkan.
Penerapan algoritma Apriori yang
dilakukan melalui perangkat lunak yang dirancang terbukti menujukkan hasil yang sama dibandingkan
dengan melakukan perhitungan secara manual ataupun dengan perangkat lunak sejenis. Hal ini dibuktikan
melalui perhitungan nilai support dan confidence yang menunjukkan hasil yang sama.
Adapun saran
dari hasil penelitian adalah sebagai berikut : algoritma apriori ini dapat diterapkan dalam proses
pelaksanaan promosi dan proses lainnya yang dapat melibatkan hubungan antar beberapa item dalam
lingkungan lainnya tidak hanya terbatas pada lembaga pendidikan saja seperti misalnya pada strategi
cross market analysis. Selanjutnya penulis juga menyarankan agar dapat membandingkan metode
pengambilan keputusan dengan menggunakan algoritma apriori ini dengan teknik yang lainnya.

Daftar Pustaka
[1] Abdallah Alashqur, Mining Association Rule: A Database Perspective, International Journal of
Computer Science and Network Security, Vol 8 No. 12, December 2008, Page 69 74, HTTP://
paper.ijcsns.org/07_book/200812/20081211.pdf
[2] David J. Hand, Data Mining: Statistic and More?, American Statistical Association, May 1998 Vol.
52, No. 2, Page 112 118, HTTP:// amscampus.cib.unibo.it/archive/00001164/01/Hand98.pdf
[3] E.W.T. Ngai, Li Xiu, dan D.C.K. Chau, Application of Data Mining Technique in Customer
Relationship Management: A Literature Review and classification, Journal Elsevier (2009), Page
2592

2602,
HTTP://
163.17.12.2/.../Application%20of%20data%20mining%20techniques%20%20%20%20in%
[4] Jayanthi Ranjan (2007), Application of Data Mining Technique in Pharmaceutical Industry,
Journal of Theoritical and Applied Information Technology, Page 61 67, HTTP://
www.jatit.org/volumes/research-papers/Vol3No4/7vol3no4.pdf
[5] Kusrini (2007), Penerapan Algoritma Apriori pada Data Mining untuk Mengelompokkan Barang
Berdasarkan Kecenderungan Kemunculan Bersama dalam Satu Transaksi, Page 1 16, HTTP://
dosen.amikom.ac.id/.../Publikasi%20Apriori-Kusrini_Feb-07_.pdf
[6] Kusrini and Emha Taufiq Luthfi, Algoritma Data Mining, Yogyakarta: Penerbit Andi, 2009, Page
149 176
[7] Lamine, M.A, Nhien-An LK, and Tahar M.K, Distributed Frequent Itemsets Mining in
Heterogenous Platforms, Journal of Engineering, Computing, and Architecture Volume 1, Issue 2,
2007, Page 1 12, HTTP:// www.scientificjournals.org/journals2007/articles/1239.pdf
[8] Sarjon D. and Mohd Noor MD Sap (2001), Mining Association Rule From Large Databases, Jurnal
Tekologi
Maklumat
Jilid
13,
Bil.
2,
page
16

37,
HTTP://
eprints.utm.my/8764/1/MohdNoorMdSap2001_MiningAssociationRuleFromLarge.pdf
[9] U. Fayyad, Gregory P.S, and P. Smyth, From Data Mining to Knowledge Discovery in Database,
American Association for Artificial Intelligence
(1996),
Page 37
54,
HTTP://citeseer.ist.psu.edu/283224.html
[10] Yudho
Giri
Sucahyo
(2003),
Pengantar
Data
Mining,
IlmuKomputer.Com,
HTTP://ilmukomputer.com/2008/11/25 mengenal-data-mining/