Algoritma FP Growth

ISSN : 1978-6603
Penerapan Data Mining dengan Algoritma Fp-Growth untuk Mendukung

Strategi Promosi Pendidikan
( Studi Kasus Kampus STMIK Triguna Dharma)
Ali Ikhwan*1, Dicky Nofriansyah#2, Sriani#3

*1
Magister Ilmu Komputer Universitas Putra IndonesiaYPTK Padang
#2,3
Program Studi Sistem Komputer, STMIK TrigunaDharma
Jl. Raya Lubuk Begalung, Sumbar Indonesia
Jl. A.H. Nasution No. 73 F-Medan
Email :Aliikhwan053@gmal.com
ABSTRAK
Saat ini semakin banyaknya jumlah kampus yang semakin berkembang yang membuat para
pengelola ingin mendapatkan strategi promosi yang lebih baik. Adapun cara dalam menemukan strategi
promosi yang tepat akan dapat mengurangi biaya promosi dan mencapai sasaran promosi yang tepat.
Salah satu cara yang dapat dilakukan untuk penentuan strategi promosi adalah dengan menggunakan
teknik data mining. Adapun teknik yang digunakan dalam hal ini adalah Algoritma FP-Growth. FP-Growth
adalah salah satu alternatif algoritma yang dapat digunakan untuk menentukan himpunan data yang
paling sering muncul (frequent item set) dalam sekumpulan data. Algoritma FP-Growth merupakan
pengembangan dari algoritma Apriori. Sedangkan di dalam algoritma FP-Growth tidak dilakukan
generate candidate karena FP-Growth menggunakan konsep pembangunan tree dalam pencarian
frequent itemset. Penelitian dilakukan dengan mengamati beberapa variabel penelitian yang sering
dipertimbangkan oleh perguruan tinggi khusunya bagian marketing dalam menentukan sasaran
promosinya, Yaitu Pendidikan Terakhir,Alamat Rumah,Jurusan,Pilihan Prodi. Hasil penelitian ini adalah
berupa suatu perangkat lunak dengan mengimplementasikan algoritma FP-Growth yang menggunakan
konsep pembangunan FP-Tree dalam mencari Frequent Itemset.
Kata Kunci : Data Mining,Association Rules,Frequent Itemset,FP-Growth.
ABSTRAC
Nowadays more and more growing amount of campus that make the managers want to get better
promotion strategy. So how to find the right promotional strategy will be able to reduce costs and
achieve targeted promotional campaign right. One of proces that can be done to determine promotion
strategy is to use data mining techniques . The technique used in this case is the FP-Growth Algorithm.
FP-Growth algorithm is one of the alternatives that can be used to determine the set of data that
appears most frequently (frequent item sets) in a set of data. FP-Growth algorithm is an extension of
Apriori algorithm. While in the FP-Growth algorithm do not generate candidate because the FP-Growth
using the concept of development in the search for frequent itemset tree. The research doing by
observing and some research variables are often considered by colleges especially the marketing in
targeting the promotion, Namely Latest Education, Home Address, Subject, Options Prodi. The results of
this research are in the form of a software to implement the FP-Growth algorithm that uses the concept
of development of FP-Tree in finding Frequent Itemset.
Keywords: Data Mining,Association Rules,Frequent Itemset,FP-Growth.
211
Ali Ikhwan, Dicky Nofriansyah, Sriani, Penerapan Data Mining Dengan Algoritma..
1. PENDAAHULUAN teknik analisa yang dapat digolongkan

dalam Data Mining. Teknik Data Mining
1.1 Latar Belakang Masalah yang akan digunakan dalam penelitian ini
adalah Association Rule Mining. Association
Persaingan di dalam dunia bisnis ini rule mining adalah teknik mining untuk
sangat ketat , khususnya dalam menemukan aturan asosiatif antara suatu
mempromosikan perguruan tinggi. Setiap kombinasi item.
kampus berusaha memberikan fasilitas Adapun dalam penelitian ini akan
yang terbaik. Oleh karena itu setiap kampus dibahas bagaimana cara
berusaha mencari strategi yang tepat untuk mengimplementasikan salah satu algoritma
mempromosikan kampusnya. Menurut para dalam data mining, yaitu algoritma frequent
pengembang untuk menemukan suatu Pattern-Growth (FP-Growth). Algoritma ini
strategi yang dapat menentukan strategi adalah bagian dari teknik asosiasi pada data
pemasaran dalam mempromosikan mining. Adapun FP-Growth sendiri adalah
perguruan tinggi dengan memaksimalkan salah satu altenatif algoritma yang dapat
pelayanan kepada masyarakat. Salah satu digunakan untuk menentukan himpunan
teknik yang dipakai dalam penerapan Data data yang paling sering mucul (frequent
Mining adalah di dalam bidang promosi. itemset) dalam sekumpulan data.
Bila sasaran promosi tidak ditentukan Karakteristik algoritma FP-Growth adalah
secara baik, dalam arti tidak diupayakan struktur data yang digunakan dalam tree
mencari sasaran promosi yang potensial, yang disebut FP-Tree. Dengan
maka hanya akan menghabiskan banyak menggunakan FP-Tree, algoritma FP-Growth
waktu dan biaya yang seharusnya bisa dapat langsung mengekstrak frequent
diminimalisir melalui pemilihan target itemset dari FP-Tree.
promosi yang baik.
Salah satu cara yang dapat 1.2 Perumusan Masalah
diterapkan adalah dengan menerapkan
penggunaan Data Mining. Karena di dalam 1. Bagaimana sistem memberikan
data mining sendiri terdapat cara dan teknik informasi kepada user dalam
dalam pemenuhan kebutuhan salah mempromosikan pendidikan di
satunya adalah kebutuhan informasi yang Perguruan Tinggi Swasta secara efektif
luas, dan dari informasi yang kita dapat bia dan efisien?
kita gunakan sebagai suatu keputusan atau 2. Bagaimana sistem ini menentukan
menentukan sebuah kualitas dalam target dalam mempromosikan
menentukan sauatu keputusan. Adapun pendidikan?
kumpulan dari sebuah data atau informasi 3. Bagaimana menerapkan algoritma FP-
memeiliki banyak potensi untuk dijadikan Growth di dalam promosi pendidikan
suatu kesimpulan dalam mengambil sebuah sehingga dalam proses tersebut dapat
keputusan dengan melakukan analisis dan menentukan strategi yang tepat ?
menggali suatu unformasi yang terdapat di 4. Bagaimana melakukan pengujian
dalam sebuah data. Maka dimungkinkan Metode FP-Growth dengan Rapidminer
untuk dibuat strategi dalam mendukung sehingga menghasilkan penyelesain
promosi pendidikan. Dari definisi Data masalah dalam mencari strategi
Mining yang luas terdapat banyak jenis promosi yang tepat?
Jurnal SAINTIKOM Vol.14, No. 3, September 2015 212

1.3 Batasan Masalah 1.5 Manfaat Penelitian
penulis mencoba memberikan 1. Mengetahui algoritma FP-Growth dapat

batasan masalah antara lain: memberikan alternatif pengetahuan
1. Algoritma FP- Growth yaitu algoritma tentang menemukan strategi dalam
yang digunakan di dalam penyeleksian promosi pendidikan.
untuk mempercepat proses penetuan 2. Menemukan strategi atau sasaran yang
frequent itemset sebelum meng- lebih tepat dalam mempromosikan
generate rull sebagai rekomendasi pendidikan.
keputusan. 3. Menjadikan hasil software ini dapat
2. Penelitian ini khusus membahas tentang digunakan pihak kampus untuk
strategi promosi pendidikan pada menentukan strategi dalam promosi
Perguruan Tinggi khususnya di STMIK pendidikan.
TRIGUNA DHARMA .
3. Data yang digunakan sebagai sumber
merupakan data yang diambil di STMIK 2. LANDASAN TEORI
TRIGUNA DHARMA 1 tahun terakhir,
yang meliputi asal sekolah, daerah asal, 2.1 Knowledge Discovery In Database
jurusan dan pilihan prodi. (KKD)
4. Tools yang digunakan di dalam Knowledge Discovery in Database (KDD)
pengolahan data adalah Rapidminer 5.2 adalah proses menentukan informasi yang
berguna serta pola-pola yang ada dalam
1.4 Tujuan Penelitian data. Informasi ini terkandung dalam basis
data yang berukuran besar yang
1. Untuk menganalisa permasalahan sebelumnya tidak diketahui dan potensial
promosi pendidikan di STMIK TRIGUNA bermanfaat. Data Mining merupakan salah
DHARMA. satu langkah dari serangkaian proses
2. Untuk menerapkan metode FP- Growth iterative KDD. Tahapan proses KDD dapat
di dalam strategi promosi pendidikan di dilihat pada gambar 2.1.
STMIK TRIGUNA DHARMA.
3. Untuk melakukan pengujian metode FP-
Growth dengan menggunakan tools
Rapidminer sehingga menghasilkan
strategi promosi pendidikan yang efektif
dan efisien.
4. Menghasilkan sebuah hubungan antara
variable atau item berdasarkan
implementasi dari algoritma FP- Gambar 2.1 Tahapan dalam KDD
Growth.
5. Menguji hubungan variable atau item Tahapan proses KDD terdiri dari:
tersebut untuk mendapatkan a. Data Selection
pengetahuan baru dari proses ekstraksi Pada proses ini dilakukan pemilihan
menggunakan Tools yang ada. himpunan data, menciptakan himpunan
data target, atau memfokuskan pada subset
213 Jurnal SAINTIKOM Vol.14, No. 3, September 2015

variable (sampel data) dimana penemuan banyak. (Fadlina, 2014) Data Mining atau
(discovery) akan dilakukan. Hasil seleksi sering disebut sebagai knowledge discovery
disimpan dalam suatu berkas yang terpisah in database (KDD) adalah kegiatan yang
dari basis data operasional. meliputi pengumpulan, pemakaian data
historis untuk menemukan keteraturan,
b. Pre-Processing dan Cleaning Data pola atau hubungan dalam data berukuran
Pre-Processing dan Cleaning Data besar. Keluaran Data Mining ini bisa dipakai
dilakukan membuang data yang tidak untuk membantu pengambilan keputusan
konsisten dan noise, duplikasi data, di masa depan. Pengembangan KDD ini
memperbaiki kesalahan data, dan bisa menyebabkan penggunaan pattern
diperkaya dengan data eksternal yang recognition semakin berkurang karena telah
relevan. menjadi bagian Data Mining.
c. Transformation 2.3 Tahapan dalam Data Mining

Proses ini mentransformasikan atau
menggabungkan data ke dalam yang lebih Menurut (Buulolo, 2013) ada empat
tepat untuk melakukan proses mining tahap yang dilalui dalam data mining,
dengan cara melakukan peringkasan antara lain:
(agregasi). 1. Tahap pertama : Pricise statement of the
problem (pernyataan tepat terhadap
d. Data Mining permasalahan)
Proses Data Mining yaitu proses Sebelum mengakses perangkat lunak
mencari pola atau informasi menarik dalam data mining, seorang analis harus memiliki
data terpilih dengan menggunakan teknik, kejelasan perihal pertanyaan apa yang
metode atau algoritma tertentu sesuai akan ingin dijawabnya. Jika tidak ada
dengan tujuan dari proses KDD secara formula yang tepat untuk problematika
keseluruhan. yang ada maka anda hanya akan
membuang-buang dan uang dalam
e. Interpretation / Evaluasi membuat solusinya.
Proses untuk menerjemahkan pola- 2. Tahap kedua : Initial exploration
pola yang dihasilkan dari Data Mining. Tahap ini dimulai dengan
Mengevaluasi (menguji) apakah pola atau mempersiapkan data yang juga juga
informasi yang ditemukan bersesuaian atau termasuk kedalam data mining cleaning
bertentangan dengan fakta atau hipotesa (misalnya : mengedentifikasi dan
sebelumnya. Pengetahuan yang diperoleh menyikirkan data yang dikodekkan salah),
dari pola-pola yang terbentuk transformasi data, memilih subset record,
dipresentasikan dalam bentuk visualisasi. data set, langkah awal seleksi.
Mendeskripsikan dan memvisualisasikan
2.2 Data Mining data adalah kunci dari tahap ini.
3. Tahap tiga : Model building and
Data Mining adalah proses untuk validation
mendapatkan informasi dengan melakukan Tahap ini melibatkan pertimbangan
pencarian pola dan relasi-relasi yang terhadap ragam permodelan dan memilih
tersembunyi di dalam timbunan data yang yang terbaik bagi performasi prediktif.

4. Tahap ke-empat : Deployment Prediksi hampir sama dengan klasifikasi

Memilih aplikasi yang tepat berikut dan estimasi, kecuali bahwa dalam
permodelan untuk membuat (generate) prediksi nilai dari hasil akan ada di masa
prediksi. Selanjutnya kita kan melihat mendatang.
rincian perihal tahapan-tahapan data Contoh prediksi bisnis dan penelitian
mining. adalah:
a. Prediksi harga beras dalam tiga bulan
2.4 Pengelompokan Data Mining yang akan datang.
b. Prediksi persentasi kenaikan
Data Mining dibagi menjadi kecelakaan lalu lintas tahun depan jika
beberapa kelompok berdasarkan tugas yang batas bawah kecepatan dinaikkan.
dapat dilakukan, yaitu (Kusrini dan Emha Beberapa metode dan teknik yang
Taufiq Luthfi, 2009): digunakan dalam klasifikasi dan estimasi
dapat pula digunakan (untuk keadaan
1. Deskripsi yang tepat) untuk prediksi.
Terkadang peneliti dan analis secara
sederhana ingin mencoba mencari cara 4. Klasifikasi
untuk menggambarkan pola dan Dalam klasifikasi, terdapat target
kecenderungan yang terdapat dalam variabel kategori. Sebagai contoh,
data. Sebagai contoh, petugas penggolongan pendapatan dapat
pengumpulan suara mungkin tidak dipisahkan dalam tiga kategori, yaitu
dapat menentukan keterangan atau pendapatan tinggi, pendapatan sedang
fakta bahwa siapa yang tidak cukup dan pendapatan rendah.
profesional akan sedikit didukung dalam Contoh lain klasifikasi dalam bisnis dan
pemilihan presiden. penelitian adalah:
a. Menentukan apakah suatu transaksi
2. Estimasi kartu kredit merupakan transaksi
Estimasi hampir sama dengan klasifikasi, yang curang atau tidak.
kecuali variabel target estimasi lebih b. Memperkirakan apakah suatu
kearah numerik daripada kearah pengajuan hipotek oleh nasabah
kategori. Sebagai contoh akan dilakukan merupakan suatu kredit yang baik
estimasi tekanan darah sistolik pada atau buruk.
pasien rumah sakit berdasarkan umur c. Mendiagnosis penyakit seorang
pasien, jenis kelamin, indeks berat pasien untuk mendapatkan
badan, dan level sodium darah. termasuk kategori penyakit apa.
Hubungan antara tekanan darah sistolik
dan nilai variabel prediksi dalam proses 5. Pengklusteran
pembelajaran akan menghasilkan model Pengklusteran merupakan pengelom-
estimasi. Model estimasi yang dihasilkan pokan record, pengamatan atau
dapat digunakan untuk kasus baru memperhatikan dan membentuk kelas
lainnya. objek-objek yang memiliki kemiripan.
Contoh pengklusteran dalam bisnis dan
3. Prediksi penelitian adalah:

a. Mendapatkan kelompok-kelompok kombinasi item tersebut dalam database

konsumen untuk target pemasaran dan confidence (Fadlina, 2014).
dari satu suatu produk bagi
perusahaan yang tidak memiliki A. Data Preparation.
dana pemasaran yang besar. Pada banyak bidang keilmuan,
b. Untuk tujuan audit akuntansi, yaitu terutama komputer sains, diperlukan data
melakukan pemisahan terhadap yang berkualitas melalui proses preparation
perilaku financial dalam baik dan dari data mentah. Dalam prakteknya,
mencurigakan. ditemukan bahwa data cleaning dan
c. Melakukan pengklusteran terhadap preparation membutuhkan total usaha 80%
ekspresi dari gen, untuk dari usaha untuk merekayasa data,
mendapatkan kemiripan perilaku sehingga menjadikan data preparation
dari gen dalam jumlah besar. sebagai proses yang krusial. Pentingnya
proses ini dapat dilihat dari tiga aspek,
6. Asosiasi yakni:
Tugas asosiasi dalam Data Mining 1. Data real world merupakan data kotor.
adalah menemukan attribut yang Data real world bisa mengandung data
muncul dalam satu waktu. Dalam dunia yang tidak, terdapat noise, tidak
bisnis lebih umum disebut analisis konsisten, yang dikarenakan:
keranjang belanja. Contoh asosiasi a. Tidak lengkap (incomplete), yaitu
dalam bisnis dan penelitian adalah: kekurangan nilai atribut atau hanya
a. Meneliti jumlah pelanggan dari mengandung agregat data (contoh :
perusahaan telekomunikasi seluler address = " ")
yang diharapkan untuk memberikan b. Noise, yaitu masih mengandung error
respon positif terhadap penawaran dan outliers.
upgrade layanan yang diberikan. c. Tidak konsisten (inconsistent), yaitu
b. Menentukan barang dalam data yang mengandung discrepansi
supermarket yang dibeli secara dalam code dan nama atau
bersamaan dan yang tidak pernah singkatnya datanya tidak konsisten.
dibeli secara bersamaan. 2. Sistem mining dengan performa tinggi
membutuhkan data yang berkualitas.
2.5 Tahapan Asosiasi Data preparation atau preparation
menghasilkan dataset yang lebih sedikit
Analisis asosiasi dikenal juga sebagai daripada dataset yang asli, ini bias
salah satu teknik Data Mining yang menjadi meningkatkan efisiensi dari Data
dasar dari berbagai teknik Data Mining Mining. Langkah ini mengandung:
lainnya. Khususnya salah satu tahap dari a. Memilih data yang relevan
analisis asosiasi yang disebut analisis pola b. Mengurangi data.
frequensi tinggi (frequent pattern mining) 3. Data yang berkualitas menghasilkan pola
menarik perhatian banyak peneliti untuk yang berkualitas. Dengan data
menghasilkan algoritma yang efisien. preparation, maka data yang dihasilkan
Penting tidaknya suatu aturan assosiatif adalah data yang berkualitas, yang
dapat diketahui dengan dua parameter, mengarah pada pola yang berkualitas
support (nilai penunjang) yaitu persentase pula, dengan:

a. Mengembalikan data yang tidak yang memungkinkan dengan kemungkinan

lengkap itemset yang muncul dengan m-item adalah
b. Membenarkan eror, atau 2m. Karena besarnya komputasi untuk
menghilangkan outliers menghitung frequent itemset, yang
c. Membenahi data yang membandingkan setiap kandidat itemset
bertentangan. dengan setiap transaksi, maka ada
beberapa pendekatan untuk mengurangi
B. Association Rules komputasi tersebut, salah satunya dengan
Association rule merupakan salah algoritma apriori.
satu metode yang bertujuan mencari pola
yang sering muncul di antara banyak D. Apriori
transaksi, dimana setiap transaksi terdiri Algoritma apriori digunakan untuk
dari beberapa item sehingga metode ini mencari frequent itemset yang memenuhi
akan mendukung sistem rekomendasi minsup kemudian mendapatkan rule yang
melalui penemuan pola antar item dalam memenuhi minconf dari frequent itemset
transaksi-transaksi yang terjadi tadi. Algoritma ini mengontrol
Metodologi dasar analisis asosiasi terbagi berkembangnya kandidat itemset dari hasil
menjadi dua tahap: frequent itemset dengan support-based
pruning untuk menghilangkan itemset yang
1. Analisa pola frekuensi tinggi tidak menarik dengan menetapkan minsup.
Tahap ini mencari kombinasi item Prinsip dari apriori ini adalah bila itemset
yang memenuhi syarat minimum dari nilai digolongkan sebagai frequent itemset, yang
support dalam database. Nilai support memiliki support lebih dari yang ditetapkan
sebuah item diperoleh dengan rumus sebelumnya, maka semua subsetnya juga
berikut: termasuk golongan frequent itemset, dan
sebaliknya.
E. Rule Generation
Setelah mendapatkan frequent
itemset menggunakan algoritma apriori,
langkah selanjutnya adalah mendapatkan
rule yang memenuhi confidence. Karena
rule yang dihasilkan berasal dari frequent
2. Pembentukan aturan assosiatif
itemset, dengan kata lain, dalam
Setelah semua pola frekuensi tinggi
menghitung rule menggunakan confidence,
ditemukan, barulah dicari aturan assosiatif
tidak perlu lagi menghitung support-nya
yang memenuhi syarat minimum untuk
karena semua calon rules yang dihasilkan
confidence dengan menghitung confidence
telah memenuhi minsup sesuai yang
aturan assosiatif A _B Nilai confidence dari
ditentukan. Penghitungan ini juga tidak
aturan A _B diperoleh dari rumus berikut:
perlu melakukan perulangan scanning pada
database untuk menghitung confidence,
C. Frequent Itemset
cukup dengan mengambil itemset dari hasil
Langkah pertama pada association
support.
rule adalah menghasilkan semua itemset

2. 6 Algoritma FP-Growth 3.2 Kerangka Kerja
(Sensuse, 2012)FP-growth adalah Dalam metodologi penelitian ada

salah satu alternatif algoritma yang dapat urutan kerangka kerja yang harus diikuti,
digunakan untuk menentukan himpunan urutan kerangka kerja ini merupakan
data yang paling sering muncul (frequent gambaran dari langkahlangkah yang harus
itemset) dalam sebuah kumpulan data. FP- dilalui agar penelitian ini bisa berjalan
growth menggunakan pendekatan yang dengan baik. Kerangka kerja yang harus
berbeda dari paradigma yang digunakan diikuti bisa dilihat pada gambar 3.1.
pada algoritma Apriori.
Mengidentifikasi Masalah
(Ririanti, 2014). FP-Growth adalah
salah satu alternatif algoritma yang dapat
digunakan untuk menentukan himpunan Menganalisis Masalah
data yang paling sering muncul (frequent
item set) dalam sekumpulan data. Algoritma
FP-Growth merupakan pengembangan dari Menentukan Tujuan
algoritma Apriori.
FP-growth adalah metode yang
sering itemset pertambangan tanpa Mempelajari Literatur
Generasi calon. Ini membangun sebuah
struktur data yang sangat padat (FP-tree)
untuk kompres database transaksi asli. Mengumpulkan Data
3. METODOLOGI PENELITIAN Menganalisis Data
3.1 Pendahuluan
Pengujian Menggunakan
Dalam melakukan penelitian agar Aplikasi Yang Ditentukan
hasilnya bisa maksimal, penulis mengikuti
kaidah-kaidah (metode) yang telah
Mengambil Keputusan
ditetapkan. Metode penelitian yang akan
diterapkan adalah metode penelitian ilmiah
yang telah diajarkan di bangku perkuliahan
Gambar 3.1 Kerangka Kerja
sarjana. Metodologi penelitian ini memuat
tentang kerangka kerja penelitian yang Berdasarkan gambar 3.1 dijabarkan
akan dibahas di bawah ini. Pada bab ini urutanurutan langkah kerja sebagai
akan dibahas metodologi penelitian untuk berikut:
mengidentifikasi permasalahan, analisa
permasalahan dan pada akhirnya mencari 3.2.1. Mengidentifikasi Masalah
penyelesaian masalah di dalam Masalah yang diidentifikasi dalam
menganalisa strategi dalam penelitian ini untuk mendapatkan strategi
mempromosikan pendidikan pada STMIK promosi yang efektif dan efisien dalam
TRIGUNA DHARMA MEDAN. mendapatkan calon mahasiswa baru

ditengah ketatnya persaingan antar Literatur-literatur yang dipakai

Perguruan Tinggi . sebagai bahan referensi dalam penelitian ini
adalah dari jurnal-jurnal ilmiah, modul
3.2.2. Menganalisis Masalah pembelajaran dan buku tentang Data
Analisis masalah pada penelitian ini Mining. literatur-literatur ini akan menjadi
dilakukan dengan dua metode yaitu metode pedoman untuk melakukan penelitian agar
deskriptif dan metode komperatif. memudahkan proses penelitian.
a. Metode Deskriptif 3.2.4. Mengumpulkan Data
Pada metode ini data yang ada Metode pengumpulan data
dikumpulkan, disusun, dilakukan dengan cara melakukan
dikelompokkan dan dianalisis pengamatan langsung ke kampus STMIK
sehingga diperoleh beberapa TRIGUNA DHARMA. Selain pengamatan,
gambaran yang jelas pada masalah juga dilakukan wawancara kepada pihak-
yang akan dibahas. pihak yang terkait dengan penelitian ini. Di
b. Metode Komperatif samping itu juga, melakukan pengambilan
Pada metode ini analisis dilakukan sampel database nasabah untuk menunjang
dengan cara membandingkan teori penelitian ini.
dan praktek sehingga diperoleh 3.2.5. Menganalisis Data
gambaran yang jelas tentang Pada tahap ini data yang telah
persamaan dan perbedaan di antara dikumpulkan akan dianalisis. Analisis
keduanya. menggunakan Association Rule yang
3.2.3. Menentukan Tujuan dimaksud dilakukan melalui mekanisme
Berdasarkan uraian di atas, tujuan penghitungan support dan confidence dari
dari penelitian ini adalah: suatu hubungan item. Sebuah rule asosiasi
a. Untuk mengklasifikasikan setiap dikatakan interesting jika nilai support
wilayah di Sumatera Utara dalam adalah lebih besar dari minimum support
menentukan target promosi dan juga nilai confidence adalah lebih besar
pendidikan di STMIK TRIGUNA dari minimum confidence .Dengan
DHARMA MEDAN. menggunakan teknik FP-Growth yang
b. Untuk mendapatkan atau menghasilkan Frequent Itemset tanpa
menghasilkan suatu knowledge melakukan candidates generation. dengan
(pengetahuan) tentang wilayah yang tujuan untuk mendapatkan pengetahuan
akan dipilih dalam mempromosikan yang baru (knowledge) berupa informasi
pendidikan. tentang strategi promosi yang efektif dan
c. Untuk memberikan masukan kepada efisien dalam mendapatkan calon
pihak akademik sebagai bahan mahasiswa baru ditengah ketatnya
pertimbangan pihak akademik di persaingan antar Perguruan Tinggi.
dalam menentukan wilayah yang
akan dijadikan target dalam 3.2.6. Pengujian Menggunakan Aplikasi
promosikan pendidikan. Yang Ditentukan
Pada tahap ini, rule dites kembali
Mempelajari Literatur atau diuji lagi menggunakan sistem data

mining yang sudah ada. Tools yang menentukan strategi dalam

digunakan sebagai pengujian sistem adalah mempromosikan pendidikan.
Ramidminer 5. 2.
Mula-mula data manual Data
Mahasiswa Baru yang sudah ada 4. ANALISA
sebelumnya, di transformasikan ke dalam 4.1 Analisa Data
Microsoft Excel.
Sebagai tahap awal di dalam proses Karakteristik algoritma FP-Growth
pengujian yaitu mengimport data adalah struktur data yang digunakan adalah
mahasiswa baru pada kampus STMIK tree yang disebut dengan FP-Tree. Dengan
TRIGUNA DHARMA yang akan dijadikan menggunakan FP-Tree, algoritma FP-growth
sebagai data tabel transaksi frequensi item dapat langsung mengekstrak frequent
di dalam tools Ramidminer 5 2. tersebut. Itemset dari FP-Tree. Penggalian itemset
Kemudian tahap selanjutnya yaitu, yang frequent dengan menggunakan
melakukan proses Data Input dan Affinity algoritma FP-Growth akan dilakukan dengan
analysis atau market basket analysis. cara membangkitkan struktur data tree atau
Analisis asosiasi atau association rule adalah disebut dengan FP-Tree. Metode FP-Growth
teknik Data Mining untuk menemukan dapat dibagi menjadi 3 tahapan utama yaitu
aturan asosiatif antara suatu kombninasi sebagai:
item. Analasis FP-Growth didefenisikan 1. Tahap pembangkitan conditional pattern
suatu proses untuk menemukan semua base,
aturan FP-Growth yang memenuhi syarat 2. Tahap pembangkitan conditional FP-Tree,
minimum support dan syarat minimum dan
untuk confidence. Dari proses Data Input 3. Tahap pencarian frequent itemset.
dan Affinity tersebut akan terdapat pola Ketiga tahap tersebut merupakan
atau kriteria tertentu dalam mendapatkan langkah yang akan dilakukan untuk
strategi promosi. Hasil dari Proses Data mendapat frequent itemset.
Input dan Affinity tersebut akan diolah Input : FP-Tree Tree
kembali untuk menghasilkan suatu Output : Rt Sekumpulan lengkap
association rule. Dari association rule pola frequent
tersebut akan terlihat hasilnya. Hasilnya Methode : FP-Growth (Tree, null)
tersebut merupakan pengetahuan baru Procedure : FP-Growth (Tree, )
(knowledge) dan juga merupakan sebagai {
acuan untuk menganalisa strategi dalam 01: if Tree mengandung single path P;
mempromosikan pendidikan. 02: then untuk tiap kombinasi (dinotasikan
3.2.7. Pengambilan Keputusan ) dari node-node dalam path do
Setelah diuji, hasil analisis antara 03: bangkitkan pola dengan support
manual ways (cara manual) dan pengujian dari node-node dalam path do ;
memanfaatkan tools akan terlihat 04: else untuk tiap a1 dalam header dari
perbandingannya. Langkah berikutnya tree do
adalah penentuan atau pengambilan }
keputusan terhadap knowledge yang baru 05: bangkitkan pola
didapat yaitu berupa penentuan dalam

06: bangun = a1 dengan support = a1 9 D1,C1,A3

support 10 D1,C1,A4
07: if Tree = 11 D1,C1,A4
12 A3,B1.C2
4.2 Pra Proses 13 D1,C1
14 C1
Tabel 4.1 Untuk Memberi Tanda Pada 15 D1,C1,A3
Setiap Itemset 16 C1,A3
17 D1,C1,A3
Item 18 -
SMK Negeri ( A1 ) 19 D1,A4,C2
SMK Swasta( A2 ) 20 D1,A4,B1,C2
SMA Negeri ( A3 ) 21 A3,B1,C2
SMA Swasta ( A4 ) 22 A3,B1,C2
Madrasah Aliyah ( A5) 23 D1,B1
Medan ( B1 ) 24 D1
Aceh ( B2 ) 25 D1,C1,A4,B1
Lubuk Pakam ( B3 ) 26 D1,C1,A4,B1
Deli Serdang ( B4 ) 27 D1,C1,A4
Perbaungan ( B5 ) 28 D1,C1,A3
Tebing Tinggi ( B6 ) 29 C2
Riau ( B7 ) 30 D1,A4,C2
IPA ( C1 )
IPS ( C2 )
TKJ ( C3 ) Maka langkah selanjutnya adalah
MULTIMEDIA ( C4 ) membentuk pohon FP-Tree dengan melihat
Sistem Informasi ( D1 ) tabel 4.2 sebagai berikut:
Sistem Komputer ( D2 ) Gambar di bawah ini memberikan
Teknik Komputer ( D3 ) ilustrasi mengenai pembentukan FP-tree
Manajemen Informatika ( D4 setelah pembacaan TID pada tabel 4.2
)
NULL
Tabel 4.2 Frekuensi dari Setiap Transaksi
Item D1=1
TID ITEM
1 D1,B1 B1=1
2 C1,A3,B1
3 A3,C2 Gambar 4.1: Hasil Pembentukan FP-tree
4 D1,A4,B1,C2 Setelah
5 D1,C1,A4 Pembacaan TID 1
6 C1,A3
7 D1,C1,A3 Gambar 4.1 adalah penjelasan
8 D1 tentang pembentukan FP-Tree setelah

pembacaan didapat setelah melakukan TID akhiri D1. Proses pembentukan masing-
1, Yaitu berisi : NULL- D1 (Sistem Informasi) masing node dapat dilihat pada gambar 4.4.
=1 (B1) Medan= 1.
NULL
C1=1
D1=1
A3=1
B1=1
B1=1 Gambar 4.4 Lintasan yang Mengandung

Simpul C2
Gambar 4.2 : Hasil Pembentukan FP-tree

Setelah
Pembacaan TID 2
Gambar 4.2 didapat setelah
melakukan TID 2 ,Yaitu: NULL-C1 (IPA) =1-
A3 (SMAN) =1-B1(Medan) =1.
Gambar 4.5 Lintasan yang Mengandung
Simpul B1
NULL
D1=20
Gambar 4.6 Lintasan yang Mengandung

Simpul D1
Gambar 4.3 : Hasil Pembentukan FP-tree
Setelah Pembacaan TID 30
Setelah mencari frequent itemset
Gambar didapat setelah melakukan
untuk beberapa akhiran suffix maka didapat
TID 30 yang dijumlahkan, yaitu berisi Null-
hasil yang dirangkum dalam tabel berikut:
Sistem Informasi (D1) = 20 -IPA (C1) =16 -
SMA Negeri (A3) =12 -SMA Swasta (A4) =10- Tabel 4.3 Daftar Frequent Itemset
Medan (B1) = 10-IPS (C2) = 9. Diurutkan Berdasarkan Hubungan Akhiran
Untuk menemukan Frequent itemset
Suffix Frequent Itemset
dari tabel 4.2, maka perlu ditentukan
C2 {C2},{C2,A4}{C2,A3}{C2,D1}{C2,B1,
terlebih dahulu lintasan yang berakhir
A3},{C2,B1,A4}
dengan support count terkecil, yaitu C2
B1 {B1},{B1,D1},{B1,A3},{B1,A3,C1},(B
yang diikuti dengan A4,A3, C1,D1 dan di
1,A4,D1},{B1,A4,C1,D1}
A4 {A4},{A4,C1,D1}

A3 {A3},{A3,C1},{A3,C1,D1} Confidence = (SMA Negeri,Medan,IPS)

C1 {C1},{ C1,D1} Count (SMA Negeri,Medan,IPS /Count
D1 {D1} Medan =1/9.
Confidence = (Sistem Informasi,SMA
Dari frequent itemset yang didapat Swasta,IPS) Count(Sistem Informasi,SMA
dari pembentikan Fp-Tree dan FP-Growth Swasta,IPS)/Count Medan= 1/19.
maka dapat dihitung nilai Support dan Confidence = (Sistem Informasi,SMA
Confidence sebagai berikut: Swasta,Medan,IPS) Count (Sistem
Support = (Sistem Informasi,IPA,SMA Informasi,SMA Swasta,Medan,IPS)/Count
Swasta,Medan) = Count (Sistem Medan =1/9.
Informasi,IPA,SMA Swasta,Medan)/Jumlah Confidence = (SMA Negeri, Medan,IPS)
Transaksi = 1/30. Count (SMA Negeri, Medan,IPS) / Count
Support = (Sistem Informasi,IPA,SMA Medan =1/9.
Negeri) = Count (Sistem Informasi,IPA,SMA Confidence = (Sistem Informasi,IPS) Count
Negeri)/Jumlah Transaksi = 1/30. (Sistem Informasi,IPS) / Count Medan =1/9.
Support = (Sistem Informasi, Medan) Count Confidence = (Sistem Informasi,SMA
(Sistem Informasi, Medan)/Jumlah Swasta,IPS) Count (Sistem Informasi,SMA
Transaksi =1/30. Swasta,IPS) / Count Medan =1/9.
Support = (Sistem Informasi,SMA Swasta, Setelah didapat nilai support dan
IPS) Count(Sistem Informasi,SMA Swasta, confidence dari keseluruhan kombinasi
IPS)/Jumlah Transaksi = 1/30. pada data dengan perhitungan FP-Tree dan
Support = (Sistem Informasi,SMA FP-Growth maka didapat niai support dan
Swasta,Medan, IPS ) Count (Sistem confidence yang paling tinggi dan akurat
Informasi,SMA Swasta, Medan,IPS)/Jumlah yaitu kombinasi. (D1,C1,A3) { Sistem
Transaksi =1/30. Informasi, IPA, SMA Negeri } yang
Support = (SMA Negeri ,IPS ) Count (SMA mempunyai nilai support : 5/30 = 0,16 dan
Negeri ,IPS) / Jumlah Transaksi = 1/30. nilai confidence : 5/20 = 0.25.
Support = (SMA Negeri ,Medan,IPS ) Count
(SMA Negeri ,Medan,IPS) / Jumlah Transaksi
= 1/30. 5. IMPLEMENTASI SISTEM
Support = (IPA,SMA Negeri ,Medan ) Count
(IPA,SMA Negeri ,Medan) / Jumlah Untuk membuktikan kebenaran hasil
Transaksi = 1/30. analisa diperlukan sebuah proses pengujian
untuk menguji kebenaran dari hasil
Sedangkan untuk confidence atau pengolahan data yang dikerjakan secara
nilai kepercayaannya adalah sebagai manual pada BAB IV yang telah dikerjakan
berikut : sebelumnya, untuk proses pengujian
Confidence = (SMA Negeri,IPS) = Count tersebut kita dapat menggunakan salah
(SMA Negeri,IPS)/Count Medan= 1/9. satu software aplikasi seperti Rapidminer,
Confidence = (Sistem Informasi,SMA dengan langkah-langkah sebagai berikut:
Swasta,Medan,IPS) = Count (Sistem
Informasi,SMA Swasta,Medan,IPS /Count 1. Dataset yang terdiri 30 record data
Medan = 1/9. dan berisi variabel-variabel atribut Sistem
Informasi,IPA,SMA Negeri,SMA

Swasta,Medan, IPS disimpan dalam aplikasi

microsoft excel dengan nama file datauji.xls
dan yang akan dicoba menggunakan
software rapidminer 5.2 untuk melihat hasil
sama tidaknya dengan pencarian frequent
itemsetnya melalu :
Gambar 5.20 Rule valid jika nilai Lift

Ratio > 1
Lift Ratio adalah parameter penting

selain support dan confidence dalam
association rule. Lift Ratio mengukur
seberapa penting rule yang teleh terbentuk
berdasarkan nilai support dan confidence.
Gambar 5.1 Tampilan Import Excel Sheet Lift Ratio merupakan nilai yang
Gambar 5.1 adalah proses dari menunjukkan kevalidan proses transaksi
import data uji Xls ke dalam rapidminer dan memberikan informasi apakah benar
produk A dibeli bersamaan dengan produk
B.
Improvement Ratio dapat dihitung
dengan rumus
Support ( A B)
=
SupportA * SupportB
Untuk mencari nilai rule yang valid
adalah jika mempunyai nilai Lift Ratio > 1
dengan cara Support Lift Ratio = Support
yang mengandung nilai A dan nilai B dibagi
support A* Support B nilai support yang
Gambar 5.2 Proses menghubungkan FP- mengandung nilai A dan nilai B Adalah hasil
Growth ke ras pertama dan Create dari minimum support dibagi dengan item
Association Rules ke res kedua (D1,C1,A3) { Sistem Informasi, IPA, SMA
Negeri }Pada setiap kemunculan ditransaksi.
Pada Gamabar 5.2 dijelaskan =
tentang proses menghubungkan FP-Growth
5 / 30 0,16
ke ras Pertama dan Create Association Rules
20 / 30 *16 / 30 *12 / 30 0,66 * 0,53 * 0,4
ke ras kedua dan diatur pada minimum
support dan minimum confidencenya. 0,16
=1,1494
0,1392

Jadi dari hasil pencarian nilai Lift pemilihan atribut di dalam dataset
Ratio > 1 maka kita bisa menentukan sangat penting.
sebuah rule yang valid dari sekian 4. Algoritma FP-Growth dapat diterapkan
banyaknya rule yang dijalankan dengan untuk mendukung strategi promosi
software Rapidminer. pendidikan pada Perguruan Tinggi.
Adapun hasil dari rule yang paling Adapun Informasi yang berkaitan
mempangaruhi adalah: dengan pelaksanaan promosi dapat
tersedia dengan cepat, contohnya
Jika dia Asal sekolahnya SMA dalam pemilihan tempat yang akan
Swasta, Alamatnya Medan dan Asal dijadikan promosi pendidikan, sehingga
Jurusanya IPS maka dia memilih Prodi pihak manajemen dari kampus sendiri
Sistem Informasi dengan tingkat dapat melakukan pengambilan
kepercayaan 100% dan didukung 6% dari keputusan dengan cepat.
data keseluruhan. 5. Pelaksanaan promosi pendidikan pada
Hasil dari rule tersebut yang akan perguruan tinggi sangat dibantu dengan
dijadikan target dalam mempromosikan adanya penerapan algoritma FP-Growth
pendidikan. ini sehingga diharapkan efektifitas
pelaksanaan promosi pendidikan akan
6. SIMPULAN DAN SARAN dapat semakin ditingkatkan.
6. Untuk menemukan rule atau
6.1 Simpulan knowledge yang sangat berarti dalam
menganalisa strategi dalam
1. Metode dalam pencarian Frequent menentukan promosi pendidikan,
Itemsset pohon keputusan dibutuhkan banyak data sampel yang
menggunakan algoritma FP-Ggrowth digunakan untuk proses ekstraksi rule
bekerja sangat baik dalam melakukan atau knowledge tersebut.
Frequent Itemsset dengan proses
pembentukan FP-Tree dengan
menghasilkan rule dari data sampel 6.2 Saran
mahasiswa baru.
2. Penentuan data variabel sangat Salah satu tujuan penelitian ini adalah
menentukan tingkat akurasi FP-Growth agar teknik dalam menentukan strategi
yang dibuat dan besarnya presentase promosi pendidikan di Kampus STMIK
dalam menentukan minum support dan TRIGUNA DHARMA MEDAN dapat
minimum confidence dipengaruhi oleh diimplementasikan atau diterapkan dengan
data variabel yang digunakan untuk baik, untuk itu saran yang dapat
mencari frequent itemset yang saling diperhatikan untuk pengimplementasian
berhubungan untuk menemukan data dari teknik ini adalah:
variabel yang akan dijadikan stretegi
dalam promosi pendidikan. 1. Pada penelitian ini, penulis hanya
3. Dari penelitian yang dilakukan ada mencoba salah satu teknik dalam
beberapa atribut yang tidak digunakan menemukan hubungan beberapa item
dalam rule yang dihasilkan, sehingga yang digunakan untuk membentuk FP-
Tree dalam menentukan strategi

promosi pendidikan dengan Algoritma Association Rule Metode

menggunakan Algorima FP-Growth. Apriori (Studi Kasus Di Polsekta
Untuk menentukan stategi dalam Medan Sunggal). Informasi dan
promosi pendidikan yang baik dapat Teknologi Ilmiah (INTI), Vol : III No :
digunakan beberapa atau 1, 144-154.
penggabungan beberapa teknik yang
akan digabungkan dalam sistem RIRIANTI. 2014. Implementasi Algoritma FP-
pengambilan keputusan untuk GROWTH Pada Aplikasi Prediksi
menentukan stategi yang tepat dalam Persedian Sepeda Motor (Studi
menentukan stategi promosi pendidikan Kasus PT. Pilar Deli Labumas). Pelita
atau bisa juga menggunakan algoritma Informatika Budi Darma, Vol : VI No:
CT-Pro. Oleh sebab itu perlunya 1.
dilakukan penelitian lebih lanjut untuk
mendapatkan strategi promosi dan SENSUSE, G. G. D. D. I. 2012. Penerapan
menentukan teori mana yang Metode Data Mining Market Basket
menghasilkan strategi yang paling baik. Analysis Terhadap Data Penjualan
2. Untuk mendapatkan hasil promosi yang Produk Buku Dengan Menggunakan
baik sangat diperlukan sumber data Algoritma Apriori dan Frequent
yang yang lebih banyak dan lebih Pattern Growth (FP-GROWTH) :
lengkap. Studi Kasus Percetakan PT.
3. Untuk mengimplementasikan rule yang GRAMEDIA. Jurnal TELEMATIKA
dihasilkan dari teknik dari algoritma FP- MKOM, Vol.4 No.1, 118-132.
Growth dapat berkonsultasi dengan tim
marketing yang ada di kampus tersebut. KUSRINI dan EMHA TAUFIQ LUTHFI. 2009.
Sehingga dengan adanya hubungan Algoritma Data Minning. Jakarta :
algoritma FP-Growth dengan pihak Andi. 10
manajemen dapat mengembangkan
strategi dalam promosi pendidikan
sehingga pihak kampus akan lebih maju
lagi kedepannya.
7. DAFTAR PUSTAKA
BUULOLO, E. 2013. Implementasi Algoritma

Apriori Pada Sistem Persediaan Obat
(Studi Kasus : Apotik
Rumah Sakit Estomihi Medan). Pelita

Informatika Budi Darma, Vol : IV No:
1, 71-83.
FADLINA. 2014. Data Mining Untuk Analisa

Tingkat Kejahatan Jalanan Dengan

Algoritma FP Growth

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Algoritma FP Growth

Diunggah oleh

Hak Cipta:

Format Tersedia

ISSN : 1978-6603

Penerapan Data Mining dengan Algoritma Fp-Growth untuk Mendukung

Ali Ikhwan*1, Dicky Nofriansyah#2, Sriani#3

Kata Kunci : Data Mining,Association Rules,Frequent Itemset,FP-Growth.

Keywords: Data Mining,Association Rules,Frequent Itemset,FP-Growth.

1. PENDAAHULUAN teknik analisa yang dapat digolongkan

Jurnal SAINTIKOM Vol.14, No. 3, September 2015 212

1.3 Batasan Masalah 1.5 Manfaat Penelitian

penulis mencoba memberikan 1. Mengetahui algoritma FP-Growth dapat

213 Jurnal SAINTIKOM Vol.14, No. 3, September 2015

c. Transformation 2.3 Tahapan dalam Data Mining

Jurnal SAINTIKOM Vol.14, No. 3, September 2015 214

4. Tahap ke-empat : Deployment Prediksi hampir sama dengan klasifikasi

215 Jurnal SAINTIKOM Vol.14, No. 3, September 2015

a. Mendapatkan kelompok-kelompok kombinasi item tersebut dalam database

Jurnal SAINTIKOM Vol.14, No. 3, September 2015 216

a. Mengembalikan data yang tidak yang memungkinkan dengan kemungkinan

217 Jurnal SAINTIKOM Vol.14, No. 3, September 2015

2. 6 Algoritma FP-Growth 3.2 Kerangka Kerja

(Sensuse, 2012)FP-growth adalah Dalam metodologi penelitian ada

3. METODOLOGI PENELITIAN Menganalisis Data

Jurnal SAINTIKOM Vol.14, No. 3, September 2015 218

ditengah ketatnya persaingan antar Literatur-literatur yang dipakai

219 Jurnal SAINTIKOM Vol.14, No. 3, September 2015

mining yang sudah ada. Tools yang menentukan strategi dalam

Jurnal SAINTIKOM Vol.14, No. 3, September 2015 220

06: bangun = a1 dengan support = a1 9 D1,C1,A3

221 Jurnal SAINTIKOM Vol.14, No. 3, September 2015

B1=1 Gambar 4.4 Lintasan yang Mengandung

Gambar 4.2 : Hasil Pembentukan FP-tree

Gambar 4.6 Lintasan yang Mengandung

Jurnal SAINTIKOM Vol.14, No. 3, September 2015 222

A3 {A3},{A3,C1},{A3,C1,D1} Confidence = (SMA Negeri,Medan,IPS)

223 Jurnal SAINTIKOM Vol.14, No. 3, September 2015

Swasta,Medan, IPS disimpan dalam aplikasi

Gambar 5.20 Rule valid jika nilai Lift

Lift Ratio adalah parameter penting

Jurnal SAINTIKOM Vol.14, No. 3, September 2015 224

225 Jurnal SAINTIKOM Vol.14, No. 3, September 2015

promosi pendidikan dengan Algoritma Association Rule Metode

BUULOLO, E. 2013. Implementasi Algoritma

Rumah Sakit Estomihi Medan). Pelita

FADLINA. 2014. Data Mining Untuk Analisa

Jurnal SAINTIKOM Vol.14, No. 3, September 2015 226

Anda mungkin juga menyukai