Disusun oleh :
Achmad Khusyaini
M0513001
SURAKARTA
2018
UNIVERSITAS SEBELAS MARET
PROGRAM STUDI INFORMATIKA
PERSETUJUAN PEMBIMBING
Proposal Tugas Akhir ini telah disetujui oleh :
Pembimbing I
1. PENDAHULUAN
I. Latar Belakang
Data mining merupakan proses mancari pola atau informasi menarik
dalam data yang terpilih dengan menggunakan teknik atau metode tertentu.
Analisis asosiasi atau association rule mining adalah teknik data mining untuk
menemukan aturan asosiatif antara suatu kombinasi item. Analisis asosiasi
dikenal juga sebagai salah satu teknik data mining yang menjadi dasar dari salah
satu teknik data mining lainnya (Han J et al., 2012). Algoritma apriori adalah
algoritma untuk menemukan pola frequent itemsets pada aturan asosiasi.
Langkah utama pada algoritma apriori adalah : pertama, mencari frequent
itemset (himpunan item-item yang memenuhi minimum support) dari database
transaksi, kedua menghilangkan itemset dengan frekuensi yang rendah
berdasarkan level minimum support yang telah ditentukan sebelumnya.
Selanjutnya membangun aturan asosiasi dari itemset yang memenuhi nilai
minimum confidence dalam database (Srikant R and Agrawal R, 1994).
Masalah utama penerapan metode konvensional pada association rule
menggunakan algoritma apriori yaitu (Seyed Abbas Mahmoodi et al., 2016) :
1) Memproduksi banyak rule, sehingga proses penelusuran informasi
menjadi sulit dalam cakupan rule yang menjadi luas.
2) Memproduksi sejumlah rule yang tidak menarik dalam jumlah tinggi
sehingga menghasilkan rule yang tidak berarti.
3) Proses running time yang lama. Jika database yang digunakan dalam
jumlah besar dan bervariasi maka memerlukan waktu yang lama untuk
proses menjalankan algoritmanya.
Teknologi untuk meningkatkan hasil penelusuran informasi dari
metode association rule salah satunya menggunakan teknologi semantic web
yang menerapkan basis pengetahuan (knowledge base) dalam bentuk
ontology. Bahwa dengan menggunakan domain ontology memiliki dampak
positif untuk mendukung association rule, yaitu dapat melakukan pemangkasan
pada rule yang tidak menarik (Inhaúma Neves Ferraz and Ana Cristina Bicharra
Garcia, 2013). Dengan menggunakan ontology dapat meningkatkan proses
knowledge discovery pada association rule (Svátek et al., 2006). Ontology
digunakan untuk mendukung proses integrasi data miniing, yaitu
menggabungkan domain knowledge ke dalam proses data mining (Pan et al.,
2006). Pendekatan hierarki ontology dapat menyederhanakan seluruh komponen
data ke bentuk tingkatan-tingkatan tertentu sehingga dapat dipahami secara
komprehensif. Kemudian data diklasifikasikan sesuai kategorinya sehingga
memudahkan penelusuran informasi pada dataset.
Semantic Web merupakan suatu pendekatan yang dikembangkan
khusus pada teknologi World Wide Web (WWW) yang bertujuan untuk
memperkaya informasi yang diberikan sehingga menjadi lebih baik dalam
pendefinisiannya. Semantic Web memungkinkan suatu web menjadi lebih
cerdas dikarenakan memiliki basis pengetahuan (knowledge base)
didalamnya dalam bentuk ontology. Dalam teknologi semantic web,
ontology berperan sebagai inti (core technology) sehingga dapat disebut
sebagai semantic web ontology (T. Berners-Lee et al., 2001). Ontology adalah
sekumpulan istilah terstruktur secara hierarki untuk menjelaskan sebuah domain
yang dapat digunakan sebagai kerangka dasar sebuah knowledge base (Swartout
B et al., 1997).
Pengembangan knowledge base dari konstruksi ontology bertujuan
untuk menangkap pengetahuan menjadi format yang dapat digunakan dalam
sistem. Selanjutnya mempopulasikan knowledge base sehingga mendapatkan
instance – instance untuk mengisi knowledge base. Manfaat ontology adalah
menjelaskan suatu domain pengetahuan secara eksplisit; memberikan
struktur hierarki dari konsep untuk menjelaskan sebuah domain dan
bagaimana mereka berhubungan (Seyed Abbas Mahmoodi et al., 2016).
Pada penelitian ini mempertimbangkan adanya kekurangan pada
penerapan metode konvensional association rule menggunakan algoritma apriori
dan kelebihan ontology maka diperlukan suatu penggabungan, yaitu association
rule dengan ontology. Penggunaan ontology ini diharapkan memberikan solusi
untuk masalah metode konvensional association rule, yaitu : pada masalah
memproduksi banyak rule dan memproduksi sejumlah rule yang tidak menarik
dalam jumlah tinggi.
V. Manfaat Penelitian
Manfaat dari penelitian ini adalah memperkaya kajian ontology dalam
pengolahan data association rule.
2. TINJAUAN PUSTAKA
L1 = {large 1-itemsets};
for ( k = 2; Lk-1<=ϕ ; k++ ) do
begin
Ck=apriori - gen(Lk-1);
// kandidat baru
forall transactions t ∈ D do
begin
Ct = subset(Ck, t);
// kandidat yang ada dalam t
forall candidates c ∈ Ct do
c.count++;
end
2.1.5 Ontology
Ontology merupakan suatu teori tentang makna dari suatu obyek,
properti dari satu objek, serta relasi objek tersebut yang mungkin terjadi
pada suatu domain pengetahuan. Ontology membuka kemungkinan untuk
berpindah dari pandangan berorientasi dokumen, ke arah pengetahuan yang
saling terkait, dikombinasikan dan dikelola untuk digunakan dikemudian hari
(Nava’atul Fadillah et al., 2010). Definisi lain mengenai ontology adalah
sekumpulan istilah terstruktur secara hierarki untuk menjelaskan sebuah
domain yang dapat digunakan sebagai kerangka dasar sebuah knowledge base
(Swartout B et al., 1997). Ontology memiliki beberapa komponen yang dapat
menjelaskan ontology tersebut, yaitu :
Instance atau individual digunakan untuk merepresentasikan elemen
pada suatu domain
Class merupakan titik pusat ontology. Class menjelaskan sebuah
konsep dalam suatu domain yang terdiri dari beberapa instance atau
individual. Class juga dikenal sebagai concept, object, dan categories.
Properties atau slot terdiri dari dua jenis, yaitu object properties dan
datatype properties. Object properties akan menghubungkan instance
dengan instance sedangkan datatype properties akan menghubungkan
instance dengan datatype value seperti text string atau number.
(Matthew Horridge et al., 2004)
Tahap pengembangan ontology terdiri dari beberapa tahap, yaitu (Noy and
McGuinness, 2001) :
1. Menentukan domain dan ruang lingkup ontology .
2. Mempertimbangkan kemungkinan penggunaan ontology yang sudah ada.
3. Menentukan daftar terminologi-terminologi yang penting dalam ontology.
4. Mendefinisikan class dan hierarkinya.
5. Mendefinisikan property dari class (slot).
6. Mendefinisikan batasan (facet) dari slot.
7. Membuat instance-instance
Beberapa penelitian yang pernah dilakukan mengenai keterkaitannya terhadap penelitian ini ditampilkan pada Tabel 2.1.
1 Ontology in Association (Inhaúma Neves Masalah pada Tujuan penelitian ini SemPrune Pada penelitian ini bahwa dengan Penelitian ini
Rules Ferraz and Ana penelitian ini mengidentifikasikan menggunakan domain ontology memberikan informasi
Cristina Bicharra mengenai hubungan antar item memiliki dampak positif untuk bahwa dengan
Garcia, 2013) identifikasi melalui model mendukung association rule. menggunakan
hubungan antar item SemPrune yang ontology dapat
melalui model dibangun dengan Hal ini dapat mengantisipasi adanya mendukung hasil
SemPrune yang ontology. data yang ambigu, mengurangi hasil kinerja association
dibangun dengan rule sehingga lebih akurat rule.
ontology.
2 Ontology-Enhanced (Svátek et al., Masalah pada Tujuan pada Knowledge Pada penelitian ini menemukan Penelitian ini
Association Mining 2006) penelitian ini penelitian ini Discovery (KDD) beragam hasil koleksi entri ontology memberikan informasi
mengenai bagaimana menyajikan metode pada proses KDD. Pengujian bahwa metode KDD
cara penelusuran KDD untuk Association rule dilakukan pada 2 domain, yaitu dapat meningkatkan
data ontologi melalui melakukan bidang medis dan sosiologi. hasil proses
KDD. peningkatan proses association rule pada
mining pada hasil data ontology.
data ontology.
3 A New Algorithm to Extract (Seyed Abbas Masalah pada Tujuan penelitian ini Algoritma Apriori Pada penelitian ini menggabungkan Penelitian ini
Hidden Rules of Gastric Mahmoodi et al., penelitian ini menyajikan metode algoritma apriori dan konsep ontology memberikan informasi
Cancer Data Based on 2016) mengenai algoritma baru untuk dari faktor resiko penyakit kanker. bahwa kinerja konsep
Ontology untuk menggali menemukan aturan ontology pada
informasi tentang asosiasi Hasil pengujian yang diperoleh association rule
penyakit kanker menggunakan dengan database menunjukkan bahwa menghasilkan rule
berdasarkan ontology yang prediksi model sesuai tujuan yang yang terbaik dan
ontology. berkaiatan dengan diinginkan yaitu menghasilkan aturan dalam jumlah sedikit.
penyakit kanker. -aturan terbaik.
Penerapan metode menggabungkan
algoritma apriori dan konsep ontology
memberikan dampak baik dalam hasil
pencarian rule semakin akurat,
berbeda dengan hasil menggunakan
algoritma apriori saja.
4 Enhanced Way of (T.Bharathi and Dr. Masalah pada Tujuan penelitian ini Association rule Hasil pada penelitian ini bahwa Penelitian ini
Association Rule Mining A.Nithya, 2016) penelitian ini menyajikan metode mining with metode yang diusulkan lebih efisien memberikan informasi
With Ontology mengenai bagaimana untuk optimasi hasil ontology dibandingkan dengan metode mengenai kinerja dan
penerapan domain association Rule (ARMO). association rule lainnya. Jumlah rule langkah – langkah
ontology dapat dengan menerapkan yang dihasilkan bisa dikurangi perhitungan konsep
mengurangi hasil domain ontology meskipun pada jumlah dataset yang ontology dapat
association rule pada pada dataset yang besar. mendukung hasil
dataset besar melalui diuji. Association rule.
association rule
mining with
ontology (ARMO).
5 Ontology-based Urban Data (Booma Masalah pada Tujuan penelitian ini Algoritma apriori Hasil pada penelitian ini bahwa Penelitian ini
Exploration Sowkarthiga penelitian ini menyajikan metode metode yang diusulkan dapat memberikan informasi
Balasubramani et mengenai bagaimana untuk mengurangi mengurangi hasil rule yang dihasilkan mengenai kinerja
al., 2016) peran domain rule hasil ARM pada dari proses association rule mining konsep ontology (
ontology pada dataset administrasi pada jumlah dataset yang besar. Filter & Pruning )
Association Rule kota dalam jumlah dapat mendukung
Mining ( ARM ) besar. hasil association rule.
dalam mengurangi
hasil rule.
6 Incorporating Domain (Pan et al., 2006) Masalah pada Tujuan pada C-DM Process Implementasi proses DM ( Data Penelitian ini
Knowledge into Data penelitian ini penelitian ini Model Mining ) telah menarik minat dari memberikan informasi
Mining Process: An mengenai bagaimana melakukan berbagai industri. Pada penelitian ini bahwa metode C- DM
Ontology Based Framework implementasi pengelompokan data mengusulkan sebuah model data dapat
knowledge base pada mining berdasarkan mining baru dan kerangka kerja mengelompokkan
data mining ontology. berdasarkan ontology. Model ini proses ( sub proses &
berdasarkan berupaya memisahkan sub-proses kompleks ) pada data
ontology. mining otonom dari proses DM
kompleks, dan menggabungkan hasil mining.
mining.
Berdasarkan penelitian terkait tersebut menunjukkan bahwa penelitian sebelumnya menggunakan ontology pada proses association rule dapat
mengurangi hasil rule dan meningkatkan hasil penggalian informasi. Pada metode Association Rule Mining with Ontology (ARMO) proses pembentukan rule
mempertimbangkan perhitungan nilai IR ( Interesting Rules ) dan perhitungan nilai IR ini dapat dikembangkan lagi berdasarkan knowledge base yang
dibangun dari pemodelan ontology.
BAB III
METODOLOGI PENELITIAN
Pengumpulan Data
Data Preprocessing
Development Ontology
Keterangan :
A adalah banyaknya itemset A
Trans(A) adalah jumlah transaksi dari itemset A
B adalah banyaknya itemset B
Trans(B) adalah jumlah transaksi dari itemset B
Trans(A,B) adalah jumlah transaksi dari itemset A dan B
Total_trans adalah jumlah total transaksi dalam database
[ Trans (A , B)
Total trans
3.5 Experimental
Pada tahap ini dilakukan pengujian association rule dengan kriteria
menggunakan association rule tanpa ontology dan association rule dengan
ontology. Pengujian dilakukan pada data mahasiswa, data world bank, dan data
IMDB dengan variasi jumlah data sebesar 250, 500, 750, dan 1000 data.
Perbandingan jumlah rule yang dihasilkan masing – masing variasi jumlah data
dapat dilihat pada tabel 3.1, tabel 3.2, dan tabel 3.3.
250
500
750
1000
Tabel 3.2. Jumlah rule yang dihasilkan pada data world bank
250
500
750
1000
250
500
750
1000
Tabel 3.4. Jumlah rule yang dihasilkan pada data sebesar 1000
Data
Mahasiswa
World
Bank
IMDB
Waktu
Maret-
No. Aktivitas April-2018 Mei-2018 Juni-2018
2018
1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4
1 Pengumpulan Data
2 Data Preprocessing
3 Development Ontology
4 Implementasi
Association Rule
dengan Ontology
5 Experimental
6 Analisis dan Penarikan
Kesimpulan
7 Penyusunan Laporan
DAFTAR PUSTAKA