Anda di halaman 1dari 23

PROPOSAL TUGAS AKHIR

PEMANFAATAN ONTOLOGY UNTUK MENDUKUNG

HASIL ASSOCIATION RULE

Disusun oleh :

Achmad Khusyaini

M0513001

PROGRAM STUDI INFORMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS SEBELAS MARET

SURAKARTA

2018
UNIVERSITAS SEBELAS MARET
PROGRAM STUDI INFORMATIKA

PROPOSAL TUGAS AKHIR

Nama : Achmad Khusyaini


NIM : M0513001

PERSETUJUAN PEMBIMBING
Proposal Tugas Akhir ini telah disetujui oleh :

Pembimbing I

Dr. Techn. Dewi Wisnu Wardani, S.Kom, M.S.


NIP. 197810262005012002
BAB I

1. PENDAHULUAN

I. Latar Belakang
Data mining merupakan proses mancari pola atau informasi menarik
dalam data yang terpilih dengan menggunakan teknik atau metode tertentu.
Analisis asosiasi atau association rule mining adalah teknik data mining untuk
menemukan aturan asosiatif antara suatu kombinasi item. Analisis asosiasi
dikenal juga sebagai salah satu teknik data mining yang menjadi dasar dari salah
satu teknik data mining lainnya (Han J et al., 2012). Algoritma apriori adalah
algoritma untuk menemukan pola frequent itemsets pada aturan asosiasi.
Langkah utama pada algoritma apriori adalah : pertama, mencari frequent
itemset (himpunan item-item yang memenuhi minimum support) dari database
transaksi, kedua menghilangkan itemset dengan frekuensi yang rendah
berdasarkan level minimum support yang telah ditentukan sebelumnya.
Selanjutnya membangun aturan asosiasi dari itemset yang memenuhi nilai
minimum confidence dalam database (Srikant R and Agrawal R, 1994).
Masalah utama penerapan metode konvensional pada association rule
menggunakan algoritma apriori yaitu (Seyed Abbas Mahmoodi et al., 2016) :
1) Memproduksi banyak rule, sehingga proses penelusuran informasi
menjadi sulit dalam cakupan rule yang menjadi luas.
2) Memproduksi sejumlah rule yang tidak menarik dalam jumlah tinggi
sehingga menghasilkan rule yang tidak berarti.
3) Proses running time yang lama. Jika database yang digunakan dalam
jumlah besar dan bervariasi maka memerlukan waktu yang lama untuk
proses menjalankan algoritmanya.
Teknologi untuk meningkatkan hasil penelusuran informasi dari
metode association rule salah satunya menggunakan teknologi semantic web
yang menerapkan basis pengetahuan (knowledge base) dalam bentuk
ontology. Bahwa dengan menggunakan domain ontology memiliki dampak
positif untuk mendukung association rule, yaitu dapat melakukan pemangkasan
pada rule yang tidak menarik (Inhaúma Neves Ferraz and Ana Cristina Bicharra
Garcia, 2013). Dengan menggunakan ontology dapat meningkatkan proses
knowledge discovery pada association rule (Svátek et al., 2006). Ontology
digunakan untuk mendukung proses integrasi data miniing, yaitu
menggabungkan domain knowledge ke dalam proses data mining (Pan et al.,
2006). Pendekatan hierarki ontology dapat menyederhanakan seluruh komponen
data ke bentuk tingkatan-tingkatan tertentu sehingga dapat dipahami secara
komprehensif. Kemudian data diklasifikasikan sesuai kategorinya sehingga
memudahkan penelusuran informasi pada dataset.
Semantic Web merupakan suatu pendekatan yang dikembangkan
khusus pada teknologi World Wide Web (WWW) yang bertujuan untuk
memperkaya informasi yang diberikan sehingga menjadi lebih baik dalam
pendefinisiannya. Semantic Web memungkinkan suatu web menjadi lebih
cerdas dikarenakan memiliki basis pengetahuan (knowledge base)
didalamnya dalam bentuk ontology. Dalam teknologi semantic web,
ontology berperan sebagai inti (core technology) sehingga dapat disebut
sebagai semantic web ontology (T. Berners-Lee et al., 2001). Ontology adalah
sekumpulan istilah terstruktur secara hierarki untuk menjelaskan sebuah domain
yang dapat digunakan sebagai kerangka dasar sebuah knowledge base (Swartout
B et al., 1997).
Pengembangan knowledge base dari konstruksi ontology bertujuan
untuk menangkap pengetahuan menjadi format yang dapat digunakan dalam
sistem. Selanjutnya mempopulasikan knowledge base sehingga mendapatkan
instance – instance untuk mengisi knowledge base. Manfaat ontology adalah
menjelaskan suatu domain pengetahuan secara eksplisit; memberikan
struktur hierarki dari konsep untuk menjelaskan sebuah domain dan
bagaimana mereka berhubungan (Seyed Abbas Mahmoodi et al., 2016).
Pada penelitian ini mempertimbangkan adanya kekurangan pada
penerapan metode konvensional association rule menggunakan algoritma apriori
dan kelebihan ontology maka diperlukan suatu penggabungan, yaitu association
rule dengan ontology. Penggunaan ontology ini diharapkan memberikan solusi
untuk masalah metode konvensional association rule, yaitu : pada masalah
memproduksi banyak rule dan memproduksi sejumlah rule yang tidak menarik
dalam jumlah tinggi.

II. Rumusan Masalah


Berdasarkan latar belakang yang telah diuraikan di atas, maka
permasalahan pada penelitian ini dapat dirumuskan sebagai berikut :
Bagaimana pemanfaatan ontology untuk meningkatkan hasil association rule ?

III. Batasan Masalah


Batasan masalah yang digunakan dalam penelitian ini yaitu :
algoritma association rule yang digunakan adalah apriori dan ontology yang
digunakan adalah pendekatan hierarki ontology.

IV. Tujuan Penelitian


Tujuan dari penelitian ini adalah mengkaji pemanfaatan ontology
untuk meningkatkan hasil association rule.

V. Manfaat Penelitian
Manfaat dari penelitian ini adalah memperkaya kajian ontology dalam
pengolahan data association rule.

VI. Sistematika Penulisan


Sistematika penulisan proposal penelitian ini pada bab 1 pendahuluan
membahas mengenai latar belakang masalah, rumusan masalah, batasan
masalah, tujuan, manfaat, dan sistematika penulisan. Kemudian pada bab 2
tinjauan pustaka berisi tentang teori-teori yang dijadikan sebagai landasan dalam
penelitian. Lalu pada bab 3 metodologi penelitian membahas mengenai langkah
– langkah atau metode yang digunakan untuk menyelesaikan masalah yang
diambil dalam penelitian meliputi : pengumpulan data, data preprocessing,
development ontology, implementasi association rule dengan ontology,
experimental, analisis dan penarikan kesimpulan.
BAB II

2. TINJAUAN PUSTAKA

2.1 Dasar Teori


2.1.1 Data Mining
Data mining merupakan proses ekstraksi informasi atau pola yang
penting dalam database yang berukuran besar (Han J, Kamber M, 2001).
Data mining merupakan bagian dari proses Knowledge Discovery in
Databases (KDD). Berikut adalah tahapan - tahapan pada proses
Knowledge Discovery in Databases (KDD) :
1. Pembersihan data
Pembersihan data dilakukan untuk membuang noise dan data yang
tidak konsisten.
2. Integrasi data
Integrasi data merupakan tahapan penggabungan data dari beberapa
sumber.
3. Seleksi data
Seleksi data adalah tahap pengambilan data yang relevan dengan proses
analisis dari database.
4. Transformasi data
Pada tahap ini data diubah menjadi bentuk yang sesuai untuk di mining
dengan cara dilakukan peringkasan atau operasi agregasi.
5. Aplikasi teknik data mining
Data mining merupakan proses yang penting dalam KDD dimana
metode - metode data mining diaplikasikan untuk mengekstrak pola -
pola dari kumpulan data.
6. Evaluasi pola - pola yang ditemukan
Evaluasi pola dilakukan untuk mengidentifikasi pola - pola tertentu
yang menarik atau bernilai yang mempresentasikan pengetahuan
berdasarkan suatu ukuran kemenarikan.
7. Representasi pengetahuan
Dengan teknik visualisasi pengetahuan yang sudah digali dapat
direpresentasikan kepada pengguna.

2.1.2 Association Rule


Association rule merupakan teknik data mining yang digunakan
untuk menemukan aturan assosiatif antara kombinasi item (Efori Buulolo,
2013). Analisis asosiasi dikenal sebagai salah satu teknik data mining yang
menjadi dasar dari berbagai teknik data mining lainnya. Khususnya salah satu
tahap dari analisis asosiasi yang disebut analisis pola frekuensi tinggi
(frequent pattern mining) yaitu mencari kombinasi item yang memenuhi
syarat minimum dari nilai support dalam database (M.Ikhsan et al., 2011).
Contoh algoritma yang menerapkan association rule antara lain : apriori, FP
– Growth, dan CT-Pro.

Metodologi dasar analisis asosiasi terbagi menjadi dua tahap :


1. Analisis pola frekuensi tinggi
Tahap ini mencari kombinasi item yang memenuhi syarat minimum
dari nilai support dalam database. Support merupakan nilai ukuran
kombinasi item dalam database. Nilai support sebuah item diperoleh
dengan rumus berikut:
Jumla hTransaksi Mengandung A
Support(A) =
Total Transaksi
Sedangkan nilai dari support 2 item diperoleh dari rumus berikut :
Support(A,B) = P(A | B)
Jumla hTransaksi Mengandung A dan B
=
Tota lTransaksi

2. Pembentukan aturan assosiatif


Setelah semua pola frekuensi tinggi ditemukan, barulah dicari
aturan assosiatif yang memenuhi syarat minimum untuk confidence
dengan menghitung confidence aturan assosiatif A  B. Confidence
merupakan nilai kepastian / kuatnya hubungan antar item dalam aturan
assosiatif.
Nilai confidence dari aturan A  B diperoleh dari rumus berikut :
Jumla hTransaksi Mengandung A dan B
Confidence P(B|A) =
Total Transaks i Mengandung A

2.1.3 Algoritma Apriori


Algoritma apriori merupakan algoritma yang dikenal untuk
menemukan pola frekuensi tinggi. Algoritma apriori digunakan untuk
mencari frequent itemset yang memenuhi minimum support kemudian
mendapatkan rule yang memenuhi minimum confidence dari frequent
itemset tadi (Nugroho Wandi et al., 2012).
Pseudocode dari algoritma apriori (Srikant R and Agrawal R, 1994)
adalah sebagai berikut :

L1 = {large 1-itemsets};
for ( k = 2; Lk-1<=ϕ ; k++ ) do
begin
Ck=apriori - gen(Lk-1);
// kandidat baru

forall transactions t ∈ D do
begin
Ct = subset(Ck, t);
// kandidat yang ada dalam t

forall candidates c ∈ Ct do
c.count++;
end

Lk={c ∈ Ck | c.count ≥ minsup}


//semua kandidat pada Ck dengan minimum
support
end
Answer =Uk Lk ;
2.1.4 Semantic Web
Semantic Web merupakan suatu pendekatan yang dikembangkan
khusus pada teknologi World Wide Web (WWW) yang bertujuan untuk
memperkaya informasi yang diberikan sehingga menjadi lebih baik dalam
pendefinisiannya. Semantic Web memungkinkan suatu web menjadi lebih
cerdas dikarenakan memiliki basis pengetahuan (knowledge base)
didalamnya dalam bentuk ontology. Dalam teknologi semantic web,
ontology berperan sebagai inti (core technology) sehingga dapat disebut
sebagai semantic web ontology (T. Berners-Lee et al., 2001). Model arsitektur
semantic web dapat dilihat pada gambar 2.1

Gambar 2.1. Model arsitektur semantic web


(Tim Berners-Lee, 2001)
Lapisan/layer pertama yaitu URI (Uniform Resource Identifier)
dan Unicode merupakan fitur penting dari sebuah web. URI merupakan
standard untuk lokasi dan identitas suatu sumber daya web (web resource).
Sedangkan Unicode merupakan standar pengkodean set karakter internasional
yang memungkinkan semua bahasa manusia dapat digunakan didalam web
menggunakan satu bentuk standar dari URI.
Lapisan kedua yaitu XML (Extensible Markup Language). XML
merupakan sintaks yang umum digunakan dalam web terutama semantic
web. XML merupakan bahasa markup untuk dokumen yang berisi informasi
yang terstruktur.
Lapisan selanjutnya yaitu RDF (Resource Description Framework)
yang merupakan format representasi data untuk semantic web. RDF
merupakan framework yang berbentuk graph untuk merepresentasikan dan
mendeskripsikan informasi pada sumber daya web (web resource).
Lapisan berikutnya yaitu OWL (Ontology Web Language) yang
merupakan bahasa ontologi yang direkomendasikan oleh W3C. OWL
merupakan bahasa yang lebih kaya dan kompleks untuk mendeskripsikan
resource. Untuk melakukan query data RDF dan OWL maka hadirlah
SPARQL (SPARQL Protocol and RDF Query Language). Query diperlukan
untuk mengambil informasi untuk semantic web.
Lapisan-lapisan berikutnya yaitu logic, proof dan trust. Lapisan
logic merupakan aturan / rule dan sistem untuk melakukan penalaran pada
ontologi, lapisan proof mengeksekusi aturan dan mengevaluasi bersama-
sama dengan mekanisme lapisan trust untuk mempercayai bukti yang
diberikan pada aplikasi atau tidak. Untuk masukan yang terpercaya, kriptografi
perlu digunakan, seperti tanda tangan digital (digital signature) untuk verifikasi
asal-usul sumber data. Dan lapisan teratas yaitu user interface & application
agar memungkinkan manusia dalam menggunakan aplikasi semantic web.

2.1.5 Ontology
Ontology merupakan suatu teori tentang makna dari suatu obyek,
properti dari satu objek, serta relasi objek tersebut yang mungkin terjadi
pada suatu domain pengetahuan. Ontology membuka kemungkinan untuk
berpindah dari pandangan berorientasi dokumen, ke arah pengetahuan yang
saling terkait, dikombinasikan dan dikelola untuk digunakan dikemudian hari
(Nava’atul Fadillah et al., 2010). Definisi lain mengenai ontology adalah
sekumpulan istilah terstruktur secara hierarki untuk menjelaskan sebuah
domain yang dapat digunakan sebagai kerangka dasar sebuah knowledge base
(Swartout B et al., 1997). Ontology memiliki beberapa komponen yang dapat
menjelaskan ontology tersebut, yaitu :
 Instance atau individual digunakan untuk merepresentasikan elemen
pada suatu domain
 Class merupakan titik pusat ontology. Class menjelaskan sebuah
konsep dalam suatu domain yang terdiri dari beberapa instance atau
individual. Class juga dikenal sebagai concept, object, dan categories.
 Properties atau slot terdiri dari dua jenis, yaitu object properties dan
datatype properties. Object properties akan menghubungkan instance
dengan instance sedangkan datatype properties akan menghubungkan
instance dengan datatype value seperti text string atau number.
(Matthew Horridge et al., 2004)

Tahap pengembangan ontology terdiri dari beberapa tahap, yaitu (Noy and
McGuinness, 2001) :
1. Menentukan domain dan ruang lingkup ontology .
2. Mempertimbangkan kemungkinan penggunaan ontology yang sudah ada.
3. Menentukan daftar terminologi-terminologi yang penting dalam ontology.
4. Mendefinisikan class dan hierarkinya.
5. Mendefinisikan property dari class (slot).
6. Mendefinisikan batasan (facet) dari slot.
7. Membuat instance-instance

Manfaat ontology adalah menjelaskan suatu domain pengetahuan


secara eksplisit; memberikan struktur hierarki dari konsep untuk
menjelaskan sebuah domain dan bagaimana mereka berhubungan (Seyed
Abbas Mahmoodi et al., 2016).

2.1.6 Knowledge Base


Secara umum, knowledge base merupakan suatu bentuk basis data
tertentu yang digunakan dalam manajemen pengetahuan. Knowledge base
menyimpan pengetahuan yang terdiri dari dua elemen dasar. Elemen dasar
pertama adalah fakta, yang dalam hal ini merupakan situasi, kondisi, dan
kenyataan dari permasalahan. Yang kedua adalah spesial heuristik yang
merupakan informasi mengenai cara untuk membangkitkan fakta baru dari fakta
yang sudah diketahui. Dalam sistem berbasis aturan ( rule-based system ),
elemen kedua ini berupa kaidah atau aturan ( rule ) (Hersatoto Listiyono, 2008).
Pengetahuan (knowledge) adalah rangkaian dari informasi dan data
yang membentuk jaringan semantik. Pengetahuan berbeda dengan data ataupun
informasi. Data merupakan representasi dari fakta yang dimodelkan dalam
bentuk gambar, kata, dan/atau angka. Informasi adalah rangkaian data yang
mempunyai sifat sementara, tergantung dengan waktu, dan mampu memberi
kejutan pada penerimanya. Jadi dapat disimpulkan bahwa informasi adalah data
yang disertai makna dan penjelasannya, sedangkan pengetahuan adalah
informasi ditambah hasil pengolahan kesimpulan (Smith P, 1997).
2.2 Penelitian Terkait

Beberapa penelitian yang pernah dilakukan mengenai keterkaitannya terhadap penelitian ini ditampilkan pada Tabel 2.1.

Tabel 2.1 Penelitian Terkait dengan Penelitian Penulis


NO JUDUL JURNAL REFERENSI MASALAH TUJUAN METODE HASIL KETERKAITAN

1 Ontology in Association (Inhaúma Neves Masalah pada Tujuan penelitian ini SemPrune Pada penelitian ini bahwa dengan Penelitian ini
Rules Ferraz and Ana penelitian ini mengidentifikasikan menggunakan domain ontology memberikan informasi
Cristina Bicharra mengenai hubungan antar item memiliki dampak positif untuk bahwa dengan
Garcia, 2013) identifikasi melalui model mendukung association rule. menggunakan
hubungan antar item SemPrune yang ontology dapat
melalui model dibangun dengan Hal ini dapat mengantisipasi adanya mendukung hasil
SemPrune yang ontology. data yang ambigu, mengurangi hasil kinerja association
dibangun dengan rule sehingga lebih akurat rule.
ontology.

2 Ontology-Enhanced (Svátek et al., Masalah pada Tujuan pada Knowledge Pada penelitian ini menemukan Penelitian ini
Association Mining 2006) penelitian ini penelitian ini Discovery (KDD) beragam hasil koleksi entri ontology memberikan informasi
mengenai bagaimana menyajikan metode pada proses KDD. Pengujian bahwa metode KDD
cara penelusuran KDD untuk Association rule dilakukan pada 2 domain, yaitu dapat meningkatkan
data ontologi melalui melakukan bidang medis dan sosiologi. hasil proses
KDD. peningkatan proses association rule pada
mining pada hasil data ontology.
data ontology.

3 A New Algorithm to Extract (Seyed Abbas Masalah pada Tujuan penelitian ini Algoritma Apriori Pada penelitian ini menggabungkan Penelitian ini
Hidden Rules of Gastric Mahmoodi et al., penelitian ini menyajikan metode algoritma apriori dan konsep ontology memberikan informasi
Cancer Data Based on 2016) mengenai algoritma baru untuk dari faktor resiko penyakit kanker. bahwa kinerja konsep
Ontology untuk menggali menemukan aturan ontology pada
informasi tentang asosiasi Hasil pengujian yang diperoleh association rule
penyakit kanker menggunakan dengan database menunjukkan bahwa menghasilkan rule
berdasarkan ontology yang prediksi model sesuai tujuan yang yang terbaik dan
ontology. berkaiatan dengan diinginkan yaitu menghasilkan aturan dalam jumlah sedikit.
penyakit kanker. -aturan terbaik.
Penerapan metode menggabungkan
algoritma apriori dan konsep ontology
memberikan dampak baik dalam hasil
pencarian rule semakin akurat,
berbeda dengan hasil menggunakan
algoritma apriori saja.

4 Enhanced Way of (T.Bharathi and Dr. Masalah pada Tujuan penelitian ini Association rule Hasil pada penelitian ini bahwa Penelitian ini
Association Rule Mining A.Nithya, 2016) penelitian ini menyajikan metode mining with metode yang diusulkan lebih efisien memberikan informasi
With Ontology mengenai bagaimana untuk optimasi hasil ontology dibandingkan dengan metode mengenai kinerja dan
penerapan domain association Rule (ARMO). association rule lainnya. Jumlah rule langkah – langkah
ontology dapat dengan menerapkan yang dihasilkan bisa dikurangi perhitungan konsep
mengurangi hasil domain ontology meskipun pada jumlah dataset yang ontology dapat
association rule pada pada dataset yang besar. mendukung hasil
dataset besar melalui diuji. Association rule.
association rule
mining with
ontology (ARMO).

5 Ontology-based Urban Data (Booma Masalah pada Tujuan penelitian ini Algoritma apriori Hasil pada penelitian ini bahwa Penelitian ini
Exploration Sowkarthiga penelitian ini menyajikan metode metode yang diusulkan dapat memberikan informasi
Balasubramani et mengenai bagaimana untuk mengurangi mengurangi hasil rule yang dihasilkan mengenai kinerja
al., 2016) peran domain rule hasil ARM pada dari proses association rule mining konsep ontology (
ontology pada dataset administrasi pada jumlah dataset yang besar. Filter & Pruning )
Association Rule kota dalam jumlah dapat mendukung
Mining ( ARM ) besar. hasil association rule.
dalam mengurangi
hasil rule.

6 Incorporating Domain (Pan et al., 2006) Masalah pada Tujuan pada C-DM Process Implementasi proses DM ( Data Penelitian ini
Knowledge into Data penelitian ini penelitian ini Model Mining ) telah menarik minat dari memberikan informasi
Mining Process: An mengenai bagaimana melakukan berbagai industri. Pada penelitian ini bahwa metode C- DM
Ontology Based Framework implementasi pengelompokan data mengusulkan sebuah model data dapat
knowledge base pada mining berdasarkan mining baru dan kerangka kerja mengelompokkan
data mining ontology. berdasarkan ontology. Model ini proses ( sub proses &
berdasarkan berupaya memisahkan sub-proses kompleks ) pada data
ontology. mining otonom dari proses DM
kompleks, dan menggabungkan hasil mining.
mining.

Berdasarkan penelitian terkait tersebut menunjukkan bahwa penelitian sebelumnya menggunakan ontology pada proses association rule dapat
mengurangi hasil rule dan meningkatkan hasil penggalian informasi. Pada metode Association Rule Mining with Ontology (ARMO) proses pembentukan rule
mempertimbangkan perhitungan nilai IR ( Interesting Rules ) dan perhitungan nilai IR ini dapat dikembangkan lagi berdasarkan knowledge base yang
dibangun dari pemodelan ontology.
BAB III

METODOLOGI PENELITIAN

Tahapan – tahapan yang akan dilakukan dalam penelitian ini


ditunjukkan pada Gambar 3.1 berikut :

Pengumpulan Data

Data Preprocessing

Development Ontology

Implementasi Association Rule dengan Ontology


Experimental

Analisis dan Penarikan Kesimpulan

Gambar 3.1 Alur Penelitian

3.1 Pengumpulan Data


Pada tahap ini dilakukan pengumpulan data mentah. Kandidat data
yang akan digunakan pada proses association rule , yaitu : data mahasiswa
UNS, data dari world bank, dan data internet movie database ( IMDB ). Data
mahasiswa menyediakan informasi mengenai data pribadi maupun akademik
mahasiswa. World bank data menyediakan akses terhadap data secara terbuka
yang dikumpulkan melalui survei pada berbagai topik. IMDB menyediakan
informasi mengenai film dari seluruh dunia, termasuk orang-orang yang terlibat
di dalamnya mulai dari aktor/aktris, sutradara, dan penulis.
Contoh pada data mahasiswa terdapat beberapa atribut misalnya :
nama mahasiswa, golongan uang kuliah tunggal ( UKT ), Id beasiswa, program
studi, fakultas, alamat, tempat tanggal lahir ( TTL ), indeks prestasi kumulatif
( IPK ) , asal SMA, lama studi, jalur masuk, penghasilan orang tua, dll. Pada
data IMDB terdapat beberapa atribut misalnya : director name, genre, movie
tittle, country, number review, budget, dll. Data dengan beberapa atribut akan
dilakukan pemilihan lagi pada tahap data prepocessing.

3.2 Data Preprocessing


Pada tahap ini dilakukan preprocessing terhadap data mentah agar
data tersebut dapat diproses ke tahap selanjutnya. Data preprocessing dilakukan
dengan menyeleksi atribut – atribut yang akan digunakan. Pada tahap ini juga
dilakukan penyempurnaan isi data pada jika datanya tidak lengkap.
Penyempurnaan isi data dilakukan agar proses pengolahan data bisa
dilakukan / tidak terjadi error. Data yang kosong atau kurang lengkap akan
diseleksi sehingga tidak diikutsertakan pada proses pengolahan data. Kemudian
data yang ganda akan dipilih salah satu saja. Data yang sudah lengkap akan
dilakukan penyesuaian format file sehingga data bisa dibaca oleh program .

3.3 Development Ontology


Pada tahap ini dilakukan perancangan ontology berdasarkan data yang
digunakan. Perancangan ontology melalui pendekatan hierarki ontology.
Pendekatan hierarki ontology bertujuan untuk menyederhanakan seluruh
komponen data ke bentuk tingkatan-tingkatan tertentu sehingga dapat dipahami
secara komprehensif. Kemudian data diklasifikasikan sesuai kategorinya.
Contoh bentuk hierarki ontology data mahasiswa dapat dilihat pada Gambar 3.2
berikut :
l
a
G
w
i
h
V
U
g
n
o
t
J
-
+
I
K
F
s
L
B
P
M
N
D
A
W
k
S
m
d
u
.
7
H
T
6
r
Dr. A.Nithya, 2016) :
Gambar 3.2 Bentuk ontology data mahasiswa

3.4 Implementasi Association Rule dengan Ontology


Pada tahap ini dilakukan implementasi association rule dengan
ontology pada data dengan mempertimbangkan nilai support dan perhitungan
nilai IR. Nilai IR ini digunakan untuk meningkatkan hasil penelusuran rule antar
item dalam dataset. Rumus menghitung nilai IR sebagai berikut (T.Bharathi and

IR = [ log ( A x Trans ( A ) ) + log ( B x Trans ( B ) ) ] x

Keterangan :
A adalah banyaknya itemset A
Trans(A) adalah jumlah transaksi dari itemset A
B adalah banyaknya itemset B
Trans(B) adalah jumlah transaksi dari itemset B
Trans(A,B) adalah jumlah transaksi dari itemset A dan B
Total_trans adalah jumlah total transaksi dalam database
[ Trans (A , B)
Total trans

Setelah mendapatkan nilai IR, dilakukan pembentukan general rules


dengan mempertimbangkan nilai support dari kandidat itemset. Kemudian
]
dilakukan penyederhanaan general rules sehingga menghasilkan rule dalam
jumlah sedikit.

3.5 Experimental
Pada tahap ini dilakukan pengujian association rule dengan kriteria
menggunakan association rule tanpa ontology dan association rule dengan
ontology. Pengujian dilakukan pada data mahasiswa, data world bank, dan data
IMDB dengan variasi jumlah data sebesar 250, 500, 750, dan 1000 data.
Perbandingan jumlah rule yang dihasilkan masing – masing variasi jumlah data
dapat dilihat pada tabel 3.1, tabel 3.2, dan tabel 3.3.

Tabel 3.1. Jumlah rule yang dihasilkan pada data mahasiswa

Jumlah Association rule tanpa ontology Association rule dengan ontology


Dataset
Apriori IR Asli IR Customize

250

500

750

1000

Tabel 3.2. Jumlah rule yang dihasilkan pada data world bank

Jumlah Association rule tanpa ontology Association rule dengan ontology


Dataset
Apriori IR Asli IR Customize

250

500

750
1000

Tabel 3.3. Jumlah rule yang dihasilkan pada data IMDB

Jumlah Association rule tanpa ontology Association rule dengan ontology


Dataset
Apriori IR Asli IR Customize

250

500

750

1000

Tabel 3.4. Jumlah rule yang dihasilkan pada data sebesar 1000

Dataset Association rule tanpa ontology Association rule dengan ontology

Apriori IR Asli IR Customize

Data
Mahasiswa

World
Bank

IMDB

3.6 Analisis dan Penarikan Kesimpulan


Pada tahap ini dilakukan analisis mengenai hasil rule yang diperoleh
dari metode association rule dengan ontology kemudian dibandingkan dengan
association rule tanpa ontology. Selanjutnya membuat kesimpulan dari hasil
pembahasan.
JADWAL PELAKSANAAN

Waktu
Maret-
No. Aktivitas April-2018 Mei-2018 Juni-2018
2018
1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4
1 Pengumpulan Data
2 Data Preprocessing
3 Development Ontology
4 Implementasi
Association Rule
dengan Ontology
5 Experimental
6 Analisis dan Penarikan
Kesimpulan
7 Penyusunan Laporan
DAFTAR PUSTAKA

Booma Sowkarthiga Balasubramani, Vivek R. Shivaprabhu, Smitha Krishnamurthy,


Isabel F. Cruz, Tanu Malik, 2016. Ontology-based Urban Data Exploration .
UrbanGIS.
Efori Buulolo, 2013. Implementasi Algoritma Apriori Pada Sistem Persediaan Obat
(Studi Kasus : Apotik Rumah Sakit Estomihi Medan). Pelita Inform. Budi
Darma IV.
Han J, Kamber M, 2001. Data Mining: Concepts and Techniques. Morgan Kaufmann
Publishers, USA.
Han J, Kamber M, Pei J, 2012. Data mining : concepts and techniques. Elsevier.
Hersatoto Listiyono, 2008. Merancang dan Membuat Sistem Pakar. J. Teknol. Inf.
Din. VIII, 115–124.
Inhaúma Neves Ferraz, Ana Cristina Bicharra Garcia, 2013. Ontology in Association
Rules. SpringerPlus.
Matthew Horridge, Holger Knublauch, Alan Rector, Robert S, Chris W, 2004. A
Practical Guide to Building OWL Ontologies Using The Protege-OWL
Plugin and CO-ODE Tools Edition 1.0.
M.Ikhsan, M. Dahria, Sulindawaty, 2011. Penerapan Association Rules Dengan
Algoritma Apriori Pada Proses Pengelompokan Barang di Perusahaan Retail .
STMIK - Triguna Dharma Medan.
Nava’atul Fadillah, Novrido Charibaldi, Herlina Jayadiant, 2010. Penerapan
Teknologi Semantic Web Pada Aplikasi Pencarian Koleksi Perpustakaan
(Studi Kasus:Perpustakaan FTI UPN ”Veteran” Yogyakarta) . Semin. Nas.
Inform.
Noy, McGuinness, 2001. Ontology Development 101: A Guide to Creating your first
Ontology, 2001st ed.
Nugroho Wandi, Rully A. Hendrawan, Ahmad Mukhlason, 2012. Pengembangan
Sistem Rekomendasi Penelusuran Buku dengan Penggalian Association Rule
Menggunakan Algoritma Apriori (Studi Kasus Badan Perpustakaan dan
Kearsipan Provinsi Jawa Timur). J. Tek. ITS 1.
Pan, D., Shen, J.-Y., Zhou, M.-X., 2006. Incorporating domain knowledge into data
mining process: An ontology based framework. Wuhan Univ. J. Nat. Sci. 11,
165–169.
Seyed Abbas Mahmoodi, Kamal Mirzaie, Seyed Mostafa Mahmoudi, 2016. A New
Algorithm to Extract Hidden Rules of Gastric Cancer Data Based on
Ontology. SpringerPlus.
Smith P, 1997. An Introduction to Knowledge Engineering. International Thomson
Computer Press.
Srikant R, Agrawal R, 1994. Fast Algorithms for Mining Association Rules . Int.
Conf. Very Large Data Bases VLDB.
Svátek, V., Rauch, J., Ralbovskỳ, M., 2006. Ontology-enhanced association mining,
in: Semantics, Web and Mining. Springer, pp. 163–179.
Swartout B, Patil R, Knight K, Russ T, 1997. Toward Distributed Use of Large-Scale
Ontologies Ontological Engineering. Spring Symp. Ser. 161–197.
T.Bharathi, Dr. A.Nithya, 2016. Enhanced Way of Association Rule Mining With
Ontology. Int. J. Eng. Comput. Sci. 5.
Tim Berners-Lee, 2001. World Wide Web Consort. W3C.

Anda mungkin juga menyukai