36
Infotech Journal ISSN : 2460-1861
adalah proses menggali dan menganalisa tingkat dominasi suatu item atau itemset
sejumlah data yang sangat besar untuk terhadap keseluruhan transaksi. Sedangkan
memperoleh sesuatu yang benar, baru dan confidence adalah ukuran yang menunjukan
bermanfaat dan akhirnya dapat ditemukan suatu hubungan antara dua item secara conditional.
corak atau pola dalam data tersebut. (Han dan Association analysis digunakan untuk
Kamber, 2006). Data mining adalah bagian menemukan aturan-aturan asosiasi yang
integral dari knowledge discovery database memperlihatkan kondisi-kondisi nilai atribut
(KDD) yang merupakan proses keseluruhan yang sering muncul secara bersamaan dalam
mengubah data mentah menjadi pola-pola data sebuah himpunan data.
yang menarik yang merupakan informasi yang 3. Cluster analysis
dibutuhkan oleh pengguna sebagai pengetahuan,
Tidak seperti klasifikasi yang menganalisa kelas
seperti yang ditunjukan pada gambar 2.
data objek yang mengandung label. Clustering
digunakan untuk menganalisa objek dari data
tanpa memeriksa kelas label yang diketahui.
Label-label kelas dilibatkan di dalam data
training karena belun diketahui sebelumnya.
Clustering merupakan proses mengelompokan
sekumpulan objek yang sangat mirip.
4. Anomaly detection/outlier mining
Sebuah database dapat mengandung data objek
yang tidak sesuai atau menyimpang dari model
data. Data objek ini disebut outlier. Banyak
metode data mining yang menghilangkan outlier
ini. Padahal, pada beberapa aplikasi seperti fraud
Gambar 2 : Proses penemuan pengetahuan dalam detection, kejadian yang jarang terjadi tersebut
database/KDD (Han & Kamber, 2006) justru lebih menarik untuk dianalisa daripada
kejadian yang sering terjadi. Analisa dari outlier
Terdapat empat tugas utama data mining data tersebut disebut sebagai outlier mining.
yang terlihat pada gambar 3 yaitu : Outlier mining juga sering disebut dengan
1. Predictive modelling anomaly detection yang merupakan metode
pendeteksian suatu data dimana tujuannya
Predictive modelling digunakan untuk adalah menemukan objek yang berbeda dari
membangun sebuah model untuk target variabel sebagian besar objek lain. Anomaly dapat
sebagai fungsi dari explanatory variabel. dideteksi dengan menggunakan uji statistik yang
Explanatory variabel dalam hal ini merupakan menerapkan model distribusi atau probabilitas
semua atribut yang digunakan untuk melakukan untuk data.
prediksi, sedangkan variable target merupakan
atribut yang akan diprediksi nilainya. Predictive
modelling dibagi menjadi dua tipe yaitu :
Classification yang digunakan untuk
memprediksi nilai dari target variabel yang
diskrit dan regresi yang digunakan untuk
memprediksi nilai dari target variabel yang
kontinyu.
2. Association analysis
Association analysis adalah penemuan
association rule yang menunjukan pola-pola
yang sering muncul dalam data. Terdapat nilai
support dan confidence yang dapat menunjukan
seberapa besar suatu rule dapat dipercaya. Gambar 3 Empat tugas utama data mining (Tan,
Support adalah ukuran dimana seberapa besar dkk, 2006)
37
Infotech Journal ISSN : 2460-1861
(1)
38
Infotech Journal ISSN : 2460-1861
7. Kesimpulan
Daftar Pustaka
Han, J., & Kamber, M., 2006, Data Mining:
Concepts and Techniques 2e, Morgan
Kaufmann.
39