Anda di halaman 1dari 15

Peran AI dalam

Data Mining
Introduction
Data mining adalah istilah baru yang
diusulkan dalam beberapa dekade
terakhir, namun tugas data mining seperti
klasifikasi dan clustering telah ada untuk
waktu yang lebih lama.
Dengan tujuan untuk menemukan pola
yang tidak diketahui dari data,
metodologi data mining dibuat
berdasarkan dari machine learning,
artificial intelligence, statistik, dll
Data Mining Tasks
Ada beberapa cara dalam
mengkategorikan tugas dari data mining.
Berikut gambaran umum dari tugas data
mining
Data Dimensionality Reduction
Classification and Clustering
Rule Extraction
Data Dimensionality
Reduction
Reduksi data dimensi (DDR) dapat
mengurangi dimensi dari hipotesis ruang
pencarian, mengurangi pengumpulan data
dan jumlah penyimpanan, meningkatkan
kinerja dari data mining, dan
menyederhanakan hasil data mining. Atribut
atau fitur adalah variabel dari sampel data.
Salah satu kategori DDR adalah feature
extraction, di mana fitur baru yang berasal
dari fitur asli digunakan untuk meningkatkan
efisiensi komputasi dan akurasi klasifikasi.
Classification and Clustering
Klasifikasi dan clustering adalah dua tugas
data mining dengan hubungan dekat. Class
adalah satu set data sampel dengan
beberapa kesamaan atau hubungan dan
semua sampel di class ini diberi label class
yang sama.
Sebuah cluster adalah kumpulan benda-
benda yang mirip. Cluster biasanya dihasilkan
dalam rangka untuk lebih mengklasifikasikan
objek dalam kategori yang relatif lebih besar.

Rule Extraction
Rule Extractionbertujuan untuk menyajikan
data agar interpretasi , aksi, dan keputusan
yang dihasilkan dapat dibuat berdasarkan
pengetahuan yang diperoleh dari data.
Ekstraksi Rule dapat dikategorikan menjadi
dua jenis utama. Satu yang bersangkutan
dengan hubungan antara atribut Input dan
label class output dalam set data berlabel.
Yang lainnya adalah asosiasi rule mining,
yang mengekstrak hubungan antara atribut
di set data yang mungkin tidak memiliki label
kelas.

Artificial Intelligence
Menurut Haag dan Ken AI adalah
studi yang berhubungan dengan
penangkapan, pemodelan, dan
penyimpanan kecerdasan manusia
dalam teknologi informasi sehingga
dapat memfasilitasi proses
pengambilan keputusan.
Computational Intelligence
Methods for Data Mining
Ada beberapa metode AI yang
diterapkan dalam data mining untuk
membantu kinerja data mining
diantaranya adalah:
fuzzy neural networks (FNNs)
multi-layer perceptron neural networks
(MLPs)
Support vector machines (SVMs)
Fuzzy Neural Networks
Jaringan saraf Fuzzy (FNNs) menggabungkan
pembelajaran dan komputasi kekuatan crisp
neural networks dengan human-like descriptions
dan reasoning of fuzzy systems
Karena logika fuzzy memiliki afinitas dengan
representasi pengetahuan manusia, maka
jaringan saraf fuzzy harus menjadi komponen
kunci dari sistem data mining.
Sebuah keuntungan yang kita dapatkan ketika
menggunakan logika fuzzy adalah bahwa kita
bisa mengungkapkan pengetahuan tentang
database dengan cara yang alami bagi orang
untuk memahami sesuatu.
Multi-layer Perceptron Neural
Networks
Neural network classifiers adalah alat yang sangat
penting untuk data mining. Neural interkoneksi
dalam otak diabstraksikan dan diimplementasikan
pada komputer digital sebagai model jaringan
saraf.
Aplikasi baru dan arsitektur baru dari jaringan saraf
(NNS) sedang diteliti lebih lanjut di perusahaan
dan lembaga penelitian untuk mengendalikan
biaya dan menurunkan revenue di pasar.
Munculnya ketertarikan dalam jaringan saraf telah
dipicu oleh keberhasilan dalam teori dan aplikasi.
Support Vector Machines
Mesin Dukungan vektor (SVM) telah
banyak diterapkan untuk masalah
klasifikasi pola dan regresi non-linear.
SVMs biasanya digunakan dalam
masalah klasifikasi pola. Setelah
pengklasifikasi SVM dilatih, mereka dapat
digunakan untuk memprediksi tren masa
depan.
Gene Selection for Cancer
Classification
Sebagai langkah penting untuk klasifikasi
kanker, pilihan gen telah dipelajari secara
intensif dalam beberapa tahun terakhir. Ada
dua pendekatan utama;
Pertama adalah, Principal Component
Analysis(PCA), mungkin metode yang paling
banyak digunakan;
Yang lain adalah t-statistik, yang telah ebih
diterima secara luas.
Untuk contoh kali ini kami hanya akan
membahas pendekatan PCA.
PCA for Gene Selection
Analisis komponen utama bertujuan
mengurangi dimensi input dengan
mengubah ruang input ke ruang baru yang
dijelaskan oleh principal components (PC).
Kami menguji PCA sebagai skema seleksi gen
di lymphoma dataset[bisa di download di
http://llmpp.nih.gov/lymphoma/data.shtml].
Kami memilih 62 gen dari 4026 gen dalam
kumpulan data dengan menggunakan PCA.
Kemudian, kami merangking gen-gen
menurut eigen mereka (nilai absolut).
PCA for Gene Selection II

Kesimpulan
Karena data mining bertujuan untuk
mencari pola. Maka dibutuhkan
pengklasifikasian di dalamnya. Disinilah AI
berperan sebagai peklasifikasi dalam
data mining.

Anda mungkin juga menyukai