com
Lihat diskusi, statistik, dan profil penulis untuk publikasi ini di:https://www.researchgate.net/publication/220577832
KUTIPAN BACA
50 661
3 penulis:
37PUBLIKASI432KUTIPAN 235PUBLIKASI2.382KUTIPAN
Andreu Catala
Universitat Politècnica de Catalunya
135PUBLIKASI2.049KUTIPAN
LIHAT PROFIL
MoMoPa2Lihat proyek
Semua konten yang mengikuti halaman ini diunggah olehAndreu Catalapada tanggal 31 Mei 2014.
Haydemar Núñez
Laboratorium Kecerdasan Buatan, Universitas Pusat Venezuela, Caracas,
Venezuela
Abstrak.Pada artikel ini kami mengusulkan beberapa metode untuk menurunkan interpretasi simbolik data dalam bentuk sistem
pembelajaran berbasis aturan dengan menggunakan Support Vector Machines. Pertama, teknik pembelajaran Radial Basis Function Neural
Networks dieksplorasi, seperti biasa dalam literatur, karena sifat lokal dari paradigma ini membuatnya menjadi platform yang cocok untuk
melakukan ekstraksi aturan. Dengan menggunakan vektor dukungan dari Mesin Vektor Dukungan yang dipelajari, dalam pendekatan kami
dimungkinkan untuk menggunakan teknik pembelajaran Fungsi Basis Radial standar apa pun untuk ekstraksi aturan, sambil menghindari
masalah tumpang tindih antar kelas. Kami akan menunjukkan bahwa menggabungkan pusat simpul dan aturan penjelasan vektor pendukung
dapat diperoleh dalam bentuk ellipsoid dan hiper-persegi panjang. Selanjutnya, dalam bentuk ganda, mengikuti kerangka kerja yang
dikembangkan untuk RBFNN, kami membuat algoritme untuk Mesin Vektor Dukungan. Mengambil SVM sebagai paradigma utama, geometri
di ruang input didefinisikan dari kombinasi vektor pendukung dan vektor prototipe yang diperoleh dari algoritma pengelompokan apa pun.
Terakhir, keacakan yang terkait dengan algoritme pengelompokan atau pembelajaran RBF dihindari dengan hanya menggunakan Support
Vector Machine yang dipelajari untuk menentukan geometri wilayah yang dipelajari. Hasil yang diperoleh dari sejumlah percobaan pada tolok
ukur di berbagai domain juga diberikan, yang mengarah pada kesimpulan tentang kelayakan proposal kami. keacakan yang terkait dengan
algoritma pengelompokan atau pembelajaran RBF dihindari dengan hanya menggunakan Support Vector Machine yang dipelajari untuk
menentukan geometri wilayah yang dipelajari. Hasil yang diperoleh dari sejumlah percobaan pada tolok ukur di berbagai domain juga
diberikan, yang mengarah pada kesimpulan tentang kelayakan proposal kami. keacakan yang terkait dengan algoritma pengelompokan atau
pembelajaran RBF dihindari dengan hanya menggunakan Support Vector Machine yang dipelajari untuk menentukan geometri wilayah yang
dipelajari. Hasil yang diperoleh dari sejumlah percobaan pada tolok ukur di berbagai domain juga diberikan, yang mengarah pada kesimpulan
Singkatan:RBF – Fungsi Basis Radial; RBFNN – Jaringan Saraf Fungsi Basis Radial;
SVM – Mendukung Mesin Vektor
1. Perkenalan
©
c 2005Penerbit Akademik Kluwer. Dicetak di Belanda.
Variabilitas yang tinggi dalam hasil diharapkan, dan juga diamati pada beberapa
kumpulan data, karena diketahui bahwa kinerja algoritma pengelompokan
bervariasi dengan perubahan kondisi awal. Sebagai ekstensi terakhir, algoritme
dimodifikasi untuk penggunaan eksklusif informasi yang disediakan oleh SVM,
sehingga variabilitas dihilangkan dan kami menunjukkan bahwa mungkin untuk
mengelompokkan data dari SVM yang dipelajari. Akhirnya, kami menyajikan
beberapa kata penutup dan mendiskusikan pekerjaan masa depan.
Vektor pendukung adalah pola pelatihan yang paling dekat dengan batas pemisahan
antar kelas atau merupakan data yang salah klasifikasi; dalam hal apapun, mereka
Pusat simpul yang dihasilkan oleh RBFNN terletak di zona yang mewakili 'pusat
massa' untuk pola yang terkait dengan pusat ini, sedangkan vektor pendukung
terletak di perbatasan geometris kelas. Oleh karena itu, dengan membatasi zona
pengaruh yang terkait dengan pusat simpul RBF dengan vektor pendukung di dekat
perbatasan, kami akan menunjukkan bahwa mungkin untuk membangun daerah di
ruang input, yang nantinya akan diterjemahkan ke aturan jika-maka. Daerah ini
awalnya akan didefinisikan sebagai ellipsoid, yaitu, kami akan menghasilkan aturan
yang antesedennya adalah persamaan matematika dari ellipsoid. Untuk
meningkatkan kekuatan penjelas dari aturan yang dihasilkan untuk pengguna,
hiper-persegi panjang akan ditentukan dari ellipsoid paralel ke sumbu di fase
selanjutnya. Mereka akan menghasilkan aturan yang premisnya adalah sekumpulan
batasan pada nilai setiap variabel (Gambar 1).
Dua fitur utama akan dipertimbangkan untuk mengevaluasi kinerja tugas
ekstraksi aturan dalam bentuk ellipsoid: (i) ellipsoid harus menyesuaikan
dengan bentuk batas keputusan yang ditentukan oleh SVM, memperlihatkan
tumpang tindih antar kelas yang serendah mungkin ; (ii) ellipsoid harus sebesar
mungkin untuk mencakup banyak data yang menghasilkan sejumlah kecil
aturan.
Dalam proposal kami, metode ekstraksi aturan tidak melibatkan
algoritme pelatihan RBFNN khusus atau arsitektur khusus; itu mengekstrak
aturan dari RBFNN yang biasanya dipelajari. Untuk mengatasi masalah
tumpang tindih antar aturan, SVM digunakan sebagai pemilih pola
perbatasan. Berikut ini, kami menjelaskan algoritme yang diusulkan
(Algoritma 1) untuk menurunkan seperangkat aturan dari RBFNN terlatih.
Awalnya, partisi ruang input dibuat dengan menetapkan setiap pola
input ke pusat terdekatnya, sebuah simpul RBF, menurut jarak
Euclidean. Perlu dicatat bahwa ketika sebuah pola ditugaskan ke pusat
terdekatnya, itu akan ditugaskan ke simpul RBF yang akan memberikan
nilai aktivasi maksimum untuk pola itu, tanpa mempertimbangkan
kelas yang berlaku untuk simpul ini.
Selanjutnya, label kelas diberikan untuk setiap pusat unit RBF. Nilai
keluaran dari jaringan RBF untuk setiap pusat digunakan untuk
SVM
Dukungan t ATURAN
EKSTRAKSI
vektor MODUL
Aturan:
KEMUDIAN KELAS
Pelatihan
JIKA X1∈ [a,b] ∧X2∈ [CD]
Data KEMUDIAN KELAS
PENGGUNA
ANTARMUKA
untuk
untukkelas lain di partisi
tentukan titik tengah data di kelas Region =
Build Region{Titik tengah, Pola}
akhir untuk
akhir untuk
Algoritma 1.Algoritme umum untuk ekstraksi aturan dari RBFNN dan vektor
pendukung.
(sebuah) (b)
Gambar 2.Dua contoh (a) ellipsoid dan (b) hiper-persegi panjang dihasilkan
oleh metode ekstraksi aturan dari RBFNN terlatih pada data buatan di
pesawat.
tidak
akhir untuk
berakhir sementara
dihasilkan oleh algoritme pengelompokan apa pun, dan RBFNN tidak lagi
diperlukan untuk mengekstrak aturan. Dengan demikian, prosedur ekstraksi
aturan dapat diturunkan - sebagai dua dari yang disajikan sebelumnya (Núñez
et al., 2002) -: pertama SVM dipelajari pada set pelatihan, selanjutnya algoritma
pengelompokan menentukan vektor prototipe untuk kelas, dan akhirnya
daerah ellipsoid (hyper-rectangles) dibangun untuk diterjemahkan ke dalam
aturan jika-maka (Gambar 4). Perbedaan utama metodologi ini dari ekstraksi
aturan berbasis RBFNN adalah:
Gambar 3.Hiper - persegi panjang ge nerat ed dengan melamar Algoritma 2 untuk menyempurnakan
dasar aturan.
Jumlah Daerah = 1
untuksetiap kelas
ketikaKondisi apa pun (i) == Iterasi Benar & Angka<= Iterasi Maks
{Prototipe(i), Partisi(i)}= ...
Tentukan Prototipe{Data, Jumlah Wilayah} Wilayah(i) =
Bangun Wilayah{Prototipe(i), Partisi(i)} Kondisi(i) = Uji
Partisi{Wilayah(i)}
Jumlah Daerah Baru = 1 Data
Baru = himpunan kosong
untuki=1:Jumlah Daerah
jikaKondisi(i) == Salah|Jumlah Iterasi == Max Iterasi
Aturan Wilayah = Wilayah(i) kalau
tidak
akhir untuk
berakhir sementara
akhir untuk
Algoritma 3.Prosedur berulang untuk mengekstraksi basis aturan dari SVM yang dipelajari
dengan vektor prototipe.
Dukungan vektor
mesin
Elipsoid
Aturan persamaan
Kekelompokan
EKSTRAKSI
Prototipe
ATURAN
algoritma
METODE
Hyper-persegi panjang
Aturan interval
Data
− Skema partisi 2: pilih vektor dukungan yang paling dekat satu sama
lain.
5. Eksperimen
Tabel II. Nilai kinerja untuk beberapa basis data ketika wilayah ellipsoid
digunakan (dengan algoritma EM).
basis. Oleh karena itu, kinerja aturan yang dihasilkan diukur dengan
langkah-langkah berikut:
− Fidelity (Fd): Persentase set pengujian yang disetujui oleh SVM dan
keluaran basis aturan.
− Cakupan (Cv): Persentase set pengujian yang dicakup oleh basis aturan.
− Tumpang Tindih (Ov): Persentase set pengujian yang dicakup oleh beberapa
aturan.
Tabel II, III, IV, dan V menunjukkan akurasi jaringan RBF dan nilai kinerja basis
aturan yang diekstraksi yang diperoleh saat menginterpretasikan RBFNN dengan
vektor pendukung. Hasilnya diperoleh dengan rata-rata 10 run over stratifikasi
sepuluh kali lipat validasi silang ketika set pengujian tidak disediakan. Kami dapat
mengamati kesepakatan yang tinggi antara hasil yang diperoleh dari basis aturan
dan yang diperoleh dari jaringan RBF. Selanjutnya, karena metode Orr
menggunakan lebih banyak unit tersembunyi untuk memperoleh kinerja yang lebih
baik, metode ini menghasilkan jumlah aturan yang lebih banyak.
Saat menafsirkan SVM dengan vektor prototipe, Tabel VI dan VII
menunjukkan kesalahan prediksi SVM dan nilai kinerja basis aturan
yang diekstraksi untuk setiap masalah ketika persamaan ellipsoid dan
hiperrectangle digunakan. Hasil diperoleh dengan rata-rata validasi
silang sepuluh kali lipat bertingkat, ketika perangkat tes tidak tersedia.
Prototipe ditentukan dengan menggunakan k-means clustering
algoritma (Cherkassky dan Mulier, 1998). Titik utama untuk menjadi
Tabel III. Nilai performa untuk beberapa basis data saat wilayah hiper-persegi
panjang yang mudah digunakan digunakan (dengan algoritme EM).
Tabel IV. Nilai kinerja untuk beberapa basis data ketika wilayah ellipsoid
digunakan (dengan algoritma Orr).
Tabel V. Nilai kinerja untuk beberapa basis data saat wilayah hiper-persegi panjang
yang mudah digunakan digunakan (dengan algoritma Orr).
Tabel VI. Nilai kinerja diperoleh untuk setiap basis data saat
wilayah ellipsoid digunakan.
ditekankan adalah kesetiaan yang sangat tinggi antara basis aturan dan SVM awal yang
dipelajari dengan tingkat tumpang tindih yang rendah. Nilai-nilai ini menunjukkan bahwa
model basis aturan yang dihasilkan menangkap sebagian besar informasi yang
disematkan dalam SVM, dan secara fungsional setara dengan SVM yang dipelajari.
Tabel VII. Diperoleh nilai kinerja untuk setiap basis data saat wilayah
hiper-persegi panjang yang lebih ramah pengguna digunakan.
Tabel IX. Nilai kinerja untuk setiap basis data menggunakan skema partisi 3
ketika wilayah hiper-persegi panjang yang lebih mudah digunakan
digunakan.
Dalam karya ini, metode ekstraksi aturan untuk RBFNN yang menggunakan inti
sebuah algoritma untuk membangun ellipsoid berdasarkan vektor pendukung
telah diusulkan. Berdasarkan hasil yang diperoleh, dapat disimpulkan bahwa
teknik ekstraksi mencapai model yang konsisten dengan RBFNN, tanpa
persyaratan sebelumnya baik rezim pelatihan yang digunakan maupun
arsitekturnya.
Selanjutnya, untuk memberikan SVM dengan kekuatan penjelas, sebuah
metode yang mengubah pengetahuan yang tertanam dalam SVM terlatih
menjadi representasi berdasarkan aturan dikembangkan. Eksperimen metode
ekstraksi aturan pada basis data dari domain yang berbeda, menunjukkan
tingkat kesetaraan yang tinggi antara SVM dan basis aturan yang diekstraksi.
Selain itu, proposal baru telah diturunkan yang menghindari
keacakan dalam algoritma aturan ekstraksi. Dari hasil yang diperoleh
dapat disimpulkan bahwa modifikasi yang diusulkan memang
menghindari keacakan, dan basis aturan yang konsisten diperoleh
tanpa iterasi proses.
Mengingat pencapaian pekerjaan ini, jalur penelitian di masa depan
muncul. Misalnya, akan menarik untuk mempelajari cara memperluas
metode ekstraksi aturan ke masalah regresi. Jika ini tercapai, teknik
yang lebih serbaguna akan tersedia untuk lebih banyak orang
Terima kasih
Referensi
Andrews, R., J. Diederich, dan A. Tickle: 1995, 'A survey and Critique of Techniques
untuk Mengekstrak Aturan dari Jaringan Syaraf Tiruan Terlatih'.Sistem Berbasis
Pengetahuan8(6), 373–389.
Blake, C. and C. Merz: 1998, 'UCI Repository of Machine Learning Databases'.
Cherkassky, V. dan F. Mulier: 1998,Belajar dari Data. John Wiley & Sons, Inc. Cortes,
C. dan V. Vapnik: 1995, 'Mendukung jaringan vektor'.Pembelajaran mesin20,
273–297.
Craven, M. dan J. Shavlik: 1997, 'Menggunakan Neural Networks untuk Penambangan Data'.Masa depan
Sistem Komputer Generasi13,211–229.
Cristianini, N. dan J. Shawe-Taylor: 2000,Pengantar Support Vector Ma-
Cina dan metode pembelajaran berbasis kernel lainnya. Cambridge University press 2000.
Duda, R., P. Hart, dan D. Bangau: 2001,Pengenalan Pola. John Wiley & Sons,
Inc, edisi kedua.
Fu, X. and L. Wang: 2001, 'Ekstraksi Aturan dengan Algoritma Genetika Berdasarkan
Jaringan Syaraf RBF yang disederhanakan'. Di:Prosiding Kongres tentang Perhitungan
Evolusioner, Jil. 2. hlm. 753–758.
Guyon, I., N. Martı́c, dan V. Vapnik: 1996,Kemajuan dalam Penemuan Pengetahuan dan
Penambangan Data, Bab. Pola Informasi Penemuan dan Pembersihan Data.
Pers MIT.
Huber, K. dan M. Berthold: 1995, 'Building Precise Classifiers with Automatic Rule
Ekstraksi'. Di:Prosiding Konferensi Internasional IEEE tentang Jaringan Syaraf
Tiruan, Jil. 3. hlm. 1263–1268.
Kaufmand, L. dan P. Rousseeuw: 1990,Menemukan Grup dalam Data. Sebuah Pengantar
untuk Analisis Cluster. John Wiley & Sons, Inc.
Kecman, V.: 2001,Pembelajaran dan Soft Computing. Mendukung Mesin Vektor, Neural
Jaringan dan Model Logika Fuzzy. Pers MIT.
Ma, J. dan Y. Zhao: 2004, 'OSU Support Vector Machines Toolbox, versi 3.0'.
http:// www.csie.ntu.edu.tw/ cjlin/libsvm.
McGarry, K., S. Wermter, dan J. MacIntyre: 2001, 'Ekstraksi Pengetahuan dari
Jaringan Fungsi Lokal '. Di:Prosiding Konferensi Bersama Internasional tentang
Jaringan Syaraf Tiruan. hlm. 765–770.
Mitra, S., S. Pal, and P. Mitra: 2002, 'Data Mining in Soft Computing Framework:
Survei'.Transaksi IEEE di Neural Networks13(1), 3–14.
Moody, J. dan C. Darken: 1989, 'Pembelajaran Cepat di Jaringan yang Disetel Secara Lokal
Unit Pengolahan'.Perhitungan saraf1(2), 281–294.