Anda di halaman 1dari 5

Weka adalah kumpulan mesin belajar algoritma untuk tugas-tugas data mining.

Algoritma dapat diterapkan secara langsung ke dataset atau disebut dari kode Java Anda sendiri. Weka berisi alat
untuk data pra-pengolahan, klasifikasi, regresi, clustering, aturan asosiasi, dan visualisasi. Hal ini juga cocok untuk
mengembangkan skema pembelajaran mesin baru.

Weka adalah perangkat lunak open source yang dikeluarkan di bawah GNU General PublicLicense .
Introduction

Mesin algoritma pembelajaran berfungsi untuk mendorong aturan klasifikasi dari


Dataset contoh dan dengan demikian memperluas pengetahuan domain dan pemahaman.

WEKA adalah meja kerja untuk pembelajaran mesin yang dimaksudkan untuk membuat
penerapan teknik pembelajaran mesin lebih mudah dan intuitif untuk sebuah
berbagai masalah di dunia nyata.

Lingkungan target tidak hanya mesin belajar ahli tetapi juga spesialis domain. Itulah sebabnya interaktif modul
untuk pengolahan data, data dan visualisasi model yang terlatih, database
koneksi dan cross-validasi disediakan.

Mereka pergi bersama dengan dasar fungsi yang perlu didukung dengan sistem pembelajaran mesin
klasifikasi dan regresi memprediksi, clustering dan seleksi atribut.

Hal ini dikembangkan di University of Waikato, Selandia Baru.


Beberapa definisi dasar pembelajaran mesin, yang digunakan adalah sebagai berikut:

Contoh-contoh adalah objek dari ruang dimensi tetap.


Setiap dimensi sesuai dengan atribut apa yang disebut objek.
Paling sering atribut bisa jadi nominal (enumerasi) atau numerik (Bilangan real) atau string.
Satu atribut khusus adalah atribut kelas, yang menentukan alat-alat dari contoh untuk kelompok tertentu
contoh.
Dataset adalah satu set contoh.
Pelatihan set adalah satu set yang digunakan untuk membangun classifier, yang merupakan
proses belajar sesuatu dari contoh untuk memprediksi atribut kelas yang baru.
Uji set adalah satu set yang digunakan untuk evaluasi sebuah classifier.

Weka(Wakaito Environment for Knowledge Analysis) adalah aplikasi Data Mining Open Source berbasis Java.

Aplikasi ini dikembangkan pertama kali oleh Universitas Waikato di Selandia Baru. Weka terdiri dari koleksi
algoritma machine learning yang dapat digunakan untuk melakukan generalisasi/formulasi dari sekumpulan data
sampling.

Algoritma ini bisa diterapkan secara langsung kedalam data set atau bisa juga dipanggil dari kode java kita sendiri.
Weka memiliki tools untuk data re-processing, classification, regression, clustering, association rules, dan
visualization.

Weka mengorganisasi kelas-kelas kedalam paket-paket dan setiap kelas dipaket dapat mereferensi kelas lain
dipaket lain.

Paket classifiers berisi implementasi dari hamper semua algoritma untuk klarifikasi dan prediksi. Kelas yang paling
penting disini adalah Classifier, yang mendeklarasikan struktur umun dari skema klasifikasi dan prediksi.

Kelas ini memiliki 2 metoda, yaitu build Classifier dan classify Instance, yang harus diimplementasikan oleh kelas-
kelas yang menginduk kekelas ini.

Semua kelas yang mengimplementasikan algoritma klasifikasi menginduk pada kelas Classifier, termasuk kelas J48.

J48, yang menangani himpunan data dalam format ARFF, tidak mengandung kode untuk mengkonstruksi pohon
keputusan.

Kelas ini mereferensi kelas-kelas lain, kebanyakan di paket Weka. Classifiers J48, yang mengerjakan semua prosses
konstruksi pohon.

Pada Weka ada beberapa metode pemilihan variable dari suatu dataset, diantaranya BestFirst, ExhautiveSearch,
FCBFSearch, GeneticSearch, GreedyStepwise, RaceSearch, RandomSearch, Ranker dan,RankerSearch.

Metode atau Teknik yang digunakan Weka adalah Predictive dan Descriptive

Karena Weka mendukung teknik-teknik data preprocessing, clustering, classification, regression, visualization, and
feature selection.

Semua teknik Weka adalah didasarkan pada asumsi bahwa data tersedia sebagai flat file tungggal atau hubungan,
dimana setiap titik data digambarkan oleh sejumlah tetap atribut(biasanya, atribut numeric atau nominal, tetapi
beberapa jenis atribut lain juga didukung).

Algoritma yang digunakan adalah :


1. J48, atau cloning versi open source dari algoritma yang digunakan untuk pembentukkan keputusan.
2. Liniar Regression, algoritma untuk menghasilkan formulasi numeric dengan metode statistic regresi linear.
3. Nave Bayes

Weka menerima input data dalam format ARFF(Attribute Relation File Format). Jika menggunakan format file
seperti CSV(Comma Separated Values) atau BSI(Binary Serialized Instances) maka kita harus mengkonversi file
tersebut mmenjadi format ARFF,

begitu juga ketika kita menggunakan format Java kita harus mengubah menjadi format ARFF terlebih dahulu.
Format ARFF adalah tipe file teks yang berisi berbagai instance. Data yang berhubungan dengan suatu set atribut
data yang dideskripsikan juga dalam file tersebut.

Cara mengkonversi data SCV menjadi ARFF, pertama buka WekaGul, Pilih menu Explorer, kita akan diarahkan
menuju Weka Explorer lalu pilih Open File, dan Pilih Use Converter, maka data kita akan diconvert menjadi format
ARFF.

Apa itu .ARFF dan cara membuatnya dari file excel .csv
19 Juni 2011 Ismail Sunni Tinggalkan komentar Go to comments

Saya sedang mencoba untuk menggunakan tools untuk melakukan data mining, yang konon
sangat hebat. Nama tool-nya adalah WEKA. Open source, dengan GNU Public License. Hmm,
saya tidak akan membahas tentang WEKA dan tetek bengeknya, maklum, masih mencoba. Saya
hanya ingin share tentang format .ARFF yang dipakai sebagai file input ketika menggunakan
WEKA Sungguh, saya menghabiskan waktu sejam lebih dikit untuk trial and error, agar WEKA
tidak protes.

Apa itu .ARFF ?

.ARFF adalah format file yang digunakan dalam WEKA> Dibuat oleh Andrew Donkin. Konon,
ARFF ini singkatan dari Andrews Ridiculos File Format. Icon file ini adalah gambar burung
WEKA (sama seperti aplikasinya). Berikut contoh file .ARFF yang pernah saya buat :

Contoh file .arff


Maaf, kalau terlalu kecil. Jadi, dalam file .arff, ada 2 bagian, Yakni, header, dan data. Dalam file
di atas, kotak pertama adalah header, dan kotak ke dua adalah data.

Untuk header, menunjukan nama relasi, kasus di atas, relasinya bernama WillWait. Sedangkan
untuk baris-baris selanjutnya adalah @attribute[spasi][nama atribut][spasi][tipe data].

Dalam WEKA, ada 4 jenis tipe data, yakni :

1. numeric
tipe untuk bilangan bulat atau real. Untuk menggunakannya, cukup tulis numeric
2. nominal spesification
Semua atribut dalam contoh di atas adalah bertipe ini. Semacam enumerasi pada
database. Untuk menggunakan atribut ini, gunakan kurung kurawal dan koma untuk
mengenumerasi nila-nilai yang mungkin.Contoh :@attribute type
{French,Thai,Burger,Italian}
3. string
Untuk merepresentasikan tipe string. Cara penulisannya, cukup tulis string
4. date[<date-format>]
Untuk merepresentasikan date. Saya sendiri belum pernah menggunakan tipe ini.

Pada bagian ke dua, yakni data, cukup dituliskan @data dan selanjutnya, menulis tiap baris
dengan isi data. Tiap atribut dipisahkan dengan tanda koma. Lihat contoh. Untuk atribut yang
belum diketahui, cukup diganti dengan tanda tanya ?. Sedangkan untuk tipe string, gunakan
tanda petik tunggal untuk mengapitnya.

Cara membuatnya ?

Cara pertama, manual. He jelas, rentan salah ketik dan sangat capek.

Care ke dua, membuat dari file .csv, atau comma separated files. WEKA masih mau menerima
format .csv ini. Tapi Ada tapinya. Sebelumnya, sekilas tentang .csv ini.

Untuk mudahnya, .csv merupkana representasi sebuah file yang berisi data (tabel) yang
dipisahkan dengan tanda comma untuk tiap kolomnya. Biar gampang dibayangkan, coba buka
salah satu file excel Anda, lalu simpan sebagai (save-as) file .csv. Lalu, buka melalu notepad,
maka akan kelihatan tanda pemisahnya.

Sebenarnya, file .csv ini bisa diterima oleh WEKA sebagai input. Namun sialnya, ada 2 standar
.csv, yakni yang menggunakan , dan ;. Nah, si WEKA ini ngotot menggunakan ,, sementara
ketika kita menyimpan ke .csv, ada yang menggunakan ;. Jelas, tidak terbaca dan ditolak.

Oleh, karenanya, kita harus secara manual mengubah ; menjadi ,. Caranya ? Buka di
notepad, dan gunakan fungsi replace. Tapi, ingat, ubah dulu semua tanda , menjadi .. Supaya
tidak salah arti.
Ketika Anda menjalankan WEKA, pilih open file, lalu pilih dengan tipe .csv. Pilih file .csv
Anda. Lalu, muncul di WEKA-nya. Nah, sekarang, save sebagai .ARFF. SELESAI.

Jelas, cara ke dua lebih mudah diterapkan. Karena, micorsoft excel lebih manusiawi daripada
notepad.

Nah, segitu dulu untuk masalah kecil seperti ini. Nanti, saya lanjutkan lagi untuk di WEKAnya.

Sumber : AI32-Guide to Weka, Andrew Roberts

Iklan

Anda mungkin juga menyukai