Algoritma dapat diterapkan secara langsung ke dataset atau disebut dari kode Java Anda sendiri. Weka berisi alat
untuk data pra-pengolahan, klasifikasi, regresi, clustering, aturan asosiasi, dan visualisasi. Hal ini juga cocok untuk
mengembangkan skema pembelajaran mesin baru.
Weka adalah perangkat lunak open source yang dikeluarkan di bawah GNU General PublicLicense .
Introduction
WEKA adalah meja kerja untuk pembelajaran mesin yang dimaksudkan untuk membuat
penerapan teknik pembelajaran mesin lebih mudah dan intuitif untuk sebuah
berbagai masalah di dunia nyata.
Lingkungan target tidak hanya mesin belajar ahli tetapi juga spesialis domain. Itulah sebabnya interaktif modul
untuk pengolahan data, data dan visualisasi model yang terlatih, database
koneksi dan cross-validasi disediakan.
Mereka pergi bersama dengan dasar fungsi yang perlu didukung dengan sistem pembelajaran mesin
klasifikasi dan regresi memprediksi, clustering dan seleksi atribut.
Weka(Wakaito Environment for Knowledge Analysis) adalah aplikasi Data Mining Open Source berbasis Java.
Aplikasi ini dikembangkan pertama kali oleh Universitas Waikato di Selandia Baru. Weka terdiri dari koleksi
algoritma machine learning yang dapat digunakan untuk melakukan generalisasi/formulasi dari sekumpulan data
sampling.
Algoritma ini bisa diterapkan secara langsung kedalam data set atau bisa juga dipanggil dari kode java kita sendiri.
Weka memiliki tools untuk data re-processing, classification, regression, clustering, association rules, dan
visualization.
Weka mengorganisasi kelas-kelas kedalam paket-paket dan setiap kelas dipaket dapat mereferensi kelas lain
dipaket lain.
Paket classifiers berisi implementasi dari hamper semua algoritma untuk klarifikasi dan prediksi. Kelas yang paling
penting disini adalah Classifier, yang mendeklarasikan struktur umun dari skema klasifikasi dan prediksi.
Kelas ini memiliki 2 metoda, yaitu build Classifier dan classify Instance, yang harus diimplementasikan oleh kelas-
kelas yang menginduk kekelas ini.
Semua kelas yang mengimplementasikan algoritma klasifikasi menginduk pada kelas Classifier, termasuk kelas J48.
J48, yang menangani himpunan data dalam format ARFF, tidak mengandung kode untuk mengkonstruksi pohon
keputusan.
Kelas ini mereferensi kelas-kelas lain, kebanyakan di paket Weka. Classifiers J48, yang mengerjakan semua prosses
konstruksi pohon.
Pada Weka ada beberapa metode pemilihan variable dari suatu dataset, diantaranya BestFirst, ExhautiveSearch,
FCBFSearch, GeneticSearch, GreedyStepwise, RaceSearch, RandomSearch, Ranker dan,RankerSearch.
Metode atau Teknik yang digunakan Weka adalah Predictive dan Descriptive
Karena Weka mendukung teknik-teknik data preprocessing, clustering, classification, regression, visualization, and
feature selection.
Semua teknik Weka adalah didasarkan pada asumsi bahwa data tersedia sebagai flat file tungggal atau hubungan,
dimana setiap titik data digambarkan oleh sejumlah tetap atribut(biasanya, atribut numeric atau nominal, tetapi
beberapa jenis atribut lain juga didukung).
Weka menerima input data dalam format ARFF(Attribute Relation File Format). Jika menggunakan format file
seperti CSV(Comma Separated Values) atau BSI(Binary Serialized Instances) maka kita harus mengkonversi file
tersebut mmenjadi format ARFF,
begitu juga ketika kita menggunakan format Java kita harus mengubah menjadi format ARFF terlebih dahulu.
Format ARFF adalah tipe file teks yang berisi berbagai instance. Data yang berhubungan dengan suatu set atribut
data yang dideskripsikan juga dalam file tersebut.
Cara mengkonversi data SCV menjadi ARFF, pertama buka WekaGul, Pilih menu Explorer, kita akan diarahkan
menuju Weka Explorer lalu pilih Open File, dan Pilih Use Converter, maka data kita akan diconvert menjadi format
ARFF.