Anda di halaman 1dari 3

Weka adalah kumpulan mesin belajar algoritma untuk tugas-tugas data mining.

Algoritma dapat diterapkan secara langsung ke dataset atau disebut dari kode Java Anda sendiri. Weka berisi alat
untuk data pra-pengolahan, klasifikasi, regresi, clustering, aturan asosiasi, dan visualisasi. Hal ini juga cocok untuk
mengembangkan skema pembelajaran mesin baru.

Weka adalah perangkat lunak open source yang dikeluarkan di bawah GNU General PublicLicense .
Introduction

Mesin algoritma pembelajaran berfungsi untuk mendorong aturan klasifikasi dari


Dataset contoh dan dengan demikian memperluas pengetahuan domain dan pemahaman.

WEKA adalah meja kerja untuk pembelajaran mesin yang dimaksudkan untuk membuat
penerapan teknik pembelajaran mesin lebih mudah dan intuitif untuk sebuah
berbagai masalah di dunia nyata.

Lingkungan target tidak hanya mesin belajar ahli tetapi juga spesialis domain. Itulah sebabnya interaktif modul
untuk pengolahan data, data dan visualisasi model yang terlatih, database
koneksi dan cross-validasi disediakan.

Mereka pergi bersama dengan dasar fungsi yang perlu didukung dengan sistem pembelajaran mesin
klasifikasi dan regresi memprediksi, clustering dan seleksi atribut.

Hal ini dikembangkan di University of Waikato, Selandia Baru.


Beberapa definisi dasar pembelajaran mesin, yang digunakan adalah sebagai berikut:

Contoh-contoh adalah objek dari ruang dimensi tetap.


Setiap dimensi sesuai dengan atribut apa yang disebut objek.
Paling sering atribut bisa jadi nominal (enumerasi) atau numerik (Bilangan real) atau string.
Satu atribut khusus adalah atribut kelas, yang menentukan alat-alat dari contoh untuk kelompok tertentu
contoh.
Dataset adalah satu set contoh.
Pelatihan set adalah satu set yang digunakan untuk membangun classifier, yang merupakan
proses belajar sesuatu dari contoh untuk memprediksi atribut kelas yang baru.
Uji set adalah satu set yang digunakan untuk evaluasi sebuah classifier.

Weka(Wakaito Environment for Knowledge Analysis) adalah aplikasi Data Mining Open Source berbasis Java.

Aplikasi ini dikembangkan pertama kali oleh Universitas Waikato di Selandia Baru. Weka terdiri dari koleksi
algoritma machine learning yang dapat digunakan untuk melakukan generalisasi/formulasi dari sekumpulan data
sampling.

Algoritma ini bisa diterapkan secara langsung kedalam data set atau bisa juga dipanggil dari kode java kita sendiri.
Weka memiliki tools untuk data re-processing, classification, regression, clustering, association rules, dan
visualization.

Weka mengorganisasi kelas-kelas kedalam paket-paket dan setiap kelas dipaket dapat mereferensi kelas lain
dipaket lain.

Paket classifiers berisi implementasi dari hamper semua algoritma untuk klarifikasi dan prediksi. Kelas yang paling
penting disini adalah Classifier, yang mendeklarasikan struktur umun dari skema klasifikasi dan prediksi.

Kelas ini memiliki 2 metoda, yaitu build Classifier dan classify Instance, yang harus diimplementasikan oleh kelas-
kelas yang menginduk kekelas ini.

Semua kelas yang mengimplementasikan algoritma klasifikasi menginduk pada kelas Classifier, termasuk kelas J48.

J48, yang menangani himpunan data dalam format ARFF, tidak mengandung kode untuk mengkonstruksi pohon
keputusan.

Kelas ini mereferensi kelas-kelas lain, kebanyakan di paket Weka. Classifiers J48, yang mengerjakan semua prosses
konstruksi pohon.

Pada Weka ada beberapa metode pemilihan variable dari suatu dataset, diantaranya BestFirst, ExhautiveSearch,
FCBFSearch, GeneticSearch, GreedyStepwise, RaceSearch, RandomSearch, Ranker dan,RankerSearch.

Metode atau Teknik yang digunakan Weka adalah Predictive dan Descriptive

Karena Weka mendukung teknik-teknik data preprocessing, clustering, classification, regression, visualization, and
feature selection.

Semua teknik Weka adalah didasarkan pada asumsi bahwa data tersedia sebagai flat file tungggal atau hubungan,
dimana setiap titik data digambarkan oleh sejumlah tetap atribut(biasanya, atribut numeric atau nominal, tetapi
beberapa jenis atribut lain juga didukung).

Algoritma yang digunakan adalah :


1. J48, atau cloning versi open source dari algoritma yang digunakan untuk pembentukkan keputusan.
2. Liniar Regression, algoritma untuk menghasilkan formulasi numeric dengan metode statistic regresi linear.
3. Nave Bayes

Weka menerima input data dalam format ARFF(Attribute Relation File Format). Jika menggunakan format file
seperti CSV(Comma Separated Values) atau BSI(Binary Serialized Instances) maka kita harus mengkonversi file
tersebut mmenjadi format ARFF,

begitu juga ketika kita menggunakan format Java kita harus mengubah menjadi format ARFF terlebih dahulu.
Format ARFF adalah tipe file teks yang berisi berbagai instance. Data yang berhubungan dengan suatu set atribut
data yang dideskripsikan juga dalam file tersebut.

Cara mengkonversi data SCV menjadi ARFF, pertama buka WekaGul, Pilih menu Explorer, kita akan diarahkan
menuju Weka Explorer lalu pilih Open File, dan Pilih Use Converter, maka data kita akan diconvert menjadi format
ARFF.

Anda mungkin juga menyukai