Anda di halaman 1dari 14

Pengantar WEKA

(Waikato Environment for Knowledge Analysis)

INF‐305 Data Mining

Taufik Fuadi Abidin
Jurusan Informatika
FMIPA Universitas Syiah Kuala
tfa@informatika.unsyiah.ac.id
www.informatika.unsyiah.ac.id/tfa
Pendahuluan
Dikembangkan di 
University of 
Waikato, New 
Zealand
Dikembangkan 
menggunakan Java
Free software under 
the GNU General 
Public License
http://www.cs.waikato.ac.nz/ml/weka/
Apa itu Weka?
Weka adalah perangkat lunak data mining 
yang memiliki sekumpulan algoritma standar 
data mining
Weka dapat dijalankan berbasis GUI dan 
secara langsung melalui Command Line 
(advanced users)
Weka dapat digunakan untuk melakukan pre‐
processing, klasifikasi, clustering 
(pengelompokan), regresi, association rule 
mining (ARM) dan visualisasi
Versi Stabil Weka
Versi stable saat ini (September 2012) adalah 
3.6.8 dan dapat diunduh melalui URL:
http://prdownloads.sourceforge.net/weka/weka‐3‐6‐
8.zip

FAQ dari Weka dapat diperoleh di Weka 
WIKI: 
http://weka.wikispaces.com/Frequently+Asked+Questio
ns
Tampilan Weka
Penggunaan
Advance
Dataset
Dalam Weka, setiap dataset merupakan 
instance dari class: weka.core.Instance
Setiap instance memiliki beberapa atribut 
(field)
Domain dari atribut dapat berupa:
Nominal: jeruk, apel, pepaya
Numerik: bilangan bulat dan pecahan
String: diapit oleh tanda petik
Date: tanggal
Relasional
Contoh Dataset
ARFF File (Representasi Data)
ARFF: Attribute‐Relation File Format
ARFF terdiri dari dua bagian:
Header: menjelaskan tipe atribut
Bagian Data: meliputi data yang dipisah dengan 
koma
ARFF File (Contoh Format)
Contoh Data dalam ARFF
Dapat dilihat dalam direktori Data pada 
folder dimana Weka diinstal
Diantaranya:
Weather.arff
Iris.arff
Labor.arff
Soybean.arff
Data: Iris.arff
Data: Iris.arff (Detail)
Data: weather.arff
Latihan: Ubah dalam Format arff
age income student credit_rating buys_computer
<=30 high no fair no
<=30 high no excellent no
30…40 high no fair yes
>40 medium no fair yes
>40 low yes fair yes
>40 low yes excellent no
31…40 low yes excellent yes
<=30 medium no fair no
<=30 low yes fair yes
>40 medium yes fair yes
<=30 medium yes excellent yes
31…40 medium no excellent yes
31…40 high yes fair yes
>40 medium no excellent no

Anda mungkin juga menyukai