Weka PDF
Weka PDF
(Waikato Environment for Knowledge Analysis)
INF‐305 Data Mining
Taufik Fuadi Abidin
Jurusan Informatika
FMIPA Universitas Syiah Kuala
tfa@informatika.unsyiah.ac.id
www.informatika.unsyiah.ac.id/tfa
Pendahuluan
Dikembangkan di
University of
Waikato, New
Zealand
Dikembangkan
menggunakan Java
Free software under
the GNU General
Public License
http://www.cs.waikato.ac.nz/ml/weka/
Apa itu Weka?
Weka adalah perangkat lunak data mining
yang memiliki sekumpulan algoritma standar
data mining
Weka dapat dijalankan berbasis GUI dan
secara langsung melalui Command Line
(advanced users)
Weka dapat digunakan untuk melakukan pre‐
processing, klasifikasi, clustering
(pengelompokan), regresi, association rule
mining (ARM) dan visualisasi
Versi Stabil Weka
Versi stable saat ini (September 2012) adalah
3.6.8 dan dapat diunduh melalui URL:
http://prdownloads.sourceforge.net/weka/weka‐3‐6‐
8.zip
FAQ dari Weka dapat diperoleh di Weka
WIKI:
http://weka.wikispaces.com/Frequently+Asked+Questio
ns
Tampilan Weka
Penggunaan
Advance
Dataset
Dalam Weka, setiap dataset merupakan
instance dari class: weka.core.Instance
Setiap instance memiliki beberapa atribut
(field)
Domain dari atribut dapat berupa:
Nominal: jeruk, apel, pepaya
Numerik: bilangan bulat dan pecahan
String: diapit oleh tanda petik
Date: tanggal
Relasional
Contoh Dataset
ARFF File (Representasi Data)
ARFF: Attribute‐Relation File Format
ARFF terdiri dari dua bagian:
Header: menjelaskan tipe atribut
Bagian Data: meliputi data yang dipisah dengan
koma
ARFF File (Contoh Format)
Contoh Data dalam ARFF
Dapat dilihat dalam direktori Data pada
folder dimana Weka diinstal
Diantaranya:
Weather.arff
Iris.arff
Labor.arff
Soybean.arff
Data: Iris.arff
Data: Iris.arff (Detail)
Data: weather.arff
Latihan: Ubah dalam Format arff
age income student credit_rating buys_computer
<=30 high no fair no
<=30 high no excellent no
30…40 high no fair yes
>40 medium no fair yes
>40 low yes fair yes
>40 low yes excellent no
31…40 low yes excellent yes
<=30 medium no fair no
<=30 low yes fair yes
>40 medium yes fair yes
<=30 medium yes excellent yes
31…40 medium no excellent yes
31…40 high yes fair yes
>40 medium no excellent no