Anda di halaman 1dari 13

LAPORAN ANALISA DATA IRIS

MENGGUNAKAN APLIKASI WEKA

Oleh:
Nabilla Tsurayya Silmi
5112100055
Nida Amalia

5113100100

Kevin Zulkarnain Yuseti


5113100146

JURUSAN TEKNIK INFORMATIKA


FAKULTAS TEKNOLOGI INFORMASI
INSTITUT TEKNOLOGI SEPULUH NOPEMBER

2015

TUJUAN
Menggunakan WEKA decision tree untuk menglasifikasikan sampel Iris.

DECISION TREE PADA WEKA


Weka adalah aplikasi data mining open source berbasis Java. Algoritma yang
akan digunakan untuk analisa decision tree adalah J48. Perbedaan ID3, C4.5 dan J48
sebagai berikut ini: ID3 merupakan algoritma yang dipergunakan untuk
membangun sebuah decision tree atau pohon keputusan. Algoritma ini ditemukan
oleh J. Ross Quinlan, dengan memanfaatkan Teori Informasi atau Information Theory
milik Shanon. ID3 sendiri merupakan singkatan dari Iterative Dichotomiser 3.
Idenya, adalah membuat pohon dengan percabangan awal adalah atribut yang
paling signifikan. Maksudnya signifikan adalah yang paling bisa mempartisi antara
iya dan tidak.
Pada WEKA, ada pilihan untuk menggunakan ID3 ini, dengan nama yang
sama. Namun, jelas semua atribut harus bertipe nominal, dan tidak boleh ada yang
kosong. Sedangkan, C4.5 merupakan pengembangan dari ID3. Beberapa
perbedaannya antara lain :
1. Mampu menangani atribut dengan tipe diskrit atau kontinu.
2. Mampu menangani atribut yang kosong (missing value)
3. Bisa memangkas cabang.

LANGKAH PENGERJAAN

Klik Open file pada tab preprocess

buka file dataset yang akan jadi


bahan analisa

centang pada semua atribut yang


akan digunakan untuk analisa nanti

klik pada tab classify lalu klik


button choose untuk memilih teknik classifer

lalu pilih J48 pada folder

tree
analisa

lalu klik start untuk memulai

DECISION TREE KASUS IRIS


Informasi:
1.
2.
3.
4.
5.

Sepal length in cm
Sepal width in cm
Petal length in cm
Petal width in cm
Class:
Iris Setosa
Iris Versicolour
Iris Virginica

Jika Petal Witdh <= 0.6,


maka termasuk Setosa.

Jika Petal Width> 0.6 dan Petal Width > 1.7,


maka termasuk Iris Virginica

Jika Jika Petal Width> 0.6 dan Petal Width > 1.7 dan Petal Length <= 4.6
Maka termasuk Iris - Versicolor

Jika Jika Petal Width> 0.6 dan Petal Width > 1.7 dan Petal Length > 4.6 dan Petal
Width <= 1.5,
Maka termasuk Iris Virginica, dan lainnya termasuk Iris Versicolor

OUTPUT
=== Confusion Matrix ===
a b c
50 0 0
0 49 1
0 2 48

<-- classified as
| a = Iris-setosa
| b = Iris-versicolor
| c = Iris-virginica

Iris-setosa yang benar identifikasinya sebanyak 50


Iris-versicolor yang benar identifikasinya sebanyak 49
Ada 1 iris-versicolor yang ternyata teridentifikasi sebagai iris-virginica
Iris-virginica yang benar identifikasinya sebanyak 48
Ada 2 iris- virginica yang ternyata teridentifikasi sebagai iris- versicolor

Kita juga bisa melihat hasil dari output pada bagian Outpul Classifier :
J48 pruned tree
------------------

petalwidth <= 0.6: Iris-setosa (50.0)


petalwidth > 0.6
| petalwidth <= 1.7
| | petallength <= 4.9: Iris-versicolor (48.0/1.0)
| | petallength > 4.9
| | | petalwidth <= 1.5: Iris-virginica (3.0)
| | | petalwidth > 1.5: Iris-versicolor (3.0/1.0)
| petalwidth > 1.7: Iris-virginica (46.0/1.0)

Number of Leaves : 5

Size of the tree :

Dari gambar tersebut memperlihatkan jumlah jenis iris tersebut yang


teridentifikasi/jumlah iris yang incorrect atau salah identifikasi. Misal Iris-versicolor

(48.0/1.0) berarti ada 48 Iris-versicolor yang teridentifikasi tetapi ada 1 salah


identifikasi.
Evaluasi dari Training set
=== Evaluation on training set ===
=== Summary ===
Correctly Classified Instances
147
Incorrectly Classified Instances
3
Kappa statistic
0.97
Mean absolute error
0.0233
Root mean squared error
0.108
Relative absolute error
5.2482 %
Root relative squared error
22.9089 %
Total Number of Instances
150

98
2

%
%

Tree mengklasifikasikan dengan benar sebanyak 147 data dari 150 data sample
(98%)

Ada beberapa factor yang menyebabkan adanya kesalahan pada


klasifikasi iris, antara lain:
1. Kesalahan pengukuran
Misal, pengukuran pada Petal dan Sepal kurang akurat.
2. Kesalahan kelas indentifikasi
Misal, beberapa setosa diklasifikasikan sebagai versicolor.
3. Deviasi sampel
Misal, sampel bunga kering.
4. Data set tidak teratur
5. Klasifikasi algoritma yang tidak tepat
J48 decision tree learner tidak berlaku untuk iris.

Kita juga bisa melihat titik persebaran data, misalnya, pada gambar dibawah ini
untuk sumbu X dengan atribut petal length dan pada sumbu Y dengan atribut petal
width.

KESIMPULAN
Untuk menglasifikasikan Iris, hanya perlu mengukur Petal Length dan Petal Width
saja.

Output for training data and test data

Kelas
Sebenarnya

Setosa
Versicolor
Virginica

Setosa
50
0
0

Prediksi kelas
versicolor
0
49
2

Virginica
0
1
48

Data yang

Anda mungkin juga menyukai