Anda di halaman 1dari 6

KERTAS KERJA UJIAN  

Semester :Ganji / Genap / Pendek*) Tahunakademik : 2019/2020

           

NomorIndukMahasiswa  41516120105 NomorUjian : ParafMahasiswa

Nama   CHAERIL FAJRI CHAERIL FAJRI 

Fakultas / Program Studi ILMU KOMPUTER /TEKNIK INFORMATIKA ParafPengawas

Mata Kuliah    DATA MINING LANJUT  

Dosen    INDRAJANI NilaiUjian (00-100)

Waktu   Hari Tanggal Jam Ruang  

PelaksanaanUjian   SABTU 11 JULI 2020 19:30 D-205  

Bagian 1 : Jawaban Singkat (Bobot 25)

a. Preprocess, Classify, Cluster, Associate, Select attributes, Visualize


b. J48, RandomTree, DecisionStump
c. Training Set, Test Set
d. Klasifikasi Data, Klustering Data
e. Weka, Rapid Miner, Python

Bagian 2 : Memahami Data Mining (Bobot 25)

a. Data Preprocessing adalah proses manipulasi dataset sebelum diinput kedalam model.
Tujuan Preprocessing adalah
1. Compatibility, Preprocess data agar kompatibel dengan library yang digunakan. Contoh
TensorFlow memerlukan inputan bukan file excels.
2. Categorical Data, Preprocess data non numerical seperti jenis kelamin, status pernikahan,
setuju atau tidak setuju. Contoh : Kita memiliku produk fashion dengan kategori kaos, celana
dan topi.
Ada 2 pendekatan yaitu Binary Encoding dan One Hot Encoding

Binary Encoding

Kategori Ordinal Var 1 Var 2


Kaos 1 0 1
Celana 2 1 0
Topi 3 1 1

Yaitu mengubah nilai ordinal menjadi 2 variabel dengan binary coding yaitu
Pada baris Biner 1 = 0 1, Baris 2 = 1 0, Baris 3 = 11.

One Hot Encoding

Kaos Celana Topi


Kaos 1 0 1
Celana 2 1 0
Topi 3 1 1

One Hot Encoding akan membuat variable sebanyak jumlah kategori. Masih
dengan contoh fashion diatas maka akan dibuat variable misalnya dengan nama
kaos, celana dan topi.

b. Naïve Bayes, Tree J48, OneR


c. Instal Weka untuk Windows
1. Download Weka dari web Waikato.github.io
2. Lakukan Instalasi dengan, Klik dua kali file exe Weka
3. Pada Tampilan Awal Klik Next
4. Pada Tampilan License Agreement klik I Agree
5. Pada Tampilan Choose Component Klik Next
6. Pada Tampilan Choose Install Location Klik Next
7. Pada Tampilan Choose Start Menu Folder Klik Next
8. Tunggu sampai Proses Instalasi Selesai
9. Muncul tampilan Completing Setup Klik Finish
d. Weka merupakan sebuah perangkat lunak open source yang menerapkan berbagai algoritma
machine learning untuk melakukan beberapa proses untuk mendapatkan informasi melalui data
mining. Fitur unggulang yang dimiliki weka adalah Classification, Regression, Clustering,
Association Rules, Visualization dan Data Preprocessing.

Bagian 3 : Membuat Data Mining (Bobot 50)

1. Model Klasifikasi dengan Dataset : https://archive.ics.uci.edu/ml/machine-learning-


databases/iris/iris.data.
Jawab :
Model Klasifikasi yang saya pilih yaitu menggunakan model Naïve Bayes, OneR dan Tree J48.

2. Tools yang saya gunakan adalah WEKA.


3. Hasilnya Jelaskan

Setelah Dataset didownload dari link yang tertera, maka saya mencoba memasukkan dataset
tersebut kedalam Aplikasi Weka. Namun karena extension dataset yang didapat tidak komatibel
dengan dengan WEKA, maka saya merubah iris.data menjadi iris.arff. Setelah dirubah barulah
saya masukkan ke dalam aplikasi WEKA.
Gambar. Tampilan Preprocess

Pada tab Preprocess, Terdapat 5 Atribut, yaitu :


1. sepal length (Panjang Kelopak Bunga) : 5.1 (inputan)
2. sepal width (Lebar Kelopak Bunga) : 3.5 (inputan)
3. petal length (Panjang Mahkota Bunga ) : 1.4 (inputan)
4. petal width (Lebar Mahkota Bunga ) : 0.2 (inputan)
5. class Iris Setosa : Iris Setosa, Versicolor dan Virginica (target)

Pada Atribut Class Iris Setosa terdapat 3 label yaitu Iris Setosa , Iris Versicolor dan Iris Virginica.
Pada label tersebut ditandai dengan warna yaitu Iris Setosa = Biru, Iris Versicolor = Merah , dan
Iris Virginica = Abu-abu.

Warna tersebut akan menjadi tanda bahwa Class Iris-Setosa ada di 4 Atribut Lain. Maka ketika di
visulisasikan semuanya akan tampil seperti berikut ini :
Gambar. Tampilan Visualize All

Kemudian saya melakukan klasifikasi dengan beberapa model seperti Naïve Bayes, OneR dan
TreeJ48. Dibawah ini adalah hasil klasifikasi dari model Naïve Bayes.

Gambar. Tampilan Hasil Klasifikasi dengan Model Naïve Bayes

Pada hasil klasifikasi diatas menunjukan bahwa tingkat keakuratan pengklasifikasian dengan
model Naïve Bayes yaitu sebesar 94.6 % (141 instances dari 149 instance yang ada).

Saya juga mencoba melakukan pengklasifikasian dengan menggunakan model OneR. Dibawah
ini adalah hasil klasifikasi dari model OneR.
Gambar. Tampilan Hasil Klasifikasi dengan Model OneR

Pada hasil klasifikasi diatas menunjukan bahwa tingkat keakuratan pengklasifikasian dengan
model OneR yaitu sebesar 91.9 % (137 instances dari 149 instance yang ada).

Yang terakhir saya mencoba melakukan pengklasifikasian dengan menggunakan model Tree J48.
Dibawah ini adalah hasil klasifikasi dari model Tree J48 .

Gambar. Tampilan Hasil Klasifikasi dengan Model Tree J48

Pada hasil klasifikasi diatas menunjukan bahwa tingkat keakuratan pengklasifikasian dengan
model Tree J48 yaitu sebesar 95.3 % (142 instances dari 149 instance yang ada).
Dibawah ini adalah hasil visualisasi pengklasifikasian dengan model Tree J48.

Gambar. Tampilan Hasil Visualisasi dengan Model Tree J48

Pada hasil visualisasi klasifikasi diatas menunjukan bahwa

1. Bunga yang mempunyai 0,2 (Lebar Mahkota Bunga) kurang dari sama dengan 0,6 yaitu
Bunga Iris Setosa (sebanyak 49 instances),
2. Bunga yang mempunyai 0,2 (Lebar Mahkota Bunga) lebih dari sama dengan 0,6 akan
diklasifikasikan apakah memiliki Panjang Mahkota Bunga lebih dari atau kurang dari sama
dengan 1.7 ?
3. Pada Visualisasi Tree diatas menunjukkan bahwa yang memiliki Panjang Mahkota Bunga
lebih dari sama dengan 1.7 yaitu Bunga Iris Virginica (sebanyak 46 instances).
4. Yang memiliki Panjang Mahkota Bunga kurang dari sama dengan 1.7 akan diklasifikasikan
apakah mempunyai Lebar Kelopak Bunga lebih dari atau kurang dari sama dengan 4.9 ?
5. Pada Visualisasi Tree diatas menunjukkan bahwa yang memiliki Lebar Kelopak Bunga
kurang dari sama dengan 4.9 yaitu Bunga Iris Versicolor (sebanyak 48 instances).
6. Selanjutnya yang memiliki Lebar Kelopak Bunga lebih dari 4.9 akan diklasifikasikan apakah
mempunyai Panjang Mahkota Bunga kurang dari sama dengan atau lebih dari 1.5 ?
7. Pada Visualisasi Tree diatas menunjukkan bahwa yang memiliki Panjang Mahkota Bunga
kurang dari sama dengan 1.5 yaitu Bunga Iris Virginica (sebanyak 3 instances). Dan yang
memiliki Panjang Mahkota Bunga lebih dari 1.5 yaitu Bunga Iris Versicolor (sebanyak 3
instances).

Pada hasil uji coba pengklasifikasian dataset Iris Setosa diatas maka urutan model berdasarkan
tingkat keakuratannya adalah :

1. Tree J48 yaitu sebesar 95.3 % (142 instances dari 149 instance yang ada).
2. Naïve Bayes yaitu sebesar 94.6 % (141 instances dari 149 instance yang ada).
3. One R yaitu sebesar 91.9 % (137 instances dari 149 instance yang ada).

Anda mungkin juga menyukai