Uas DML - Chaeril Fajri - 41516120105

KERTAS KERJA UJIAN
Semester :Ganji / Genap / Pendek*) Tahunakademik : 2019/2020

NomorIndukMahasiswa 41516120105 NomorUjian : ParafMahasiswa
Nama CHAERIL FAJRI CHAERIL FAJRI
Fakultas / Program Studi ILMU KOMPUTER /TEKNIK INFORMATIKA ParafPengawas
Mata Kuliah DATA MINING LANJUT
Dosen INDRAJANI NilaiUjian (00-100)
Waktu Hari Tanggal Jam Ruang
PelaksanaanUjian SABTU 11 JULI 2020 19:30 D-205
Bagian 1 : Jawaban Singkat (Bobot 25)
a. Preprocess, Classify, Cluster, Associate, Select attributes, Visualize

b. J48, RandomTree, DecisionStump
c. Training Set, Test Set
d. Klasifikasi Data, Klustering Data
e. Weka, Rapid Miner, Python
Bagian 2 : Memahami Data Mining (Bobot 25)
a. Data Preprocessing adalah proses manipulasi dataset sebelum diinput kedalam model.
Tujuan Preprocessing adalah
1. Compatibility, Preprocess data agar kompatibel dengan library yang digunakan. Contoh
TensorFlow memerlukan inputan bukan file excels.
2. Categorical Data, Preprocess data non numerical seperti jenis kelamin, status pernikahan,
setuju atau tidak setuju. Contoh : Kita memiliku produk fashion dengan kategori kaos, celana
dan topi.
Ada 2 pendekatan yaitu Binary Encoding dan One Hot Encoding
Binary Encoding
Kategori Ordinal Var 1 Var 2

Kaos 1 0 1
Celana 2 1 0
Topi 3 1 1
Yaitu mengubah nilai ordinal menjadi 2 variabel dengan binary coding yaitu
Pada baris Biner 1 = 0 1, Baris 2 = 1 0, Baris 3 = 11.
One Hot Encoding
Kaos Celana Topi

Kaos 1 0 1
Celana 2 1 0
Topi 3 1 1
One Hot Encoding akan membuat variable sebanyak jumlah kategori. Masih
dengan contoh fashion diatas maka akan dibuat variable misalnya dengan nama
kaos, celana dan topi.
b. Naïve Bayes, Tree J48, OneR

c. Instal Weka untuk Windows
1. Download Weka dari web Waikato.github.io
2. Lakukan Instalasi dengan, Klik dua kali file exe Weka
3. Pada Tampilan Awal Klik Next
4. Pada Tampilan License Agreement klik I Agree
5. Pada Tampilan Choose Component Klik Next
6. Pada Tampilan Choose Install Location Klik Next
7. Pada Tampilan Choose Start Menu Folder Klik Next
8. Tunggu sampai Proses Instalasi Selesai
9. Muncul tampilan Completing Setup Klik Finish
d. Weka merupakan sebuah perangkat lunak open source yang menerapkan berbagai algoritma
machine learning untuk melakukan beberapa proses untuk mendapatkan informasi melalui data
mining. Fitur unggulang yang dimiliki weka adalah Classification, Regression, Clustering,
Association Rules, Visualization dan Data Preprocessing.
Bagian 3 : Membuat Data Mining (Bobot 50)
1. Model Klasifikasi dengan Dataset : https://archive.ics.uci.edu/ml/machine-learning-

databases/iris/iris.data.
Jawab :
Model Klasifikasi yang saya pilih yaitu menggunakan model Naïve Bayes, OneR dan Tree J48.
2. Tools yang saya gunakan adalah WEKA.

3. Hasilnya Jelaskan
Setelah Dataset didownload dari link yang tertera, maka saya mencoba memasukkan dataset
tersebut kedalam Aplikasi Weka. Namun karena extension dataset yang didapat tidak komatibel
dengan dengan WEKA, maka saya merubah iris.data menjadi iris.arff. Setelah dirubah barulah
saya masukkan ke dalam aplikasi WEKA.
Gambar. Tampilan Preprocess
Pada tab Preprocess, Terdapat 5 Atribut, yaitu :

1. sepal length (Panjang Kelopak Bunga) : 5.1 (inputan)
2. sepal width (Lebar Kelopak Bunga) : 3.5 (inputan)
3. petal length (Panjang Mahkota Bunga ) : 1.4 (inputan)
4. petal width (Lebar Mahkota Bunga ) : 0.2 (inputan)
5. class Iris Setosa : Iris Setosa, Versicolor dan Virginica (target)
Pada Atribut Class Iris Setosa terdapat 3 label yaitu Iris Setosa , Iris Versicolor dan Iris Virginica.
Pada label tersebut ditandai dengan warna yaitu Iris Setosa = Biru, Iris Versicolor = Merah , dan
Iris Virginica = Abu-abu.
Warna tersebut akan menjadi tanda bahwa Class Iris-Setosa ada di 4 Atribut Lain. Maka ketika di
visulisasikan semuanya akan tampil seperti berikut ini :
Gambar. Tampilan Visualize All
Kemudian saya melakukan klasifikasi dengan beberapa model seperti Naïve Bayes, OneR dan
TreeJ48. Dibawah ini adalah hasil klasifikasi dari model Naïve Bayes.
Gambar. Tampilan Hasil Klasifikasi dengan Model Naïve Bayes
Pada hasil klasifikasi diatas menunjukan bahwa tingkat keakuratan pengklasifikasian dengan
model Naïve Bayes yaitu sebesar 94.6 % (141 instances dari 149 instance yang ada).
Saya juga mencoba melakukan pengklasifikasian dengan menggunakan model OneR. Dibawah
ini adalah hasil klasifikasi dari model OneR.
Gambar. Tampilan Hasil Klasifikasi dengan Model OneR
model OneR yaitu sebesar 91.9 % (137 instances dari 149 instance yang ada).
Yang terakhir saya mencoba melakukan pengklasifikasian dengan menggunakan model Tree J48.
Dibawah ini adalah hasil klasifikasi dari model Tree J48 .
Gambar. Tampilan Hasil Klasifikasi dengan Model Tree J48
model Tree J48 yaitu sebesar 95.3 % (142 instances dari 149 instance yang ada).
Dibawah ini adalah hasil visualisasi pengklasifikasian dengan model Tree J48.
Gambar. Tampilan Hasil Visualisasi dengan Model Tree J48
Pada hasil visualisasi klasifikasi diatas menunjukan bahwa
1. Bunga yang mempunyai 0,2 (Lebar Mahkota Bunga) kurang dari sama dengan 0,6 yaitu
Bunga Iris Setosa (sebanyak 49 instances),
2. Bunga yang mempunyai 0,2 (Lebar Mahkota Bunga) lebih dari sama dengan 0,6 akan
diklasifikasikan apakah memiliki Panjang Mahkota Bunga lebih dari atau kurang dari sama
dengan 1.7 ?
3. Pada Visualisasi Tree diatas menunjukkan bahwa yang memiliki Panjang Mahkota Bunga
lebih dari sama dengan 1.7 yaitu Bunga Iris Virginica (sebanyak 46 instances).
4. Yang memiliki Panjang Mahkota Bunga kurang dari sama dengan 1.7 akan diklasifikasikan
apakah mempunyai Lebar Kelopak Bunga lebih dari atau kurang dari sama dengan 4.9 ?
5. Pada Visualisasi Tree diatas menunjukkan bahwa yang memiliki Lebar Kelopak Bunga
kurang dari sama dengan 4.9 yaitu Bunga Iris Versicolor (sebanyak 48 instances).
6. Selanjutnya yang memiliki Lebar Kelopak Bunga lebih dari 4.9 akan diklasifikasikan apakah
mempunyai Panjang Mahkota Bunga kurang dari sama dengan atau lebih dari 1.5 ?
7. Pada Visualisasi Tree diatas menunjukkan bahwa yang memiliki Panjang Mahkota Bunga
kurang dari sama dengan 1.5 yaitu Bunga Iris Virginica (sebanyak 3 instances). Dan yang
memiliki Panjang Mahkota Bunga lebih dari 1.5 yaitu Bunga Iris Versicolor (sebanyak 3
instances).
Pada hasil uji coba pengklasifikasian dataset Iris Setosa diatas maka urutan model berdasarkan
tingkat keakuratannya adalah :
1. Tree J48 yaitu sebesar 95.3 % (142 instances dari 149 instance yang ada).
2. Naïve Bayes yaitu sebesar 94.6 % (141 instances dari 149 instance yang ada).
3. One R yaitu sebesar 91.9 % (137 instances dari 149 instance yang ada).

Uas DML - Chaeril Fajri - 41516120105

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Uas DML - Chaeril Fajri - 41516120105

Diunggah oleh

Hak Cipta:

Format Tersedia

KERTAS KERJA UJIAN

Semester :Ganji / Genap / Pendek*) Tahunakademik : 2019/2020

NomorIndukMahasiswa 41516120105 NomorUjian : ParafMahasiswa

Nama CHAERIL FAJRI CHAERIL FAJRI

Fakultas / Program Studi ILMU KOMPUTER /TEKNIK INFORMATIKA ParafPengawas

Mata Kuliah DATA MINING LANJUT

Dosen INDRAJANI NilaiUjian (00-100)

Waktu Hari Tanggal Jam Ruang

PelaksanaanUjian SABTU 11 JULI 2020 19:30 D-205

Bagian 1 : Jawaban Singkat (Bobot 25)

a. Preprocess, Classify, Cluster, Associate, Select attributes, Visualize

Bagian 2 : Memahami Data Mining (Bobot 25)

Kategori Ordinal Var 1 Var 2

One Hot Encoding

Kaos Celana Topi

b. Naïve Bayes, Tree J48, OneR

Bagian 3 : Membuat Data Mining (Bobot 50)

1. Model Klasifikasi dengan Dataset : https://archive.ics.uci.edu/ml/machine-learning-

2. Tools yang saya gunakan adalah WEKA.

Pada tab Preprocess, Terdapat 5 Atribut, yaitu :

Gambar. Tampilan Hasil Klasifikasi dengan Model Naïve Bayes

Gambar. Tampilan Hasil Klasifikasi dengan Model Tree J48

Gambar. Tampilan Hasil Visualisasi dengan Model Tree J48

Pada hasil visualisasi klasifikasi diatas menunjukan bahwa

Anda mungkin juga menyukai