Anda di halaman 1dari 8

Praktikum 9 – Data Mining

Minggu 09 – Klasifikasi

Nama : Ardy Armando


NIM : 3311801021
Kelas : Informatika 3 A
Program Studi : Teknik Informatika

Tugas Praktikum:
1. Tuliskan kembali proses praktikum ini, kemudian buat laporannya.
2. Pengertian klasifikasi? Tuliskan dengan bahasa anda sendiri.
3. Cari tau perbedaan antara algoritma C4.5 dan C5.0?
4. Apa yang dimaksud dengan entropy dan gain?
5. Apa itu pruning (cek pada referensi)
6. Tuliskan rules yang dihasilkan pada praktikum ini! Contoh: Rule 1: (income = high) ∧
(credit_rating = Fair) → No
7. Bandingkan rules yang dihasilkan, dengan rules yang anda hitung pada pertemuan sebelumnya.
Apakah terdapat perbedaan?
8. Kumpulkan laporan, script, dataset dalam bentuk .rar/.zip pada learningif.polibatam.ac.id

Jawaban :

1) Tuliskan kembali proses praktikum ini, kemudian buat laporannya.


1. Bukalah Rstudio
2. Buat script baru
3. Pengaturan lokasi directory setwd(“D:/OneDrive – Politeknik Negeri
Batam/2019/pengajaran/data mining/w8”) Sesuaikan code diatas dengan lokasi file anda.
Script :

Hasil Running :

Hasil running adalah menepkan sebuah directory kedalam variable yang bernama “lokasi”.
Directory ini nantinya akan dijadikan working directory dimana kita akan bekerja.
4. Buat file baru, beri nama w8.csv, boleh diganti yang lain

5. Kemudian baca data tersebut


dataset <- read.csv(“w8.csv”, sep = “;”)
Sesuaikan dengan nama file anda.
Script :

Hasil Running :

Script diatas akan membuat sebuah variable yang bernama dataset, variable ini berisi data
excel dengan format (.csv) dan menggunakan pemisah berupa tanda “;”.

6. Instalasi package
install.packages(“C50”)
install.packages(“printr”)
Script :
7. Untuk melihat package yang sudah terinstal pada computer anda, perhatikan pada bagian
kanan bawah
Jawab :

Pastikan package C50 dan printr dalam keadaan checklist

8. Gunakan package
library(C50)
library(printr)
Script:

Hasil Running :

Hasil running akan memuat libgrary C50 dan printr kedalam projek yang akan kita buat.

9. Pembuatan model decision tree menggunakan algoritman C5.0


Jawab :
10. Melihat model
Jawab :

Hasil Running :
11. Menampilkan pohon yang sudah dibangun
Jawab :

12. . Menjadikan dataset, sebagai data testing. Namun hanya kolom 1,2,3,4 saja, dan tanpa
label
datatesting <-dataset[,1:4] :
Script :

Script diatas akan membuat dataset baru namun hanya pada kolom 1 – 4. Dataset
tersebut akan disimpan pada sebuah variable bernama datatest
Isi Dataset

#prediksi
predictions <-predict(model, datatesting)

13. Membandingkan hasil prediksi dengan dataset


Script :

Hasil Running :
2) Pengertian klasifikasi? Tuliskan dengan bahasa anda sendiri.

Jawab :

Klasifikasi adalah suatu proses pengelompokkan / pengklasifikasian data berdasarkan attribut


atau kriteria tertentu. Metode untuk mengelompokkan data tersebut berbentuk seperti
kondisional / percabangan dimana biasanya proses ini digambarkan dengan C4.5 atau C5.0.

3) Cari tau perbedaan antara algoritma C4.5 dan C5.0?

Jawab :

C4.5 yang digunakan untuk membangun sebuah pohon keputusan yang mudah dimengerti
fleksibel dan menarik dikarenakan dapat divisualisasikan dalam bentuk gambar.

Algoritma C5.0 yaitu salah satu algoritma klasifikasi data mining yang khususnya diterapkan
pada teknik decision tree. Dalam algoritma ini pemilihan atribut yang akan diproses
menggunakan information gain.

4) Apa yang dimaksud dengan entropy dan gain?

Jawab :

Entropy adalah ukuran kemurnian semakin rendah nilai entropinya maka semakin murni,
semakin homogen. salah satu besaran termodinamika yang mengukur energi dalam sistem per
satuan temperatur yang tak dapat digunakan untuk melakukan usaha.

Gain adalah Pengurangan entropy total oleh partisi atribut , semakin banyak
partisipasinya,semakin banyak dikurangin.

5) Apa itu pruning (cek pada referensi)

Jawab :

Pruning adalah proses pemangkasan atau penyederhanaan dari pohon keputusan (decision tree)
sehingga dapat membuat pengelompokkan data menjadi lebih mudah dan lebih singkat.

Pruning ada 2, yaitu :

a. Pre-Prunning : proses pemangkasan dengan menentukan apakah sebuah branch (cabang)


dalam pohon keputusan dapat dicabangkan lagi atau tidak (menjadi leaf).
b. Post-Prunning : proses pemangkasan ketika pohon keputusan telah seutuhnya jadi, lalu kita
akan menyederhanakan dahan (branch) yang dapat disederhakan menjadi leaf (daun).
6) Tuliskan rules yang dihasilkan pada praktikum ini! Contoh: Rule 1: (income = high) ∧
(credit_rating = Fair) → No

Jawab :

Rule 1 : Jika usia 31 – 40 maka buys_computer adalah “yes”


Rule 2 : jika usia kecil sama dari 30 dan student maka buys_computer adalah “yes”
Rule 3 : Jika usia kecil sama dari 30 dan tidak student maka buys_computer adalah “no”
Rule 4 : Jika usia besar dari 40 dan credit_rating-nya excellent maka buys_computer adalah “no”
Rule 5 : jika usia besar dari 40 dan credit_rating-nya fair maka buys_computer adalah “yes”

7) Bandingkan rules yang dihasilkan, dengan rules yang anda hitung pada pertemuan sebelumnya.
Apakah terdapat perbedaan?

Jawab :

Setelah dibandingkan, rules yang dihasilkan pada praktikum ini dengan praktikum minggu lalu
sama.

8) Kumpulkan laporan, script, dataset dalam bentuk .rar/.zip pada learningif.polibatam.ac.id

Anda mungkin juga menyukai