Anda di halaman 1dari 16

TUGAS DATA MINING LANJUT

CHAERIL FAJRI - 41516120105

Data Pre Procesing

Dataset yang saya gunakan saya dapatkan dari :


https://storm.cis.fordham.edu/~gweiss/data-mining/datasets.html
dengan nama dataset contact-lens.arff

Gambar 1.1. Web Download Dataset Contact-Lens.arff

Dataset tersebut merupakan contoh Dataset Untuk Pemasangan Lensa Kontak.

Terdapat 3 Class Atribut Information yang ada pada dataset ini yaitu :

1. Pasien harus dilengkapi dengan lensa kontak keras


2. Pasien harus dilengkapi dengan lensa kontak lunak,
3. Pasien tidak harus dilengkapi dengan lensa kontak.

Terdapat 4 Class Atribut Relation Lensa Kontak yang ada pada dataset ini yaitu :

1. age of the patient: (1) young, (2) pre-presbyopic, (3) presbyopic


2. spectacle prescription: (1) myope, (2) hypermetrope
3. astigmatic: (1) no, (2) yes
4. tear production rate: (1) reduced, (2) normal

Prepocessing Dataset
Preprocessing data adalah teknik data mining yang digunakan untuk mengubah data mentah dalam format yang
berguna dan efisien.

Referensi : https://www.geeksforgeeks.org/data-preprocessing-in-data-mining/

1. Buka dataset dengan, Klik button Explorer

1
Gambar 1.2. Button Explorer

2. Maka akan tampil Weka Explorer seperti gambar dibawah ini.

Gambar 1.3. Tampilan WEKA Explorer pada menu Preprocess

3. Klik Button Open File , cari file dataset contact-lens.arff, lalu klik Open

Gambar 1.4. Tampilan Open File

4. Maka file dataset tadi sudah terbuka di Weka Explorer, seperti gambar dibawah ini .

2
Gambar 1.5. Tampilan Dataset Weka Explorer pada menu Preprocess

5. Untuk melakukan preprocessing, perhatikan setiap atribut apakah terdapat missing? Jika ada lakukan
pengisian missing atau menghapus atribut tersebut. Berikut ini status pada setiap atribut :

Gambar 1.6. Tampilan Status Atribut Age pada menu Preprocess

Gambar 1.7. Tampilan Status Atribut Spectacle Prescription pada menu Preprocess

Gambar 1.8. Tampilan Status Atribut Astigmatic pada menu Preprocess

Gambar 1.9. Tampilan Status Atribut Tear Production Rate pada menu Preprocess

Pada gambar (1.6, 1.7, 1.8, 1.9 ) diatas karena tidak adak missing pada setiap atribut maka preprocessing
tidak perlu dilakukan dilanjutkan ke Klasifikasi Dataset. Dataset ini berisi contoh yang lengkap dan bebas
noise sehingga tidak perlu di pre processing.

3
Instalasi WEKA

Untuk dapat menginstal Weka, download file Weka di link berikut ini :

https://www.cs.waikato.ac.nz/ml/weka/

Gambar 2.1. Tampilan Web Official Weka

Pilih Download and Install, maka akan diarahkan ke link berikut

https://waikato.github.io/weka-wiki/downloading_weka/

Gambar 2.2. Tampilan Web Official Weka setelah Klik Button Download and Install

Pilih Windows untuk dapat dinstall di System Operasi Windows, lalu klik here. Maka akan diarahkan ke link berikut,
secara automatic file .exe weka akan langsung terdownload.

https://sourceforge.net/projects/weka/files/weka-3-8/3.8.4/weka-3-8-4-azul-zulu-windows.exe/download?
use_mirror=nchc

4
Gambar 2.3. Tampilan Weka Otomatis Terdownload di Link ini

Jika sudah terdownload maka lanjut ke instalasi Weka.

Langkah instalasi Weka adalah sebagai berikut:

1. Klik dua kali file executable dari Weka 3.8.4 (.exe) hasil proses pengunduhan

Gambar 2.4. Installer Weka

2. Pada jendela seperti tampak Gambar 2.5, pilih Next

Gambar 2.5. Jendela Awal Setup Weka 3.8.4

3. Pada bagian License Agreement (Gambar 2.6), pilih I Agree

5
Gambar 2.6. Jendela License Agreement Proses Instalasi Weka 3.8.4

4. Jendela selanjutnya (Gambar 2.7), pada bagian select the type of install pilih full, untuk menginstall seluruh
komponen yang diperlukan untuk menjalankan aplikasi (jika JRE yang sesuai sudah terinstall maka hilangkan
ceklist pada bagian Install JRE), lalu pilih Next

Gambar 2.7. Jendela Choose Components

5. Pada bagian selanjutnya (Gambar 2.8), tentukan di mana/di direktori mana Anda ingin menyimpan file hasil
proses instalasinya (perlu diingat aplikasi ini memerlukan memori sebesar 73.0 MB, jadi pilih direktori yang
Anda anggap dapat untuk menampungnya), setelah selesai menentukan direktorinya pilih Next

Gambar 2.8. Jendela Choose Install Location

6. Pada jendela selanjutnya (Gambar 2.9.), tentukan apakah Anda ingin membuat shortcut untuk menjalankan
aplikasinya pada start menu atau tidak dan tentukan nama dari shortcutnya, selanjutnya pilih Install

6
Gambar 2.9. Jendela Choose Start Menu Folder

7. Maka proses instalasi akan dilakukan (Gambar 2.10)

Gambar 2.10. Jendela Proses Penginstallan Weka

8. Setelah proses instalasi aplikasi Weka sudah selesai, klik Next, maka instalasi Weka Sudah selasai

Gambar 2.11. Jendela Pemberitahuan Instalasi Weka 3.8.4 Selesai

7
Penggunaan Weka
Berikut ini penggunaan weka dalam mengklasifikasi Dataset :

1. Buka Aplikasi Weka


2. Akan muncul tampilan awal weka

Gambar 3.1. Tampilan Awal WEKA

Penjelasan Fitur pada Weka

a. Pada tampilan awal, ketika aplikasi WEKA dibuka terlihat seperti pada Gambar 3.1, yaitu WEKA
memiliki empat menu utama dan empat tombol. Empat menu utama tersebut adalah program,
visualisation, tools, dan help.

b. Pada menu program, terdapat tiga sub menu, yaitu:


1. LogWindow (Shortcut Ctrl+L) Sub menu ini berfungsi untuk menampilkan jendela Log yang merekap
semua yang tercetak untuk stdout dan stderr.
2. Memory usage (Shortcut Ctrl+M) Menampilkan penggunaan memori pada saat aplikasi WEKA
digunakan.
3. Exit (Shortcut Ctrl+E) Untuk keluar dari aplikasi WEKA.

c. Pada menu Visualisation, merupakan sarana untuk memvisualisasikan data dengan aplikasi WEKA. Pada
menu ini terdapat lima sub menu, yaitu:
1. Plot (Shortcut Ctrl+P) Untuk menampilkan plot 2D dari sebuah dataset.
2. ROC (Shortcut Ctrl+R) Untuk menampilkan kurva ROC yang telah disimpan sebelumnya.
3. TreeVisualizer (Shortcut Ctrl+T) Untuk menampilkan graf berarah, contohnya: sebuah decision tree.
4. Graph Visualizer (Shortcut Ctrl+G) Memvisualisasikan format grafik XML BIF atau DOT, contohnya
sebuah jaringan Bayesian.
5. Boundary Visualizer (Shortcut Ctrl+B) Mengizinkan visualisasi dari batas keputusan classifier dalam
plot 2D.

d. Pada menu Tools, menampilkan aplikasi lainnya yang berguna bagi pengguna. Pada menu ini terdapat
tiga sub menu, yaitu:
1. ArffViewer (Shortcut Ctrl+A) Sebuah aplikasi MDI yang menampilkan file Arff dalam format
spreadsheet.
2. SqlViewer (Shortcut Ctrl+S) Merepresentasikan sebuah lembar kerja SQL, untuk melakukan query
database via JDBC.

8
3. Bayes net editor (Shortcut Ctrl+N) Sebuah aplikasi untuk mengedit, memvisualisasikan dan
mempelajari bayes net

Mengklasifikasi Dataset
Buka dataset dengan, Klik button Explorer
1

Gambar 3.2. Tampilan Awal WEKA

Maka akan tampil Weka Explorer seperti gambar dibawah ini.

Gambar 3.3. Tampilan WEKA Explorer pada menu Preprocess

Klik Button Open File , cari file dataset contact-lens.arff, lalu klik Open

9
1

Gambar 3.4. Tampilan Open File

Maka file dataset tadi sudah terbuka di Weka Explorer, seperti gambar dibawah ini .

Gambar 3.5. Tampilan Dataset Weka Explorer pada menu Preprocess

Setelah dataset ada di Weka Explorer, Pilih Menu Classify untuk mengklasifikasikan dataset.
1

10
Gambar 3.6. Tampilan Weka Explorer pada menu Classify

Pilih Classifier nya (Contoh NaiveBayes), lalu pilih (Nom) contact-lenses, lalu Klik Start seperti gambar
dibawah ini :

2
3
Gambar 3.7. Langkah Mengklasifikasi

Maka akan muncul output Klasifikasi dari Metode NaiveBayes seperti gambar dibawah ini :

Gambar 3.8. Tampilan Classifier NaiveBayes Output (Nom) contact-lenses

Pada gambar diatas metode NaiveBayes keakuratan dalam pengklasifikasiannya terdapat pada Correctly
Classified Instances yaitu bernilai 70,8 % (17 instances) dari Total Instances 24. Maka Confusion Matrix
nya sebagai berikut : a = soft terdiri dari 5 instances, b = hard terdiri dari 4 instances, c = none terdiri
dari 15 instances.

Kemudian saya mencoba melakukan klasifikasi lagi dengan metode ke 2 yaitu Naïve Bayes Multinomial
Text. Pilih Classifier nya (NaiveBayesMultinomialText), lalu pilih (Nom) contact-lenses, lalu Klik Start
seperti gambar dibawah ini :

11
1

2
3
Gambar 3.9. Langkah Mengklasifikasi

Maka akan muncul output Klasifikasi dari Metode NaiveBayesMultinomialText seperti gambar dibawah
ini :

Gambar 3.10. Tampilan Classifier NaiveBayesMultinomialText Output (Nom) contact-lenses

Pada gambar diatas metode NaiveBayes keakuratan dalam pengklasifikasiannya terdapat pada Correctly
Classified Instances yaitu bernilai 62,5 % (15 instances) dari Total Instances 24. Maka Confusion Matrix
nya sebagai berikut : a = soft terdiri dari 5 instances, b = hard terdiri dari 4 instances, c = none terdiri
dari 15 instances.

Kemudian saya mencoba melakukan klasifikasi lagi dengan metode ke 3 yaitu ZeroR. Pilih Classifier nya
(ZeroR), lalu pilih (Nom) contact-lenses, lalu Klik Start seperti gambar dibawah ini :

12
1

2
3
Gambar 3.11. Langkah Mengklasifikasi

Maka akan muncul Classifier ZeroR Outputnya, seperti gambar dibawah ini :

Gambar 3.12. Tampilan Classifier ZeroR Output (Nom) contact-lenses

Pada gambar diatas metode ZeroR keakuratan dalam pengklasifikasiannya terdapat pada Correctly
Classified Instances yaitu bernilai 62,5 % (15 instances). Total Instances adalah 24 instances. Maka
Confusion Matrix nya sebagai berikut : a = soft terdiri dari 5 instances, b = hard terdiri dari 4 instances, c
= none terdiri dari 15 instances.

Kemudian saya mencoba kembali melakukan klasifikasi dengan metode ke 4 yaitu TreesJ48.
Jika ingin merubah teknik Klasifikasi nya, pilih Choose pada Clasifier, kemudian pilih teknik/metode yang
di inginkan seperti gambar dibawah ini memilih teknik atau metode trees J48 :

13
1

Gambar 3.13. Tampilan pilih metode Classifier

Setelah Classifier nya (J48) dipilih, lalu pilih (Nom) contact-lenses, lalu Klik Start seperti gambar dibawah
ini :

2
3
Gambar 3.14. Langkah Mengklasifikasi

Maka akan muncul output klasifikasinya seperti dibawah ini :

14
Gambar 3.15. Tampilan Output Classifier Trees J48

Pada gambar diatas metode Trees J48 keakuratan dalam pengklasifikasiannya terdapat pada Correctly
Classified Instances yaitu bernilai 83,3 % (20 instances) dari total Instances adalah 24 instances. Maka
Confusion Matrix nya sebagai berikut : a = soft terdiri dari 5 instances, b = hard terdiri dari 4 instances, c
= none terdiri dari 15 instances.

Metode Trees J48 memiliki fitur untuk memvisualisasikan data kedalam bentuk trees (pohon). Maka saya
mencoba memvisualisasikan Trees J48, kedalam bentuk Tree (pohon). Cara memvisualisasikannya
dengan cara klik kanan pada trees.j48, kemudian pilih visualize tree, maka akan muncul seperti gambar
dibawah ini :

Gambar 3.16. Langkah Visualize Tree pada Trees J48

15
Setelah melakukan langkah diatas maka akan muncul tampilan trees (pohon) nya seperti gambar
dibawah ini :

Gambar 3.17. Tampilan Visualize Tree pada Trees J48

Dari gambar pohon diatas dapat dijelaskan bahwa :

Tear Production Rate (tingkat produksi air mata) nya yang reduced (yang mempunyai pengurangan
produksi air mata) sebesar 12 orang , sehingga tidak dilengkapi dengan lensa kontak.

Dan orang yang normal dari Tear Production Rate diklasifikasikan apakah termasuk Astigmatic?
Dari gambar diatas yang tidak termasuk astigmatic berjumlah 6 orang maka harus dilengkapi lensa
kontak yang lembut dan yang memiliki astigmatic akan diklasifikasikan apakah memiliki spectacle
prescript (keputusan vonis penyakit mata yang berasal dari dokter)?

Dari gambar diatas hasil keputusan vonis nya ada 3 orang yang menderita myope (rabun jauh) sehingga
harus dilengkapi lensa kontak yang bersifat keras. Dan ada 3 orang yang menderita hypermetrope
(rabun dekat ) sehingga tidak dilengkapi dengan lensa kontak.

Setelah melakukan percobaan klasifikasi dataset “Lenses” dengan menggunakan metode J48 decision
Trees, Rules ZeroR, Naïve Bayes Multinomial Text dan Naive Bayes, maka dapat disimpulkan bahwa:
Tingkat ke akuratan dalam pengklasifikasian adalah metode :

1. Tree J48 (83,3 %)


2. Naïve Bayes (70, 83 %)
3. Rules Zero R dan NaiveBayesMultinomialText (62,5 % )

Referensi :

http://repository.gunadarma.ac.id/1668/1/07_Buku%20WEKA_Lintang.pdf

16

Anda mungkin juga menyukai