Anda di halaman 1dari 2

Materi II

Praktikum Data Mining


Program Studi Informatika / Matematika
FMIPA Universitas Syiah Kuala

Dosen Pengasuh
Dr. Taufik Fuadi Abidin, M.Tech
Dr. Muhammad Subianto, M.Si

{tfa,subianto}@informatika.unsyiah.ac.id

PENDAHULUAN
Praktikum ini berkaitan dengan penggunaan software data mining, Weka
(http://www.cs.waikato.ac.nz/ml/weka/), penulisan data dalam format arff, dan
pengklasifikasian menggunakan KNN. Tujuan dari praktikum ini adalah:
a. Meningkatkan pemahaman mahasiswa terhadap software Weka.

b. Mengetahui cara dan aturan pembentukan data dalam format arff.

c. Melatih mahasiswa menyelesaikan masalah-masalah klasifikasi sederhana


menggunakan metode KNN.

PRAKTIKUM

1. Pelajari training set dari data segmentation yang disimpan dalam file segment-
challenge.arff dalam direktori data dimana software Weka diinstal, sebagai contoh:

/home/tfa/weka-3-6-8/data

Buka file tersebut dengan menggunakan text editor (gedit, textpad atau vim) dan pelajari
bagaimana data dalam format arff disusun. Perhatikan penjelasan di bagian atas file
tersebut dan perhatikan pula bagian deklarasi seperti potongan pernyataan berikut:

@relation segment

@attribute region-centroid-col numeric


@attribute region-centroid-row numeric
@attribute region-pixel-count numeric
@attribute short-line-density-5 numeric
@attribute short-line-density-2 numeric
:
:
@attribute hue-mean numeric
@attribute class
{brickface,sky,foliage,cement,window,path,grass}

@data

Praktikum Data Mining 1


Dr. Taufik Fuadi Abidin, S.Si., M.Tech dan Dr. Muhammad Subianto, M.Si
Perhatikan pula bagian @data dan bagaimana data disusun dibawahnya. Diskusi dengan
teman dan pahami maksudnya.

2. Setelah anda memahami bagaimana data dalam format arff disusun, pelajari testing set
data segmentation yang disimpan dalam file segment-test.arff dalam direktori yang
sama. Lakukan proses klasifikasi menggunakan metode KNN untuk k=3, k=5, k=7, k=9
dan k=11. Lakukan analisa, untuk nilai k berapa metode KNN memberikan akurasi yang
paling tinggi?

Sebagai acuan, berikut snapshot dari Weka setelah file segment-test.arff dibuka.

Lakukan observasi dan lanjutkan proses klasifikasi (classify) menggunakan metode KNN
(dalam software Weka disebut sebagai metode lazy). Diskusi dengan asisten bila anda
mengalami kesulitan dalam memahami praktikum tentang klasifikasi menggunakan KNN
(lazy classifier) ini.

- - - Happy Mining - - -

Praktikum Data Mining 2


Dr. Taufik Fuadi Abidin, S.Si., M.Tech dan Dr. Muhammad Subianto, M.Si

Anda mungkin juga menyukai