Anda di halaman 1dari 22

PRAKTIKUM DATA MINING

RapidMiner

Algoritma C4.5 (Decision Tree)  Classification

1. Buka RapidMiner
2. Untuk membuat baru, pilih New Process

Ratna – Data Mining 1


3. Pengaturan penggunaan data training, dengan cara :
a. Dikarenakan data training yang akan digunakan dalam bentuk Excel, maka pada tab
Operator dipilih Data  Import  Read Excel
b. Letakkan operator Read Excel tersebut pada Main Process dengan double klik
operator Read Excel atau dengan klik dan drag Read Excel ke Main Process

c. Menempatkan file data training yang berupa excel, dengan meng-klik tombol Import
Configuration Wizard... yang terdapat di tab parameter

d. Menentukan lokasi penyimpanan file data training, lalu tekan tombol Next

Ratna – Data Mining 2


e. Selanjutnya, memilih range data yang akan di Import lalu tekan tombol Next

f. Klik tombol Next lagi


g. Kemudian menentukan tipe data, atribut dan label

 Binominom : untuk tipe data yang hanya terdiri 2 (dua) kategori, seperti Ya –
Tidak, Baik – Cukup, Kuat – Lemah dsb

Ratna – Data Mining 3


 Polynom : untuk tipe data yang terdiri lebih dari 2 kategori, seperti Tinggi –
Sedang – Kurang dsb
 Attribute : digunakan sebagai variabel prediksi (predictor)
 Label : digunakan sebagai variabel tujuan (class)

Tekan tombol Finish, setelah selesai menentukan tipe data, atribut dan label.

4. Meletakkan operator Decision Tree yang terdapat di tab Operator  Modeling 


Classification and Regression  Tree Induction  Decision Tree di Main Process

5. Agar data training dapat di proses, maka operator Read Excel dengan Decision Tree harus
dikoneksikan dengan cara :
a. Pada Read Excel, klik “out” (output), lalu drag ke “tra” (training) yang terdapat di
Decision Tree
b. Pada Decision Tree, klik “mod” (model), lalu drag ke “res” (result) yang terdapat di
sebelah kanan Main Process

6. Tekan tombol Run, untuk mengetahui hasil dari Main Process

Ratna – Data Mining 4


7. Maka akan tampil Decision Tree seperti berikut ini :

LATIHAN
1. Diketahui data sebagai berikut :

Dengan menggunakan RapidMiner, buatlah decession tree dengan algoritma C.45 dan apa
yang dapat Anda simpulkan dari Decession Tree tersebut.

Ratna – Data Mining 5


2. Diketahui data sebagai berikut :

Dengan menggunakan RapidMiner, buatlah decession tree dengan algoritma C.45 dan apa
yang dapat Anda simpulkan dari Decession Tree tersebut.

Ratna – Data Mining 6


PRAKTIKUM DATA MINING
RapidMiner

Algoritma Naïve Bayes  Classification

EXCEL
 Tuliskan Data Training (data sample yang sudah ada) berikut ini di sheet1

 Tuliskan Data Testing (data yang akan diprediksi) berikut ini di sheet2

Ratna – Data Mining 7


RapidMiner
1. Buka RapidMiner
2. Untuk membuat baru, pilih New Process

3. Memanggil Data Training, dengan cara :


a. Pada TextBox Search tuliskan Read, maka akan menampilkan komponen yang
terdapat kata Read.
b. Drag and drop Read Excel ke editor Main Proses.
c. Maka di Main Proses akan tampil komponen Read Excel.

b c

d. Menempatkan file data training yang berupa excel, dengan meng-klik tombol Import
Configuration Wizard... yang terdapat di tab parameter

Ratna – Data Mining 8


e. Menentukan lokasi penyimpanan file Excel yang telah dibuat sebelumnya, lalu tekan
tombol Next

f. Selanjutnya, memilih data yang ada di sheet1 lalu tekan tombol Next

Ratna – Data Mining 9


g. Kemudian pada BELI KOMPUTER, ubah attribute menjadi LABEL. Setelah selesai tekan
tombol FINISH.

4. Memanggil Teknik yang digunakan, yaitu Naïve Bayes dengan cara :


a. Pada TextBox Search tuliskan Naive, maka akan menampilkan komponen yang
terdapat kata Read.
b. Drag and drop Naïve Bayes ke editor Main Proses.
c. Maka di Main Proses akan tampil komponen Naïve Bayes.
d. Koneksikan Read Excel (output) dengan Naïve Bayes (training)

Ratna – Data Mining 10


a

d
c
b

5. Memanggil Data Testing, dengan cara :


a. Pada TextBox Search tuliskan Read, maka akan menampilkan komponen yang
terdapat kata Read.
b. Drag and drop Read Excel ke editor Main Proses.
c. Maka di Main Proses akan tampil komponen Read Excel (2).

d. Menempatkan file Excel yang akan diolah, dengan meng-klik tombol Import
Configuration Wizard... yang terdapat di tab parameter.
e. Menentukan lokasi penyimpanan file Excel tersebut, lalu tekan tombol Next.
f. Selanjutnya, memilih data yang ada di sheet2 lalu tekan tombol FINISH.

Ratna – Data Mining 11


6. Mengaplikasikan (Apply Model) komponen-komponen yang ada dengan cara :
a. Pada TextBox Search tuliskan Apply, maka akan menampilkan komponen yang
terdapat kata Apply.
b. Drag and drop Apply Model ke editor Main Proses.
c. Maka di Main Proses akan tampil komponen Apply Model.

d. Koneksikan Naïve Bayes (model) dengan Apply Model (model)


e. Koneksikan Read Excel (2) (output) dengan Apply Model (unl)
f. Koneksikan Apply Model (lab) ke result
g. Koneksikan Apply Model (model) ke result

Ratna – Data Mining 12


7. Tekan tombol Run, untuk mengetahui hasil dari Main Process

8. Maka akan tampil sebagai berikut, dan untuk mengetahui hasil prediksi Label Beli
Komputer data testing dengan klik Tab ExampleSet (Read Excel (2)) :

Ratna – Data Mining 13


9. Maka akan ditampilkan hasil prediksi sebagai berikut :

Sehingga akan diperoleh Class / Label Beli Komputer untuk :


 Usia <= 30; Pendapatan = Sedang; Pelajar = Ya; Penilaian = Cukup; diprediksi
memiliki Label Beli Komputer = YA.
 Usia > 40; Pendapatan = Tinggi; Pelajar = Tidak; Penilaian = Cukup; diprediksi
memiliki Label Beli Komputer = TIDAK.

LATIHAN No. 1
Data Training

Data Testing

Dengan menggunakan RapidMiner, tentukan Label Beli Komputer dari Data Testing dengan
Teknik Naïve Bayes.

Ratna – Data Mining 14


LATIHAN No. 2
Data Training mengenai REKOMENDASI yang diangkat menjadi KARYAWAN TETAP, dengan
Class REKOMENDASI

Data Testing

Dengan menggunakan RapidMiner, tentukan Label REKOMENDASI dari Data Testing dengan
Teknik Naïve Bayes.

Ratna – Data Mining 15


PRAKTIKUM DATA MINING
RapidMiner

Algoritma K – Nearest Neigbor  Classification

Data training dan testing menggunakan data excel sebelumnya (Class BELI KOMPUTER)

1. Buka RapidMiner
2. Untuk membuat baru, pilih New Process

3. Memanggil Data Training, dengan cara :


a. Pada TextBox Search tuliskan Read, maka akan menampilkan komponen yang
terdapat kata Read.
b. Drag and drop Read Excel ke editor Main Proses.
c. Maka di Main Proses akan tampil komponen Read Excel.

b c

d. Menempatkan file data training yang berupa excel, dengan meng-klik tombol Import
Configuration Wizard... yang terdapat di tab parameter

Ratna – Data Mining 16


e. Menentukan lokasi penyimpanan file Excel yang telah dibuat sebelumnya, lalu tekan
tombol Next

f. Selanjutnya, memilih data yang ada di sheet1 lalu tekan tombol Next

Ratna – Data Mining 17


g. Kemudian pada BELI KOMPUTER, ubah attribute menjadi LABEL. Setelah selesai tekan
tombol FINISH.

4. Memanggil Teknik yang digunakan, yaitu k-NN dengan cara :


a. Pada TextBox Search tuliskan k-NN, maka akan menampilkan komponen yang
terdapat kata Read.
b. Drag and drop k-NN ke editor Main Proses.
c. Maka di Main Proses akan tampil komponen k-NN.
d. Koneksikan Read Excel (output) dengan k-NN (training)

d c
b

Ratna – Data Mining 18


5. Memanggil Data Testing, dengan cara :
a. Pada TextBox Search tuliskan Read, maka akan menampilkan komponen yang
terdapat kata Read.
b. Drag and drop Read Excel ke editor Main Proses.
c. Maka di Main Proses akan tampil komponen Read Excel (2).

d. Menempatkan file Excel yang akan diolah, dengan meng-klik tombol Import
Configuration Wizard... yang terdapat di tab parameter.
e. Menentukan lokasi penyimpanan file Excel tersebut, lalu tekan tombol Next.
f. Selanjutnya, memilih data yang ada di sheet2, blok data yang akan diolah lalu
tekan tombol NEXT, lalu FINISH.

Ratna – Data Mining 19


6. Mengaplikasikan (Apply Model) komponen-komponen yang ada dengan cara :
a. Pada TextBox Search tuliskan Apply, maka akan menampilkan komponen yang
terdapat kata Apply.
b. Drag and drop Apply Model ke editor Main Proses.
c. Maka di Main Proses akan tampil komponen Apply Model.

b
c

d. Koneksikan k-NN (model) dengan Apply Model (model)


e. Koneksikan Read Excel (2) (output) dengan Apply Model (unl)
f. Koneksikan Apply Model (lab) ke result
g. Koneksikan Apply Model (model) ke result

7. Mengisikan nilai k sebagai jumlah tetangga terdekat

8. Tekan tombol Run, untuk mengetahui hasil dari Main Process

Ratna – Data Mining 20


9. Maka akan tampil sebagai berikut, dan untuk mengetahui hasil prediksi Label Beli
Komputer data testing dengan klik Tab ExampleSet (Read Excel (2)), maka akan
ditampilkan hasil prediksi sebagai berikut :

Sehingga akan diperoleh Class / Label Beli Komputer untuk :


 Usia <= 30; Pendapatan = Sedang; Pelajar = Ya; Penilaian = Cukup; diprediksi
memiliki Label Beli Komputer = YA.
 Usia > 40; Pendapatan = Tinggi; Pelajar = Tidak; Penilaian = Cukup; diprediksi
memiliki Label Beli Komputer = TIDAK.

LATIHAN No. 1
Data Training

Ratna – Data Mining 21


Data Testing

Dengan menggunakan RapidMiner, tentukan Label Beli Komputer dari Data Testing dengan
Teknik Naïve Bayes.

LATIHAN No. 2
Data Training mengenai REKOMENDASI yang diangkat menjadi KARYAWAN TETAP, dengan
Class REKOMENDASI

Data Testing

Dengan menggunakan RapidMiner, tentukan Label REKOMENDASI dari Data Testing dengan
Teknik Naïve Bayes.

Ratna – Data Mining 22

Anda mungkin juga menyukai