Anda di halaman 1dari 24

Data Mining

Prima Dina Atika, S.Kom., M. Kom.


Wowon Priatna, S.T., M.T.I.

Fakultas Ilmu Komputer 1


Program Studi Informatika
2. Proses Data Mining
2.1 Proses dan Tools Data Mining
2.2 Penerapan Proses Data Mining
2.3 Evaluasi Model Data Mining

Fakultas Ilmu Komputer


Program Studi Informatika
2.2 Penerapan Proses Data Mining

Fakultas Ilmu Komputer - Program Studi Informatika 3


www.ubharajaya.ac.id
Proses Data Mining

1. Himpunan 2. Metode 3. Pengetahuan 4. Evaluation


Data Data Mining

(Pemahaman dan (Pilih Metode (Pola/Model/Rumus/ (Akurasi, AUC,


Pengolahan Data) Sesuai Karakter Data) Tree/Rule/Cluster) RMSE, Lift Ratio,…)

DATA PRE-PROCESSING Estimation


Data Cleaning Prediction
Data Integration Classification
Data Reduction Clustering
Association
Data Transformation

Fakultas Ilmu Komputer - Program Studi Informatika


www.ubharajaya.ac.id
4
1. Latihan: Rekomendasi Main Golf

1. Lakukan training pada data golf


(maingolf.xls) dengan menggunakan
algoritma decision tree

2. Tampilkan himpunan data (dataset)


dan pengetahuan (model tree) yang
terbentuk

Fakultas Ilmu Komputer - Program Studi Informatika


www.ubharajaya.ac.id
5
Fakultas Ilmu Komputer - Program Studi Informatika
www.ubharajaya.ac.id
6
7
Fakultas Ilmu Komputer - Program Studi Informatika
www.ubharajaya.ac.id
8
Fakultas Ilmu Komputer - Program Studi Informatika
www.ubharajaya.ac.id
9
Fakultas Ilmu Komputer - Program Studi Informatika
www.ubharajaya.ac.id
10
Fakultas Ilmu Komputer - Program Studi Informatika
www.ubharajaya.ac.id
11
Fakultas Ilmu Komputer - Program Studi Informatika
www.ubharajaya.ac.id
12
Fakultas Ilmu Komputer - Program Studi Informatika
www.ubharajaya.ac.id
13
Fakultas Ilmu Komputer - Program Studi Informatika
www.ubharajaya.ac.id
14
2. Latihan: Rekomendasi Main Tenis

1. Lakukan training pada data golf


(tenis.xls) dengan menggunakan
algoritma decision tree

2. Tampilkan himpunan data (dataset)


dan pengetahuan (model tree) yang
terbentuk

Fakultas Ilmu Komputer - Program Studi Informatika


www.ubharajaya.ac.id
15
3. Latihan: Penentuan Jenis Bunga Iris

1. Lakukan training pada data Bunga Iris (ambil dari repositories


rapidminer) dengan menggunakan algoritma decision tree
2. Tampilkan himpunan data (dataset) dan pengetahuan (model
tree) yang terbentuk

Fakultas Ilmu Komputer - Program Studi Informatika


www.ubharajaya.ac.id
16
3.Latihan: Klastering Jenis Bunga Iris

1. Lakukan training pada


data Bunga Iris (ambil dari
repositories rapidminer)
dengan menggunakan
algoritma k-Means
2. Tampilkan himpunan data
(dataset) dan
pengetahuan (model tree)
yang terbentuk
3. Tampilkan grafik dari
cluster yang terbentuk

Fakultas Ilmu Komputer - Program Studi Informatika


www.ubharajaya.ac.id
17
4. Latihan: Rekomendasi Contact Lenses

1. Lakukan training pada data Contact Lenses (contact-lenses.xls) dengan


menggunakan algoritma decision tree
2. Gunakan operator Read Excel (on the fly) atau langsung menggunakan fitur Import
Data (persistent)
3. Tampilkan himpunan data (dataset) dan pengetahuan (model tree) yang terbentuk

Fakultas Ilmu Komputer - Program Studi Informatika


www.ubharajaya.ac.id
18
Read Excel Operator

Fakultas Ilmu Komputer - Program Studi Informatika


www.ubharajaya.ac.id
19
Import Data Function

Fakultas Ilmu Komputer - Program Studi Informatika


www.ubharajaya.ac.id
20
5. Latihan: Prediksi Elektabilitas Caleg

1. Lakukan training pada data pemilu


(datapemilukpu.xls) dengan algoritma
yang tepat
2. Data bisa ditarik dari Import Data atau
operator Read Excel
3. Tampilkan himpunan data (dataset) dan
pengetahuan (pola/model) yang terbentuk
4. Gunakan model yang dihasilkan untuk
memprediksi datapemilukpu-testing.xls

Fakultas Ilmu Komputer - Program Studi Informatika


www.ubharajaya.ac.id
21
6. Latihan: Klasifikasi Data Kelulusan
Mahasiswa

1. Lakukan training pada data kelulusan


mahasiswa (datakelulusanmahasiswa.xls)

2. Gunakan operator Split Data untuk memecah


data secara otomatis menjadi dua dengan
perbandingan 0.9:0.1, di mana 0.9 untuk
training dan 0.1 untuk testing

3. Pilih metode yang tepat supaya menghasilkan


pola yang bisa menguji data testing 10%

Fakultas Ilmu Komputer - Program Studi Informatika


www.ubharajaya.ac.id
22
7. Latihan: Deteksi Kanker Payudara

1. Lakukan training pada data kanker


payudara (breasttissue.xls)

2. Pilih metode yang tepat supaya


menghasilkan pola

Fakultas Ilmu Komputer - Program Studi Informatika


www.ubharajaya.ac.id
23
8. Latihan: Klasifikasi Music Genre

1. Lakukan training pada data Music Genre


(musicgenre-small.xls)

2. Pilih metode yang tepat supaya


menghasilkan pola

Fakultas Ilmu Komputer - Program Studi Informatika


www.ubharajaya.ac.id
24

Anda mungkin juga menyukai