Program Studi Informatika 2. Proses Data Mining 2.1 Proses dan Tools Data Mining 2.2 Penerapan Proses Data Mining 2.3 Evaluasi Model Data Mining
Fakultas Ilmu Komputer
Program Studi Informatika 2.2 Penerapan Proses Data Mining
Fakultas Ilmu Komputer - Program Studi Informatika 3
www.ubharajaya.ac.id Proses Data Mining
1. Himpunan 2. Metode 3. Pengetahuan 4. Evaluation
Data Data Mining
(Pemahaman dan (Pilih Metode (Pola/Model/Rumus/ (Akurasi, AUC,
Pengolahan Data) Sesuai Karakter Data) Tree/Rule/Cluster) RMSE, Lift Ratio,…)
DATA PRE-PROCESSING Estimation
Data Cleaning Prediction Data Integration Classification Data Reduction Clustering Association Data Transformation
Fakultas Ilmu Komputer - Program Studi Informatika
www.ubharajaya.ac.id 4 1. Latihan: Rekomendasi Main Golf
1. Lakukan training pada data golf
(maingolf.xls) dengan menggunakan algoritma decision tree
2. Tampilkan himpunan data (dataset)
dan pengetahuan (model tree) yang terbentuk
Fakultas Ilmu Komputer - Program Studi Informatika
www.ubharajaya.ac.id 5 Fakultas Ilmu Komputer - Program Studi Informatika www.ubharajaya.ac.id 6 7 Fakultas Ilmu Komputer - Program Studi Informatika www.ubharajaya.ac.id 8 Fakultas Ilmu Komputer - Program Studi Informatika www.ubharajaya.ac.id 9 Fakultas Ilmu Komputer - Program Studi Informatika www.ubharajaya.ac.id 10 Fakultas Ilmu Komputer - Program Studi Informatika www.ubharajaya.ac.id 11 Fakultas Ilmu Komputer - Program Studi Informatika www.ubharajaya.ac.id 12 Fakultas Ilmu Komputer - Program Studi Informatika www.ubharajaya.ac.id 13 Fakultas Ilmu Komputer - Program Studi Informatika www.ubharajaya.ac.id 14 2. Latihan: Rekomendasi Main Tenis
1. Lakukan training pada data golf
(tenis.xls) dengan menggunakan algoritma decision tree
2. Tampilkan himpunan data (dataset)
dan pengetahuan (model tree) yang terbentuk
Fakultas Ilmu Komputer - Program Studi Informatika
www.ubharajaya.ac.id 15 3. Latihan: Penentuan Jenis Bunga Iris
1. Lakukan training pada data Bunga Iris (ambil dari repositories
rapidminer) dengan menggunakan algoritma decision tree 2. Tampilkan himpunan data (dataset) dan pengetahuan (model tree) yang terbentuk
Fakultas Ilmu Komputer - Program Studi Informatika
www.ubharajaya.ac.id 16 3.Latihan: Klastering Jenis Bunga Iris
1. Lakukan training pada
data Bunga Iris (ambil dari repositories rapidminer) dengan menggunakan algoritma k-Means 2. Tampilkan himpunan data (dataset) dan pengetahuan (model tree) yang terbentuk 3. Tampilkan grafik dari cluster yang terbentuk
Fakultas Ilmu Komputer - Program Studi Informatika
1. Lakukan training pada data Contact Lenses (contact-lenses.xls) dengan
menggunakan algoritma decision tree 2. Gunakan operator Read Excel (on the fly) atau langsung menggunakan fitur Import Data (persistent) 3. Tampilkan himpunan data (dataset) dan pengetahuan (model tree) yang terbentuk
Fakultas Ilmu Komputer - Program Studi Informatika
www.ubharajaya.ac.id 18 Read Excel Operator
Fakultas Ilmu Komputer - Program Studi Informatika
www.ubharajaya.ac.id 19 Import Data Function
Fakultas Ilmu Komputer - Program Studi Informatika
(datapemilukpu.xls) dengan algoritma yang tepat 2. Data bisa ditarik dari Import Data atau operator Read Excel 3. Tampilkan himpunan data (dataset) dan pengetahuan (pola/model) yang terbentuk 4. Gunakan model yang dihasilkan untuk memprediksi datapemilukpu-testing.xls
Fakultas Ilmu Komputer - Program Studi Informatika
www.ubharajaya.ac.id 21 6. Latihan: Klasifikasi Data Kelulusan Mahasiswa
1. Lakukan training pada data kelulusan
mahasiswa (datakelulusanmahasiswa.xls)
2. Gunakan operator Split Data untuk memecah
data secara otomatis menjadi dua dengan perbandingan 0.9:0.1, di mana 0.9 untuk training dan 0.1 untuk testing
3. Pilih metode yang tepat supaya menghasilkan
pola yang bisa menguji data testing 10%
Fakultas Ilmu Komputer - Program Studi Informatika