Anda di halaman 1dari 19

PERTEMUAN

Data Science
03 Membangun Skenario
Pemodelan

Muhammad Resha S.Kom, MMSI


http://resha.web.id
Tujuan pembelajaran

• Mahasiswa dapat mendalami data yang dimiliki


• Mahasiswa dapat memahami konsep mengumpulkan data
• Mahasiswa dapat menjelaskan cara menelaah data
• Mahasiswa dapat memvalidasi data
• Mahasiswa dapat memahami data preparation
• Mahasiswa dapat membangun model
• Mahasiswa dapat membangun scenario pemodelan
2. Data Understanding :
Mengapa Perlu Mengenali/ mendalami data yang dimiliki

• Angkatan bersenjata Amerika Serikat


menghadapi dilema selama perang, karena
pesawat pengebom yang kembali penuh
dengan lubang peluru dan mereka
membutuhkan cara yang lebih baik untuk
melindunginya.

• "Di mana mereka harus meletakkannya?"


• Ketika mereka merencanakan kerusakan
yang ditimbulkan oleh pesawat-pesawat ini,
kerusakan itu menyebar, tetapi sebagian
besar terkonsentrasi di sekitar ekor, badan,
dan sayap.
• Haruskah mereka meningkatkan bagian ini?
2. Data Understanding : Mengumpulkan Data

Mengumpulkan Data yang Diperlukan

Jumlah Data: Berapa banyak yang dapat diperoleh


Deskripsi Data: Penjelasan arti atribut/ fitur
2. Data Understanding : Menelaah Data

Menganalisa data secara eksploratif (EDA)

Karakteristik Atribut: Deskripsi data (atribut) yang diperoleh


Keterkaitan antar Data: Analisis statistik korelasi, Anova, Chi-
Squared,…
2. Data Understanding : Memvalidasi Data
Menilai kesesuaian kualitas data dengan
masalah yang akan dipecahkan

Laporan Kualitas Data:


- Ukuran Data (Atribut/ fitur dan Jumlah record
- Deskripsi statistical atribut
- Relasi antar atribut (dan label)
- Visualisasi data
3. Data Preparation :
Memperbaiki kualitas data untuk Pemodelan

01
Memilih dan memilah data Rekord terpakai
Memilih data yang akan dipergunakan Atribut terpakai

02
Membersihan Data Data lengkap
Meminimalkan noise (tidak lengkap, salah) Data yang diperbaiki
Data Pecilan

03
Mengkonstruksi data Fitur tambahan (Feature Engineering)
Menambahkan fitur dan transformasi data Transformasi data (standardisasi, transformasi)

04
Integrasi Data
Menggabungkan data Gabungan data
4. Modeling :
Mengembangkan Model (Pengetahuan)

01 Membangun Skenario Pemilihan Algoritma Machine Learning


Pemodelan (ML)
Membuat strategi pencarian model Pembagian Data
Penentuan Langkah Eksperimen
terbaik

02 Membangun model Eksekusi Algoritma


Pengaturan Parameter
Mengembangkan model dengan
Pengukuran Performance Metrics
Teknik ML
4. Modeling : Membangun Skenario Pemodelan

Membuat strategi pencarian model terbaik

Pemilihan Algoritma Machine Learning (ML)


Pembagian Data
Penentuan Langkah Eksperimen
4. Modeling : Membangun Skenario Pemodelan

Membuat strategi pencarian model terbaik

B. Membagi data: Sesuai dengan ketersediaan data


1. Data Latih: Untuk mengembangkan model
2. Data Uji: Untuk Mengukur performansi model

Data
Latih

Split
Data

Data
Uji
4. Modeling : Membangun Skenario Pemodelan
Membuat strategi pencarian model terbaik

C. Menentukan Langkah Eksperimen: Untuk


mendapatkan model terbaik secara efisien dan efektif

Best Guess One Factor at A Time Grid Search


4. Modeling : Membangun model
Mengembangkan model dengan Teknik ML
Pemilihan Algoritma Machine Learning (ML)
Pembagian Data
Penentuan Langkah Eksperimen

Tidak ada Algoritma yang SELALU TERBAIK untuk setiap


dataset! Coba beberapa algoritma!!
4. Modeling : Membangun model
Mengembangkan model dengan Teknik ML

A. Proses Pelatihan : Untuk mendapatkan model


Data Teknik ML Model
Latih

1. k-Nearest Neighbor (k-


NN)
2. Naïve Bayes
3. Regression Techniques
4. Support Vector Machines
(SVMs)
5. Decision Trees
6. Random Forests
7. Deep Learning Algorithms
8. ...
4. Modeling : Membangun model

Mengembangkan model dengan Teknik ML

B. Proses Pengujian : Untuk mengukur Performansi

Data Model Decision


Uji
5. Model Evaluation
Mengevaluasi Performansi Model Yang Dihasilkan

01 Mengevaluasi Model
Mengukur performansi model
Performansi Capaian vs Target
Memilih Model terbaik

02 Mengevaluasi Proses
Menilai apakah proses sudah maksimal

Review Proses untuk mencari


batasan atau kekurangan model
6. Deployment

Memasang model ke dalam aplikasi atau menggunakannya

01
Membuat rencana deployment Rencana pemasangan model menjadi suatu
Mengukur performansi model sistem

02
Melakukan deployment model Pemasangan model ke dalam sistem operasional
Menilai apakah proses sudah maksimal

03
Membuat rencana pemeliharaan Memonitor performansi sistem dan membuat
Mengukur performansi model rencana pemeliharaan

04
Melakukan pemeliharaan model Melakukan perawatan atau membuat model baru
Menilai apakah proses sudah maksimal
7. Evaluation

Mengevaluasi semua kegiatan projek DATA SCIENCE

01
Melakukan review projek DS Umpan balik dan lesson learned
Lesson learned selama mekalukan projek

02
Membuat laporan akhir proyek Laporan akhir projek
DS
Laporan pelaksanaan an pencapaian
Tugas

• Carilah 3 contoh data yang dapat di


Terima Kasih

Anda mungkin juga menyukai