Anda di halaman 1dari 24

Learning progress review

Week 8
RADR
TABLE OF CONTENTS

01 02

Regression Model
Deployment
Regression
REGRESSION FUNDAMENTAL

REGRESSION
Dalam ilmu statistik, regresi digunakan untuk
mengetahui hubungan antara variabel. Baik
variabel x dan y.

JENIS REGRESI :
★ Simple linear regression
★ Multiple linear regression
★ Lasso regression
★ Ridge regression
REGRESSION FUNDAMENTAL

Regression adalah mengkonstruksikan Konsep Pembuatan Model Regresi :


sebuah model untuk memprediksi nilai Mencari hubungan antara satu atau lebih
dari data input yang telah diberikan. variabel independen atau predictor (X)
dengan variabel dependen atau response (Y).
● Klasifikasi digunakan untuk
memprediksi label kategori/kelas.
● Prediksi berbeda dengan
klasifikasi (dalam Machine
Learning, klasifikasi termasuk ke
dalam jenis prediksi).
HOW DO COMPANIES USE REGRESSION ?

Analisis regresi adalah go-to method in analytics.


Fungsi regresi dalam perusahaan :

★ Dasar pengambilan keputusan untuk permasalahan bisnis.


★ Menjelaskan kondisi bisnis/fenomena.
★ Memprediksi bisnis seperti prediksi penjualan.
SIMPLE LINEAR REGRESSION multiple linear regression
Simple linear regression adalah salah Multiple linear regression adalah salah satu
satu jenis analisis regresi dimana hanya analisis regresi yang digunakan untuk
ada satu variabel independen dan menjelaskan hubungan antara sebuah
terdapat hubungan linear antara variabel dependen kontinyu dan dua atau
variabel independen (x) dan variabel lebih variabel independen. Variabel
dependen (y)
independen dapat bersifat kontinyu atau
kategori.
Ordinary least square (OLS)
Ordinary Least Square (OLS) adalah jenis metode kuadrat
linear terkecil yang digunakan untuk memperkirakan
parameter yang tidak diketahui dalam model regresi linear.

Umumnya berikut rumus OLS :


Linear regression
selection

Linear regression selection adalah salah


satu prosedur untuk menyeleksi garis
regresi menggunakan nilai error SSE (Sum
Square Error). Garis regresi terbentuk saat meminimalisir
nilai SSE
Berikut rumus SSE:

Untuk mengatasi overfit dalam regresi


linear, terdapat 2 metode yang dapat
dipakai :

● Ridge Regression
● Lasso Regression
Ridge Regression Lasso Regression
Ridge Regression merupakan variasi dari Lasso Regression biasa digunakan pada saat
regresi linier. Ridge Regression biasa memiliki data dengan jumlah variabel
digunakan untuk mengatasi masalah prediktor yang besar. Persamaan LASSO mirip
multikolinieritas. Ridge regression akan dengan Regresi Ridge dan terlihat seperti di
membuat model dengan meminimalkan : bawah ini.
Decision Tree Concept
Decision tree merupakan cara untuk membangun klasifikasi atau model
regresi ke dalam bentuk struktur pohon, dengan melakukan breakdown
dataset menjadi bagian bagian terkecil dengan hasil akhir dari decision
tree concept ini adalah decision nodes dan leaf nodes
Keuntungan dan Kerugian Decision tree concept
Keuntungan :

1. Dengan cara ini decision tree


lebih mudah dijelaskan kepada Pendekatan yang biasa dilakukan
orang lain. dalam penggunaan decision tree
2. Decision tree ini dapat adalah pendekatan top down
ditampilkan secara grafis dan dengan memulai dari semua node
sangat mudah di pahami kemudian pilih atribut
berdasarkan kriteria kemudian
Kerugian : partisikan berdasarkan atribut
yang dipilih secara rekrusif
1. Decision tree bisa menjadi
sangat tidak kuat
2. Perubahan kecil yang terjadi
dapat berakibat perubahan
besar pada decision tree
Model Metrics
1. R Square
R Square adalah proporsi variasi variabel dependen yang dapat diprediksi
dari variabel independen.

2. Mean Squared Error


Mean Squared Error adalah Rata-rata Kesalahan kuadrat diantara nilai
aktual dan nilai peramalan.

3. Mean Absolute Error


Mean Absolute Error adalah rata-rata selisih mutlak nilai sebenarnya
(aktual) dengan nilai prediksi (peramalan)
MODEL
DEPLOYMENT
CRISP-DM

CRISP-DM (Cross Industry Standard


Process for Data Mining) adalah
standar proses data mining yang akan
digunakan pada penelitian ini.

CRISP-DM terbagi enam fase yang


berkaitan satu sama lain.
CRISP-DM (DETAILS)
Machine Learning Workflow
Model Deployment

Model Deployment Option :

1. Menulis ulang
keseluruhan code dalam
bahasa yang dimengerti
software engineering.

2. API
WHAT IS API ?
API adalah sebuah kontrak hipotetikal antara 2
software. Jika user software memberikan input dalam
format yang telah terdefinisi sebelumnya, bagian
software kedua akan menjalankan fungsi code dan
menyediakan hasil untuk user software.

Kita dapat menciptakan Machine Learning API sendiri


menggunakan Flask, sebuah web framework in Python.
SERIALIZATION
Serializing adalah sebuah cara untuk
menulis sebuah object python pada
suatu disk yang dapat ditransfer di
mana saja dan akan di-deserialisasikan
kemudian oleh sebuah python script.
STEPS OF MODEL DEPLOYMENT

1. MODEL SERIALIZATION
Dalam environment training,
tujuan model serialization adalah
agar dapat berkomunikasi
dengan environment aplikasi kita.

2. MODEL DESERIALIZATION
Dalam environment training, tujuan
model deserialization adalah untuk
memuat data.
3. CREATE A PYTHON 4. DEPLOY THE APP
APPLICATION ENVIRONMENT (IN LOCAL)
5. Request sent and we will get the result of
the prediction (Classification)
THANK YOU !

Anda mungkin juga menyukai