03 Probstat 2019
03 Probstat 2019
http://www.unhas.ac.id/amil/S1TIF/probstat2019/
L3
Regresi Linier
Amil Ahmad Ilham
Hubungan antarvariabel
Terhubung Non-linier
Hubungan antarvariabel
Linier, terhubung kuat Linier, terhubung lemah
Regresi Linier
Residuals
Residuals
Residuals
acak acak - tersebar berpola - tersebar
Koefisien korelasi
• Mengukur korelasi antara dua variabel
• Menunjukkan kekuatan korelasi
r
( X X )(Y Y )
i i
( X X ) (Y Y )
i
2
i
2
koefisien korelasi
Apa itu regresi? Regresi adalah proses untuk memprediksi
nilai kontinu variable terikat
Nilai kontinu
4 3.5 6 10.6 244
5 3.5 6 10.0 230
6 3.5 6 10.1 232
7 3.7 6 11.1 255
8 3.7 6 11.6 267
9 2.4 4 9.2 ?
Training
Model
Jenis mobil baru Estimasi
Emisi CO2
10
Jenis Model Regresi
• Simple Regression (regresi sederhana):
• Linier
• Non-linier
Prediksi EmisiCO2 vs Ukuran Mesin
11
Aplikasi Regresi
• Prediksi Nilai Penjualan per Tahun seseorang
• Berdasarkan umur, pendidikan dan pengalaman seorang sales
• Analisis kepuasan pelanggan
• Berdasarkan demografi dan faktor psikologis pelanggan
• Estimasi Harga Rumah
• Berdasarkan luas, jumlah kamar dll
• Gaji Karyawan
• Berdasarkan jenis pekerjaan, pendidikan, jenis kelamin, umur, pengalaman
kerja dll.
Berbagai Algoritma Regresi
• Regresi Ordinal
• Regresi Poisson
• Fast Forest Quantile
• Linier, Polinomial, Lasso, Stepwise, Ridge
• Regresi Linier Bayesian
• Neural Network
• Decision Forest
• Booseted Decision Tree
• KNN (K-nearest neighbors)
13
Regresi Linier Sederhana
14
Menggunakan Regresi Linier untuk memperkirakan nilai
kontinu
X: variable bebas Y: variable terikat
Ukuran Silinder Konsumsi Emisi CO2
Mesin BBM
0 2.0 4 8.5 196
1 2.4 4 9.6 221
2 1.5 4 5.9 136
3 3.5 6 11.1 255
Nilai kontinu
4 3.5 6 10.6 244
5 3.5 6 10.0 230
6 3.5 6 10.1 232
7 3.7 6 11.1 255
8 3.7 6 11.6 267
9 2.4 4 9.2 ?
15
Topologi Regresi Linier
• Regresi Linier Sederhana
• Prediksi Emisi CO2 vs Ukuran Mesin dari semua mobil
16
Cara menerapkan regresi linier
Emisi CO2
2 1.5 4 5.9 136
3 3.5 6 11.1 255
4 3.5 6 10.6 244
5 3.5 6 10.0 230
6 3.5 6 10.1 232
7 3.7 6 11.1 255
8 3.7 6 11.6 267
9 2.4 4 9.2 ? Ukuran Mesin
Cara menerapkan regresi linier
Plot Data Y vs X
Ukuran Silinder Konsumsi Emisi
Mesin BBM CO2
0 2.0 4 8.5 196
1 2.4 4 9.6 221 214
Y (Emisi CO2)
2 1.5 4 5.9 136
3 3.5 6 11.1 255
4 3.5 6 10.6 244
5 3.5 6 10.0 230
6 3.5 6 10.1 232
7 3.7 6 11.1 255
8 3.7 6 11.6 267
9 2.4 4 9.2 ? x1 (Ukuran Mesin)
2.4
Cara menerapkan regresi linier
Koefisien garis Plot Data Y vs X
Y (Emisi CO2)
𝑦 = 𝜃0 + 𝜃1 𝑥1
Bagaimana mencari nilai 𝜃0 dan 𝜃1 sehingga garis paling mendekati data (best fit) ?
Cara mencari best fit ?
Plot Data Y vs X
Ambil nilai variable bebas 𝑥1 = 5.4
𝑦 = 250 (nilai Emisi CO2 menurut data)
Y (Emisi CO2)
𝑦 = 𝜃0 + 𝜃1 𝑥1 𝒚 = 𝟑𝟒𝟎
𝑛
1 2
𝑀𝑆𝐸 = 𝑦𝑖 − 𝑦𝑖
Y (Emisi CO2)
𝑛
𝑖=1
Pendekatan minimasi:
• Pendekatan matematis
• Pendekatan optimasi
x1 (Ukuran Mesin)
Distribusi Error
Estimasi parameter 𝜃0 dan 𝜃1 (𝒎𝒂𝒕𝒆𝒎𝒂𝒕𝒊𝒔)
𝑦 = 𝜃0 + 𝜃1 𝑥1
Ukuran Silinder Konsumsi Emisi
Mesin BBM CO2 𝑠
0 2.0 4 8.5 196 𝑖=1 𝑥𝑖 − 𝑥 𝑦𝑖 − 𝑦
𝜃1 = 𝑠 2
1 2.4 4 9.6 221
𝑖=1 𝑥𝑖 − 𝑥
2 1.5 4 5.9 136
3 3.5 6 11.1 255
4 3.5 𝑥1 6 10.6 244 𝑦
𝜃1 = 43.98
5 3.5 6 10.0 230
6 3.5 6 10.1 232
7 3.7 6 11.1 255 𝜃𝑜 = 𝑦 − 𝜃1 𝑥
8 3.7 6 11.6 267
9 2.4 4 9.2 ?
𝜃𝑜 = 92.8
Estimasi parameter 𝜃0 dan 𝜃1 (𝒐𝒑𝒕𝒊𝒎𝒂𝒔𝒊)