Anda di halaman 1dari 27

IKMA UNS

Workshop Biostatististika Seri ke 3,


20 Februari 2021

Regresi Linier
Prof. Bhisma Murti
Karlinda, SKM, MKM, CPS, CPSP

Program Magister Ilmu Kesehatan


Masyarakat, Sekolah Pascasarjana,
Universitas Sebelas Maret
Apakah Regresi
Linier?
Regresi linier (linear regression) adalah
model statistik yang dapat digunakan
untuk mempelajari hubungan linier
antara satu variabel dan variabel
lainnya, atau pengaruh satu variabel
terhadap variabel lainnya.
Apakah Kegunaan
Model Regresi Linier?
Model regresi linier dapat digunakan
untuk:

1. Menjelaskan (explanation) hubungan


suatu variabel dengan variabel
lainnya, atau pengaruh satu variabel
terhadap variabel lainnya

2. Memprediksi (prediction) terjadinya


suatu variabel berdasarkan
keberadaan variabel iannya
Variabel Independen dan
Variabel Dependen
Variabel Independen:
(disebut juga variabel bebas, independent
variable, explanatory variable, predictor,
regressor) adalah variabel yang menjelaskan
atau memprediksi terjadinya variabel
dependen dalam model regresi

Variabel Dependen:
(disebut juga variabel terikat, dependent
variable, outcome variable, response
variable, regressand) adalah variabel yang
terjadinya dijelaskan atau diprediksi oleh
variabel lainnya dalam model regresi.
Apakah Regresi
Linier Merupakan
Suatu Uji Statistik?
BUKAN. Regresi linier bukan
merupakan uji statistik,
melainkan suatu model statistik
yang menjelaskan hubungan linier
antar variabel atau pengaruh
satu variabel terhadap lainnya.
Apakah
Hubungan

Variabel dependen
Linier?
Hubungan linier (linear
relationship atau linear
association) adalah istilah
statistik yang digunakan untuk
menggambarkan hubungan garis
lurus antara dua variabel.

Variabel independen
Hubungan Linier
dan Non-linier
Hubungan linier Hubungan kurvi-linier
Persamaan Regresi Linier
Variabel independent dan dependen dalam
analisis regresi linier diberi label, berturut-
turut X dan Y. Persamaan yang
mendeskripsikan hubungan antara Y dan X
disebut model regresi.

Y = β0 +β1x+ε

Model regresi linier digambarkan dalam grafik


sebagai garis lurus:

β0 adalah intersep (intercept) dari garis regresi.


β1 adalah lereng (slope) garis regresi
Ε(y) adalah mean atau nilai harapan dari Y untuk
suatu nilai X.
Error Term
(Residual Term)
Y = β0 +β1X+ε

Model regresi linier terdiri atas angka


kesalahan (error term, residual term)
yang ditulis ε. Error term digunakan
untuk menunjukkan variasi dalam Y yang
tidak bisa dijelaskan (unexplained) oleh
model hubungan linier antara X dan Y.

Jika ε tidak ada alias ε= nol, maka


variabel X saja cukup memberikan
informasi yang diperlukan untuk
menentukan nilai dari Y.
Nilai teramati Garis lurus
(observed value)
regresi
dari Y jika X= Xo

Nilai estimasi
(estimated/ predicted
“Anatomi” value) Y jika X= Xo

Garis
Prediksi Satu unit
Regresi perubahan dalam X

Xo= Suatu nilai dari


variabel independen X
Estimasi Persamaan
Regresi Linier
Jika parameter populasi diketahui, maka
persamaan regresi linier dapat digunakan untuk
menghitung rata-rata nilai dari Y (yaitu, Ε(y))
untuk suatu nilai X yang diketahui.

Ε(y) = β0 +β1x+ε

Namun dalam praktik, nilai-nilai parameter


populasi umumnya tidak diketahui, sehingga
harus diestimasi (diperkirakan) dengan
menggunakan data sampel yang dipilih dari
populasi. Parameter populasi diestimasi dengan
menggunakan statistik sampel, yakni bo
(intersep) dan b1 (lereng).
Estimasi Persamaan
Regresi Linier
Jika statistik sampel disubstitusi untuk
parameter populasi maka akan diperoleh bentuk
estimasi persamaan regresi, sebagai berikut:

(ŷ) = β0 +β1x+ε

Grafik persamaan estimasi regresi disebut


estimasi garis regresi, di mana:
1.Ŷ = baca Y hat= Nilai Y yang diprediksi (diestimasi)
2.β0 adalah intersep (intercept) Y dari garis regresi.
3.β1 adalah lereng (slope).
4.(ŷ) adalah nilai estimasi dari Y untuk suatu nilai X.
Apakah Ordinary Garis regresi
Least Square?
Ordinary Least Square (OLS) adalah
metode untuk mengestimasi
koefisien regresi (baik slope maupun
Nilai Y yang
intersep) dengan cara meminimalkan Nilai Y yang
teramati
jumlah kuadrat perbedaan antara diprediksi
(observed
nilai-nilai yang teramati (observed (predicted
values)
values) dan nilai-nilai yang diprediksi values)
(predicted values).

Karena OLS merupakan metode


utama yang digunakan dalam
mengestimasi parameter pada regresi
linier, maka regresi linier disebut juga
regresi OLS (OLS regression).
Lima Asumsi
Regresi Linier
1. Model regresi dapat dinyatakan
dalam hubungan linier
2. Mean dari semua error = 0
3. Varians dari error konstan
(homoskedasticity)
4. Error bersifat independen (tidak
ada autokorelasi). Asumsi ini tidak
relevan untuk data cross-sectional
5. Error memiliki distribusi kurang-
lebih normal
Hubungan Linier

Hubungan Hubungan Tidak terdapat Hubungan


negatif positif hubungan kurvi-linier

Hubungan linier Hubungan non-linier


Mean dari Semua Error = 0
Error
(residual)
positif

Error
(residual)
negatif
Homoskedastisitas dan
Heteroskedastisitas
Y Y

X X
Homoskedastisitas Heteroskedastisitas

Variasi efek X terhadap Y Variasi efek X terhadap Y berubah di


konstan di semua nilai X berbagai nilai X. Makin besar X, makin
lebar variasi efek X terhadap Y
Error diasumsikan memiliki
varians konstan dan distribusi
normal di semua nilai X
Tes untuk
Mendeteksi
Heteroskedastisitas
1. Bartlett Test
2. Breusch Pagan Test
3. Score Test
4. F Test
Akibat
Heteroskedastisitas
1. Heteroskedastisitas tidak menyebabkan bias
dalam estimasi parameter.
2. Namun estimasi parameter dengan
menggunakan OLS tidak lagi estimasi yang
tidak bias yang terbaik (BLUE = Best Linear
Unbiased Estimators) karena tidak lagi efisien
(meningkatkan varians di seputar estimasi
koefisien)), sehingga prediksi regresi tidak
efisien juga (meningkatkan varians)
3. Heteroskedasitas menyebabkan metode OLS
underestimasi standard error dari koefisien,
sehingga statistik t tentang signifikansi
koefisien menjadi terlalu besar
Tidak Terdapat Auto-korelasi
Auto-korelasi (Korelasi Serial)
Garis Regresi Garis Regresi
Error tersebar
random di atas
Auto-korelasi
dan di bawah
positif
garis regresi

Tidak terdapat auto- Auto-korelasi positif


korelasi jika nilai error terjadi jika error
yang bertanda positif dengan suatu tanda
dan negatif terjadi cenderung diikuti
secara random di oleh error lain dengan
semua nilai X. tanda yang sama.

Auto-korelasi merupakan isu penting jika Sebagai contoh, error positif biasanya
urutan X penting, misalnya pada data time diikuti oleh error positif, dan error negatif
series. Tidak relevan jika data cross-sectional biasanya diikuti oleh error negatif.
VO2 max adalah jumlah maksimum
Penerapan Analisis oksigen yang dapat digunakan seorang
selama latihan fisik.
Regresi Linier
Vo2 max biasanya digunakan untuk
menguji ketahanan aerobik atau
kebugaran kardiovaskuler seorang atlet
sebelum dan pada akhir latihan fisik.

Co2 max diukur dalam milliliters oksigen


yang dikonsumsi per menit, per kilogram
berat badan (mL/kg/min).

Rumusan masalah penelitian:

Berapa besar pengaruh umur, jenis


kelamin, dan berat badan terhadap
VO2 max?
Inter-
pretasi
Hasil
Regresi
Linier

Terdapat pengaruh umur terhadap VO2 max. Umur menurunkan VO2 max dan
secara statistik signfikan. Setiap pertambahan 1 tahun umur akan menurunkan
VO2 max sebesar 0.17 mL/ kg/ menit (b= -0.17; CI95% -0.29 sd – 0.04; p= 0.010).
Inter-
pretasi
Hasil
Regresi
Linier

Variabel independen dalam model, yakni umur, berat badan,


denyut jantung, dan jenis kelamin, secara bersama mampu
menjelaskan variasi VO2 max sebesar 55.92%
Memprediksi Variabel
Dependen dengan
Menggunakan Model
Regresi Linier

Bentuk persamaan regresi linier untuk


memprediksi VO2max berdasarkan
age, weight, heart_rate dan gender sebagai berikut:

Predicted VO2max = 87.83 – (0.165 x age) – (0.385


x weight) – (0.118 x heart_rate) + (13.208 x gender)
Keterbatasan
Penggunaan model regresi linier
memungkinkan peneliti mengungkapkan
ada-tidaknya hubungan linier antar
variabel.

Namun untuk meyakinkan apakah


hubungan tersebut kausal (sebab-akibat),
diperlukan pertimbangan lainnya, meliputi
didukung oleh teori yang berlaku (theory-
driven), masuk di akal secara biologis
(biological plausibility), konsisten dengan
hasil penelitian yang relevan, menunjukkan
hubungan dosis-respons, dan sebagainya.
Thank You...Coffee Time

Anda mungkin juga menyukai