Anda di halaman 1dari 10

PROBLEM SET 5 “REGRESI LINEAR BERGANDA”

MATA KULIAH ANALISIS DATA LINGKUNGAN

Oleh:
Putri Sandi Daniar
25321314

Asisten:
Nadiyatur Rahmatikal Wasi'ah, ST, MT

Dosen Pengampu:
Ir. Driejana, MSCE, Ph.D
Dr. Sukandar, MT

PROGRAM MAGISTER
JURUSAN TEKNIK LINGKUNGAN
FAKULTAS TEKNIK SIPIL DAN LINGKUNGAN
INSTITUT TEKNOLOGI BANDUNG
2022
REGRESI LINEAR BERGANDA

1. Persiapan Data
Persiapan data yang dilakukan pertama kali sebelum melakukan analisis selanjutnya adalah
data cleaning, yaitu dengan mengisi data NA dengan rerata nilai pada variabel tersebut.
Adapun dalam hal ini data NA berada pada variable bikarbonat nomor sampel 78 dan
variabel magnesium nomor sampel 45. Setelah itu dilakukan penghilangan outlier pada data
untuk meminimalkan kesalahan pada analisis yang akan dilakakukan.
Berdasarkan boxplott, diketahui bahwa outlier data konsentrasi bikarbonat, magnesium, dan
potassium berada pada sampel nomor 47, 48, 49, 50, 51, 52, 53, 65, 66, dan 67. Data-data
yang dianggap outlier tersebut kemudian dihapus, sehingga kesalahan analisis dapat
diminimalisir. Setelah dilakukan penghilangan data outlier, dilakukan pegujian normalitas.

Berdasarkan hasil uji normalias, didapatkan p-value yang nilainya masih jauh dari normal
yaitu <0,05, sehingga perlu dilakukan transformasi data. Adapun transformasi data yang
dilakukan pada variabel konsentrasi bikarbonat, magnesium, dan potassium adalah log10x.
Hasil p-value dari hasil transformasi data yang diperoleh dapat dilihat pada gambar berikut.
Berdasarkan uji yang telah dilakukan, didapatkan p-value pada ketiga variabel yang lebih
mendekati 0,05, dimana p-value pada variabel konsentrasi bikarbonat adalah 0,01004, p-
value pada variabel konsentrasi magnesium adalah 0,000001827, dan p-value pada variabel
konsentrasi potassium adalah 0,03963.

2. Hipotesis
Pada analisis ini, yang berperan sebagai variabel independen (x) adalah magnesium,
sedangkan variabel dependen (y) adalah bikarbonat. Berikut merupakan persamaan umum
regresi linear sederhana yang dapat digunakan untuk mengetahui asosiasi kedua variabel
tersebut:
Y i=β 0 + β 1 i x 1 i+ β2 i x2 i +ε i
Dimana,
Yi : Nilai konsentrasi bikarbonat (variabel response)
x1i : Nilai konsentrasi magnesium
x2i : Nilai konsentrasi potassium
0 : Intercept
1i : Slope Y dengan variabel x1 ketika x2 dianggap konstan
2i : Slope Y dengan variabel x2 ketika x1 dianggap konstan
i : Nilai random error
Berdasarkan persamaan tersebut maka hipotesis yang digunakan dalam analisis ini adalah:
 H0: i = 0, tidak terdapat korelasi antara konsentrasi bikarbonat dengan kedua variabel
prediktor yaitu magnesium dan potassium
 H1: I  0, terdapat korelasi antara konsentrasi bikarbonat dengan kedua variabel
prediktor yaitu magnesium dan potassium

3. Analisis korelasi antara konsentrasi bikarbonat dengan magnesium


Analisis ini dapat dilakukan dengan memplot masing-masing variabel predictor yaitu
magnesium dan potassium dengan variabel response yaitu bikarbonat menggunakan
scatterplot, seperti berikut.
Berdasarkan hasil plot, diketahui bahwa persebaran data pada kedua grafik di atas adalah
acak, namun cenderung membentuk garis linier ke atas, sehingga diperkirakan bahwa
terdapat korelasi yang positif antara magnesium dan potassium terhadap bikarbonat, artinya
penambahan nilai konsentrasi magnesium dan/atau potassium diperkirakan dapat
meningkatkan nilai pada variabel konsentrasi bikarbonat. Selanjutnya dilakukan uji korelasi
menggunakan pearson test sehingga didapatkan hasil sebagai berikut:
Berdasarkan hasil uji korelasi pada data konsentrasi magnesium terhadap bikarbonat,
didapatkan p-value yang nilainya <0,05, yaitu sebesar 0,00000117 sehingga H 0 ditolak.
Artinya bahwa terdapat korelasi antara konsentrasi bikarbonat dengan magnesium. Adapun
nilai korelasi yang didapatkan adalah sebesar 0,5183183, yang artinya nilai konsentrasi
bikarbonat dan magnesium memiliki korelasi sekitar 51,83183%.

Kemudian pada data konsentrasi potassium terhadap bikarbonat, didapatkan p-value yang
juga nilainya <0,05, yaitu sebesar 0,02135 sehingga H0 ditolak. Artinya bahwa terdapat
korelasi antara konsentrasi bikarbonat dengan potassium. Adapun nilai korelasi yang
didapatkan adalah sebesar 0,2603201, yang artinya nilai konsentrasi bikarbonat dan
magnesium memiliki korelasi sekitar 26,03201%.

4. Analisis deskriptif pada variabel konsentrasi bikarbonat dan magnesium


Berikut merupakan hasil analisis deskriptif yang didapatkan:

Berdasarkan hasil diketahui bahwa rerata variabel konsentrasi bikarbonat yang telah
ditransformasi adalah 2,3196791 dengan standar error 0,05867900. Hal ini menunjukkan
bahwa nilai konsentrasi bikarbonat pada data analisis yang telah ditransformasi berada di
sekitar 2,3196791. Kemudian rerata variabel konsentrasi magnesium adalah 1,3477742
dengan standar error 0,07916471, yang artinya nilai konsentrasi magnesium yang telah
ditransformasi berada di sekitar nilai tersebut. Adapun rerata variabel konsentrasi potassium
adalah 0,4136337 dengan standar error 0,11102662, yang artinya nilai konsentrasi
magnesium yang telah ditransformasi berada di sekitar 0,4136337.

5. Pemodelan regresi linier


Dilakukan uji t-test untuk dapat mengetahui kecocokan dari model regresi yang dilakukan.
Adapun pengujian dilakukan dengan hipotesis sebagai berikut:
 H0 : tidak terdapat perbedaan variasi antara konsentrasi magnesium dan potassium
dengan bikarbonat
 H1 : terdapat perbedaan variasi yang signifikan antara konsentrasi magnesium dan
potassium dengan bikarbonat

Berdasarkan t-test yang dilakukan pada variabel magnesium dan bikarbonat, didapatkan t-
hitung sebesar 122,69 dengan confidence interval 95%. Adapun nilai t-tabel pada df=77 dan
=0,05 adalah 1,99125. Kemudian nilai p-value yang dihasilkan <0,05 yaitu sebesar 2,2e-16,
maka H0 ditolak, artinya konsentrasi magnesium merupakan penjelas yang signifikan
terhadap variabel konsentrasi bikarbonat.

Berdasarkan t-test yang dilakukan pada variabel potassium dan bikarbonat, didapatkan t-
hitung sebesar 151,3 dengan confidence interval 95%. Adapun nilai t-tabel pada df=77 dan
=0,05 adalah 1,99125. Kemudian nilai p-value yang dihasilkan juga <0,05 dengan nilai
yang sama yaitu sebesar 2,2e-16, maka H0 juga ditolak, artinya konsentrasi potassium juga
merupakan penjelas yang signifikan terhadap variabel konsentrasi bikarbonat.
Setelah dilakukan uji t-test, selanjutnya dilakukan pengujian regresi linier pada variabel
konsentrasi bikarbonat, magnesium, dan potassium. Adapun hasil yang didapatkan adalah
sebagai berikut:
Berdasarkan hasil yang telah didapatkan, diperoleh nilai p-value sebesar 0,0000009704,
yang mengindikasikan bahwa terdapat hubungan antara variabel konsentrasi magnesium dan
potassium dengan bikarbonat. Selanjutnya dari hasil juga dapat diketahui bahwa intercept
menunjukkan nilai estimasi 1,63817 dengan standar error 0,12408. Pada intercept, niali t-
value 13,203 > t-tabel 1,99125, sehingga H0 ditolak yang artinya terdapat korelasi yang
liniear antara konsentrasi bikarbonat dan magnesium. Kemudian didapatkan slope
magnesium (b1) dengan estimasi 0,55520 dengan standar error 0,10859, dan nilai t-value
5,113 > t-tabel 1,99125, sehingga H0 ditolak yang juga artinya terdapat korelasi yang liniear
antara konsentrasi bikarbonat dengan magnesium. Adapun slope potassium (b2) dengan
estimasi -0,16143 dengan standar error 0,07743, dan nilai t-value -2,085 < t-tabel 1,99125,
sehingga H0 diterima yang artinya tidak terdapat korelasi yang liniear antara konsentrasi
bikarbonat dengan potassium

Berdasarkan hasil uji regresi linier antara variabel konsentrasi magnesium dengan
bikarbonat, diketahui bahwa b0=1,63817, b1=0,55520, dan b2=-0,16143 sehingga didapatkan
persamaan regresi linier sebagai berikut:
Y^ =b0 +b1 x i+ b2 x i
Y^ =1,63817 +0,55520 xi +¿
Berdasarkan persamaan yang didapatkan, maka dapat diketahui bahwa setiap penambahan
konsentrasi magnesium sebesar 1 mg/L akan meningkatkan nilai estimasi Y sebesar
0,55520xi, ketika variabel konsentrasi potassium dianggap konstan. Kemudian setiap terjaddi
penambahan konsentrasi potassium sebesar 1 mg/L akan menurunkan nilai estimasi Y
sebesar 0,16143xi, ketika variabel konsentrasi magnesium dianggap konstan.

Koefisien regresi, korelasi, dan determinasi


Berdasarkan hasil uji regresi linier yang telah didapatkan, diperoleh nilai koefisien regresi
magnesium (x1) sebesar 0,5520 dan koefisien regresi potassium (x2) sebesar -0,16143.
Adapun nilai koefisien ini menunjukkan besarnya perubahan pada variabel independen.
Selain itu, pada pengujian regresi linier juga didapatkan nilai koefisien multi determinasi
(R2) yaitu sebesar 0,3087. R2 menunjukkan persentase keterlibatan varibael independen
terhadap variabel dependen. Sehingga berdasarkan nilai R2 yang diperoleh maka diketahui
bahwa 30,87% proporsi variansi konsentrasi bikarbonat dapat dijelaskan oleh variabel
explanatorynya yaitu konsentrasi magnesium dan potassium. Adapun sisanya yaitu sebesar
69,13% dipengaruhi oleh variabel selain magnesium dan potassium. Dari nilai R2 yang
diperoleh, dapat dihitung nilai koefisien korelasi (R) sebagai berikut:
R=√ R
2

R=√ 0,3087
R=0 ,55561
Berdasarkan perhitungan, didapatkan nilai R sebesar 0,55561. Adapun nilai R menunjukkan
asosiasi atau kekuatan hubungan antara variabel dependen dan independen. Berdasarkan
hasil diketahui bahwa korelasi antar variabel bernilai positif dan mendekati 1, sehingga
dapat dikatakan bahwa peningkatan nilai konsentrasi magnesium dan/atau potassium cukup
berpengaruh terhadap konsentrasi bikarbonat.

6. Aptness test persamaan regresi linier


Aptness test merupakan suatu metode yang diguanakan untuk mengetahui apakah model
regresi yang dibuat telah memenuhi asumsi persamaan linier. Berikut merupakan grafik hasil
aptness test yang diperoleh:

Berdasarkan grafik residual vs Fitted, dapat diketahui bahwa residu tersebar tidak terlalu
merata sehingga mengindikasikan kedua variabel memiliki hubungan yang nonlinear linier.
Kemudian pada grafik Normal Q-Q plot dapat dilihat bahwa data membentuk garis yang
cukup diagonal yang artinya data mengikuti asumsi distribusi normal walaupun terdapat
beberapa outlier.

7. Uji hipotesis nilai estimasi


Uji ini dilakukan dengan t-test pada intercept dan slope yang telah diperoleh. Apabila t-
hitung> t-tabel maka H0 ditolak, namun apabila t-hitung < t-tabel maka H0 diterima. Apabila
hubungan antara variabel konsentrasi magnesium dan potassium memiliki slope yang
signifikan, maka analisis regersi linear dapat digunakan
Berikut merupakan hipotesis slope x1i dimana t-value = 5,113:
H0: 0=0
H1: 10
Kemudian untuk hipotesis slope x2i dimana t-value = -2,085 adalah sebagai berikut:
H0: 2=0
H1: 20

Pada slope diperoleh t-value x1i sebesar 5,113 > t-tabel 1,99125, sehingga H 0 ditolak, yang
artinya nilai slope pada hubungan konsentrasi magnesium dengan bikarbonat tidak bernilai
nol atau dapat dikatakan bahwa terdapat slope yang signifikan.
Kemudian t-value x2i adalah -2,085 < t-tabel 1,99125, sehingga H0 diterima, yang artinya
nilai slope pada hubungan konsentrasi potassium dengan bikarbonat bernilai nol atau dapat
dikatakan bahwa tidak terdapat slope yang signifikan.

Adapun untuk uji pada intercept digunakan hipotesis sebagai berikut:


H0: 0=0
H1: 10
Pada intercept diperoleh nilai t-value 13,203 > t-tabel 1,99125, sehingga H0 ditolak, yang
artinya nilai intercept pada hubungan variabel response dengan explanatory tidak bernilai
nol atau dapat dikatakan signifikan

8. Persamaan regresi serta interval kepercayaanya pada =0,05


Berdasarkan perhitungan menggunakan R commander, didapatkan hasil sebagai berikut:

Pada rentang kepercayaan 95%, nilai slope konsentrasi magnesium memiliki estimasi batas
bawah pada 0,3388851 dan batas atas 0,771517094. Selanjutnya nilai slope konsentrasi
potassium memiliki estimasi batas bawah pada -0,3156701 dan batas atas -0,007192896.
Berdasarkan hasil tersebut maka dapat diketahui bahwa kedua nilai slope tidak melewati
angka nol sehingga slope dikatakan signifikan. Adapun untuk intercept, estimasi batas
bawahnya berada pada 1,3909935 dan batas atas 1,885340353.

Berdasarkan hasil yang diperoleh maka didapatkan persamaan regresi linear sebagai berikut:
Y^ =b0 +b1 x i+ b2 x i
Y^ =1,63817 +0,55520 xi +¿

Adapun persamaan regresi linear dengan mempertimbangkan nilai estimate dan confidence
interval dapat diperoleh menggunkan persamaan berikut:
Y^ =(b ¿ ¿ 0± t (0,025 ;n−2) × S b 0 )+(b ¿ ¿1 ± t (0,025; n−2) × S b 1) x1 i +( b ¿ ¿ 2 ±t (0,025 ;n−2) × Sb 2 ) x 2 i ¿ ¿ ¿
Y^ =1,3909935+ 0,3388851 x i+ ¿ ->lower estimate
Y^ =1,885340353+ 0,771517094 xi +¿ ->upper estimate

Anda mungkin juga menyukai