Anda di halaman 1dari 8

PROBLEM SET 5 “REGRESI LINIER SEDERHANA”

MATA KULIAH ANALISIS DATA LINGKUNGAN

Oleh:
Putri Sandi Daniar
25321314

Asisten:
Nadiyatur Rahmatikal Wasi'ah, ST, MT

Dosen Pengampu:
Ir. Driejana, MSCE, Ph.D
Dr. Sukandar, MT

PROGRAM MAGISTER
JURUSAN TEKNIK LINGKUNGAN
FAKULTAS TEKNIK SIPIL DAN LINGKUNGAN
INSTITUT TEKNOLOGI BANDUNG
2022
REGRESI LINIER SEDERHANA

1. Persiapan Data
Persiapan data yang dilakukan pertama kali sebelum melakukan analisis selanjutnya adalah
data cleaning, yaitu dengan mengisi data NA dengan rerata nilai pada variabel tersebut.
Adapun dalam hal ini data NA berada pada variable bikarbonat nomor sampel 78 dan
variabel magnesium nomor sampel 45. Setelah itu dilakukan penghilangan outlier pada data
untuk meminimalkan kesalahan pada analisis yang akan dilakakukan.

Berdasarkan scatterplot, diketahui bahwa outlier berada pada sampel nomor 47, 48, 49, 50,
51, 52, 53, 65, 66, dan 67. Data-data yang dianggap outlier tersebut kemudian dihapus,
sehingga kesalahan analisis dapat diminimalisir. Setelah dilakukan penghilangan data
outlier, dilakukan pegujian normalitas kembali.

Berdasarkan hasil uji normalias, didapatkan p-value yang nilainya masih jauh dari normal
yaitu <0,05, sehingga perlu dilakukan transformasi data. Adapun transformasi data yang
dilakukan pada variabel konsentrasi bikarbonat dan magnesium adalah -1/x. Hasil dari
transformasi data dapat dilihat pada gambar berikut.

Berdasarkan uji yang telah dilakukan, didapatkan p-value pada variabel konsentrasi
bikarbonat dan magnesium yang lebih mendekati 0,05, dimana p-value pada variabel
konsentrasi bikarbonat adalah 0,01004, dan p-value pada variabel konsentrasi magnesium
adalah 0,000001827.

2. Hipotesis
Pada analisis ini, yang berperan sebagai variabel independen (x) adalah magnesium,
sedangkan variabel dependen (y) adalah bikarbonat. Berikut merupakan persamaan umum
regresi linear sederhana yang dapat digunakan untuk mengetahui asosiasi kedua variabel
tersebut:
Y i=β 0 + β i x i + ε i
Dimana,
Yi : Nilai konsentrasi bikarbonat (y)
xi : Nilai konsentrasi magnesium (x)
i : Slope
0 : Intercept
i : Nilai random error
Berdasarkan persamaan tersebut maka hipotesis yang digunakan dalam analisis ini adalah:
 H0: i = 0, tidak terdapat korelasi antara konsentrasi magnesium dengan konsentrasi
bikarbonat
 H1: I  0, terdapat korelasi antara konsentrasi magnesium dengan konsentrasi
bikarbonat

3. Analisis korelasi antara konsentrasi bikarbonat dengan magnesium


Analisis ini dapat dilakukan dengan memplot kedua variabel yaitu konsentrasi bikarbonat
dan magnesium menggunakan scatterplot, seperti berikut.
Berdasarkan hasil plot, diketahui bahwa persebaran data kedua variabel adalah acak, namun
cenderung membentuk garis linier ke atas, sehingga diperkirakan bahwa kedua variabel
memiliki korelasi yang positif, artinya penambahan nilai konsentrasi magnesium
diperkirakan dapat meningkatkan nilai pada variabel konsentrasi bikarbonat. Selanjutnya
dilakukan uji korelasi menggunakan pearson test sehingga didapatkan hasil sebagai berikut:

Berdasarkan hasil uji didapatkan p-value yang nilainya <0,05, yaitu sebesar 0,00000117
sehingga H0 ditolak. Artinya bahwa terdapat korelasi antara konsentrasi bikarbonat dengan
magnesium. Adapun nilai korelasi yang didapatkan adalah sebesar 0,5183183, yang artinya
nilai konsentrasi bikarbonat dan magnesium memiliki korelasi sekitar 51,83183%.

4. Analisis deskriptif pada variabel konsentrasi bikarbonat dan magnesium


Berikut merupakan hasil analisis deskriptif yang didapatkan:

Berdasarkan hasil diketahui bahwa rerata variabel konsentrasi bikarbonat yang telah
ditransformasi adalah 2,319679 dengan standar error 0,05867900. Hal ini menunjukkan
bahwa nilai konsentrasi bikarbonat pada data analisis yang telah ditransformasi berada di
sekitar 2,319679. Kemudian rerata variabel konsentrasi magnesium adalah 1,347774 dengan
standar error 0,07916471, yang artinya nilai konsentrasi magnesium yang telah
ditransformasi berada di sekitar nilai tersebut.

5. Pemodelan regresi linier


Dilakukan uji t-test untuk dapat mengetahui kecocokan dari model regresi yang dilakukan.
Adapun pengujian dilakukan dengan hipotesis sebagai berikut:
 H0 : tidak terdapat perbedaan variasi antara nilai konsentrasi bikarbonat dan
magnesium
 H1 : terdapat perbedaan yang signifikan antara variasi nilai konsentrasi bikarbonat
dan magnesium

Berdasarkan t-test yang dilakukan, didapatkan t-hitung sebesar -122,69 dengan confidence
interval 95%. Adapun nilai t-tabel pada df=77 dan =0,05 adalah 1,99125. Kemudian nilai
p-value yang dihasilkan juga <0,05 yaitu sebesar 2,2e -16, maka H0 ditolak, artinya
konsentrasi magnesium merupakan penjelas yang signifikan terhadap variabel konsentrasi
bikarbonat.
Setelah dilakukan uji t-test, selanjutnya dilakukan pengujian regresi linier pada variabel
konsentrasi bikarbonat dan magnesium. Adapun hasil yang didapatkan adalah sebagai
baerikut

Berdasarkan hasil yang telah didapatkan, diperoleh nilai p-value sebesar 0,00000117, yang
mengindikasikan bahwa terdapat hubungan antara variabel konsentrasi bikarbonat dan
magnesium. Selanjutnya dari hasil juga dapat diketahui bahwa intercept menunjukkan nilai
estimasi 1,80188 dengan standar error 0,09817. Pada intercept, niali t-value 18,355 > t-tabel
1,99125, sehingga H0 ditolak yang artinya terdapat korelasi yang liniear antara konsentrasi
bikarbonat dan magnesium. Kemudian didapatkan juga slope dengan estimasi 0,38419
dengan standar error 0,07271, dan nilai t-value 5,284 > t-tabel 1,99125, sehingga H0 ditolak
yang juga artinya terdapat korelasi yang liniear antara konsentrasi bikarbonat dan
magnesium.

Berdasarkan hasil uji regresi linier antara variabel konsentrasi magnesium dengan
bikarbonat, diketahui bahwa 0=1,80188 dan i=0,38419, sehingga didapatkan persamaan
regresi linier sebagai berikut:
Y^ = β0 + β i xi
Y^ =1,80188+ 0,38419 x i
Berdasarkan persamaan yang didapatkan, maka dapat diketahui bahwa setiap penambahan
konsentrasi magnesium sebesar 1 mg/L akan meningkatkan nilai estimasi Y sebesar
0,38419xi.

Koefisien regresi, korelasi, dan determinasi


Berdasarkan hasil uji regresi linier yang telah didapatkan, diperoleh nilai koefisien regresi
sebesar 0,38419. Adapun nilai koefisien ini menunjukkan besarnya perubahan pada variabel
independen. Selain itu, pada pengujian regresi linier juga didapatkan nilai koefisien
determinasi (R2) sebesar 0,2687. R2 menunjukkan persentase keterlibatan varibael
independen (magnesium) terhadap variabel dependen (bikarbonat). Sehingga berdasarkan
nilai R2 yang diperoleh maka diketahui bahwa 26,87% proporsi variansi konsentrasi
bikarbonat dapat dijelaskan oleh variabel dependenya yaitu konsentrasi magnesium. Adapun
sisanya yaitu sebesar 73,13% dipengaruhi oleh variabel selain magnesium. Dari nilai R 2
yang diperoleh, dapat dihitung nilai koefisien korelasi (R) sebagai berikut:
R=√ R 2
R=√ 0,2687
R=0,5183
Berdasarkan perhitungan, didapatkan nilai R sebesar 0,5183. Adapun nilai R menunjukkan
asosiasi atau kekuatan hubungan antara variabel dependen dan independen. Berdasarkan
hasil diketahui bahwa korelasi antar variabel bernilai positif dan mendekati 1, sehingga
dapat dikatakan bahwa peningkatan nilai konsentrasi magnesium cukup berpengaruh
terhadap konsentrasi bikarbonat.

6. Aptness test persamaan regresi linier


Aptness test merupakan suatu metode yang digunakan untuk mengetahui apakah model
regresi yang telah dibuat telah memenuhi asumsi persamaan linier. Berikut merupakan
grafik hasil aptness test yang diperoleh:
Berdasarkan grafik residual vs Fitted, dapat diketahui bahwa residu tersebar tidak terlalu
merata sehingga mengindikasikan kedua variabel memiliki hubungan yang cukup linier.
Kemudian pada grafik Normal Q-Q plot dapat dilihat bahwa data membentuk garis yang
cukup diagonal yang artinya data mengikuti asumsi distribusi normal walaupun terdapat
beberapa outlier.

7. Uji hipotesis nilai estimasi


Berikut merupakan hipotesis yang digunakan pada estimasi nilai :
H0: =0
H1: 0
Untuk menguji hipotesis ini maka perlu dilakukan t-test sehingga dapat diketahui t-
hitungnya. t-hitung yang didapatkan kemudian dibandingkan dengan t-tabel, dimana dalam
analisis ini t-tabel pada df=77 dengan rentang kepercayaan 95% adalah 1,99125. Adapun
nilai t-hitung yang didapatkan berdasarkan hasil yaitu 18,355 > t-tabel 1,99125 sehingga H0
ditolak (0). Kemudian nilai t-hitung pada slope adalah 5,284 > t-tabel 1,99125, sehingga
H0 juga ditolak (0) yang artinya terdapat korelasi yang liniear antara konsentrasi
bikarbonat dan magnesium.

8. Persamaan regresi serta interval kepercayaanya pada =0,05


Berdasarkan persamaan regresi yang didapatkan sebagai berikut:
Y^ =1,80188+ 0,38419 x i
Dapat dihitung rentang interval kepercayaan intersept maupun slope yang telah didapatkan
menggunakan persamaan berikut:
interval estimasi intercept =b0 ± t (0,025; n−2 ) × S b 0
interval estimasi slope=b1 ± t (0,025 ;n−2) × S b 1
Berdasarkan persamaan tersebut, maka didapatkan hasil sebagai berikut:
 interval estimasi intercept =1,80188 ±1,99125 ×0,09817
interval estimasi intercept =1,80188 ±0,19548
1,99736 ≤ β0 ≤ 1,6064
 interval estimasi slope=0,38419± 1,99125× 0,07271
interval estimasi slope=0,38419± 0,14478
0,52897 ≤ β1 ≤ 0,23941
Berdasarkan hasil perhitungan interval yang telah dilakukan, didapatkan interval nilai
estimasi pada intercept berada di antara 1,99736 (batas atas) dan 1,6064 (batas bawah),
sedangan interval nilai estimasi pada slope berada di antara 0,52897 (batas atas) dan 0,23941
(batas bawah). Adapun berdasarkan hasil yang didapatkan, maka persamaan tidak dapat
dituliskam tanpa nilai interceptnya, sebab kedua variabel yaitu konsentrasi magnesium dan
bikarbonat memiliki korelasi.

9. Estimasi variabel y apabila konsentrasi x adalah 9,5 (=0,05)


Y^ =1,80188+ 0,38419 x i
Y^ =1,80188+ 0,38419× 9,5
Y^ =5,451685
Berdasarkan perhitungan, maka didapatkan nilai estimasi variabel y apabila konsentrasi
x=9,5 adalah 5,451685 mg/L.

Anda mungkin juga menyukai