ABSTRAK
Pada setiap permasalahan, merasa perlu untuk mengetahui faktor-faktor yang
menyebabkan masalah tersebut. Faktor-faktor tersebut merupakan prediktor,
sedangkan permasalahannya merupakan respon. Dalam permasalahan data jumlah
permintaan air bersih (respon), pendapatan total keluarga (prediktor 1), jumlah
tanggungan keluarga (prediktor 2), dan pengeluaran energi (prediktor 3) dengan
jumlah sampel 37 data. Tujuannya untuk mengetahui bagaimana pengaruh dari
semua prediktor terhadap respon dengan cara melakukan analisis regresi linier
sederhana yakni pengujian serentak dan parsial (individu). Dengan uji berganda,
semua variabel prediktor berpengaruh terhadap respon. Pada uji parsial, diketahui
bahwa prediktor 1 dan prediktor 2 berpengaruh terhadap respon, sedangkan
prediktor 3 tidak berpengaruh terhadap respon. Pada asumsi IIDN (0,σ2), diketahui
bahwa data tidak independen, identik, tidak berdistribusi normal dan tidak memiliki
multikolinieritas.
Kata Kunci : Korelasi, Uji Serentak, Uji Parsial, Analisis Regresi, IIDN (0,σ2)
1. Pendahuluan
Air bersih merupakan salah satu kebutuhan pokok manusia yang dibutuhkan
secara berkelanjutan. Penggunaan air bersih sangat penting untuk komsumsi
rumah tangga, kebutuhan industri dan tempat umum. Karena pentingnya
kebutuhan akan air bersih, maka adalah hal yang wajar jika sektor air bersih
mendapatkan prioritas penanganan utama karena menyangkut kehidupan orang
banyak. Penanganan akan pemenuhan kebutuhan air bersih dapat dilakukan
dengan berbagai cara, disesuaikan dengan sarana dan prasarana yang ada. Di
daerah perkotaan, sistem penyediaan air bersih dilakukan dengan sistem perpipaan
dan non perpipaan. Sistem perpipaan dikelola oleh Perusahaan Daerah Air Minum
(PDAM) dan sistem non perpipaan dikelola oleh masyarakat baik secara individu
maupun kelompok.
Di sebuah wilayah, jumlah permintaan air bersih dapat dipengaruhi oleh
bebarapa faktor, diantaranya pendapatan total keluarga, jumlah tanggungan
keluarga, dan pengeluaran energi dari masing-masing rumah tangga tersebut.
Sehingga dibutuhkan adanya penelitian untuk memperkirakan jumlah permintaan
air yang stabil setiap waktunya. Sumber permasalahan ini berasal dari penelitian
yang dilakukan oleh Universitas Sumatera Utara.
Rumusan masalah yang dibahas dalam praktikum adalah bagaimana
signifikansi uji regresi linier berganda dengan signifikansi hasil uji individu pada
1
kasus jumlah permintaan air bersih. Bagaimana pengaruh banyaknya prediktor
(pendapatan total keluarga, jumlah tanggungan keluarga, dan pengeluaran energi
dari masing-masing rumah tangga) dan nilai koefisien determinasi terhadap model
serta bagaimana uji asumsi residual IIDN dan multikolinieritasnya. Tujuannya
signifikansi uji regresi linier berganda dengan signifikansi hasil uji individu, dan
mengetahui apakah residual sudah memenuhi asumsi residual IIDN serta untuk
menegetahui variabel prediktor dalam percobaan memiliki koefisien korelasi yang
kuat atau tidak.
2. Landasan Teori
Pada landasan teori terdapat dipaparkan mengenai regresi linier berganda,
pengujian asumsi residual IIDN, serta air bersih.
Y1 1 X X X β
1 12 1 p − 1 0 ε 1
Y2 1 X X X β ε
Y = = 21 2 2p−1 1 + 2
Y=Xβ+ε
β
Y adala 1 X X X ε
dengan:
i
Y n1 n2 np−1 p−1 n
2, …, n. n
h variabel tidak bebas untuk pengamatan ke-i, untuk i = 1,
2
Tabel 2.1 ANOVA Regresi Linier Berganda
Sumber Derajat
Sum Square Mean Square F
Varians bebas
1 SSR MSR
Regresi k SSR = b' X ' Y − Y ' JY MSR = F=
n k MSE
SSR
Error n-k-1 SSE = SST − SSR = Y ' Y − b' X ' MSR =
n − k −1
1
Total n-1 SST = Y ' Y − Y ' JY
n
(Draper, 1992)
Dimana nilai Fhitung yang dapat dihitung dibandingkan dengan Fα(V 1,V 2 ) dengan
derajat bebas V1=k, V2=n-k-1 dan tingkat signifikan α. Apabila Fhitung >
Fα( k , n −k −1) maka H0 ditolak, yang berarti paling sedikit ada satu β j yang tidak
dapat sama dengan nol (Salamah, dkk 2010).
bi
t hitung = 2.2
var(bi )
[
ˆ ) = diagonal X T X
Var ( β j
]
−1
σ2
Kemudian t hitung dibandingkan dengan nilai table distribusi t dengan derajat bebas
(n-2) dan tingkat signifikan α (Salamah dkk, 2010).
3
SSR 2.3
R2 = x100%
SST
2.2 IIDN
Pemeriksaan asumsi IIDN~(0, σ 2 ) digunakan untuk mengetahui data yang
dihasilkan setelah melakukan percobaan sudah memenuhi ketiga asumsi IIDN~(0,
σ 2 ) dan dijelaskan sebagai berikut.
d = i −1 i
∑(e ) i
2
2.4
4
2.2.2 Uji Asumsi Residual Identik
Pemeriksaan residual identik dilakukan untuk melihat apakah residual
memenuhi asumsi identik. Suatu data dikatakan identik apabila plot residualnya
menyebar secara acak dan tidak membentuk suatu pola tertentu. Nilai variansnya
rata-rata sama antara varians satu dengan yang lainnya . Pemeriksaan asumsi
residual identik bisa dilihat dengan cara visual versus fits dan bisa dihitung
menggunakan uji White dapat diketahui sebagai berikut.
a. Estimasi model populasi berdasarkan sampel yang diambil sehingga diperoleh
model sampel y = β0 + β1 x1 + β2 x 2 + + βk x k + ε sehingga didapatkan model
sampel sebagai berikut.
ˆ +β
yˆ i = β ˆ x +β
ˆ x + + β
ˆ x +ε
0 1 1 2 2 k k
∑ (e − e ) zi i
2.6
rQ = i =1
n n
∑ (e − e ) ∑ ( z )
i =1
i
2
i =1
i
2
5
(Catatan: Santi P R)
1 2.7
VIF =
1 − R2( Xi )
2.3 Air Bersih, Pendapatan, Jumlah Anggota Keluarga, Pengeluaran
Energi
Kebutuhan air bersih merupakan kebutuhan yang tidak terbatas dan
berkelanjutan. Sedang kebutuhan akan penyediaan dan pelayanan air bersih dari
waktu ke waktu semakin meningkat yang terkadang tidak diimbangi oleh
kemampuan pelayanan. Peningkatan kebutuhan ini disebabkan oleh peningkatan
jumlah penduduk, peningkatan derajat kehidupan warga serta perkembangan
kota/kawasan pelayanan ataupun hal-hal yang berhubungan dengan peningkatan
kondisi sosial ekonomi warga.
Sebuah studi Bank Dunia yang disebarluaskan bulan Agustus 2008
menemukan bahwa kurangnya akses terhadap sanitasi menyebabkan biaya
finansial dan ekonomi yang berat bagi ekonomi Indonesia, tidak hanya bagi
individu tetapi juga bagi sektor publik dan perdagangan (IRD, 2013).
3. Metode Penelitian
Data penelitian ini merupakan data sekunder yang diambil dari internet pada
tanggal 22 Oktober 2013 dengan data dari Universitas Sumatera Utara. Variabel-
variabel pengukuran yang digunakan adalah jumlah permintaan air bersih (Y)
dalam m3, pendapatan total keluarga (X1) dalam rupiah, jumlah tanggungan
keluarga (X2) dalam perorangan, dan pengeluaran energi (X3) dalam rupiah
dengan jumlah sampel 30 data. Berikut langkah analisis yang digunakan dalam
penelitian ini yakni mencari data yang memiliki satu variabel respon, dengan tiga
variabel predictor, menginputkan dan melakukan analisis regresi linear berganda
dari data jumlah permintaan air bersih, pendapatan total keluarga, jumlah
tanggungan keluarga, dan pengeluaran energi. Selanjutnya mengambil setiap hasil
scatterplot, korelasi, uji serentak, uji parsial, analisis regresi dan residual lalu
menganalisis sehingga dapat diambil kesimpulan dan saran, yang kemudian
membuat makalah.
6
4.1 Analisis Regresi Linier Berganda
Analisis regresi linier berganda dilakukan dengan menganalisis estimasi
model, koefisien determinasi, uji serentak, uji parsial dari variabel pendapatan
total keluarga, jumlah tanggungan keluarga, dan pengeluaran energi dengan
menganggap asumsi metode OLS terpenuhi.
Source DF SS MS F P
Regression 3 504.47 168.16 9.02 0.000
Residual Error 26 484.57 18.64
Total 29 989.04
Tabel 4.1 diperoleh keputusan tolak H0 Fhitung (9.02) > F0.05( 3, 26 ) ( 2.98) .
Artinya, minimal satu dari pendapatan total keluarga, jumlah tanggungan keluarga
dan pengeluaran energi berpengaruh signifikan terhadap jumlah permintaan air
bersih.
7
H 1 : βj ≠ 0 (
pendapatan total keluarga- X1, jumlah tanggungan keluarga- X2 dan
pegeluaran energi- X3 berpengaruh signifikan terhadap jumlah permintaan air
bersih)
Tabel 4. 2 Uji Individu Parameter Model Regresi Variabel Y dan X1, X2, X3
10
Residual
-5
Gambar 4.1 dapat diketahui sebaran plot residual menyebar secara acak
dan tidak membentuk pola sehingga dapat dikatakan data jumlah permintaan air
8
bersih dengan pendapatan total keluarga, jumlah tanggungan keluarga dan
pengeluaran energi adalah identik.
Source DF SS MS F P
Regression 1 1.01 1.01 0.03 0.867
Residual Error 28 988.03 35.29
Total 29 989.04
Tabel 4.6 diketahui bahwa df=10, R2=16.5%, maka gagal tolak H 0 karena
χhitung
2
( 4.95) < χ10
2
, 0.05
(18.307) , artinya pada uji asumsi residual identik secara
uji White dari data jumlah permintaan air bersih dengan pendapatan total keluarga,
jumlah tanggungan keluarga dan pegeluaran energi adalah memenuhi uji residual
identik.
10
Residual
-5
2 4 6 8 10 12 14 16 18 20 22 24 26 28 30
Obser v at ion Or der
Gambar 4.2 dapat diketahui sebaran plot residual tidak menyebar secara
acak sehingga dapat dikatakan data jumlah permintaan air bersih dengan
9
pendapatan total keluarga, jumlah tanggungan keluarga dan pengeluaran energi
adalah tidak independen.
60
50
40
30
20
10
1
-10 -5 0 5 10 15
RESI 1
10
Gambar 4.3 menunjukkan p-value dari residual sebesar 0.018 lebih kecil
dari α = 0.05 sehinga tolak H0 yang artinya data jumlah permintaan air bersih
dengan pendapatan total keluarga, jumlah tanggungan keluarga dan pegeluaran
energi tidak berdistribusi normal.
Scat t er pl ot of z v s e u r u t an
3
1
z
-1
-2
-5 0 5 10 15
e ur ut an
4.2.3.3 Uji RQ
Hipotesis:
H0 = Data berdistribusi Normal
H1 = Data tidak berdistribusi Normal
Daerah Kritis: Tolak H0 jika rQ ≤ r(n,α)
Statistik Uji:
n
∑ (e
i =1
i − e) z i
- 23.6966
rQ = = = −0.20073
n n (22.0129807)(5)
∑ (e
i =1
i − e) 2 ∑ (z )
i =1
i
2
Karena rQ sebesar -0.020073 lebih kecil dari r(n,α) sebesar 0.9652 sehingga
tolak H0 yang artinya data jumlah permintaan air bersih dengan pendapatan total
keluarga, jumlah tanggungan keluarga dan pengeluaran energi adalah tidak
berdistribusi normal.
4.2.4 Multikolinieritas
Berikut ini hasil dari pengujian multikolinieritas dari jumlah permintaan air
bersih dengan pendapatan total keluarga, jumlah tanggungan keluarga dan
pegeluaran energi.
Hipotesis:
H 0 : Tidak ada multikolinieritas (tidak ada hubungan antara pendapatan total
keluarga, jumlah tanggungan keluarga dan pegeluaran energi)
11
H1 : Ada multikolinieritas (ada hubungan antara pendapatan total keluarga,
jumlah tanggungan keluarga dan pegeluaran energi)
Tabel 4. 4 ANOVA Uji Multikolinieritas
Tabel 4.8 diketahui bahwa dari keseluruhan nilai VIF dari masing-masing regresi
menghasilkan VIF < 10 sehingga gagal tolak H 0 , artinya data pendapatan total
keluarga, jumlah tanggungan keluarga dan pegeluaran energi tidak ada hubungan
multikolinieritas.
5. Kesimpulan
1. Ada hubungan (korelasi) linier antara jumlah permintaan air bersih dengan
pendapatan total keluarga dan jumlah tanggungan keluarga, sedangkan
untuk jumlah permintaan air bersih dan pengeluaran energi tidak ada
hubungan linier.
2. Tabel analisis berganda, diketahui bahwa pendapatan total keluarga, jumlah
tanggungan keluarga dan pengeluaran energi berpengaruh signifikan
terhadap jumlah permintaan air bersih.
3. Tabel uji parsial parameter, diketahui bahwa pendapatan total keluarga dan
jumlah tanggungan keluarga berpengaruh signifikan terhadap jumlah
permintaan air bersih, sedangkan pengeluaran energi tidak berpengaruh
signifikan terhadap jumlah permintaan air bersih.
4. Dengan adanya uji asumsi IIDN, diketahui bahwa data tidak berdistribusi
normal, tidak independen dan identik, serta tidak terjangkit multikolinieritas
dari data pendapatan total keluarga, jumlah tanggungan keluarga dan
pengeluaran energi tidak multikolinieritas terhadap jumlah permintaan air
bersih.
6. Daftar Pustaka
1. Draper, Harry Smith dan Norman. 1992. Analisis Regresi Terapan.
Jakarta: Gramedia Puataka Utama.
2. Gesaf. (2008, November). Regresi dan Korelasi Sederhana. Retrieved
September 28, 2013, from gesaf.files.wordpress.com:
http://gesaf.files.wordpress.com/2008/11/regresi-dan-korelasi.pdf.
3. Salamah, M dan Distri Susilaningrum. 2010. Modul Praktikum
PenghantarMetode Statistika. Surabaya: Jurusan Statistika ITS.
4. Setiawan, Y. (2012, Desember 09). Analisis Regresi Linier Sederhana dan
Analisis Korelasi. Retrieved September 28, 2013, from
yudhasetiawanst.blogspot.com:
http://yudhasetiawanst.blogspot.com/2012/12/analisis-regresi-korelasi-linier.html
12
5. Kutner, M.H., C.J. Nachtsheim., dan J. Neter. 2004. Applied Linear
Regression Models. 4th ed. New York: McGraw-Hill Companies, Inc.
6. IRD. (2013). Program Air Bersih dan Sanitasi. Retrieved October 24,
2013, from http://www.ird.or.id/
7. Air Bersih, Jumlah Keluarga, Jumlah Pendapatan, dan Kebutuhan
Energi. (n.d.). Retrieved October 22, 2013, from
httprepository.usu.ac.idbitstream123456789191211Appendix.pdf
8. Gujarati, D. 1991. Ekonometrika Dasar : Jakarta: Penerbit Erlangga.
9. Catatan Bu Santi Puteri tanggal 6 November 2013
Lampiran
Lampiran 1: Data
No Y X1 X2 X3
1 15.7 700000 4 60000
2 3.4 Keterangan:
300000 5 185000
Y = Jumlah Permintaan Air Bersih (M3)
3 5.3 650000 6 76000
X1 = Pendapatan Total Keluarga (Rp)
265000
4 23.5 X2 = Jumlah10Tanggungan
75000 Keluarga (orang)
0
X3 = Pengeluaran Energi (Rp)
5 10.3 400000 6 150000
6 8.2 300000 4 75000
196300
7 22.2 4 45000
0
8 10.8 950000 6 22500
9 6.3 300000 6 63000
10 6.4 700000 4 225000
120000
11 15.1 7 50000
0
12 8.2 300000 4 30000
158600
13 8.2 4 150000
0
177500
14 11.9 5 325000
0
15 22.6 700000 5 50000
375000
16 16 6 50000
0
150000
17 11.7 5 100000
0
18 4 600000 3 20000
19 10 700000 3 12000
175000
20 17.6 5 55000
0
264550
21 17.3 7 290000
0
22 4.6 400000 5 55000
13
23 5 318000 3 15000
24 4.6 300000 3 17000
350000
25 14.1 4 40000
0
26 5.3 300000 3 60000
27 6.3 300000 3 30000
28 9.1 600000 4 130000
29 6.3 300000 4 130000
30 7.2 800000 5 20000
Lampiran
Correlations: Y, X1, X2, X3
Y X1 X2
X1 0.655
0.000
X2 0.520 0.445
0.003 0.014
Analysis of Variance
Source DF SS MS F P
Regression 3 504.47 168.16 9.02 0.000
Residual Error 26 484.57 18.64
Total 29 989.04
14
Resi dual Pl ot s f or Y
No rmal Pro b ab ilit y Plo t Versu s Fit s
99 15
90 10
Residual
Per cent
50 5
0
10
-5
1
-10 -5 0 5 10 5 10 15 20
Residual Fit t ed Value
7.5
Residual
5
5.0
0
2.5
-5
0.0
-5.0 -2.5 0.0 2.5 5.0 7.5 10.0 12.5 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30
Residual Obser vat ion Or der
Analysis of Variance
Source DF SS MS F P
Regression 1 423.88 423.88 21.00 0.000
Residual Error 28 565.16 20.18
Total 29 989.04
Analysis of Variance
Source DF SS MS F P
Regression 1 267.48 267.48 10.38 0.003
Residual Error 28 721.56 25.77
Total 29 989.04
15
S = 5.94027 R-Sq = 0.1% R-Sq(adj) = 0.0%
Analysis of Variance
Source DF SS MS F P
Regression 1 1.01 1.01 0.03 0.867
Residual Error 28 988.03 35.29
Total 29 989.04
Analysis of Variance
Source DF SS MS F P
Regression 10 5018 502 0.38 0.942
Residual Error 19 25369 1335
Total 29 30387
Analysis of Variance
Source DF SS MS F P
Regression 2 5.62923E+12 2.81462E+12 3.44 0.047
Residual Error 27 2.21206E+13 8.19280E+11
Total 29 2.77498E+13
16
S = 4.49268 R-Sq = 42.9% R-Sq(adj) = 40.8%
Analysis of Variance
Source DF SS MS F P
Regression 1 423.88 423.88 21.00 0.000
Residual Error 28 565.16 20.18
Total 29 989.04
Analysis of Variance
Source DF SS MS F P
Regression 2 5.62923E+12 2.81462E+12 3.44 0.047
Residual Error 27 2.21206E+13 8.19280E+11
Total 29 2.77498E+13
Source DF SS MS F P
Regression 2 15.473 7.737 3.88 0.033
Residual Error 27 53.893 1.996
Total 29 69.367
17
9.267492 0.903742 69.9523108 9.267492 -7.26108 85.88640277 1
-1.43637 9.267492 114.572728 -1.43637 0.968819 2.063168465 0
-3.45755 -1.43637 4.08516818 -3.45755 1.981066 11.95467461 0
-0.74483 -3.45755 7.35884571 -0.74483 0.355316 0.554777722 0
1.150049 -0.74483 3.59058194 1.150049 -0.44314 1.322612865 0
0.472362 1.150049 0.45926 0.472362 -0.14017 0.2231257 0
-2.51342 0.472362 8.91489012 -2.51342 0.528895 6.317277554 0
1.083164 -2.51342 12.9354108 1.083164 -0.13611 1.173243625 0
12.60445 1.083164 132.739957 12.60445 -0.52673 158.8720718 0
-4.97832 12.60445 309.153646 -4.97832 -0.20804 24.78366098 0
-0.38926 -4.97832 21.0594506 -0.38926 -0.04892 0.151524432 0
-3.61525 -0.38926 10.4070175 -3.61525 -0.76075 13.07004939 0
1.98643 -3.61525 31.3788504 1.98643 0.589449 3.945906096 0
4.27529 1.98643 5.23887808 4.27529 1.647357 18.27810501 0
1.001619 4.27529 10.7169225 1.001619 0.477813 1.003240527 0
-4.38274 1.001619 28.9913235 -4.38274 -2.51117 19.20841169 0
-1.75619 -4.38274 6.89874384 -1.75619 -1.18453 3.08421811 0
-2.07913 -1.75619 0.10428677 -2.07913 -1.629 4.322776708 1
-3.82385 -2.07913 3.0440602 -3.82385 -3.45192 14.6218469 1
-0.96692 -3.82385 8.16205569 -0.96692 -1.00215 0.934936602 1
-0.25451 -0.96692 0.50753268 -0.25451 -0.30333 0.064774282 1
1.366102 -0.25451 2.62637676 1.366102 1.889311 1.866234881 2
-0.46902 1.366102 3.36765747 -0.46902 -0.77146 0.219975782 3
-3.40477 -0.46902 8.61863888 -3.40477 -7.2455 11.59244242 5
Total -23.6966 484.5713193 29
sum[(e(i)-1)-e]^2 977.959123 akar 22.0129807 5
sum e^2 484.5713
D 2.018194 rq= -0.20073
18
13 -0.96692 0.416667 -0.21043
14 -0.74483 0.45 -0.12566
15 -0.46902 0.483333 -0.04179
16 -0.38926 0.516667 0.041789
17 -0.25451 0.55 0.125661
18 0.472362 0.583333 0.210428
19 0.903742 0.616667 0.296738
20 1.001619 0.65 0.38532
21 1.054821 0.683333 0.47704
22 1.083164 0.716667 0.572968
23 1.150049 0.75 0.67449
24 1.366102 0.783333 0.7835
25 1.606717 0.816667 0.902735
26 1.98643 0.85 1.036433
27 4.27529 0.883333 1.191816
28 6.973439 0.916667 1.382994
29 9.267492 0.95 1.644854
30 12.60445 0.983333 2.128045
19