Anda di halaman 1dari 19

faANALISIS REGRESI LINIER BERGANDA DAN

PENGUJIAN ASUMSI RESIDUAL PADA DATA JUMLAH


PERMINTAAN AIR BERSIH TERHADAP PENDAPATAN
TOTAL KELUARGA, JUMLAH TANGGUNGAN KELUARGA,
DAN PENGELUARAN ENERGI

Arning Susilawati, Marlisa W Setyorini


1
Program Studi DIII, Jurusan Statistika
Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Teknologi Sepuluh Nopember, Surabaya

ABSTRAK
Pada setiap permasalahan, merasa perlu untuk mengetahui faktor-faktor yang
menyebabkan masalah tersebut. Faktor-faktor tersebut merupakan prediktor,
sedangkan permasalahannya merupakan respon. Dalam permasalahan data jumlah
permintaan air bersih (respon), pendapatan total keluarga (prediktor 1), jumlah
tanggungan keluarga (prediktor 2), dan pengeluaran energi (prediktor 3) dengan
jumlah sampel 37 data. Tujuannya untuk mengetahui bagaimana pengaruh dari
semua prediktor terhadap respon dengan cara melakukan analisis regresi linier
sederhana yakni pengujian serentak dan parsial (individu). Dengan uji berganda,
semua variabel prediktor berpengaruh terhadap respon. Pada uji parsial, diketahui
bahwa prediktor 1 dan prediktor 2 berpengaruh terhadap respon, sedangkan
prediktor 3 tidak berpengaruh terhadap respon. Pada asumsi IIDN (0,σ2), diketahui
bahwa data tidak independen, identik, tidak berdistribusi normal dan tidak memiliki
multikolinieritas.
Kata Kunci : Korelasi, Uji Serentak, Uji Parsial, Analisis Regresi, IIDN (0,σ2)

1. Pendahuluan
Air bersih merupakan salah satu kebutuhan pokok manusia yang dibutuhkan
secara berkelanjutan. Penggunaan air bersih sangat penting untuk komsumsi
rumah tangga, kebutuhan industri dan tempat umum. Karena pentingnya
kebutuhan akan air bersih, maka adalah hal yang wajar jika sektor air bersih
mendapatkan prioritas penanganan utama karena menyangkut kehidupan orang
banyak. Penanganan akan pemenuhan kebutuhan air bersih dapat dilakukan
dengan berbagai cara, disesuaikan dengan sarana dan prasarana yang ada. Di
daerah perkotaan, sistem penyediaan air bersih dilakukan dengan sistem perpipaan
dan non perpipaan. Sistem perpipaan dikelola oleh Perusahaan Daerah Air Minum
(PDAM) dan sistem non perpipaan dikelola oleh masyarakat baik secara individu
maupun kelompok.
Di sebuah wilayah, jumlah permintaan air bersih dapat dipengaruhi oleh
bebarapa faktor, diantaranya pendapatan total keluarga, jumlah tanggungan
keluarga, dan pengeluaran energi dari masing-masing rumah tangga tersebut.
Sehingga dibutuhkan adanya penelitian untuk memperkirakan jumlah permintaan
air yang stabil setiap waktunya. Sumber permasalahan ini berasal dari penelitian
yang dilakukan oleh Universitas Sumatera Utara.
Rumusan masalah yang dibahas dalam praktikum adalah bagaimana
signifikansi uji regresi linier berganda dengan signifikansi hasil uji individu pada

1
kasus jumlah permintaan air bersih. Bagaimana pengaruh banyaknya prediktor
(pendapatan total keluarga, jumlah tanggungan keluarga, dan pengeluaran energi
dari masing-masing rumah tangga) dan nilai koefisien determinasi terhadap model
serta bagaimana uji asumsi residual IIDN dan multikolinieritasnya. Tujuannya
signifikansi uji regresi linier berganda dengan signifikansi hasil uji individu, dan
mengetahui apakah residual sudah memenuhi asumsi residual IIDN serta untuk
menegetahui variabel prediktor dalam percobaan memiliki koefisien korelasi yang
kuat atau tidak.

2. Landasan Teori
Pada landasan teori terdapat dipaparkan mengenai regresi linier berganda,
pengujian asumsi residual IIDN, serta air bersih.

2.1 Regresi Linier Berganda


Analisis regresi merupakan salah satu teknik analisis data dalam statistika
yang seringkali digunakan untuk mengkaji hubungan antara beberapa variabel dan
meramal suatu variabel (Kutner, Nachtsheim dan Neter, 2004). Termasuk di
dalamnya adalah analisis regresi linier berganda.

2.1.1 Persamaan Regresi


Bentuk umum model regresi linier berganda dengan p variabel bebas adalah
seperti pada persamaan (1) berikut (Kutner, Nachtsheim dan Neter, 2004).
Yi = β0 + β1 X I + β2 X 2 +... + βk X k +εi
2.1

 Y1  1 X X  X  β
   1 12 1 p − 1   0   ε 1 
 Y2  1 X X  X   β   ε 
Y =   =  21 2 2p−1  1  +  2
Y=Xβ+ε              
  β   
Y adala    1 X X  X  ε
dengan:
i
Y n1 n2 np−1  p−1  n
2, …, n.  n  
h variabel tidak bebas untuk pengamatan ke-i, untuk i = 1,

β0 , β1 , β2 ,..., βk adalah parameter.


X 1 , X 2 ,..., X k adalah
variabel bebas.
εi adalah sisa (error) untuk pengamatan ke-i yang diasumsikan berdistribusi
normal yang saling bebas dan identik dengan rata-rata 0 (nol) dan variansi σ 2 .

2.1.2 Uji Serentak


Untuk mengetahui apakah koefisien yang ada dalam model secara serentak
nyata atau tidak, digunakan uji F, dengan hipotesisnya sebagai berikut:
H 0 : β1 ≡ β2 = ... = βk = 0 (prediktor tidak berpengaruh terhadap respon)
H 1 : Tidak semua βk sama dengan nol, untuk k=1,2,…,k
Statistik uji yang digunakan adalah:

2
Tabel 2.1 ANOVA Regresi Linier Berganda
Sumber Derajat
Sum Square Mean Square F
Varians bebas
1  SSR MSR
Regresi k SSR = b' X ' Y −  Y ' JY MSR = F=
n  k MSE
SSR
Error n-k-1 SSE = SST − SSR = Y ' Y − b' X ' MSR =
n − k −1
1 
Total n-1 SST = Y ' Y −  Y ' JY
n 
(Draper, 1992)
Dimana nilai Fhitung yang dapat dihitung dibandingkan dengan Fα(V 1,V 2 ) dengan
derajat bebas V1=k, V2=n-k-1 dan tingkat signifikan α. Apabila Fhitung >
Fα( k , n −k −1) maka H0 ditolak, yang berarti paling sedikit ada satu β j yang tidak
dapat sama dengan nol (Salamah, dkk 2010).

2.1.3 Uji Parsial


Uji parsial digunakan untuk menguji signifikasi variabel predictor terhadap
variabel respon secara individu, jika uji serentak signifikan. Rumusan
hipotesisnya:
H 0 : β j = 0 (variabel predictor X j tidak berpengaruh terhadap respon)
H 1 : β j ≠ 0 , untuk j=0,1,2,….,k
Statistik uji yang digunakan adalah

bi
t hitung = 2.2
var(bi )

[
ˆ ) = diagonal X T X
Var ( β j
]
−1
σ2

Dimana b = nilai dugaan β ; σ2 = RKG


i i

Kemudian t hitung dibandingkan dengan nilai table distribusi t dengan derajat bebas
(n-2) dan tingkat signifikan α (Salamah dkk, 2010).

2.1.4 Koefisien Determinan (R2)


Koefisien determinasi didapat dari analisis regresi dengan menggunakan
minitab. Apabila R2 bernilai di atas 75% dapat dijelaskan bahwa nilai variabel Y
yang berada di atas 75% tersebut dapat dijelaskan oleh variabel-variabel bebas
yang ada dalam model. Sedangkan sisanya yang berada di bawah 75% dijelaskan
oleh oleh variabel-variabel bebas yang tidak ada dalam model. Tingginya nilai R 2
ini menandakan baiknya model yang telah didapatkan, artinya model telah sesuai
dan antar variabel pada model terrsebut mempunyai korelasi yang sama (Salamah
dkk, 2010).

3
SSR 2.3
R2 = x100%
SST
2.2 IIDN
Pemeriksaan asumsi IIDN~(0, σ 2 ) digunakan untuk mengetahui data yang
dihasilkan setelah melakukan percobaan sudah memenuhi ketiga asumsi IIDN~(0,
σ 2 ) dan dijelaskan sebagai berikut.

2.2.1 Uji Asumsi Residual Independen


Pemeriksaan residual independen dilakukan untuk melihat apakah residual
memenuhi asumsi independen. Suatu data dikatakan independen apabila plot
residualnya menyebar secara acak dan tidak membentuk suatu pola tertentu
Pemeriksaan asumsi residual independen bisa dilihat dengan cara visual versus
order dan bisa dihitung menggunakan uji Durbin-Watson dapat diketahui sebagai
berikut. (Gujarati,1991)
Hipotesisuji Durbin Watson adalah sebagai berikut.
a) Hipotesis pertama:
H0: tidak ada korelasi positif
H1: ada korelasi positif
Pengambilan keputusan:
d < dL : tolak H0
d > du : terima H0
dL≤ d ≤ du : tidak dapat disimpulkan (inclonclusive)
Hipotesis kedua:
H0: tidak ada korelasi negatif
H1: ada korelasi negatif
Pengambilan keputusan:
d > 4-dL : tolak H0
d < 4-du : terima H0
4-du ≤ d ≤ 4-dL : tidak dapat disimpulkan (inclonclusive)
Hipotesisketiga:
H0: tidak ada korelasi positif ataunegatif
H1: ada korelasi positif ataunegatif
Pengambilan keputusan:
d < dL : tolak H0
d > 4-dL : tolak H0
du< d < 4-du : terimaH0
dL≤ d ≤ du atau 4-du≤ d ≤ 4-dL : tidak dapat disimpulkan
dengan : d = nilai d Durbin Watson
dL = batas bawah
dU = batas atas
Satistik Uji:
∑[(e − e ]
2

d = i −1 i

∑(e ) i
2
2.4

4
2.2.2 Uji Asumsi Residual Identik
Pemeriksaan residual identik dilakukan untuk melihat apakah residual
memenuhi asumsi identik. Suatu data dikatakan identik apabila plot residualnya
menyebar secara acak dan tidak membentuk suatu pola tertentu. Nilai variansnya
rata-rata sama antara varians satu dengan yang lainnya . Pemeriksaan asumsi
residual identik bisa dilihat dengan cara visual versus fits dan bisa dihitung
menggunakan uji White dapat diketahui sebagai berikut.
a. Estimasi model populasi berdasarkan sampel yang diambil sehingga diperoleh
model sampel y = β0 + β1 x1 + β2 x 2 + + βk x k + ε sehingga didapatkan model
sampel sebagai berikut.
ˆ +β
yˆ i = β ˆ x +β
ˆ x + + β
ˆ x +ε
0 1 1 2 2 k k

Dan cara mendapatkan residualnya ei = y i − yˆ i


b. Estimasi model populasi
e 2 = α 0 + α1 x1 + α 2 x 2 + α 3 x12 + α 4 x 22 + α 5 x1 x 2 + V
Sehingga diperoleh model sampel sebagai berikut.
eˆi2 = α 0 + α1 x1 + α 2 x 2 + α3 x12 + α 4 x 22 + α 5 x1 x 2
Sehingga dapat diketahui koefisien determinasi(R2) dari model
H0 : residual identik
H1 : residual tidak identik
Daerah kritis : Tolak H0 jika χ2hitung > χ2tabel
SSR
Statistik uji : R2 = x100%
SST
χhitung
2
=n * R2 2.5
(Catatan: Santi P R)

2.2.3 Uji Asumsi Distribusi Normal


Pemeriksaan residual berdistribusi normal dilakukan untuk melihat apakah
residual memenuhi asumsi berdistribusi normal, apabila plot residualnya
cenderung mendekati garis lurus (linier) Jadi data dikatakan baik jika data tesebut
memenuhi asumsi IIDN Pemeriksaan asumsi residual berdistribusi normal dilihat
dengan Q-Q Plot dengan hipotesis sebagai berikut. (De
H0 : residual berdistribusi normal
H1 : residual tidak berdistribusi normal
Daerah kritis : Tolak H0 jika rQ ≤ r(n,α)
Statistik uji :
n

∑ (e − e ) zi i
2.6
rQ = i =1
n n

∑ (e − e ) ∑ ( z )
i =1
i
2

i =1
i
2

Jika menggunakan kolmogorov-smirnov


hipotesisnya adalah sebagai berikut.
H0 : residual berdistribusi normal
H1 : residual tidak berdistribusi normal
Daerah kritis : Tolak H0 jika P-Value ≤ α
Statistik ujinya dapat dilihat dari P-value yang didapat pada percobaan dengan
software.

5
(Catatan: Santi P R)

2.2.4 Pemeriksaan Multikolinieritas


Multikolinieritas adalah suatu kondisi dimana terjadi korelasi yang kuat
diantara variabel-variabel bebas (X) yang diikutsertakan dalam pembentukan
model regresi linier. Untuk mendeteksi apakah model regresi kita mengalami
multikolinieritas, dapat diperiksa menggunakan VIF (Variance Inflation Factor).
Jika nilai VIF > 10 berarti telah terjadi multikolinieritas (Gujarati, 1991).

1 2.7
VIF =
1 − R2( Xi )
2.3 Air Bersih, Pendapatan, Jumlah Anggota Keluarga, Pengeluaran
Energi
Kebutuhan air bersih merupakan kebutuhan yang tidak terbatas dan
berkelanjutan. Sedang kebutuhan akan penyediaan dan pelayanan air bersih dari
waktu ke waktu semakin meningkat yang terkadang tidak diimbangi oleh
kemampuan pelayanan. Peningkatan kebutuhan ini disebabkan oleh peningkatan
jumlah penduduk, peningkatan derajat kehidupan warga serta perkembangan
kota/kawasan pelayanan ataupun hal-hal yang berhubungan dengan peningkatan
kondisi sosial ekonomi warga.
Sebuah studi Bank Dunia yang disebarluaskan bulan Agustus 2008
menemukan bahwa kurangnya akses terhadap sanitasi menyebabkan biaya
finansial dan ekonomi yang berat bagi ekonomi Indonesia, tidak hanya bagi
individu tetapi juga bagi sektor publik dan perdagangan (IRD, 2013).

3. Metode Penelitian
Data penelitian ini merupakan data sekunder yang diambil dari internet pada
tanggal 22 Oktober 2013 dengan data dari Universitas Sumatera Utara. Variabel-
variabel pengukuran yang digunakan adalah jumlah permintaan air bersih (Y)
dalam m3, pendapatan total keluarga (X1) dalam rupiah, jumlah tanggungan
keluarga (X2) dalam perorangan, dan pengeluaran energi (X3) dalam rupiah
dengan jumlah sampel 30 data. Berikut langkah analisis yang digunakan dalam
penelitian ini yakni mencari data yang memiliki satu variabel respon, dengan tiga
variabel predictor, menginputkan dan melakukan analisis regresi linear berganda
dari data jumlah permintaan air bersih, pendapatan total keluarga, jumlah
tanggungan keluarga, dan pengeluaran energi. Selanjutnya mengambil setiap hasil
scatterplot, korelasi, uji serentak, uji parsial, analisis regresi dan residual lalu
menganalisis sehingga dapat diambil kesimpulan dan saran, yang kemudian
membuat makalah.

4. Analisis Korelasi Linier dan Regresi Linier Sederhana


Data pendapatan total keluarga (X1) dalam rupiah, jumlah tanggungan
keluarga (X2) dalam perorangan, dan pengeluaran energi (X 3) serta jumlah
permintaan air bersih (Y) dalam m3, dalam rupiah dengan jumlah sampel 30 data
dapat dilakukan analisi korelasi linier dan regresi linier sederhana sebagai berikut.

6
4.1 Analisis Regresi Linier Berganda
Analisis regresi linier berganda dilakukan dengan menganalisis estimasi
model, koefisien determinasi, uji serentak, uji parsial dari variabel pendapatan
total keluarga, jumlah tanggungan keluarga, dan pengeluaran energi dengan
menganggap asumsi metode OLS terpenuhi.

4.1.1 Uji Serentak


Persamaan estimasi model analisis regresi linier adalah
Y = 2.36 + 0.000003 X 1 +1.17 X 2 - 0.000010 X 3 artinya setiap kenaikan X1
(pendapatan total keluarga) sebanyak satu rupiah maka Y (jumlah permintaan air
bersih) akan bertambah sebesar 0.000003 M3 saat variabel lain konstan dan setiap
kenaikan X2 (jumlah tanggungan keluarga) sebanyak satu orang maka Y(jumlah
permintaan air bersih) akan bertambah sebesar 1.17 M3 saat nilai variabel lain
konstan serta setiap kenaikan X3 (pegeluaran energi) sebanyak satu rupiah maka
Y(jumlah permintaan air bersih) akan berkurang sebesar 0.000010 M3 saat
variabel lain konstan.
Berikut uji serentak parameter model regresi dari pendapatan total keluarga,
jumlah tanggungan keluarga, pengeluaran energi terhadap jumlah permintaan air
bersih.
Hipotesis
H 0 : β1 = β2 = β3 = 0 (pendapatan total keluarga, jumlah tanggungan keluarga dan
pengeluaran energi tidak berpengaruh signifikan terhadap jumlah permintaan air
bersih)
H 1 : Minimal ada satu β j ≠ 0 (maka ada minimal satu dari pendapatan total
keluarga, jumlah tanggungan keluarga dan pengeluaran energi berpengaruh
signifikan terhadap jumlah permintaan air bersih)
Tabel 4. 1 ANOVA Uji Serentak Parameter Model Regresi Variabel Y dan X1, X2, X3

Source DF SS MS F P
Regression 3 504.47 168.16 9.02 0.000
Residual Error 26 484.57 18.64
Total 29 989.04
Tabel 4.1 diperoleh keputusan tolak H0 Fhitung (9.02) > F0.05( 3, 26 ) ( 2.98) .
Artinya, minimal satu dari pendapatan total keluarga, jumlah tanggungan keluarga
dan pengeluaran energi berpengaruh signifikan terhadap jumlah permintaan air
bersih.

4.1.2 Uji Parsial


Pada uji serentak yang dihasilkan adalah tolak H 0 sehingga dilakukan uji
parsial parameter model regresi jumlah permintaan air bersih dengan pendapatan
total keluarga, jumlah tanggungan keluarga dan pegeluaran energi.
Hipotesis:
H 0 : β j = 0 (pendapatan total keluarga- X1, jumlah tanggungan keluarga- X2 dan
pegeluaran energi- X3 tidak berpengaruh signifikan terhadap jumlah permintaan
air bersih)

7
H 1 : βj ≠ 0 (
pendapatan total keluarga- X1, jumlah tanggungan keluarga- X2 dan
pegeluaran energi- X3 berpengaruh signifikan terhadap jumlah permintaan air
bersih)
Tabel 4. 2 Uji Individu Parameter Model Regresi Variabel Y dan X1, X2, X3

No Regresi CoefSE Coef Thitung T(df.error=28, α =0.05)


1 Constan 2.358 2.625 0.9 1.701
2 0.00000322
0.0000009 3.5 1.701
X1
2
3 X2 1.1731 0.5881 1.99 1.701
4 -0.00000959 0.0000103 -0.09 1.701
X3
1
Tabel 4.2, pada uji regresi individu, pertama Thitung (0.9) <T(df.error, α) (1.701)
adalah gagal tolak H0. artinya seluruh variansi respon dapat dijelaskan oleh
presiktor. Kedua Thitung (3.5) > T(df.error, α) (1.701) adalah tolak H0. artinya
pendapatan total keluarga berpengaruh signifikan terhadap jumlah permintaan air
bersih. Pada uji regresi individu ketiga P-Value (1.99) > T(df.error, α) (1.701) adalah
tolak H0. artinya jumlah tanggungan keluarga berpengaruh signifikan terhadap
jumlah permintaan air bersih. Pada uji regresi individu keempat P-Value (0.09) <
T(df.error, α) (1.701) adalah gagal tolak H0. artinya pengeluaran energi tidak
berpengaruh signifikan terhadap jumlah permintaan air bersih.

4.2 Pemeriksaan Asumsi Residual IIDN (0, σ 2 )


Berikut merupakan pemeriksaan asumsi identik independen, dan
berdistribusi normal dari pendapatan total keluarga, jumlah tanggungan keluarga,
pengeluaran energi terhadap jumlah permintaan air bersih.

4.2.1 Pengujian Asumsi Residual Identik


Pengujian asumsi residual identik dapat divisualisasikan melalui gambar
versus fits dan menggunakan uji White. Berikut pemaparannya.

4.2.1.1 Uji Identik Versus Fits


Berikut merupakan gambar uji identik secara visual.
Ver sus Fi t s
(response is Y)
15

10
Residual

-5

5.0 7.5 10.0 12.5 15.0 17.5 20.0 22.5


Fit t ed Value

Gambar 4. 1 Versus Fits Identik Residual

Gambar 4.1 dapat diketahui sebaran plot residual menyebar secara acak
dan tidak membentuk pola sehingga dapat dikatakan data jumlah permintaan air

8
bersih dengan pendapatan total keluarga, jumlah tanggungan keluarga dan
pengeluaran energi adalah identik.

4.2.1.2 Uji White


Dengan persamaan estimasi model uji White adalah
eˆ 2 = −66.9 + 0.000043 x1 +30.5 x 2 − 0.000120 x3 − 0.000000 x12 −3.28 x 22
+ 0.000000 x32 + 0.000001x1 x 2 = 0.000000 x1 x3 + 0.000016 x 2 x3 + 0.000000 x1 x 2 x3
maka berikut ini hasil dari pengujian identik dengan menggunakan prosedur uji
white dari jumlah permintaan air bersih dengan pendapatan total keluarga, jumlah
tanggungan keluarga dan pegeluaran energi..
Hipotesis:
H 0 : Residual identik (homoskedostisitas)
H 1 : Residual tidak identik (heteroskedostisitas)
χhitung
2
= n * R 2 = 30*16.5%=4.95
Tabel 4. 3 ANOVA Uji Indetik Prosedur Uji White

Source DF SS MS F P
Regression 1 1.01 1.01 0.03 0.867
Residual Error 28 988.03 35.29
Total 29 989.04
Tabel 4.6 diketahui bahwa df=10, R2=16.5%, maka gagal tolak H 0 karena
χhitung
2
( 4.95) < χ10
2
, 0.05
(18.307) , artinya pada uji asumsi residual identik secara
uji White dari data jumlah permintaan air bersih dengan pendapatan total keluarga,
jumlah tanggungan keluarga dan pegeluaran energi adalah memenuhi uji residual
identik.

4.2.2 Pengujian Asumsi Residual Independen


Pengujian asumsi residual independen dapat divisualisasikan melalui
gambar versus order dan menggunakan uji Durbin-Watson. Berikut
pemaparannya.

4.2.2.1 Uji Residual Independen Versus Order


Berikut merupakan gambar uji independen secara visual.
Ver su s Or der
(response is Y)
15

10
Residual

-5

2 4 6 8 10 12 14 16 18 20 22 24 26 28 30
Obser v at ion Or der

Gambar 4. 2 Versus Order

Gambar 4.2 dapat diketahui sebaran plot residual tidak menyebar secara
acak sehingga dapat dikatakan data jumlah permintaan air bersih dengan

9
pendapatan total keluarga, jumlah tanggungan keluarga dan pengeluaran energi
adalah tidak independen.

4.2.2.2 Uji Durbin-Watson


Merupakan uji yang digunakan untuk menentukan asumsi Indepeden.
Hipotesis:
H 0 : ρ e = 0 (tidak ada korelasi serial(otokorelasi) pada residual)
H 1 : ρe ≠ 0 (ada korelasi serial (otokorelasi) pada residual)
α = 5%
Daerah kritis: du=1.21 dl=1.65
∑[e − e ]
2
i −1 i 977.9591232
Statistik Uji: d= = = 2.018194
∑(e ) i
2
484.5713193
Keputusan: Tolak H0 jika H0 (d<dl) atau (4-d)<du
Kesimpulan:
Gagal tolak H0 karena d (2.01)>dl(1.65), 1.99>1.21 artinya jumlah permintaan air
bersih dengan pendapatan total keluarga, jumlah tanggungan keluarga dan
pegeluaran energi tidak independen.

4.2.3 Pengujian Asumsi Residual Normalitas


Pada pengujian asumsi residual normalitas dapat menggunakan uji
kolmogorov smirnov, uji Q-Q plot, dan uji RQ. Berikut pemaparannya.

4.2.3.1Uji Kolmogorov Smirnov


Uji yang digunakan untuk mengetahui apakah data berdistri busi Normal.
Hipotesis:
H0 = Berdistribusi Normal
H1 = Tidak berdistribusi Normal
α = 5%
Daerah Kritis: Tolah H0 jika  p-value < α (0.05)
Pr obabi l i t y Pl ot of RESI 1
Normal
99
Mean -2.07242E-16
StDev 4.088
95 N 30
KS 0.180
90
P-Value 0.018
80
70
Per cent

60
50
40
30
20

10

1
-10 -5 0 5 10 15
RESI 1

Gambar 4. 3 Kolmogorov Smirnov

10
Gambar 4.3 menunjukkan p-value dari residual sebesar 0.018 lebih kecil
dari α = 0.05 sehinga tolak H0 yang artinya data jumlah permintaan air bersih
dengan pendapatan total keluarga, jumlah tanggungan keluarga dan pegeluaran
energi tidak berdistribusi normal.

4.2.3.2 Uji Q-Q plot


Dari pengujian Q-Q plot dihasilkan sactterplot seperti gambar berikut.

Scat t er pl ot of z v s e u r u t an
3

1
z

-1

-2

-5 0 5 10 15
e ur ut an

Gambar 4. 4 Uji Q-Q plot

Gambar 4.4 menunjukkan plot dari residualnya tidak mendekati garis


linier, artinya data jumlah permintaan air bersih dengan pendapatan total keluarga,
jumlah tanggungan keluarga dan pegeluaran energi tidak berdistribusi normal.

4.2.3.3 Uji RQ
Hipotesis:
H0 = Data berdistribusi Normal
H1 = Data tidak berdistribusi Normal
Daerah Kritis: Tolak H0 jika rQ ≤ r(n,α)
Statistik Uji:
n

∑ (e
i =1
i − e) z i
- 23.6966
rQ = = = −0.20073
n n (22.0129807)(5)
∑ (e
i =1
i − e) 2 ∑ (z )
i =1
i
2

Karena rQ sebesar -0.020073 lebih kecil dari r(n,α) sebesar 0.9652 sehingga
tolak H0 yang artinya data jumlah permintaan air bersih dengan pendapatan total
keluarga, jumlah tanggungan keluarga dan pengeluaran energi adalah tidak
berdistribusi normal.

4.2.4 Multikolinieritas
Berikut ini hasil dari pengujian multikolinieritas dari jumlah permintaan air
bersih dengan pendapatan total keluarga, jumlah tanggungan keluarga dan
pegeluaran energi.
Hipotesis:
H 0 : Tidak ada multikolinieritas (tidak ada hubungan antara pendapatan total
keluarga, jumlah tanggungan keluarga dan pegeluaran energi)

11
H1 : Ada multikolinieritas (ada hubungan antara pendapatan total keluarga,
jumlah tanggungan keluarga dan pegeluaran energi)
Tabel 4. 4 ANOVA Uji Multikolinieritas

No Predikto SSR SST R 2j (% VIF


r
)
1 56292300000 277498000000 20.3 1.255
X1
0 0
2 X2 15.473 69.367 22.3 1.287
3 X3 11009125301 18622200000 5.9 1.063

Tabel 4.8 diketahui bahwa dari keseluruhan nilai VIF dari masing-masing regresi
menghasilkan VIF < 10 sehingga gagal tolak H 0 , artinya data pendapatan total
keluarga, jumlah tanggungan keluarga dan pegeluaran energi tidak ada hubungan
multikolinieritas.

5. Kesimpulan
1. Ada hubungan (korelasi) linier antara jumlah permintaan air bersih dengan
pendapatan total keluarga dan jumlah tanggungan keluarga, sedangkan
untuk jumlah permintaan air bersih dan pengeluaran energi tidak ada
hubungan linier.
2. Tabel analisis berganda, diketahui bahwa pendapatan total keluarga, jumlah
tanggungan keluarga dan pengeluaran energi berpengaruh signifikan
terhadap jumlah permintaan air bersih.
3. Tabel uji parsial parameter, diketahui bahwa pendapatan total keluarga dan
jumlah tanggungan keluarga berpengaruh signifikan terhadap jumlah
permintaan air bersih, sedangkan pengeluaran energi tidak berpengaruh
signifikan terhadap jumlah permintaan air bersih.
4. Dengan adanya uji asumsi IIDN, diketahui bahwa data tidak berdistribusi
normal, tidak independen dan identik, serta tidak terjangkit multikolinieritas
dari data pendapatan total keluarga, jumlah tanggungan keluarga dan
pengeluaran energi tidak multikolinieritas terhadap jumlah permintaan air
bersih.

6. Daftar Pustaka
1. Draper, Harry Smith dan Norman. 1992. Analisis Regresi Terapan.
Jakarta: Gramedia Puataka Utama.
2. Gesaf. (2008, November). Regresi dan Korelasi Sederhana. Retrieved
September 28, 2013, from gesaf.files.wordpress.com:
http://gesaf.files.wordpress.com/2008/11/regresi-dan-korelasi.pdf.
3. Salamah, M dan Distri Susilaningrum. 2010. Modul Praktikum
PenghantarMetode Statistika. Surabaya: Jurusan Statistika ITS.
4. Setiawan, Y. (2012, Desember 09). Analisis Regresi Linier Sederhana dan
Analisis Korelasi. Retrieved September 28, 2013, from
yudhasetiawanst.blogspot.com:
http://yudhasetiawanst.blogspot.com/2012/12/analisis-regresi-korelasi-linier.html

12
5. Kutner, M.H., C.J. Nachtsheim., dan J. Neter. 2004. Applied Linear
Regression Models. 4th ed. New York: McGraw-Hill Companies, Inc.
6. IRD. (2013). Program Air Bersih dan Sanitasi. Retrieved October 24,
2013, from http://www.ird.or.id/
7. Air Bersih, Jumlah Keluarga, Jumlah Pendapatan, dan Kebutuhan
Energi. (n.d.). Retrieved October 22, 2013, from
httprepository.usu.ac.idbitstream123456789191211Appendix.pdf
8. Gujarati, D. 1991. Ekonometrika Dasar : Jakarta: Penerbit Erlangga.
9. Catatan Bu Santi Puteri tanggal 6 November 2013

Lampiran

Lampiran 1: Data
No Y X1 X2 X3
1 15.7 700000 4 60000
2 3.4 Keterangan:
300000 5 185000
Y = Jumlah Permintaan Air Bersih (M3)
3 5.3 650000 6 76000
X1 = Pendapatan Total Keluarga (Rp)
265000
4 23.5 X2 = Jumlah10Tanggungan
75000 Keluarga (orang)
0
X3 = Pengeluaran Energi (Rp)
5 10.3 400000 6 150000
6 8.2 300000 4 75000
196300
7 22.2 4 45000
0
8 10.8 950000 6 22500
9 6.3 300000 6 63000
10 6.4 700000 4 225000
120000
11 15.1 7 50000
0
12 8.2 300000 4 30000
158600
13 8.2 4 150000
0
177500
14 11.9 5 325000
0
15 22.6 700000 5 50000
375000
16 16 6 50000
0
150000
17 11.7 5 100000
0
18 4 600000 3 20000
19 10 700000 3 12000
175000
20 17.6 5 55000
0
264550
21 17.3 7 290000
0
22 4.6 400000 5 55000

13
23 5 318000 3 15000
24 4.6 300000 3 17000
350000
25 14.1 4 40000
0
26 5.3 300000 3 60000
27 6.3 300000 3 30000
28 9.1 600000 4 130000
29 6.3 300000 4 130000
30 7.2 800000 5 20000

Lampiran
Correlations: Y, X1, X2, X3

Y X1 X2
X1 0.655
0.000

X2 0.520 0.445
0.003 0.014

X3 0.032 0.170 0.231


0.867 0.369 0.219

Cell Contents: Pearson correlation


P-Value

Lampiran 3: Uji Regresi Berganda


Regression Analysis: Y versus X1, X2, X3

The regression equation is


Y = 2.36 + 0.000003 X1 + 1.17 X2 - 0.000010 X3

30 cases used, 1 cases contain missing values

S = 4.31710 R-Sq = 51.0% R-Sq(adj) = 45.4%

Analysis of Variance

Source DF SS MS F P
Regression 3 504.47 168.16 9.02 0.000
Residual Error 26 484.57 18.64
Total 29 989.04

Predictor Coef SE Coef T P VIF


Constant 2.358 2.625 0.90 0.377
X1 0.00000322 0.00000092 3.50 0.002 1.254
X2 1.1731 0.5881 1.99 0.057 1.287
X3 -0.00000959 0.00001031 -0.93 0.361 1.063

Residual Plots for Y

14
Resi dual Pl ot s f or Y
No rmal Pro b ab ilit y Plo t Versu s Fit s
99 15

90 10

Residual
Per cent

50 5

0
10
-5
1
-10 -5 0 5 10 5 10 15 20
Residual Fit t ed Value

Hist o g ram Versu s Ord er


15
10.0
10
Fr equency

7.5

Residual
5
5.0
0
2.5
-5
0.0
-5.0 -2.5 0.0 2.5 5.0 7.5 10.0 12.5 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30
Residual Obser vat ion Or der

Regression Analysis: Y versus X1

The regression equation is


Y = 6.37 + 0.000004 X1

30 cases used, 1 cases contain missing values

S = 4.49268 R-Sq = 42.9% R-Sq(adj) = 40.8%

Analysis of Variance

Source DF SS MS F P
Regression 1 423.88 423.88 21.00 0.000
Residual Error 28 565.16 20.18
Total 29 989.04

Regression Analysis: Y versus X2

The regression equation is


Y = 1.21 + 1.96 X2

30 cases used, 1 cases contain missing values

S = 5.07642 R-Sq = 27.0% R-Sq(adj) = 24.4%

Analysis of Variance

Source DF SS MS F P
Regression 1 267.48 267.48 10.38 0.003
Residual Error 28 721.56 25.77
Total 29 989.04

Regression Analysis: Y versus X3

The regression equation is


Y = 10.4 + 0.000002 X3

30 cases used, 1 cases contain missing values

15
S = 5.94027 R-Sq = 0.1% R-Sq(adj) = 0.0%

Analysis of Variance

Source DF SS MS F P
Regression 1 1.01 1.01 0.03 0.867
Residual Error 28 988.03 35.29
Total 29 989.04

Regression Analysis: e^2 versus X1, X2, ...

The regression equation is


e^2 = - 66.9 + 0.000043 X1 + 30.5 X2 - 0.000120 X3 - 0.000000 x1^2 - 3.28
X2^2
+ 0.000000 X3^2 + 0.000001 X1*X2 - 0.000000 X1*x3 + 0.000016 X2*X3
+ 0.000000 X1*X2*X3

Predictor Coef SE Coef T P


Constant -66.88 76.12 -0.88 0.391
X1 0.00004255 0.00006126 0.69 0.496
X2 30.50 30.10 1.01 0.324
X3 -0.0001197 0.0009461 -0.13 0.901
x1^2 -0.00000000 0.00000000 -1.04 0.309
X2^2 -3.281 3.591 -0.91 0.372
X3^2 0.00000000 0.00000000 0.16 0.874
X1*X2 0.00000145 0.00001177 0.12 0.903
X1*x3 -0.00000000 0.00000000 -0.42 0.680
X2*X3 0.0000163 0.0002163 0.08 0.941
X1*X2*X3 0.00000000 0.00000000 0.25 0.805

S = 36.5406 R-Sq = 16.5% R-Sq(adj) = 0.0%

Analysis of Variance

Source DF SS MS F P
Regression 10 5018 502 0.38 0.942
Residual Error 19 25369 1335
Total 29 30387

Regression Analysis: X1 versus X2, X3

The regression equation is


X1 = - 293013 + 271159 X2 + 0.86 X3

S = 905141 R-Sq = 20.3% R-Sq(adj) = 14.4%

Analysis of Variance

Source DF SS MS F P
Regression 2 5.62923E+12 2.81462E+12 3.44 0.047
Residual Error 27 2.21206E+13 8.19280E+11
Total 29 2.77498E+13

Regression Analysis: Y versus X1

The regression equation is


Y = 6.37 + 0.000004 X1

16
S = 4.49268 R-Sq = 42.9% R-Sq(adj) = 40.8%

Analysis of Variance

Source DF SS MS F P
Regression 1 423.88 423.88 21.00 0.000
Residual Error 28 565.16 20.18
Total 29 989.04

Regression Analysis: X1 versus X2, X3

The regression equation is


X1 = - 293013 + 271159 X2 + 0.86 X3

S = 905141 R-Sq = 20.3% R-Sq(adj) = 14.4%

Analysis of Variance

Source DF SS MS F P
Regression 2 5.62923E+12 2.81462E+12 3.44 0.047
Residual Error 27 2.21206E+13 8.19280E+11
Total 29 2.77498E+13

Regression Analysis: X2 versus X1, X3

The regression equation is


X2 = 3.79 + 0.000001 X1 + 0.000003 X3

S = 1.41281 R-Sq = 22.3% R-Sq(adj) = 16.6%


Analysis of Variance

Source DF SS MS F P
Regression 2 15.473 7.737 3.88 0.033
Residual Error 27 53.893 1.996
Total 29 69.367

Regression Analysis: X3 versus X1, X2

The regression equation is


X3 = 31546 + 0.0068 X1 + 10059 X2
S = 80556.5 R-Sq = 5.9% R-Sq(adj) = 0.0%
Analysis of Variance
Source DF SS MS F P
Regression 2 11009125301 5504562650 0.85 0.439
Residual Error 27 1.75212E+11 6489349989
Total 29 1.86222E+11

Hasil Uji Durbin Watson Hasil Uji rQ

e e(i)-1 [(e(i)-1)-e]^2 ei-ebar (ei-ebar)z (ei-ebar)^2 z^2


6.973439 6.973439 -14.8398 48.62885148 5
-4.0149 6.973439 120.743675 -4.0149 6.603929 16.11945157 3
-5.45863 -4.0149 2.08434054 -5.45863 7.549251 29.79662201 2
1.606717 -5.45863 49.9191001 1.606717 -1.91491 2.581538854 1
1.054821 1.606717 0.30458915 1.054821 -1.09325 1.112647001 1
0.903742 1.054821 0.02282484 0.903742 -0.81584 0.816749451 1

17
9.267492 0.903742 69.9523108 9.267492 -7.26108 85.88640277 1
-1.43637 9.267492 114.572728 -1.43637 0.968819 2.063168465 0
-3.45755 -1.43637 4.08516818 -3.45755 1.981066 11.95467461 0
-0.74483 -3.45755 7.35884571 -0.74483 0.355316 0.554777722 0
1.150049 -0.74483 3.59058194 1.150049 -0.44314 1.322612865 0
0.472362 1.150049 0.45926 0.472362 -0.14017 0.2231257 0
-2.51342 0.472362 8.91489012 -2.51342 0.528895 6.317277554 0
1.083164 -2.51342 12.9354108 1.083164 -0.13611 1.173243625 0
12.60445 1.083164 132.739957 12.60445 -0.52673 158.8720718 0
-4.97832 12.60445 309.153646 -4.97832 -0.20804 24.78366098 0
-0.38926 -4.97832 21.0594506 -0.38926 -0.04892 0.151524432 0
-3.61525 -0.38926 10.4070175 -3.61525 -0.76075 13.07004939 0
1.98643 -3.61525 31.3788504 1.98643 0.589449 3.945906096 0
4.27529 1.98643 5.23887808 4.27529 1.647357 18.27810501 0
1.001619 4.27529 10.7169225 1.001619 0.477813 1.003240527 0
-4.38274 1.001619 28.9913235 -4.38274 -2.51117 19.20841169 0
-1.75619 -4.38274 6.89874384 -1.75619 -1.18453 3.08421811 0
-2.07913 -1.75619 0.10428677 -2.07913 -1.629 4.322776708 1
-3.82385 -2.07913 3.0440602 -3.82385 -3.45192 14.6218469 1
-0.96692 -3.82385 8.16205569 -0.96692 -1.00215 0.934936602 1
-0.25451 -0.96692 0.50753268 -0.25451 -0.30333 0.064774282 1
1.366102 -0.25451 2.62637676 1.366102 1.889311 1.866234881 2
-0.46902 1.366102 3.36765747 -0.46902 -0.77146 0.219975782 3
-3.40477 -0.46902 8.61863888 -3.40477 -7.2455 11.59244242 5
Total -23.6966 484.5713193 29
sum[(e(i)-1)-e]^2 977.959123 akar 22.0129807 5
sum e^2 484.5713
D 2.018194 rq= -0.20073

Uji Q-Q plot


i e urutan i-0.5/30 z
1 -5.45863 0.016667 -2.12805
2 -4.97832 0.05 -1.64485
3 -4.38274 0.083333 -1.38299
4 -4.0149 0.116667 -1.19182
5 -3.82385 0.15 -1.03643
6 -3.61525 0.183333 -0.90273
7 -3.45755 0.216667 -0.7835
8 -3.40477 0.25 -0.67449
9 -2.51342 0.283333 -0.57297
10 -2.07913 0.316667 -0.47704
11 -1.75619 0.35 -0.38532
12 -1.43637 0.383333 -0.29674

18
13 -0.96692 0.416667 -0.21043
14 -0.74483 0.45 -0.12566
15 -0.46902 0.483333 -0.04179
16 -0.38926 0.516667 0.041789
17 -0.25451 0.55 0.125661
18 0.472362 0.583333 0.210428
19 0.903742 0.616667 0.296738
20 1.001619 0.65 0.38532
21 1.054821 0.683333 0.47704
22 1.083164 0.716667 0.572968
23 1.150049 0.75 0.67449
24 1.366102 0.783333 0.7835
25 1.606717 0.816667 0.902735
26 1.98643 0.85 1.036433
27 4.27529 0.883333 1.191816
28 6.973439 0.916667 1.382994
29 9.267492 0.95 1.644854
30 12.60445 0.983333 2.128045

19

Anda mungkin juga menyukai