METODE STATISTIKA II
Penyelesaian:
library(stats)
library(car)
library(lmtest)
library(zoo)
#MODEL AWAL, ESTIMASI PARAMETER, PENGUJIAN SIGNIFIKANSI PARAMETER
Data=read.table(file.choose(),header=TRUE)
Data
summary(Data)
reg=lm(formula=Y~X1+X2+X3+X4,data=Data)
summary(reg)
#(forward)data-importdata-fromtextfile-...-statistics-fitmodels-
linearesgression-blok variabel y di response variable-blok semua
variabel x di explanatory-ok
1. Model Awal
Yi=β 0+ β1 X 1 i + β 2 X 2i + β 3 X 3 i+ β 4 X 4 i + ε i
Keterangan :
Yi : variabel IPM
β 0 : Rataan Umum (intercept)
X 1 i : variabel angka partisipasi sekolah ke-i
β 1 : Parameter variabel independent X1
X 2 i : variabel jumlah penduduk miskin ke-i
β 2 : Parameter variabel independent X2
X 3 i : variabel tingkat pengangguran terbuka ke-i
β 3 : Parameter variabel independent X3
X 4 i : variabel penduduk buta huruf ke-i
β 4 : Parameter variabel independent X4
ε i : Error ke-i
Berdasarkan model di atas dapat diketahui bahwa konstanta sebesar 6.951 menyatakan
bahwa tanpa dipengaruhi oleh variabel angka partisipasi sekolah, jumlah penduduk
miskin, tingkat pengangguran terbuka dan variabel penduduk buta huruf maka nilai IPM
sebesar 56.4321829. Koefisien sebesar 0.1830269 menyatakan bahwa setiap penambahan
1 peringkat angka partisipasi sekolah akan meningkatkan nilai IPM sebesar 0.1830269.
Koefisien sebesar 0.0002040 menyatakan bahwa setiap penambahan 1 peringkat
penduduk miskin akan meningkatkan nilai IPM sebesar 0.0002040. Koefisien sebesar
0.2902209 menyatakan bahwa setiap penambahan 1 peringkat angka tingkat penganguran
terbuka akan meningkatkan nilai IPM sebesar 0.2902209. Koefisien sebesar 0.5107894
menyatakan bahwa setiap penambahan 1 peringkat penduduk miskin akan meningkatkan
nilai IPM sebesar 0.5107894.
3. Koefisien Determinasi
Koefisien determinasi sebesar 0,3995 menyatakan bahwa sebesar 39,95% variasi yang
terjadi pada nilai IPM disebabkan oleh variabel angka partisipasi sekolah, jumlah
penduduk miskin, tingkat pengangguran terbuka dan variabel penduduk buta huruf. Hal
ini menandakan bahwa ada sekitar 60,05% variabel lain yang belum diketahui yang
mempengaruhi Indeks Pembangunan Manusia.
Hipotesis
H0 : (Secara Simultan tidak terdapat pengaruh variabel angka partisipasi sekolah,
jumlah penduduk miskin, tingkat pengangguran terbuka dan variabel
penduduk buta huruf terhadap variabel nilai IPM)
H1 : (Secara Simultan terdapat pengaruh variabel angka partisipasi sekolah,
jumlah penduduk miskin, tingkat pengangguran terbuka dan variabel
penduduk buta huruf terhadap variabel nilai IPM)
Taraf Signifikansi
α = 0,05
Daerah Kritis
H0 ditolak jika P-value < α
Keputusan
Karena P-value = 0.004171 < α = 0,05 maka diputuskan tolak H0
Kesimpulan
Secara Simultan terdapat pengaruh variabel angka partisipasi sekolah, jumlah
penduduk miskin, tingkat pengangguran terbuka dan variabel penduduk buta
huruf terhadap variabel nilai IPM
b) Uji Parsial
1) Variabel X1(angka partisipasi sekolah)
Hipotesis:
H0 : Tidak terdapat pengaruh variabel angka partisipasi sekolah terhadap
variabel nilai IPM
H1 : Terdapat pengaruh variabel angka partisipasi sekolah terhadap
variabel nilai IPM
Taraf Signifikansi
α = 0,05
Daerah Kritis
H0 ditolak jika P-value < α
Keputusan
Karena P-value = 0.08604 > α = 0,05 maka diputuskan gagal tolak H0
Kesimpulan
Tidak terdapat pengaruh variabel angka partisipasi sekolah terhadap
variabel nilai IPM
2) Variabel X2(jumlah penduduk miskin)
Hipotesis:
H0 : Tidak terdapat pengaruh variabel jumlah penduduk miskin terhadap
variabel nilai IPM
H1 : Terdapat pengaruh variabel jumlah penduduk miskin terhadap
variabel nilai IPM
Taraf Signifikansi
α = 0,05
Daerah Kritis
H0 ditolak jika P-value < α
Keputusan
Karena P-value = 0.73159 > α = 0,05 maka diputuskan gagal tolak H0
Kesimpulan
Tidak terdapat pengaruh variabel angka melek huruf terhadap variabel
nilai IPM
Hipotesis:
H0 : Tidak terdapat pengaruh variabel tingkat pengangguran terbuka
terhadap variabel nilai IPM
H1 : Terdapat pengaruh variabel tingkat pengangguran terbuka terhadap
variabel nilai IPM
Taraf Signifikansi
α = 0,05
Daerah Kritis
H0 ditolak jika P-value < α
Keputusan
Karena P-value = 0,45485> α = 0,05 maka diputuskan gagal tolak H0
Kesimpulan
Tidak terdapat pengaruh variabel tingkat pengangguran terbuka terhadap
variabel nilai IPM
Hipotesis:
H0 : Tidak terdapat pengaruh variabel penduduk buta huruf terhadap
variabel nilai IPM
H1 : Terdapat pengaruh variabel penduduk buta huruf terhadap variabel
nilai IPM
Taraf Signifikansi
α = 0,05
Daerah Kritis
H0 ditolak jika P-value < α
Keputusan
Karena P-value = 0,00759 < α = 0,05 maka diputuskan tolak H0
Kesimpulan
Terdapat pengaruh variabel penduduk buta huruf terhadap variabel nilai
IPM
Berdasarkan Pemilihan Model Terbaik dengan metode forward diperoleh nilai AIC
untuk masing-masing model terlampir pada tabel di atas. Pada ke-tiga model tersebut
dapat dilihat bahwa model dengan nilai AIC terkecil yaitu sebesar 81.31 terletak pada
model Y ~ X4 + X1
Berdasarkan model di atas dapat diketahui bahwa konstanta sebesar 58.9036 menyatakan
bahwa tanpa dipengaruhi oleh variabel angka partisipasi sekolah dan penduduk buta
huruf, maka nilai IPM sebesar 58.9036. Koefisien sebesar 0.1709 menyatakan bahwa
setiap penambahan 1 peringkat angka partisipasi sekolah akan meningkatkan nilai IPM
sebesar 0.1709. koefisien sebesar 0.5410 menyatakan bahwa setiap penambahan 1
peringkat penduduk buta huruf akan meningkatkan nilai IPM sebesar 0.5410
Koefisien determinasi sebesar 0,3837 menyatakan bahwa sebesar 38,37% variasi yang
terjadi pada nilai IPM disebabkan oleh variable angka partisipasi sekolah dan jumlah
penduduk buta huruf. Hal ini menandakan bahwa ada sekitar 61,53 % variabel lain yang
belum diketahui yang mempengaruhi Indeks Pembangunan Manusia.
b) Uji Parsial
1) Variabel X1(angka partisipasi sekolah)
Hipotesis:
H0 : Tidak terdapat pengaruh variabel angka partisipasi sekolah terhadap
variabel nilai IPM
H1 : Terdapat pengaruh variabel angka partisipasi sekolah terhadap
variabel nilai IPM
Taraf Signifikansi
α = 0,05
Daerah Kritis
H0 ditolak jika P-value < α
Keputusan
Karena P-value = 0,08851> α = 0,05 maka diputuskan gagal tolak H0
Kesimpulan
Tidak terdapat pengaruh variabel angka partisipasi sekolah terhadap
variabel nilai IPM
Hipotesis:
H0 : Tidak terdapat pengaruh variabel penduduk buta huruf terhadap
variabel nilai IPM
H1 : Terdapat pengaruh variabel prnduduk buta huruf terhadap variabel
nilai IPM
Taraf Signifikansi
α = 0,05
Daerah Kritis
H0 ditolak jika P-value < α
Keputusan
Karena P-value = 0,00348< α = 0,05 maka diputuskan tolak H0
Kesimpulan
Terdapat pengaruh variabel penduduk buta huruf terhadap variabel nilai
IPM
9.
10.
11.
12. Asumsi Klasik
a) Non Multikolinieritas
Berdasarkan Tabel dapat diketahui bahwa ke-dua variabel bebas memiliki nilai VIF
yang lebih kecil dari 10 sehingga dapat disimpulkan bahwa tidak terjadi
multikolinieritas pada model regresi.
b) Non Heteroskedastisitas
Hipotesis:
H0 : Tidak terjadi heteroskedastisitas pada model regresi
H1 : Terjadi heteroskedastisitas pada model regresi
Taraf Signifikansi
α = 0,05
Daerah Kritis
H0 ditolak jika P-value < α
Keputusan
Karena P-value = 0,3695 > α = 0,05 maka diputuskan gagal tolak H0
Kesimpulan
Tidak terjadi heteroskedastisitas pada model regresi
c) Non Autokorelasi
Hipotesis:
H0 : Tidak terjadi autokorelasi pada model regresi
H1 : Terjadi autokorelasi pada model regresi
Taraf Signifikansi
α = 0,05
Daerah Kritis
H0 ditolak jika P-value < α
Keputusan
Karena P-value = 0,02785< α = 0,05 maka diputuskan tolak H0
Kesimpulan
Terjadi autokorelasi pada model regresi
Hipotesis:
H0 : Data residual berasal dari populasi yang berdistribusi normal
H1 : Data residual tidak berasal dari populasi yang berdistribusi normal
Taraf Signifikansi
α = 0,05
Daerah Kritis
H0 ditolak jika P-value < α
Keputusan
Karena P-value = 0,1618 > α = 0,05 maka diputuskan gagal tolak H0
Kesimpulan
Data residual berasal dari populasi yang berdistribusi normal
LAMPIRAN
> library(stats)
> library(car)
Loading required package: carData
Warning message:
package ‘car’ was built under R version 3.6.3
> library(lmtest)
Loading required package: zoo
as.Date, as.Date.numeric
Warning messages:
1: package ‘lmtest’ was built under R version 3.6.3
2: package ‘zoo’ was built under R version 3.6.3
> library(zoo)
> #MODEL AWAL ESTIMASI PARAMETER, PENGUJIAN SIGNIFIKANSI
PARAMETER
> Data=read.table(file.choose(),header=TRUE)
> Data
Y X1 X2 X3 X4
1 71.90 83.26 809.76 6.20 0.06
2 71.74 77.67 1260.50 5.41 0.18
3 72.39 83.63 343.09 5.33 0.10
4 73.00 77.29 483.92 5.97 0.10
5 71.26 71.97 273.37 4.19 0.23
6 70.02 70.29 1067.16 4.48 0.20
7 71.21 79.39 298.00 3.39 0.17
8 69.57 71.05 1041.48 4.03 0.12
9 71.30 67.79 67.37 3.62 0.60
10 75.48 84.04 127.76 6.91 0.12
11 80.76 72.01 362.30 6.22 0.05
12 72.03 67.29 3375.89 7.99 0.21
13 71.73 69.65 3679.40 4.49 0.26
14 79.99 88.97 440.89 3.14 0.05
15 71.50 72.74 4056.00 3.92 0.93
16 72.44 68.72 641.42 8.11 0.12
17 75.38 82.83 156.91 1.52 0.17
18 68.14 77.51 705.68 3.42 2.46
19 65.23 75.36 1129.46 3.35 2.51
20 67.65 68.37 370.47 4.45 1.46
21 70.91 66.95 131.24 4.10 0.11
22 70.72 69.19 190.29 4.31 0.15
23 76.61 81.81 220.91 6.09 0.18
24 71.15 76.06 48.61 4.40 0.75
25 72.99 74.04 188.60 6.25 0.08
26 69.50 75.73 404.03 3.15 0.71
27 71.66 70.85 759.58 4.97 1.72
28 71.20 74.03 299.97 3.59 0.94
29 68.49 71.44 184.71 4.06 0.31
30 65.73 69.31 151.87 3.18 2.31
31 69.45 79.65 319.51 7.08 0.55
32 68.70 76.41 87.80 4.97 0.27
33 64.70 81.49 207.59 6.24 1.53
34 60.84 63.50 900.95 3.65 20.21
> summary(Data)
Y X1 X2 X3
Min. :60.84 Min. :63.50 Min. : 48.61 Min. :1.520
1st Qu.:69.46 1st Qu.:69.81 1st Qu.: 189.02 1st Qu.:3.627
Median :71.23 Median :74.03 Median : 352.69 Median :4.425
Mean :71.04 Mean :74.71 Mean : 729.01 Mean :4.770
3rd Qu.:72.30 3rd Qu.:78.96 3rd Qu.: 797.22 3rd Qu.:6.060
Max. :80.76 Max. :88.97 Max. :4056.00 Max. :8.110
X4
Min. : 0.050
1st Qu.: 0.120
Median : 0.220
Mean : 1.174
3rd Qu.: 0.885
Max. :20.210
> reg=lm(formula=Y~X1+X2+X3+X4,data=Data)
> summary(reg)
Call:
lm(formula = Y ~ X1 + X2 + X3 + X4, data = Data)
Residuals:
Min 1Q Median 3Q Max
-7.7189 -1.6354 0.3229 1.1622 9.2945
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 56.4321829 8.1183581 6.951 1.22e-07 ***
X1 0.1830269 0.1029900 1.777 0.08604 .
X2 0.0002040 0.0005891 0.346 0.73159
X3 0.2902209 0.3831194 0.758 0.45485
X4 -0.5107984 0.1780016 -2.870 0.00759 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 3.235 on 29 degrees of freedom
Multiple R-squared: 0.3995, Adjusted R-squared: 0.3167
F-statistic: 4.824 on 4 and 29 DF, p-value: 0.004171
errorCondition
Warning messages:
1: package ‘RcmdrMisc’ was built under R version 3.6.3
2: package ‘sandwich’ was built under R version 3.6.3
3: package ‘effects’ was built under R version 3.6.3
> Dataset <- read.table("C:/Users/hp/Downloads/Y.txt",
header=TRUE,
+ stringsAsFactors=TRUE, sep="", na.strings="NA", dec=".",
strip.white=TRUE)
> RegModel.1 <- lm(Y~X1+X2+X3+X4, data=Dataset)
> summary(RegModel.1)
Call:
lm(formula = Y ~ X1 + X2 + X3 + X4, data = Dataset)
Residuals:
Min 1Q Median 3Q Max
-7.7189 -1.6354 0.3229 1.1622 9.2945
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 56.4321829 8.1183581 6.951 0.000000122 ***
X1 0.1830269 0.1029900 1.777 0.08604 .
X2 0.0002040 0.0005891 0.346 0.73159
X3 0.2902209 0.3831194 0.758 0.45485
X4 -0.5107984 0.1780016 -2.870 0.00759 **
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Direction: forward
Criterion: AIC
Start: AIC=93.76
Y ~ 1
Step: AIC=82.54
Y ~ X4
Step: AIC=81.31
Y ~ X4 + X1
Call:
lm(formula = Y ~ X4 + X1, data = Dataset)
Coefficients:
(Intercept) X4 X1
58.9036 -0.5410 0.1709
Direction: backward
Criterion: AIC
Start: AIC=84.42
Y ~ X1 + X2 + X3 + X4
Step: AIC=82.56
Y ~ X1 + X3 + X4
Step: AIC=81.31
Y ~ X1 + X4
Call:
lm(formula = Y ~ X1 + X4, data = Dataset)
Coefficients:
(Intercept) X1 X4
58.9036 0.1709 -0.5410
> Reg=lm(formula=Y~X1+X4,data=Data)
> summary(Reg)
Call:
lm(formula = Y ~ X1 + X4, data = Data)
Residuals:
Min 1Q Median 3Q Max
-7.306 -1.827 0.110 1.550 9.574
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 58.9036 7.3548 8.009 0.00000000483 ***
X1 0.1709 0.0972 1.759 0.08851 .
X4 -0.5410 0.1710 -3.164 0.00348 **
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Breusch-Pagan test
data: Y ~ X1 + X4
BP = 0.80541, df = 1, p-value = 0.3695
> dwtest(Reg,alternative='two.sided')
Durbin-Watson test
data: Reg
DW = 1.3029, p-value = 0.02785
alternative hypothesis: true autocorrelation is not 0
> residual=resid(Reg)
> shapiro.test(residual)
data: residual
W = 0.95401, p-value = 0.1618