Anda di halaman 1dari 22

Nama : Adri Arisena ; NPM : 140720160006 ; UTS Analisis

Regresi
Diketahui satu set data mengenai hasil pertanian dan 7 ukuran sumber daya untuk 22 negara
sekitar tahun 1950 (Agricultural Output and 7 Measures of Resource Use for 22 Countries circa
1950) di dapat dari http://www.stat.ufl.edu/~winner/data/worldagprod.dat. Berdasarkan data
tersebut ingin diketahui model terbaik, hubungan antar variable, dan pengaruh antara Net
Agricultural Output terhadap 7 variabel lainnya yang dijelaskan sebagai berikut :
Country
nao
paa
ale
crp
pl
ws
fc
nta
U.S.
17346
8851 468033
0.02
77474
825 3952.1 3550000
Canada
1935
1272 91266
0.02
7655
1796
192.1 367828
U.K.
2102
1221 18960
0.02
9604
625
765.9 308540
Norway
290
495
2018
0.02
1251
198
99.6
9506
France
3137
7490 52796
0.02
26070
2613
870.8 122624
W. Germany
1790
4247 21399
0.02
10202
1628 1283.6 109776
Argentina
1373
1570 79789
0.02
32294
772
13.9
25000
Denmark
614
540
6656
0.02
2903
532
198.6
12257
Netherlands
610
746
2760
0.02
2122
276
368.5
15950
South Africa
438
2651 25071
0.05
13690
158
90
39500
Ireland
388
594
3877
0.02
3661
526
60
9480
Poland
2769
7035 41755
0.02
6467
2541
158.4
14500
Chile
185
732 14688
0.02
2699
613
35.4
6000
Puerto Rico
160
246
1023
0.05
336
60
65.4
2150
Japan
2346
18623 14852
0.02
1094
1989
628.6
1810
Italy
3348
9127 38337
0.02
8700
1932
346.3
50590
Mexico
604
3803 29640
0.02
12906
6583
13.8
32000
Greece
411
1507
8255
0.02
1645
793
38.1
2869
Turkey
1199
5724 37552
0.01
12664
3915
6.3
3959
Egypt
885
7558
6039
0.01
4416
2406
97.5
5400
Peru
286
1777
4718
0.02
4440
1141
47.7
2400
India
9297
90523 336266
0.05
83328 75373
64.3
7500

Net Agricultural Output (Millions $) (nao)


Population Active n Agriculture (1000s) (paa)
Arables Land equivalent (1000s acres) (ale)
Conversion Ratio of Pasture of Arable Land (crp)
Productive Livestock (1000s animal units) (pl)
Work Stock (1000s units) (ws)
Fertilizer Consumption (1000s metric tons) (fc)
Number of Tractors in Agriculture (nta)

Jawab :

Nama : Adri Arisena ; NPM : 140720160006 ; UTS Analisis


Regresi
Dengan menggunakan software R dapat diperoleh hasil sebagai berikut :
Analisis Inferensial
Analisis inferensial ditujukan untuk mencari model hubungan antara variabel X dan
variabel Y. Untuk mengetahui model hubungan antara variabel X dan Y diperlukan sebuah
prosedur statistik dengan menggunakan analisis regresi.
1. Estimasi Model
Untuk mencari estimasi model dilakukan dengan menggunakan syntax sebgai berikut ;
> model=lm(nao~paa+ale+crp+pl+ws+fc+nta)
> summary(model)
Call:
lm(formula = nao ~ paa + ale + crp + pl + ws + fc + nta)
Residuals:
Min
1Q Median
3Q
Max
-689.84 -286.46 -67.59 73.11 1202.59
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 4.135e+02 3.353e+02 1.233 0.23779
paa
1.154e-01 3.839e-02 3.007 0.00941 **
ale
1.799e-02 1.066e-02 1.687 0.11379
crp
-1.115e+04 1.263e+04 -0.883 0.39235
pl
-5.851e-05 2.637e-02 -0.002 0.99826
ws
-9.421e-02 4.776e-02 -1.972 0.06864 .
fc
9.762e-01 5.446e-01 1.793 0.09466 .
nta
1.109e-03 1.361e-03 0.815 0.42878
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 560.7 on 14 degrees of freedom
Multiple R-squared: 0.9862,
Adjusted R-squared: 0.9793
F-statistic: 142.6 on 7 and 14 DF, p-value: 6.356e-12

Berdasarkan hasil tersebut dapat diperolah bahwa persamaan regresinya adalah


^y =4135+0.01154 x 1+0.001799 x 21115 x 30.00000585 x 40.009421 x 5+ 0.09762 x 6+0.0001109 x 7

Nama : Adri Arisena ; NPM : 140720160006 ; UTS Analisis


Regresi
Uji Signifikansi Model secara Overall
Dari hasil tersebut diperoleh nilai
nilai
H0

Fstatistic=142.6

pvalue=6.35 e12 . Jika ditentukan

dengan derajat bebas 14 dan

=0.05 , maka

pvalue<

sehingga

ditolak yang artinya bahwa terdapat hubungan secara simultan antara variabel respon (Net

Agricultural

Output)

dengan

Multiple RSquared=0.9862

(enam)

variabel

eksplanatori

nya.

Nilai

menunjukkan bahwa variansi besarnya hasil pertanian selama

pada tahun 1950 dapat dijelaskan oleh 6 variabel lainnya secara simultan sebesar 98.62%,
sedangkan sisanya dijelaskan oleh variabel lain di luar model yang tidak diteliti.
Uji Signifikansi Model Secara Parsial
> model1=lm(nao~paa)
> summary(model1)
Call:
lm(formula = nao ~ paa)
Residuals:
Min
1Q Median
3Q
Max
-1448.3 -1325.5 -1026.0 141.2 14923.1
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.561e+03 8.162e+02 1.913 0.0702 .
paa
9.734e-02 4.046e-02 2.406 0.0259 *
--Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 3513 on 20 degrees of freedom
Multiple R-squared: 0.2244,
Adjusted R-squared: 0.1856
F-statistic: 5.787 on 1 and 20 DF, p-value: 0.02594

Dari hasil output diperoleh nilai

Fstatistic=5.787 dengan derajat bebas 20 dan nilai

pvalue=0.02594 . Apabila ditentukan

=0.05 , maka

pvalue<

sehingga

H0

ditolak yang artinya terdapat hubungan antara variabel respon (Net Agricultural Output) dengan

Nama : Adri Arisena ; NPM : 140720160006 ; UTS Analisis


Regresi
variabel eksplanatori Population Active n Agriculture . Nilai

Multiple RSquared=0.2244

menunjukkan bahwa besarnya hasil pertanian selama pada tahun 1950 dapat dijelaskan melalui
populasi pertanian yang aktif sebesar 22.44%, sedangkan sisanya dijelaskan oleh variabel lain di
luar model yang tidak diteliti.

> model2=lm(nao~ale)
> summary(model2)
Call:
lm(formula = nao ~ ale)
Residuals:
Min
1Q Median
3Q
Max
-2044.9 -637.1 -169.2 920.1 1721.4
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 4.124e+02 2.571e+02 1.604 0.124
ale
3.250e-02 2.018e-03 16.110 6.41e-13 ***
--Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 1067 on 20 degrees of freedom
Multiple R-squared: 0.9284,
Adjusted R-squared: 0.9249
F-statistic: 259.5 on 1 and 20 DF, p-value: 6.408e-13

Dari hasil output diperoleh nilai

Fstatistic=259.5 dengan derajat bebas 20 dan nilai

pvalue=6.408 e13 . Apabila ditentukan


H0

=0.05 , maka

pvalue<

sehingga

ditolak yang artinya terdapat hubungan antara variabel respon (Net Agricultural Output)

dengan variabel eksplanatori Arables Land Equivalent. Nilai

Multiple RSquared=0.9284

menunjukkan bahwa besarnya hasil pertanian selama pada tahun 1950 dapat dijelaskan melalui
lahan yang tersedia sebesar 92.84%, sedangkan sisanya dijelaskan oleh variabel lain di luar
model yang tidak diteliti.
> model3=lm(nao~crp)
> summary(model3)

Nama : Adri Arisena ; NPM : 140720160006 ; UTS Analisis


Regresi
Call:
lm(formula = nao ~ crp)
Residuals:
Min
1Q Median
3Q
Max
-3304.5 -1814.5 -869.9 76.7 15137.7
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept)
1371
1965 0.698 0.493
crp
41873
76523 0.547 0.590
Residual standard error: 3959 on 20 degrees of freedom
Multiple R-squared: 0.01475,
Adjusted R-squared: -0.03451
F-statistic: 0.2994 on 1 and 20 DF, p-value: 0.5903

Dari hasil output diperoleh nilai


nilai
H0

Fstatistic=0.2994

pvalue=0.5903 . Apabila ditentukan

dengan derajat bebas 20 dan

=0.05 , maka

pvalue>

sehingga

diterima yang artinya tidak terdapat hubungan antara variabel respon (Net Agricultural

Output) dengan variabel eksplanatori Conversion Ratio of Pasture of Arable Land


Multiple RSquared=0.01475

. Nilai

menunjukkan bahwa besarnya hasil pertanian selama pada

tahun 1950 hanya dapat dijelaskan melalui rasio lahan yang digarap sebesar 0.14%, sedangkan
sisanya dijelaskan oleh variabel lain di luar model yang tidak diteliti.
> model4=lm(nao~pl)
> summary(model4)
Call:
lm(formula = nao ~ pl)
Residuals:
Min
1Q Median
3Q
Max
-3597.7 -740.5 19.7 449.7 5584.7
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 116.91330 492.93587 0.237 0.815
pl
0.15030 0.01849 8.128 9.11e-08 ***
--Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 1923 on 20 degrees of freedom

Nama : Adri Arisena ; NPM : 140720160006 ; UTS Analisis


Regresi
Multiple R-squared: 0.7676,
Adjusted R-squared: 0.756
F-statistic: 66.07 on 1 and 20 DF, p-value: 9.113e-08

Dari hasil output diperoleh nilai

Fstatistic=66.07

pvalue=9.113 e08 . Apabila ditentukan


H0

dengan derajat bebas 20 dan nilai

=0.05 , maka

pvalue<

sehingga

ditolak yang artinya terdapat hubungan antara variabel respon (Net Agricultural Output)

dengan variabel eksplanatori Productive Livestock. Nilai

Multiple RSquared=0.7676

menunjukkan bahwa besarnya hasil pertanian selama pada tahun 1950 dapat dijelaskan melalui
ternak yang produktif sebesar 76.76%, sedangkan sisanya dijelaskan oleh variabel lain di luar
model yang tidak diteliti.

> model5=lm(nao~ws)
> summary(model5)
Call:
lm(formula = nao ~ ws)
Residuals:
Min
1Q Median
3Q
Max
-1903.5 -1532.3 -1132.4 154.3 15398.9
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.867e+03 8.191e+02 2.279 0.0338 *
ws
9.733e-02 5.055e-02 1.926 0.0685 .
--Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 3664 on 20 degrees of freedom
Multiple R-squared: 0.1564,
Adjusted R-squared: 0.1142
F-statistic: 3.708 on 1 and 20 DF, p-value: 0.0685

Nama : Adri Arisena ; NPM : 140720160006 ; UTS Analisis


Regresi
Dari hasil output diperoleh nilai

Fstatistic=3.708 dengan derajat bebas 20 dan nilai

pvalue=0.0685 . Apabila ditentukan

=0.05 , maka

pvalue>

sehingga

H0

diterima yang artinya tidak terdapat hubungan antara variabel respon (Net Agricultural Output)
dengan variabel eksplanatori Work Stock. Nilai

Multiple RSquared=0.1564

menunjukkan

bahwa besarnya hasil pertanian selama pada tahun 1950 hanya dapat dijelaskan melalui lapangan
pekerjaan sebesar 15.64%, sedangkan sisanya dijelaskan oleh variabel lain di luar model yang
tidak diteliti.
> model6=lm(nao~fc)
> summary(model6)
Call:
lm(formula = nao ~ fc)
Residuals:
Min
1Q Median
3Q
Max
-3769.1 -822.1 -602.1 467.0 8318.6
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 736.8172 537.8327 1.370 0.186
fc
3.7569
0.5726 6.561 2.16e-06 ***
--Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 2247 on 20 degrees of freedom


Multiple R-squared: 0.6828,
Adjusted R-squared: 0.6669
F-statistic: 43.05 on 1 and 20 DF, p-value: 2.157e-06

Dari hasil output diperoleh nilai

Fstatistic=43.05 dengan derajat bebas 20 dan nilai

pvalue=2.157 e06 . Apabila ditentukan

H0

=0.05 , maka

pvalue<

sehingga

ditolak yang artinya terdapat hubungan antara variabel respon (Net Agricultural Output)

dengan variabel eksplanatori Fertilizer Consumption. Nilai

Multiple RSquared=0.6828

Nama : Adri Arisena ; NPM : 140720160006 ; UTS Analisis


Regresi
menunjukkan bahwa besarnya hasil pertanian selama pada tahun 1950 dapat dijelaskan melalui
konsumsi pupuk sebesar 68.28%, sedangkan sisanya dijelaskan oleh variabel lain di luar model
yang tidak diteliti.
> model7=lm(nao~nta)
> summary(model7)
Call:
lm(formula = nao ~ nta)
Residuals:
Min
1Q Median
3Q
Max
-1238.4 -1081.4 -746.1 71.5 7874.8
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.389e+03 4.504e+02 3.084 0.00586 **
nta
4.460e-03 5.889e-04 7.573 2.69e-07 ***
--Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 2028 on 20 degrees of freedom
Multiple R-squared: 0.7414,
Adjusted R-squared: 0.7285
F-statistic: 57.35 on 1 and 20 DF, p-value: 2.693e-07

Dari hasil output diperoleh nilai

Fstatistic=57.35 dengan derajat bebas 20 dan nilai

pvalue=2.693 e07 . Apabila ditentukan

H0
dengan

=0.05 , maka

pvalue<

sehingga

ditolak yang artinya terdapat hubungan antara variabel respon (Net Agricultural Output)
variabel

eksplanatori

Multiple RSquared=0.7414

Number

of

Tractors

in

Agriculture.

Nilai

menunjukkan bahwa besarnya hasil pertanian selama pada

tahun 1950 dapat dijelaskan melalui jumlah traktor sebesar 74.14%, sedangkan sisanya
dijelaskan oleh variabel lain di luar model yang tidak diteliti.
Uji Asumsi Klasik

Nama : Adri Arisena ; NPM : 140720160006 ; UTS Analisis


Regresi
Setelah didapatkan model dengan menggunakan analisis regresi, perlu dilakukan
pengujian asumsi klasik untuk melihat apakah model yang telah diperoleh telah memenuhi
asumsi-asumsi yang ada.
1. Uji Normalitas
Model regresi linier multiple dikatakan model yang baik apabila residual model tersebut
mengikuti distribusi normal. Dalam analisis ini digunakan pengujian Shapiro-Test untuk melihat
apakah data residual berdistribusi normal atau tidak.
Hipotesis Uji:
H 0 : F ( x ) =F 0 ( x ) {Data residual berdistribusi normal}
H 0 : F ( x ) F 0 ( x ) {Data residual tidak berdistribusi normal}
:0.05
> res.model=as.data.frame(resid(model))
> shapiro.test(resid(model))
Shapiro-Wilk normality test
data: resid(model)
W = 0.87837, p-value = 0.01125

Kriteria Uji:
Tolak

H0

jika nilai

pvalue=0.01125 , maka

pvalue< , berdasarkan hasil analisis diperoleh nilai


pvalue<

sehingga

H0

ditolak yang artinya bahwa data

residual tidak berdistribusi normal yang menyebabkan adanya pelanggaran dalam asumsi klasik.

Nama : Adri Arisena ; NPM : 140720160006 ; UTS Analisis


Regresi

2. Uji Heteroskedastiditas
Model regresi linier multiple dikatakan model yang baik apabila residual dari model
memiliki varians yang konstan atau bersifat homoskedastisitas. Dalam analisis ini digunakan
pengujian Breusch-Pagan/Godfrey untuk melihat apakah data residual memenuhi asumsi
homoskedastisitas.
Hipotesis Uji:
H 0 : 1=0 {Data residual bersifat homoskedastisitas}
H 0 : 1 0

{Terdapat asumsi heteroskedastisitas pada data residual}

:0.05
> library(lmtest)
> bptest(model)
studentized Breusch-Pagan test
data: model
BP = 9.2937, df = 7, p-value = 0.2323

Kriteria Uji:
Tolak

H0

jika nilai

pvalue=0 .2323 , maka

pvalue< , berdasarkan hasil analisis diperoleh nilai


pvalue>

sehingga

terdapat asumsi heteroskedastisitas pada data residual.


3. Uji Multikolinearitas

H0

diterima yang artinya bahwa tidak

Nama : Adri Arisena ; NPM : 140720160006 ; UTS Analisis


Regresi
Model regresi yang baik memiliki variabel-variabel prediktor yang independen atau tidak
berkorelasi. Pada pengujian asumsi ini diharapkan asumsi multikolinearitas tidak terpenuhi.
Penyebab terjadinya kasus multikolinearitas adalah terdapat korelasi atau hubungan linier yang
kuat diantara beberapa variabel prediktor yang dimasukkan kedalam model regresi. Dalam
analisis ini digunakan pemeriksaan nilai Variance Inflation Factor (VIF) dari masing-masing
variabel prediktor. Kasus multikolinearitas terjadi ketika nilai VIF> 10 .

> library(car)
> vif(model)
paa
ale
crp
pl
ws
fc
nta
35.328508 101.142385 1.357983 23.926065 38.121942 14.520766 69.921485

Berdasarkan hasil output diperoleh bahwa hanya ada satu variabel prediktor mempunyai
nilai VIF< 10 sehingga model dapat diasumsikan terdapat multikolinearitas.
4. Uji Autokorelasi
Model regresi linier multiple dikatakan model yang baik apabila residual dari model tidak
memiliki autokorelasi terhadap data itu sendiri. Dalam analisis ini digunakan pengujian DurbinWatson untuk meguji ada tidaknya autokorelasi pada data residual.
Hipotesis Uji:
H 0 : =0

{Data residual tidak mempunyai autokorelasi}

H 0 : 0 {Data residual mempunyai autokorelasi}


:0.05
> dwtest(model)
Durbin-Watson test

Nama : Adri Arisena ; NPM : 140720160006 ; UTS Analisis


Regresi
data: model
DW = 2.7059, p-value = 0.9152
alternative hypothesis: true autocorrelation is greater than 0

Kriteria Uji:
Tolak

H0

pvalue< , berdasarkan hasil analisis

jika nilai

pvalue=0.9152 , maka

pvalue>

sehingga

H0

diperoleh nilai

diterima. Artinya Data residual

tidak mempunyai autokorelasi.

Berdasarkan hasil output tersebut di atas maka dapat disimpulkan bahwa data tersebut
terdapat pelanggaran asumsi yaitu data tidak berdistribusi normal dan terdapat multikoliniearitas.
Pada pengujian selanjutnya akan digunakan metode PCR (Principal Component Regression)
untuk menanggulangi terjadinya multikolinearitas. Adapun jika menggunakan metode PCR
(Principal Component Regression) maka jika data tidak tidak berdistribusi normal maka akan
diabaikan sehingga tidak perlu dilakukan penanggulangan data tidak berdistribusi normal.
Berikut perhitungan dengan menggunakan metode PCR dengan menggunakan R :
local({
.PC <- princomp(~ale+crp+fc+nta+paa+pl+ws, cor=TRUE, data=Dataset)
cat("\nComponent loadings:\n")
print(unclass(loadings(.PC)))
cat("\nComponent variances:\n")
print(.PC$sd^2)
cat("\n")
print(summary(.PC))
Dataset <<- within(Dataset, {
PC2 <- .PC$scores[,2]
PC1 <- .PC$scores[,1]
})
})
Component loadings:
Comp.1
Comp.2

Comp.3

Comp.4

Comp.5

Comp.6

Nama : Adri Arisena ; NPM : 140720160006 ; UTS Analisis


Regresi
ale -0.4932735 -0.140369321 -0.04485291 -0.32429244 0.3058874 -0.18595176
crp -0.1989549 0.363103356 0.90931433 0.03877174 -0.0049671 -0.01141287
fc -0.3059733 -0.495877786 0.09982030 0.69660791 -0.3237326 0.15166118
nta -0.3307085 -0.487383356 0.13665368 -0.12644154 0.5243485 0.08861073
paa -0.3757870 0.406522541 -0.26759890 0.43214148 0.1640027 -0.59697712
pl -0.4960368 -0.004091609 -0.09020899 -0.44091117 -0.6892319 -0.05531683
ws -0.3561489 0.446920323 -0.25050052 0.10455720 0.1572470 0.75828562
Comp.7
ale 0.708276178
crp 0.007885772
fc 0.193532897
nta -0.579339612
paa -0.227792753
pl -0.270721189
ws 0.003714934
Component variances:
Comp.1
Comp.2
Comp.3
Comp.4
Comp.5
Comp.6
3.827985393 2.310681253 0.657477685 0.123884880 0.059392189 0.015374377
Comp.7
0.005204223
Importance of components:
Comp.1 Comp.2
Comp.3
Comp.4
Comp.5
Standard deviation
1.9565238 1.5200925 0.81084998 0.35197284 0.243705126
Proportion of Variance 0.5468551 0.3300973 0.09392538 0.01769784 0.008484598
Cumulative Proportion 0.5468551 0.8769524 0.97087776 0.98857560 0.997060200
Comp.6
Comp.7
Standard deviation
0.12399345 0.0721403023
Proportion of Variance 0.00219634 0.0007434605
Cumulative Proportion 0.99925654 1.0000000000
RcmdrMsg: [23] NOTE: The dataset Dataset has 22 rows and 16 columns.

Variabel prediktor yang dilibatkan ada 7 variabel dimana seluruh variabel terlebih dahulu
di transformasi ke dalam bentuk z score, sehingga akan ada 7 komponen yang diusulkan seperti
pada hasil output yang diperoleh. Kemampuan setiap komponen mewakili variabel-variabel yang
dianalisis ditunjukkan oleh besarnya varians yang dijelaskan, yang disebut dengan eigenvalue.
Eigenvalues menunjukkan kepentingan relatif masing-masing komponen dalam menghitung
varians ketiga variabel yang dianalisis. Dari output diatas, komponen utama yang mempunyai
nilai eigen > 1 dapat dilibatkan dalam analisis regresi komponen utama (Draper & Smith, 1992)
dan dapat menjelaskan keragaman cukup tinggi (80%-90%) (Johnson & Wichern, 1996, hal.
359), maka dalam kasus ini terdapat dua komponen utama. Komponen 1 memiliki eigenvalue
sebesar 3.827985393 dan Komponen 2 yang memiliki eigenvalue sebesar 2.310681253, artinya

Nama : Adri Arisena ; NPM : 140720160006 ; UTS Analisis


Regresi
komponen 1 dapat menjelaskan proporsi cumulative sebesar 54.68% dan Komponen 2 dapat
menjelaskan proporsi cumulative sebesar 87.69%.
Berdasarkan nilai eigenvector dari output diatas, dengan tidak memperdulikan nilai
eigenvector yang lebih kecil dari 0.1 diperoleh model untuk Komponen 1 dan Komponen 2
adalah sebagai berikut:

K 1=0.4932735 Zx 1 0.1989549 Zx 20.3059733 Zx 30.3307085 Zx 40.3757870 Zx 50. 0.4860368 Z x 6

K 2=0.140369321 Zx 1+0 363103356 Zx 20.495877786 Zx 30.487383356 Zx 4+ 0.406522541 Zx 5+0.4469

Komponen 1 terdiri dari variabel-variabel yang telah distandarkan X1, X2,,X7 dan
Komponen 2 terdiri dari X1, X2, X3, X4, X5, X7. Dengan nilai-nilai komponen utama nya untuk
masing-masing komponen yang terbentuk adalah sebagai berikut.
comp
1
5.848
19
0.302
071
0.419
635
1.083
6
0.224
52
0.211
195
0.038
148
0.980

comp
2
5.027
87
0.343
37
0.589
49
0.001
7
0.378
26
0.672
13
0.023
52
-

Nama : Adri Arisena ; NPM : 140720160006 ; UTS Analisis


Regresi
289
0.952
717
0.110
546
1.026
475
0.582
532
1.006
461
0.591
428
0.431
634
0.434
108
0.508
94
1.038
725
0.697
953
0.983
887
0.974
863
6.302
5

0.057
64
0.158
69
0.986
733
0.030
69
0.121
09
0.039
848
1.002
854
0.123
807
0.017
929
0.254
999
0.070
755
0.095
87
0.113
5
0.085
257
4.728
074

Setelah diperoleh nilai-nilai komponen utama untuk masing-masing faktor, maka


selanjutnya dapat dilakukan analisis regresi komponen utama dengan menstubtitusikan variabel
prediktor yang terindikasi adanya multikolinearitas dengan variabel faktor yang telah terbentuk.
Regresi Komponen Utama
Hubungan antara variabel-variabel prediktor dan variabel respon dapat diketahui dengan
melakukan analisis Principal Component Regression (PCR). Dalam hal ini, variabel respon yang
telah distandarisasikan diregresikan dengan komponen utama yang terbentuk.

Nama : Adri Arisena ; NPM : 140720160006 ; UTS Analisis


Regresi

> RegModel=lm(nao~comp1+comp2, data=pca)


> summary(RegModel)
Call:
lm(formula = nao ~ comp1 + comp2, data = pca)
Residuals:
Min
1Q Median
3Q
Max
-922.12 -235.89 -67.79 40.88 1795.15
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 2341.50
149.30 15.683 2.51e-12 ***
comp1
-1779.00
76.31 -23.312 1.93e-15 ***
comp2
-913.25
98.22 -9.298 1.68e-08 ***
--Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 700.3 on 19 degrees of freedom
Multiple R-squared: 0.9707,
Adjusted R-squared: 0.9676
F-statistic: 315 on 2 and 19 DF, p-value: 2.706e-15

Dengan demikian, model regresi komponen utama yang dibangun untuk kasus ini adalah:
Z^ y =0. 1779 K 1
dimana,

K 1=0.4932735 Zx 1 0.1989549 Zx 20.3059733 Zx 30.3307085 Zx 40.3757870 Zx 50.0 .4860368 Zx 6


Setelah mendapatkan hasil regresi komponen utama dugaan, maka langkah selanjutnya
adalah pengujian kelayakan dan uji parameter model regresi. Kelayakan model regresi dapat
dilihat dari nilai koefisien determinasi (R2), sedangkan pengujian parameter dilakukan secara
bersama melalui uji signifikansi F dan pengujian parameter secara parsial melalui uji signifikansi
t. Uji parameter bertujuan untuk mengetahui ada atau tidaknya pengaruh variabel prediktor
terhadap variabel respon, baik secara bersama maupun secara parsial/individu.

Nama : Adri Arisena ; NPM : 140720160006 ; UTS Analisis


Regresi

Koefisien Determinasi (R2)


Koefisien determinasi digunakan untuk mengukur kemampuan model dalam menjelaskan
variasi variabel respon. Koefisien determinasi bukanlah satu-satunya kriteria pemilihan model
yang baik. Alasannya, bila suatu estimasi regresi linear menghasilkan koefisien determinasi yang
tinggi, tetapi tidak lolos uji asumsi klasik, maka model tersebut bukanlah model penaksir yang
baik. Berdasarkan output sebelum nya, diperoleh nilai R2 adalah sebagai berikut.
R2
0.9707

Adjusted R2
0.9676

Standard Error
700.3

Dari tabel tersebut dapat dilihat nilai Adjusted R2 sebesar 0.9676 yang artinya sebesar
^
96.76% variasi Z y

dapat dijelaskan oleh Komponen Utama

K1

Uji Parameter Bersama (Uji Signifikansi F)


Residual standard error: 700.3 on 19 degrees of freedom
Multiple R-squared: 0.9707,
Adjusted R-squared: 0.9676
F-statistic: 315 on 2 and 19 DF, p-value: 2.706e-15

Dari hasil output diperoleh nilai

Fstatistic=315

pvalue=2.706 e1 5 . Apabila ditentukan

H0

ditolak. Nilai

pvalue

regresi awal yang mempunyai nilai

dengan derajat bebas 19 dan nilai

=0.05 , maka

ini jauh lebih kecil daripada nilai


pvalue=6.356 e12

pvalue<

pvalue

sehingga
pada model

Artinya bahwa terdapat hubungan

secara serentak atau simultan antara variabel respon dengan dua komponen utama yang
terbentuk.
Uji Parameter Parsial (Uji Signifikansi t)
Coefficients:
Estimate Std. Error t value Pr(>|t|)

Nama : Adri Arisena ; NPM : 140720160006 ; UTS Analisis


Regresi
(Intercept) 2341.50
comp1
-1779.00
comp2
-913.25

149.30 15.683 2.51e-12 ***


76.31 -23.312 1.93e-15 ***
98.22 -9.298 1.68e-08 ***

Dari hasil output diperoleh nilai t-value semua komponen signifikan sehingga model
regresi komponen utama yang terbentuk melibatkan seluruh komponen.

Uji Asumsi Untuk Regresi Komponen Utama


Uji asumsi yang digunakan untuk regresi komponen utama sama hal nya dengan uji
asumsi klasik pada regresi linear dengan menggunakan metode Ordinary Least Square (OLS),
yaitu residual non autokorelasi, varians residual yang konstan (homoskedastisitas), dan antar
komponen utama tidak terjadi kolinearitas. Asumsi residual berdistribusi normal tidak perlu
untuk dipenuhi.

Uji Residual Berdistribusi Normal


Hipotesis Uji:
H 0 : F ( x ) =F 0 ( x ) {Data residual berdistribusi normal}
H 0 : F ( x ) F 0 ( x ) {Data residual tidak berdistribusi normal}
:0.05
> shapiro.test(resid(RegModel))
Shapiro-Wilk normality test
data: resid(RegModel)
W = 0.82238, p-value = 0.001145

Kriteria Uji:

Nama : Adri Arisena ; NPM : 140720160006 ; UTS Analisis


Regresi
H0

Tolak

jika nilai

pvalue=0.001145

maka

pvalue< , berdasarkan hasil analisis diperoleh nilai

pvalue<

sehingga

H0

ditolak yang artinya bahwa data

residual tidak berdistribusi normal yang menyebabkan adanya pelanggaran dalam asumsi klasik.
Hal ini dapat diabaikan dikarenakan model regresi komponen utama tidak mengutamakan
adanya asumsi residual berdistribusi normal.

Uji Heteroskedastisitas
Hipotesis Uji:
H 0 : 1=0 {Data residual bersifat homoskedastisitas}
H 0 : 1 0

{Terdapat asumsi heteroskedastisitas pada data residual}

:0.05

Dari hasil analisis, diperoleh output sebagai berikut:


> bptest(RegModel)
studentized Breusch-Pagan test
data: RegModel
BP = 0.28223, df = 2, p-value = 0.8684

Kriteria Uji:

Nama : Adri Arisena ; NPM : 140720160006 ; UTS Analisis


Regresi
H0

Tolak

jika nilai

pvalue=0. 8684 , maka

pvalue< , berdasarkan hasil analisis diperoleh nilai

pvalue>

H0

sehingga

diterima. Artinya data residual

bersifat homoskedastisitas.
Uji Autokorelasi
Hipotesis Uji:
H 0 : =0

{Data residual tidak mempunyai autokorelasi}

H 0 : 0 {Data residual mempunyai autokorelasi}


:0.05
> dwtest(RegModel)
Durbin-Watson test
data: RegModel
DW = 1.8649, p-value = 0.288
alternative hypothesis: true autocorrelation is greater than 0

Kriteria Uji:
Tolak

H0

jika nilai

pvalue=0.2 88 , maka
tidak mempunyai autokorelasi.
Uji Multikolinearitas
> vif(RegModel)
Comp1 Comp2
1
1

pvalue< , berdasarkan hasil analisis diperoleh nilai

pvalue>

sehingga

H0

diterima. Artinya Data residual

Nama : Adri Arisena ; NPM : 140720160006 ; UTS Analisis


Regresi
Berdasarkan hasil output diperoleh bahwa untuk masing-masing komponen utama
mempunyai nilai

VIF< 10

sehingga model regresi komponen utama dapat menanggulangi

permasalahn multikolinearitas pada model regresi linear.

Kesimpulan

Model regresi linier yang terbentuk untuk kasus ini yaitu:


^y =4135+0.01154 x 1+0.001799 x 21115 x 30.00000585 x 40.009421 x 5+ 0.09762 x 6+0.0001109 x 7

Dimana model ini signifikan secara overall namun secara partial, parameter untuk tiap
variabel tidak signifikan terhadap model kecuali variable x3, hal ini mengindikasikan
terjadinya multikolinearitas pada variabel prediktor yang dibuktikan dengan nilai Variance
Inflation Factor (VIF) yang lebih dari sepuluh. Penanggulan model yang terindikasi terdapat
multikolinearitas dapat menggunakan Principal Component Regression.

Model

regresi

komponen

utama

yang

terbentuk

untuk

menanggulangi

masalah

multikolinearitas yaitu:
Z^ y =0.1779 K 1
dimana,
K 1=0.4932735 Zx 1 0.1989549 Zx 20.3059733 Zx 30.3307085 Zx 40.3757870 Zx 50.0 .4860368
Model ini masih dalam bentuk taksiran yang distandarkan, sehingga untuk mendapatkan
model taksiran yang sesungguhnya diperlukan transformasi kembali dari bentuk data yang
distandarkan menjadi data awal.

Nama : Adri Arisena ; NPM : 140720160006 ; UTS Analisis


Regresi

Z^ y =0.1779 (0.4932735 Zx 1 0.1989549 Zx 20.3059733 Zx 30.3307085 Zx 40.3757870 Zx 50.4


Z^ y =0.0877 Zx 1+ 0.0353 Zx 2+0.0544 Zx 3+ 0.0588 Zx 4+0.0668 Zx 5+0.08646 x 6+0.0633 Zx 7
^
Kemudian Z y

^
di kembalikan ke dalam bentuk Y

X 1 X 1
X 2 X 2
X 7 X 7
Y^ =0.087
+ 0.4841
+ +0.0633

Y^ =41350.0371 X 10.01815 X 21.07024 X 30.03835 X 40.0206 X 50.04316 X 60.01799 X 7


Model

regresi

komponen

utama

yang

dihasilkan

adalah

Y^ =41350.0371 X 10.01815 X 21.07024 X 30.03835 X 40.0206 X 50.04316 X 60.01799 X 7


dimana

metode

ini

merupakan

model

useful

untuk

menanggulangi

permasalahan

multikolinearitas tanpa perlu membuang variabel bebas yang berkolinear tinggi. Hal ini
dibuktikan dengan hasil pengujian multikolinearitas dimana nilai VIF menjadi kurang dari
sepuluh. Dengan metode Principal Component Analysis sebagai metode untuk mereduksi
variabel prediktor, dapat diperoleh variabel prediktor baru yang tidak berkorelasi, bebas satu
sama lainnya, lebih sedikit jumlahnya daripada variabel asli, akan tetapi dapat menyerap
sebagian besar informasi yang terkandung dalam variabel asli atau yang bias memberikan
kontribusi tergadap varian seluruh variabel. Variabel prediktor baru inilah yang digunakan untuk
menentukan model pengaruh dari variabel respon dan variabel prediktor dengan menggunakan
analisis regresi linear.

Anda mungkin juga menyukai