Anda di halaman 1dari 11

Mata kuliah : Biometrika Hutan Senin, 16 Oktober 2017

ANALISIS LINEAR BERGANDA

Nama :
Mufri Wandira P (E14150021)

Asisten :
1. Siti Mutmaina (E14130008)
2. Maria Ulfah (E14130020)
3. Widya Pradana (E14130034)
4. Gilang Raihan E (E14130037)
5. Windy Swinary Sinaga S.Hut

Dosen :
Dr Ir Teddy Rusolono, MS
Ir Budi Prihanto, MS

DEPARTEMEN MANAJEMEN HUTAN


FAKULTAS KEHUTANAN
INSTITUT PERTANIAN BOGOR
BOGOR
2017
BAB I
PENDAHULUAN

Latar Belakang
Analisis regresi merupakan salah satu teknik analisis data dalam statistika yang seringkali
digunakan untuk mengkaji hubungan antara beberapa variabel dan meramal suatu variabel.
Analisis regresi linier digunakan untuk menjelaskan pengaruh variabel bebas terhadap variabel
tak bebas (Lesnusssa et al 2010). Dengan memperluas model regresi linear dua atau tiga
variabel, maka model regresi dengan variabel terikat Y dan k variabel bebas (Ruminta 2009).
Dalam mengkaji hubungan antara beberapa variabel menggunakan analisis regresi,
terlebih dahulu peneliti menentukan satu variabel yang disebut dengan variabel tidak bebas dan
satu atau lebih variabel bebas. Jika ingin dikaji hubungan atau pengaruh satu variabel bebas
terhadap variabel tidak bebas, maka model regresi yang digunakan adalah model regresi linier
sederhana. Kemudian Jika ingin dikaji hubungan atau pengaruh dua atau lebih variabel bebas
terhadap variabel tidak bebas, maka model regresi yang digunakan adalah model regresi linier
berganda (multiple linear regression model). Kemudian untuk mendapatkan model regresi
linier sederhana maupun model regresi linier berganda dapat diperoleh dengan melakukan
estimasi terhadap parameter-parameternya menggunakan metode tertentu.

Tujuan
Untuk menguji keberartian model, mengidentifikasi amatan pencilan dan berpengaruh,
mengidentifikasi multikolinearitas, penggunaan analisis BREGG dan melakukan identifikasi
dengan diagnostik sisaan.
BAB II
METODOLOGI

Waktu dan Tempat


Tugas ini diberikan pada Senin, 16 Oktober 2017 di Teaching Lab IPB 1.01 pukul 13.00

Alat dan Bahan


Alat yang digunakan yaitu aplikasi Minitab16, MS Word 13, dan Microsoft Excell 13 dengan
bahan berupa data yang telah ditentukan.

Prosedur Kerja
1. Memilih 20 dari 23 amatan secara acak yang diberikan disertakan data amatan yang
dibuang.
2. Membuat penyusunan model regresi linier berganda dengan full model Y=
f(𝑥1, 𝑥2, 𝑥3, 𝑥4)
3. Melakukan uji keberartian kualitas model regresi Y= f(𝑥1, 𝑥2, 𝑥3, 𝑥4) dengan
menginterpretasikan nilai R-Sq, SA, SR, RMSE dan S2
4. Lakukan uji keberartian model regresi Y = f(Xa, X2, X3, X4), dan bagaimana
kesimpulannya.
5. Lakukan identifikasi adanya amatan yang tidak wajar/pencilan (outlier).
6. Lakukan identifikasi adanya amatan berpengaruh (influential observation).
7. Periksa apakah ada fenomena multikolinearitas.
8. Bagaimana hasil uji pengaruh penambahan peubah, mengapa demikian.
9. Lakukan analisis BREG dan bagaimana kesimpulannya.
10. Lakukan pemeriksaan pemenuhan asumsi tentang sisaan : kenormalan sisaan,
kehomogenan ragam, dan kebebasan antar sisaan.
BAB III
HASIL DAN PEMBAHASAN

Hasil

No. X1 X2 X3 X4 Y
1 27 18 55 20 23
2 22 13 62 16 18
3 27 21 55 20 26
4 24 18 75 8 23
5 30 23 62 18 27
6 32 26 79 11 30
7 24 19 75 8 23
8 22 18 62 16 22
9 27 20 55 20 24
10 40 12 90 32 16
11 32 25 79 11 28
12 50 28 84 12 31
13 40 19 90 32 22
14 20 21 50 15 24
15 50 28 84 12 31
16 30 26 62 18 29
17 27 19 55 20 22
18 46 24 80 8 27
19 29 24 76 8 27
20 22 17 50 15 21

Y = 7,18 - 0,0046 X1 + 0,890 X2 - 0,0083


X3 - 0,0255 X4

y (yt- (abs(yt-
taksir S^2 = (yt- abs (yt- ya)/y ya)/ya)^
an yt-ya e^2 KTS SA ya)/yt ya)/yt SR a 2 RMSE
- - -
22,10 0,7933 0,450 7,9751 0,04028 1,952 0,001499 2,389
0,89 0,0402 0,038
93 465 7716 E-05 6214 8125 71 7012
07 86 726
- - -
17,72 0,0749 0,01544 0,000231
0,27 0,0154 0,015
62 664 6063 378
38 46 211
- - -
24,77 1,4901 0,04926 0,002204
1,22 0,0492 0,046
93 085 2893 302
07 63 95
- -
22,26 0,5430 - 0,03309 0,001026
0,73 0,032
31 216 0,0331 9613 506
69 039
- - -
26,53 0,2130 0,01739 0,000292
0,46 0,0173 0,017
84 746 3664 283
16 94 096
- - -
29,23 0,5827 0,02611 0,000647
0,76 0,0261 0,025
66 796 1107 533
34 11 447
23,15 0,15 0,0234 0,0066 0,00661 0,006 4,43093E
31 31 396 125 2505 6565 -05
22,17 0,17 0,0310 0,0079 0,00794 0,008 6,41455E
62 62 464 455 5455 0091 -05
- - -
23,88 0,0122 0,00463 2,12752E
0,11 0,0046 0,004
93 545 3874 -05
07 34 612
16,11 0,11 0,0127 0,0070 0,00701 0,007 4,98789E
3 3 69 13 2971 0625 -05
28,34 0,34 0,1201 0,0122 0,01222 0,012 0,000153
66 66 316 272 7216 3786 229
- - -
30,86 0,0177 0,00431 1,84623E
0,13 0,0043 0,004
68 422 5316 -05
32 15 297
22,34 0,34 0,1176 0,0153 0,01535 0,015 0,000243
3 3 49 516 1564 5909 076
24,98 0,98 0,9613 0,0392 0,03925 0,040 0,001669
05 05 803 506 0615 8542 063
- - -
30,86 0,0177 0,00431 1,84623E
0,13 0,0043 0,004
68 422 5316 -05
32 15 297
29,20 0,20 0,0434 0,0071 0,00713 0,007 5,16416E
84 84 306 349 4934 1862 -05
22,99 0,99 0,9986 0,0434 0,04344 0,045 0,002063
93 93 005 491 9148 4227 224
27,46 0,46 0,2119 0,0167 0,01676 0,017 0,000290
04 04 682 66 5961 0519 766
27,57 0,57 0,3269 0,0207 0,02073 0,021 0,000448
18 18 552 386 8581 1778 498
21,41 0,41 0,1691 0,0192 0,01920 0,019 0,000383
13 13 677 095 9483 5857 6
494,0 0,03 6,7615 0,39056 0,011421
394 94 741 2494 344

Amatan terdiri dari lima peubah bebas dengan jumlah 20 dari 23 amatan dengan amatan
ke-2, 20 dan 22 yang dibuang dan diperoleh full model Y = 6,86 - 0,0083 X1 + 0,916 X2 -
0,0219 X4 - 0,0111 X3. Nilai R-Sq pada model ini yaitu sebesar 98,50% yang rtinya, sebesar
1,5% kesalahan dijelaskan oleh variabel lain yang tidak terdapat pada model. Diperoleh nilai
SA sebesar 3,954 x 10-5 . pada nilai tersebut SA ditoleransi karena terdapat pada rentang -
1<SA<1. Nilai SR diperoleh sebesar 1,918% dan ditoleransi karena masih kurang dari 10%.
Nilai RMSE sebesar 57,989 merupakan nilai yang kecil. RMSE merupakan nilai rata-rata dari
jumlah kuadrat kesalahan, juga dapat menyatakan ukuran besarnya kessalahan yang dihasilkan
oleh suatu model perkiraan mendekati variasi observasinya(Makridakis 1982). RMSE
digunakan untuk memilih model terbaik dengan meregresikan seluruh variabel bebas terhadap
variabel tak bebas. Sebaran pada full model Y tersebut menyebar mendekati garis normal yang
ditunjukan oleh nilai S2 mendekati nilai nol.
Amatan yang diolah tidak menunjukan adanya pencilan namun ada amatan yang berpengaruh.
Amatan tersebut adalah amatan ke-3 yang ditunjukan dengan nilai mutlak tresidual sebesar
2,125. Nilai tresidual yang melebihi mutlak 2 akan merupakan ciri amatan yang berpengaruh
terhadap nilai model, pun nilai sresidual yang melebihi mutlak 2 akan membuat nilai model
tidak stabil karena merupakan pencilan dalam seluruh amatan yang diamati. Amatan yang
merupakan pencilan tidak akan memengaruhi nilai R-Sq namun amatan yang berpengaruh akan
memengaruhi nilai R-Sq.

Tabel 1 Nilai variance inflation factors (VIF) setiap peubah bebas


Variance Inflation Factors
Peubah Bebas Keterangan
(VIF)
X1 3,546099 Moderatelly Correlated
X2 2,840909 Moderatelly Correlated
X3 2,808989 Moderatelly Correlated
X4 2,227171 Moderatelly Correlated

Pengolahan data pada tabel 1 menujukan fenomena korelasi sedang dengan nilai VIF masing-
masing berada pada rentang 1<VIF<5 yang merupakan daerah korelasi sedang. Lesnussa
(2012) menyatakan bahwa multikolinearitas adalah adanya hubungan positif antara dua peubah
misalkan X1 dengan X2. Dengan adanya hubungan positif tersebut maka penambahan salah
satu peubah tidak memberikan dampak yang signifikan malah cendurung merupakan
pemborosan. Lesnussa (2012) pun menyatakan jika nilai VIF kecil maka multikolinearitas
dikatakan sederhana namun jika melebih 10 maka multikolinearitas dikatakan tinggi. Di bidang
kehutanan, fenomena ini penting mengingat survei di lapangan dengan medan ekstrim yang
memiliki risiko tinggi bisa diminimalisir jika salah satu peubah dihilangkan.

Tabel 2 Parameter kriteria kualitas model analisis BREGG


Banyak Peubah Peubah R-Sq R-Sq adj Cp Mallows S
1 X2 98,2 98,1 1,9 0,66689
2 X1,X2 98,4 98,2 1,6 0,64185
3 X2,X3,X4 98,4 98,2 3,1 0,64976
4 X1,X2,X3,X4 98,5 98 5 0,6696

Tabel 2 menunjukan pengolahan data best subsets regression yang digunakan untuk memilih
model dugaan terbaik berdasarkan parameter yang digunakan. Diketahui bahwa full model Y=
f(X1,X2,X3,X4) memiliki nilai R-Sq tertinggi. Penambaha perubah baru setelah dua peubah
tidak signifikan karena nilai R-Sq adj konstan sehingga jika peubah baru ditambahkan
merupakan pemborosan. Nilai S menggambarkan sisaan nilai Ytaksiran terhadap Yaktual.
Semakin kecil nilai S maka model semakin baik. Model dengan nilai S terkecil merupakan
model Y= f(X1,X2). Nilai CpMallows yang mendekati parameter merupakan model yang baik.
Diketahui pada tabel 2 bahwa model yang baik adalah model Y= f(X1). Namun dari
keseluruhan model, model terbaik adalah model dengan dua peubah bebas Y=f(X1,X2) karena
nilai R-Sq adj meningkat dengan nilai S yang paling kecil.

Gambar 1 grafik analisis diagnostik sisaan

Diagnostik sisaan digunakan untuk mengamati amatan pencilan atau amatan tak wajar serta
melakukan verifikasi pemenuhan asumsi tentang sisaan dalam analisis regresi. Untuk
melakukan verifikasi digunakan tiga tahap pemenuhan asumsi yaitu uji normalitas,
homogenitas sisaan dan sisaan saling bebas. Menurut Karsanti (2014) Uji normalitas digunakan
untuk mengetahui apakah data yang diperolah berasal dari populasi yang berdistribusi normal
atau tidak.
Gambar 2 grafik uji normalitas dengan Anderson-Darling

Gambar 3 grafik uji normalitas dengan Kolmogorov-Smirnov


Gambar 4 uji normalitas dengan Ryan Joiner

Nilai p-Value untuk setiap uji diperoleh alfa>0,05 sehingga Ho diterima yang artinya sisaan
menyebar normal. Karsanti (2014) menyatakan bahwa Ho diterima jika nilai sisaan mengikuti
arah garis diagonal pada setiap uji kenormalan. Uji homogenitas dilihat dari sisaan pada grafik
versus fits yang menyebar secara acak di titik nol. Kenormalan homogenitas tersebut dilihat
apabila menyebar menigkuti pola horizontal. Uji sisaan saling bebas menurut Karsanti (2014)
apabila grafik yang terbentuk berfluktuasi secara acak di sekitar nol maka dapat dikatakan
bahwa suku-suku galat percobaan saling bebas. Grafik versus order memiliki korelasi positif
dan negatif. Sisaan pun terfluktuasi secara acak di sekitar nol pada grafik tersebut.
BAB IV
PENUTUP

Simpulan
` Full model yang didapatkan yaitu Y = 6,86 - 0,0083 X1 + 0,916 X2 - 0,0219 X4 - 0,0111
X3 dengan SA sebesar 3,954 x 10-5, SR sebesar 1,918%, RMSE sebesar 57,989 dan S2
mendekati nol yang menyebar normal.
Amatan berpengaruhi dalam data menyebabkan nilai R-Sq tidak stabil. Setiap peubah
berkorelasi sedang dilihat dari nilai VIF kurang dari 5 dan lebih dari 1. Model Y=(X1,X2)
merupakan model terbaik karena memiliki nilai S terkecil dan R-Sq adj terbesar. Penambahan
peubah setelah X1 dan X2 tidak berdampak signifikan.
Untuk mengamati amatan pencilan dan berpengaruh serta melakukan verifikasi pemenuhan
asumsi sisaan digunakan diagnostik sisaan. Sisaan menyebar normal karena nilai p-Value >
alfa untuk setiap uji KS, AD dan RJ. Sisaan pun homogen karena menyebar acak di titik nol
pada grafik versus fits dan membentuk pola horizontal. Sisaan saling bebas karena terdapat
korelasi positif dan negatif dan terfluktuasi secara acak di titik nol pada grafik versus order.

Saran
Dalam praktikum sebaiknya lebih desidiakan terminal/colokan, dan diharapkan lebih
kondusif lagi.
DAFTAR PUSTAKA

Karsanti P. 2014. Diagnostik Sisaan Pada Model Linier Rancangan Acak Kelompok Lengkap
(RAKL) Dua Faktor. [skripsi].Yogyakarta (ID): Fakultas Matematika Dan Ilmu
Pengetahuan Alam.
Lesnussa YA, Marcus GL dan Wattimanela HJ. 2012. analisis komponen utama untuk
mengatasi masalah multikolinearitas dalam analisis linier berganda. [jurnal barekeng].
6(1): 31-40.
Makridakis. 1982. The Accuracy of Exptrapolative:Result of a Forecasting Competition,
Journal of Forecasting, vol. 1, No.2, pp 111-153 (lead article)

Anda mungkin juga menyukai