Anda di halaman 1dari 16

REGRESI BEDA DAN REGRESI RIDGE

Ria Dhea Layla N.K 1 , Febti Eka P. 2 1) 1311105003 2)1311106009 1) email: riadhea0863@yahoo.co.id 2) febti08.10@gmail.com

ABSTRAK
Analisis regresi dalam statistika adalah salah satu metode untuk menentukan hubungan sebabakibat antara satu variabel dengan variabel-variabel yang lain. Pengujian asumsi klasik diperlukan untuk mengetahui apakah hasil estimasi regresi yang dilakukan benar-benar bebas dari adanya heteroskedastisitas, multikolinearitas, dan autokorelasi. Regresi beda merupakan salah satu metode yang digunakan untuk mengatasi autokorelasi. Beberapa cara yang bisa digunakan dalam mengatasi masalah multikolinearitas dalam model regresi ganda salah satunya adalah regresi ridge. Data yang digunakan untuk analisis regresi Ridge adalah data dari pendapatan perkapita Indonesia (dalam Triliun) (Y) dengan harga premium (X1), harga solar (X2), harga minyak bakar (X3) dan harga minyak tanah (X4). Sedangkan data yang digunakan untuk analisis regresi Beda adalah Oksidasi Tanaman dari Ammonia sampai Asam Nitrat. Variabel Respon (Y) adalah stack yang hilang oksidasi tanaman dari ammonia sampai asam sulfat sedangkan variabel prediktornya adalah temperatur pendingin air (X 1) dan konsentrasi asam (X2). Hasil persamaan Regresi Ridge dengan nili , maka modelnya adalah . Sedangkan persamaan hasil dari regresi beda stack yang hilang = -1,09 + 0,775 temperatur pendingin air + 0,118 konsentrasi asam

PENDAHULUAN Analisis regresi dalam statistika adalah salah satu metode untuk menentukan hubungan sebab-akibat antara satu variabel dengan satu dengan variabel-variabel yang lain. Variabel "penyebab" disebut dengan bermacam-macam istilah: variabel penjelas, variabel eksplanatorik, variabel independen, atau secara bebas, variabel X (karena seringkali digambarkan dalam grafik sebagai absis, atau sumbu X). Variabel terkena akibat dikenal sebagai variabel yang dipengaruhi, variabel dependen, variabel terikat, atau variabel Y. Kedua variabel ini dapat merupakan variabel acak (random), namun variabel yang dipengaruhi harus selalu variabel acak (Wikipedia, 2012). Permasalahan yang dibahas pada makalah ini adalah bagaimana cara mengatasi kasus multikolinieritas antara variabel bebas pada studi kasus pendapatan perkapita Indonesia (dalam Triliun) dan bagaimana cara mengatasi autokorelasi pada studi kasus antara stack yang hilang oksidasi tanaman dari ammonia sampai asam sulfat. Tujuan yang ingin dicapai adalah untuk mengetahui penggunaan penerapan regresi ridge pada sebuah studi kasus yang mengalami kasus multikolinieritas dan untuk mengetahui penerapan penggunaan regresi beda pada sebuah studi kasus yang mengalamu autokorelasi. LANDASAN TEORI Pengujian asumsi klasik diperlukan untuk mengetahui apakah hasil estimasi regresi yang dilakukan benar-benar bebas dari adanya heteroskedastisitas, multikolinearitas, dan autokorelasi. Model regresi akan dapat dijadikan alat estimasi yang tidak bias jika telah memenuhi persyaratan BLUE (best linear unbiased estimator) yakni tidak terdapat heteroskedastistas, tidak terdapat multikolinearitas, dan tidak terdapat autokorelasi ( Sudrajat 1988 : 164). Jika terdapat heteroskedastisitas, maka varian tidak konstan sehingga dapat menyebabkan biasnya standar error. Jika terdapat multikolinearitas, maka akan sulit untuk mengisolasi pengaruh-pengaruh individual dari variabel, sehingga tingkat signifikansi koefisien regresi menjadi rendah. Dengan adanya autokorelasi mengakibatkan penaksir masih tetap bias dan masih tetap konsisten hanya saja menjadi tidak efisien. Oleh karena itu, uji asumsi klasik perlu dilakukan. Pengujian-pengujian yang dilakukan adalah sebagai berikut: JURUSAN STATISTIKA FMIPA | INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA 1 II.

I.

1.

Uji Asumsi Multikolinieritas Uji multikolinearitas bertujuan untuk menguji apakah dalam model regresi ditemukan adanya korelasi antar variabel bebas (independen). Dalam model regresi yang baik seharusnya tidak terjadi korelasi di antara variabel bebas. Uji Multikolinearitas dilakukan dengan melihat nilai tolerance dan variance inflation factor (VIF) dari hasil analisis dengan menggunakan SPSS. Apabila nilai tolerance value lebih tinggi daripada 0,10 atau VIF lebih kecil daripada 10 maka dapat disimpulkan tidak terjadi multikolinearitas. 2. Uji Asumsi Klasik Heteroskedasitisitas Uji heteroskedastisitas bertujuan untuk menguji apakah dalam model regresi terjadi ketidaksamaan varians dan residual satu pengamatan ke pengamatan yang lain. jika varians dari residual satu pengamatan ke pengamatan yang lain tetap, maka disebut homoskedastisitas dan jika berbeda disebut heteroskedastisitas. Model regresi yang baik adalah yang homoskedastisitas atau tidak terjadi heteroskedastisitas. Uji heteroskedastisitas dilakukan dengan menggunakan uji Glejser, yang dilakukan dengan meregresikan nilai absolut residual yang diperoleh dari model regresi sebagai variabel dependen terhadap semua variabel independen dalam model regresi. Apabila nilai koefisien regresi dari masing-masing variabel bebas dalam model regresi ini tidak signifikan secara statistik, maka dapat disimpulkan tidak terjadi heteroskedastisitas (Sumodiningrat. 2001 : 271). 3. Uji Asumsi Klasik Autokorelasi Salah satu asumsi pada model regresi linier klasik adalah tidak adanya autokorelasi. Autokorelasi merupakan kondisi dimana terdapat korelasi atau hubungan antar pengamatan (observasi). Uji Autokorelasi bertujuan menguji apakah dalam suatu model regresi linear ada korelasi antara kesalahan pengganggu pada periode t dengan kesalahan pada periode t-1 (sebelumnya). Jika terjadi korelasi maka dinamakan ada problem autokorelasi. Model regresi yang baik adalah regresi yang bebas dari autokorelasi Uji autokorelasi dilakukan dengan menggunakan uji 5%. Apabila D-WDurbin-Watson (D-W), dengan tingkat kepercayaan terletak antara -2 sampai +2 maka tidak ada autokorelasi (Santoso. 2002 : 219). Analisis yang digunakan dalam makalah ini untuk mengatasi autokorelasi dan multikolinieritas adalah dengan menggunakan Regresi Beda dan Regresi Ridge. Berikut penjelasan tentang Regresi Beda dan Regresi Ridge. 4. Ridge Regression Beberapa cara yang bisa digunakan dalam mengatasi masalah multikolinearitas dalam Model Regresi Ganda antara lain Analisis komponen utama yaitu analisis dengan mereduksi peubah bebas (X) tanpa mengubah karakteristik peubah-peubah bebasnya, pemilihan model terbaik, regresi ridge dan lain lain. Pada dasarnya metode Ridge juga merupakan metode kuadrat terkecil. Perbedaannya adalah bahwa pada metode ridge regression, nilai variabel bebasnya ditransformasikan dahulu melalui prosedur centering and rescaling. Prosedur ridge pertama kali dikemukakan oleh A.E. Hoerl pada 1962 Prosedur ini ditunjukan untuk mengatasi kondisi buruk (ill-conditioned). Kondisi ini terjadi apabila terdapat korelasi antar variabel bebas yang cukup tinggi sehingga menyebabkan determinan mendekati nol. Metode Centering and Rescaling Persamaaan regresi yang memiliki model: Persamaan tersebut dapat dibentuk menjadi ) ) ( ( ) ( ( Menurut rumus untuk mendapatkan , yaitu: Maka berlaku, )

JURUSAN STATISTIKA FMIPA | INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA

Sehingga ( Jika ) ( ( )

) ( ( ) )

Maka didapatkan persamaan baru, yaitu: Prosedur untuk membentuk persamaan pertama menjadi persamaan terakhir disebut dengan prosedur centering. Prosedur ini mengakibatkan hilangnya (intercept) yang membuat perhitungan untuk mencari model regresi menjadi lebih sederhana. Bila dari persamaan di atas kita bentuk persamaan: dengan

maka prosedur ini disebut dengan prosedur Rescaling. Keseluruhan dari prosedur di atas disebut prosedur centering and rescaling. Salah satu metode yang dapat digunakan untuk menaksir parameter regresi dari model regresi liner berganda adalah menggunakan metode kuadrat terkecil. Dugaan metode kuadrat ( ) terkecil adalha . Dengan mebentuk maka kesalahan yang disebabkan pengaruh pembulatan menjadi lebih kecil. Terutama jika variabel bebas-nya lebih dari dua dan data yang ada besar. Jika yang merupakan matriks korelasi adalah matriks identitas maka nilai dugaan variabel regressand akan sama dengan nilai sebenarnya. Apabila tidak mendekati matriks identitas melainkan menjauhinya, maka dapat dikatakan hampir singular (buruk). Kondisi ini disebut sebagai ill conditioned (Draper & Smith ,1981). Kondisi ini terjadi apabila terdapat korelasi antar variabel bebas yang cukup tinggi sehingga menyebabkan determinan mendekati nol. Maka antara variabel bebas terjadi multikolinieritas ganda tidak sempurna. Apabila terjadi situasi tersebut, penaksiran parameter koefisien regresi masih mungkin dilakukan dengan metode kuadrat terkecil, tetapi dengan konsekuensi simpangan bakunya menjadi sangat sensitif sekalipun terjadi perubahan yang sangat kecil dalam datanya. Simpangan baku ini cenderung membesar sejalan dengan meningkatnya multikolinieritas. Apabila terjadi multikolinieritas tidak sempurna pada variabel regresso pada diagonal utama ditambah bilangan kecil positif yang bernilai antara 0 dan 1 (Hoerl A.E, 1962). Prosedur ini disebut Ridge Trace. Kemudian prosedur tersebut dikembangkan oleh A.E Hoerl dan Robert W Kennard (1970) dan Normon R. Draper dan Harry Smith (1981) dengan mentransformasikan matriks menjadi matriks korelasi . Sehingga dugaan koefisien regresi menjadi: ( ) ( ) dengan: ( )

: estimator ridge regression : ridge parameter (bilangan kecil positif terletak antara 0 dan 1) 3

JURUSAN STATISTIKA FMIPA | INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA

: Matriks n k yang merupakan hasil transformasi variabel bebas melalui metode centering dan rescaling. Sehingga nilai dugaan untuk variabel regressand menjadi: ( ) ( ) Proses tersebut di atas disebut dengan Ridge regression. Analisis ridge regression dapat ) ada dan tidak digunakan apabila tidak singular. Asumsi yang digunakan hanyalah ( sulit mendapatkannya (Draper & Herzberg, 1986). Pemilihan nilai sebenarnya diserahkan kepada analis. Untuk memperoleh nilai , analis mencobakan nilai ampai keadaan stabil. Ada beberapa metode yang bisa digunakan salah satunya yaitu dengan mencari nilai satistik Cp Mallows ( ) dengan rumus: dengan ( keterangan: : Jumlah kuadrat residu dari persamaan Ridge Regression n : banyaknya pengamatan ) : Eigen value matriks ( ( ) : Trace dari matriks : penaksir varians metode kuadrat terkecil Setelah memperoleh nilai , nilai terpilih adalah nilai yang dapat meminimumkan nilai Koefisien regresi dalam variabel asal digunakan rumus sebagai berikut : ( dengan i ) ) ( )

: 1, 2, 3 : Galat baku dari data awal Y : Galat baku dari data awal X ke-I : koefisien regresi setelah melalui metode ridge regression

5.

Regresi Beda Regresi beda merupakan salah satu metode yang digunakan untuk mengatasi autokorelasi. Dimana regresi ini dilakukan pada saat terjadi autokorelasi atau ketika saling dependent (berhubungan). Model regresi beda dapat dinyatakan dalam bentuk sebagai berikut: ( ) Regresi beda merupakan proses regresi dari differensiasi variabel y dan differensiasi variabel x. METODOLOGI PENELITIAN Data yang digunakan untuk menganalisis regresi ridge menggunakan data pendapatan perkapita Indonesia (dalam Triliun) dengan variable bebas adalah harga premium (X1), harga solar (X2), harga minyak bakar (X3) dan harga minyak tanah (X4). Variabel prediktor (Y) yaitu pendapatan Indonesia. Data yang dianalisis beda karena terjadi kasus autokorelasi adalah data stack yang hilang (Y) dengan temperatur pendingin air (X1) dan konsentrasi asam (X2). III.

JURUSAN STATISTIKA FMIPA | INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA

IV. ANALISIS DAN PEMBAHASAN A. STUDI KASUS PENDAPATAN PERKAPITA INDONESIA (DALAM TRILIUN) Berikut adalah hasil dari hubungan regresi linier antara pendapatan perkapita Indonesia (dalam Triliun) dengan harga premium, harga solar, harga minyak bakar dan harga minyak tanah diperoleh taksiran model regresinya adalah sebagai berikut:
Tabel 1. Analisis Regresi

Regression Analysis: pendapatan p versus harga premiu; harga solar; ...


The regression equation is pendapatan perkapita = 127 - 0,130 harga premiun + 0,527 harga solar - 0,981 harga m. bakar + 1,30 harga m. tanah Predictor Constant harga premiun harga solar harga m. bakar harga m. tanah S = 32,4882 Coef 126,53 -0,1304 0,5270 -0,9815 1,2978 SE Coef 33,62 0,2512 0,7022 0,4251 0,2946 T 3,76 -0,52 0,75 -2,31 4,41 P 0,002 0,611 0,465 0,036 0,001 VIF 82,119 188,192 21,278 12,498

R-Sq = 90,3%

R-Sq(adj) = 87,8%

Berdasarkan tabel 1 analisis regresi pendapatan perkapita Indonesia (dalam Triliun) dengan harga premium, harga solar, harga minyak bakar dan harga minyak tanah tersebut diperoleh persamaan regresinya yaitu pendapatan perkapita = 127 - 0,130 harga premiun + 0,527 harga solar - 0,981 harga minyak bakar + 1,30 harga minyak tanah, yang berarti bahwa setiap pengurangan nilai harga premium sebesar 1 satuan, maka nilai pendapatan perkapita akan berkurang sebesar koefisien dari harga premium (0,13 satuan), setiap pertambahan nilai harga solar sebesar 1 satuan, maka nilai pendapatan perkapita akan bertambah sebesar koefisien dari harga premium (0,527 satuan), setiap pengurangan nilai harga minyak bakar sebesar 1 satuan, maka nilai pendapatan perkapita akan berkurang sebesar koefisien dari harga minyak bakar (0,981 satuan), setiap pertambahan nilai harga minyak tanah sebesar 1 satuan, maka nilai pendapatan perkapita akan bertambah sebesar koefisien dari harga minyak tanah (1,3 satuan). Nilai R-Sq(adj) = 87,8%, berarti bahwa model tersebut dapat menjelaskan kebaikan data sebesar 87,8%. Model tersebut sudah baik untuk mewakili data karena lebih dari standart kelayakan model yaitu 75%.

Uji Signifikansi Parameter


Uji Signifikansi Parameter Secara Serentak Hipotesis H0 : H1 :
( )

Statistik Uji : Daerah Kritis : Tolak H0 jika 0,05

( ) ( )

atau P value

Tabel 2. ANOVA Uji Signifikan Secara Serentak


Analysis of Variance Source Regression Residual Error Total DF 4 15 19 SS 148158 15832 163990 MS 37039 1055 F 35,09 P 0,000

JURUSAN STATISTIKA FMIPA | INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA

Keputusan: Tolak H0 karena ( 0,000 0,05 Kesimpulan : parameter signifikan secara serentak Uji Signifikansi Parameter Secara Individu Hipotesis H0 : H1 : Statistik Uji:

atau P value

yaitu 30,20

2,87 atau

Daerah Kritis : Tolak H0 jika | | 0,05

atau P value

Tabel 3. Uji Individu


Predictor Constant harga premiun harga solar harga m. bakar harga m. tanah Coef 126,53 -0,1304 0,5270 -0,9815 1,2978 SE Coef 33,62 0,2512 0,7022 0,4251 0,2946 T 3,76 -0,52 0,75 -2,31 4,41 P 0,002 0,611 0,465 0,036 0,001 VIF 82,119 188,192 21,278 12,498

Hipotesis H0 : H1 : H0 : H1 : H0 : H1 : H0 : H1 : H0 : H1 :

Tabel 4. Hasil Keputusan dan Kesimpulan Uji Signifikan Secara Individu | | Keputusan 3,76 Tolak H0

Kesimpulan tidak signifikan

Parameter

secara individu karena ada salah satu paramaeter yang

-0,52 2,131

Gagal Tolak H0

tidak signifikan. Nilai VIF >10 sehingga antara perkapita (dalam Triliun)

0,75

Gagal Tolak H0

pendapatan Indonesia

-2,31

Gagal Tolak H0

dengan harga premium, harga solar, harga minyak bakar dan

4,41

Gagal Tolak H0

harga

minyak

tanah

mempunyai multikolinieritas.

Uji Asumsi Residual IIDN ( Identik, Independen, Distribusi Normal) Pengujian Residual Identik Untuk mengetahui adanya keidentikan antara pendapatan perkapita Indonesia (dalam Triliun) terhadap harga premium, harga solar, harga minyak bakar dan harga minyak tanah menggunakan uji Glejser sebagai berikut: Hipotesis : H0 : (residual memenuhi asumsi identik, tidak ada heteroskedastisitas) H1 : minimal ada satu (terjadi heteroskedastisitas) Statistik Uji:
( )

Daerah kritis: Tolak H0 jika | | 0,05

atau P value

JURUSAN STATISTIKA FMIPA | INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA

Tabel 5. Uji Residual Identik


Analysis of Variance Source Regression Residual Error Total DF 4 15 19 SS 2446,4 2899,3 5345,7 MS 611,6 193,3 F 3,16 P 0,045

Keputusan: Tolak H0 Kesimpulan: Terjadi heteroskedastisitas atau residualnya tidak memenuhi asumsi identik
Pengujian Residual Independen Untuk mengetahui adanya independen antara pendapatan perkapita Indonesia (dalam Triliun) terhadap harga premium, harga solar, harga minyak bakar dan harga minyak tanah menggunakan uji Durbin Watson sebagai berikut: Hipotesis : H0 : (tidak terjadi autokorelasi) H0 : (terjadi autokorelasi) Daerah kritis : Gagal Tolak H0 bila dU<d<4-Du Statistik uji :
( )

Tabel 6. Durbin Watson Statistic


Durbin-Watson statistic = 1,86030

dU<d<4-dU 1,83<1,86030<4-1,83 1,83<1,86030<2,17 Kesimpulan : Gagal tolak H0 artinya residual memenuhi asumsi independen karena tidak terjadi autokorelasi. Pengujian Residual Distribusi Normal Analisis plot residual Normality Plot ini dilakukan untuk mengetahui adanya Distribusi Normal antara pendapatan perkapita Indonesia (dalam Triliun) terhadap harga premium, harga solar, harga minyak bakar dan harga minyak tanah Hipotesis : H0 : F(x) = F0 (x), Residual data berdistribusi Normal H1 : F(x) F0 (x), Residual data tidak berdistribusi Normal | ( ) ( )| Statistik Uji: Keterangan : Fn(x) = Nilai distribusi kumulatif sanpel F0(x) = Nilai distribusi kumulatif yang ditetapkan, atau di bawah H0 P( ) untuk distribusi normal Daerah Kritis : Tolak H0 jika

JURUSAN STATISTIKA FMIPA | INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA

Probability Plot of RESI1


Normal
99 Mean StDev N KS P-Value -5,40012E-14 28,87 20 0,095 >0,150

95 90 80

Percent

70 60 50 40 30 20 10 5

-80

-60

-40

-20

0 RESI1

20

40

60

80

Gambar 1. Plot Distribusi Normal

Kesimpulan: menunjukkan bahwa nilai KS sebesar 0,095 yang menunjukkan bahwa , maka gagal tolak H0, sehingga dapat dikatakan asumsi distribusi normal. P value sebesar 0,15 sehingga P value , maka gagal tolak H0 sehingga dapat dikatakan memenuhi asumsi distribusi normal. 1. REGRESI RIDGE Uji multikolinearitas bertujuan untuk menguji apakah dalam model regresi ditemukan adanya korelasi antar variabel bebas (independen). Apabila nilai VIF lebih kecil daripada 10 maka dapat disimpulkan tidak terjadi multikolinearitas.
Tabel 7. Uji Asumsi Multikolinieritas
Predictor Constant harga premiun harga solar harga m. bakar harga m. tanah Coef 126,53 -0,1304 0,5270 -0,9815 1,2978 SE Coef 33,62 0,2512 0,7022 0,4251 0,2946 T 3,76 -0,52 0,75 -2,31 4,41 P 0,002 0,611 0,465 0,036 0,001 VIF 82,119 188,192 21,278 12,498

Tabel 7 dapat diketahui bahwa nilai VIF pada masing-masing variabel prediktor memiliki nilai VIF yang lebih > 10 maka dapat disimpulkan terjadi multikolinearitas. Kasus multikolinieritas dapat diatasi dengan salah satunya Ridge Regeression. Regresi Ridge pada kasus ini digunakan untuk menggatasi multikolinieritas antar variabel prediktor. Berikut adalah analisis regresi ridge bila terjadi multikolinieritas
Tabel 8. Regresi Ridge

* VIF( ) VIF ( ) VIF ( ) VIF ( ) 0,2 0,22904 0,607113 0,204415 -0,38497 -0,201179282 0,2 0,190218 0,204415 0,193878 -0,03815 -0,122569424 0,2 -0,09624 -0,38497 -0,03815 0,889303 -0,215621911 0,2 0,5047 -0,20118 -0,12257 -0,21562 0,775892594 Rabel 8 menunjukkan hasil yaitu centering dan resclaing regresi ridge. Dari hasil tersebut diketahui bahwa nilai yang terpilih adalah 0,2, karena memiliki nilai VIF mendekati 1. Sehingga diperoleh persamaan regresi yang dibentuk sebagai berikut: Setelah dikembalikan ke variabel asal (X) diperoleh persamaan regresi baru sebagai berikut: Setiap penambahan nilai harga premium sebesar 1 satuan, maka nilai pendapatan perkapita akan bertambah sebesar koefisien dari harga premium (0,079129 satuan), setiap JURUSAN STATISTIKA FMIPA | INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA 8

pertambahan nilai harga solar sebesar 1 satuan, maka nilai pendapatan perkapita akan bertambah sebesar koefisien dari harga premium (0,1213686 satuan), setiap penambahan nilai harga minyak bakar sebesar 1 satuan, maka nilai pendapatan perkapita akan berkurang sebesar koefisien dari harga minyak bakar (0,1105129 satuan), setiap pertambahan nilai harga minyak tanah sebesar 1 satuan, maka nilai pendapatan perkapita akan bertambah sebesar koefisien dari harga minyak tanah (0,524458 satuan). Berikut merupakan gambar Ridge Trace dari data pendapatan perkapita Indonesia (dalam Triliun).

Gambar 2. Ridge Trace

Keterangan pada Gambar 2 X1 merupakan harga premium, X2 merupakan harga solar, X3 merupakan harga minyak bakar dan X4 merupakan harga minyak tanah. Berdasarkan Gambar 2 saat nilai k = 0,2 untuk masing-masing pola penelususran mulai mendekati grafik yang stabil, sehingga nilai konstanta k yang cocok untuk memperoleh koefisien penduga yang stabil adalah saat k = 0,2

JURUSAN STATISTIKA FMIPA | INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA

Kasus multiko yang telah diatasi dengan menggunakan regresi ridge, kemudian dilakukan kelayakan model apakah model layak digunakan atau tidak dengan signifikansi parameter. Hipotesis H0 : H1 :
( )

Statistik Uji : Daerah Kritis : Tolak H0 jika 0,05 df 4 15 19

( ) ( )

atau P value

Tabel 9. ANOVA Regresi Ridge Data Pendapatan Perkapita Indonesia (dalam Triliun)

Regression 2,46 Residual Total Keputusan: Tolak H0 Kesimpulan: parameter signifikan secara serentak. Maka dapat dikatakan ada hubungan linier antara variabel-variabel bebas X1, X2, X3, dan X4 dengan variabel Y. Nilai korelasi determinasi estimator yaitu 1 atau 100% Setelah dilakukan uji signifikansi serentak dari hasil regresi ridge, maka dilakukan uji signifikansi parameter secara individu. Berikut uji signifikansi parameter secara individu hasil dari regresi ridge. Hipotesis H0 : H1 : Statistik Uji:

SS 16146,89 2,46 16146,89

MS 4036,721 1,64

P_value 0,00

Daerah Kritis : Tolak H0 jika | | 0,05


Hipotesis H0 : H1 : H0 : H1 : H0 : H1 : H0 : H1 : H0 : H1 :

atau P value

Tabel 10. ANOVA Regresi Ridge Uji Signifikansi Secara Individu | | Keputusan

Kesimpulan

1,93 -6,3 -5,3 7,29 -2,4


2,131

Gagal Tolak H0

Gagal Tolak H0 Parameter signifikan secara individu

Gagal Tolak H0

Gagal Tolak H0

Gagal Tolak H0

JURUSAN STATISTIKA FMIPA | INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA

10

Masalah multikolinearitas yang terjadi pada regresi linear berganda pada data Pendapatan Perkapita Indonesia (dalam Triliun) dapat diselesaikan dengan metode Regresi Ridge. Dengan menggunakan Ridge Trace, yaitu dengan menambah tetapan bias pada diagonal matriks akan diperoleh pada nilai tertentu nilai VIF relatif dekat dengan 1 (kurang dari 10), sehingga koefisien lebih stabil. Dari hasil koeefisien determinisai juga dapat diketahui yaitu 100% hal ini menunjukkan bahwa estimator yang diperoleh sudah dapat digunakan dan variansi Pendapatan Perkapita Indonesia (dalam Triliun) dapat dijelaskan oleh jumlah harga premiun, harga solar, minyak bakar dan minyak tanah.

B.

STUDI KASUS STACK YANG HILANG PADA OKSIDASI TANAMAN DARI AMMONIA SAMPAI ASAM SULFAT Model Regresi yang didapat dari hubungan antara stack yang hilang oksidasi tanaman dari ammonia sampai asam sulfat (Y) yang dipengaruhi oleh temperatur pendingin air (X1) dan konsentrasi asam (X2) sebagai berikut:
Tabel 11. Analisis Regresi

Regression Analysis: y versus x1; x2


The regression equation is y = - 51,2 + 2,73 x1 + 0,129 x2 Predictor Constant x1 x2 S = 5,13733 Coef -51,24 2,7320 0,1290 SE Coef 18,54 0,3949 0,2329 T -2,76 6,92 0,55 P 0,013 0,000 0,587

R-Sq = 77,0%

R-Sq(adj) = 74,5%

Output Minitab diatas didapatkan persamaan Stack yang Hilang (Y) = -51,2 + 2,73 Temperatur Pendingin Air (X1) + 0,129 Konsentrasi Asam (X2) . Artinya untuk setiap kenaikan temperatur sebanyak 10, maka stack yang hilang sebanyak 2,73 kali dengan asumsi variabel lain tetap, dan untuk setiap kenaikan konsentasi asam satu satuan maka stack yang hilang sebanyak 0,129 kali dengan asumsi variabel lain tetap. Tabel 11 didapatkan pula nilai koefisien determinasi sebesar 74,5 % yang menunjukkan model sudah baik, karena lebih dari 70%. Signifikansi Parameter Signifikansi Parameter Secara Serentak Hipotesis H0 : H1 :
( )

Statistik Uji : Daerah Kritis : Tolak H0 jika 0,05

( ) ( )

atau P value

Tabel 12. Uji Serentak


Analysis of Variance Source Regression Residual Error Total DF 2 18 20 SS 1594,18 475,06 2069,24 MS 797,09 26,39 F 30,20 P 0,000

Keputusan: Tolak H0 karena ( ) atau P value 0,000 0,05 Kesimpulan : parameter tidak signifikan secara serentak

yaitu 30,20

3,47 atau

JURUSAN STATISTIKA FMIPA | INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA

11

Signifikansi Parameter Secara Individu Hipotesis H0 : H1 : Statistik Uji:

Daerah Kritis : Tolak H0 jika | | 0,05

atau P value

Tabel 13. Uji Individu


Predictor Constant x1 x2 S = 5,13733 Coef -51,24 2,7320 0,1290 SE Coef 18,54 0,3949 0,2329 T -2,76 6,92 0,55 P 0,013 0,000 0,587

R-Sq = 77,0%

R-Sq(adj) = 74,5%

Tabel 14. Hasil Uji Individu

Hipotesis H0 : H1 : H0 : H1 : H0 : H1 :

| | -2,76 6,92 0,55 2,101

Keputusan Tolak H0 Tolak H0 Gagal Tolak H0

Kesimpulan Parameter tidak signifikan secara individu karena ada salah satu paramaeter yang tidak signifikan

Uji Asumsi Autokorelasi Berikut Uji Asumsi untuk medeteksi adanya autokorelasi
Tabel 15. Uji Asumsi Autokorelasi
Source Temperatur Pendingin Air Konsentrasi Asam DF 1 1 Seq SS 1586,09 8,09

Durbin-Watson statistic = 0,793294

Tabel 15 tersebut dari nilai Durbin Watson menunjukkan terjadi autokorelasi karena nilai Durbin Watson (d) sebesar 0,793294, dimana nilai dL untuk k=2 dan n=21 adalah sebesar 1,1246 dan nilai dU adalah sebesar 1,5385. Karena nilai d masuk kedalam selang 0<d<1,1246 maka terjadi autokorelasi positif sehingga perlu dilakukan tindakan untuk mengatasi autokorelasi. Dalam mengatasi autokorelasi dilakukan dengan regresi beda. Pengujian Residual Distribusi Normal Analisis plot residual Normality Plot ini dilakukan untuk mengetahui adanya Distribusi Hipotesis : H0 : F(x) = F0 (x), Residual data berdistribusi Normal H1 : F(x) F0 (x), Residual data tidak berdistribusi Normal | ( ) ( )| Statistik Uji:

Keterangan : Fn(x) = Nilai distribusi kumulatif sanpel F0(x) = Nilai distribusi kumulatif yang ditetapkan, atau di bawah H0 P( distribusi normal
Daerah Kritis : Tolak H0 jika

) untuk

JURUSAN STATISTIKA FMIPA | INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA

12

Probability Plot of RESI3


Normal
99 Mean StDev N KS P-Value -5,07531E-16 4,874 21 0,091 >0,150

95 90 80

Percent

70 60 50 40 30 20 10 5

-10

-5

0 RESI3

10

Gambar 3. Plot Normalitas

Kesimpulan: menunjukkan bahwa nilai KS sebesar 0,091 yang menunjukkan bahwa , maka gagal tolak H0, sehingga dapat dikatakan asumsi distribusi normal. P value sebesar 0,15 sehingga P value , maka tolak H0 sehingga dapat dikatakan memenuhi asumsi distribusi normal. 2. REGRESI BEDA Uji autokorelasi bertujuan untuk menguji apakah dalam model regresi ditemukan adanya independensi antar variabel bebas yang dilihat dari nilai durbin watsonnya. Pada model regresi antara stack yang hilang dengan temperatur pendingin air (X1) dan konsentrasi asam (X2), dapat dilihat bahwa terjadi autokorelasi atau residual dari data tidak independen. Kasus autokorelasi dapat diatasi salah satunya dengan regresi beda Regresi beda merupakan salah satu cara untuk mengatasi independensi. Pertama adalah melakukan differensiasi pada variabel respon (Y) dan variabel predictor (X), kemudian melakukan regresi kembali antara hasil differensiasi kedua variabel. Berikut adalah hasil dari differensiasi masing-masing variabel :
Tabel 16. Differinsiasi Variabel

diff_Stack yang hilang * -5 0 -9 -10 0 1 1 -5 -1 0 -1 -2 1 -4 -1 1

diff_Temperatur pendingin air * 0 -2 -1 -2 1 1 0 -1 -5 0 -1 1 1 -1 0 1

diff_konsentrasi asam * -1 2 -3 0 0 6 0 -6 -7 9 -1 -6 11 -4 -3 -14


13

JURUSAN STATISTIKA FMIPA | INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA

0 1 6 0

0 1 0 0

7 1 2 9

Setelah dilakukan differensiasi terhadap semua variabel, maka dilakukan analisis regresi antara variabel yang telah didiferensiasikan tersebut. Berikut adalah hasil dari analisis regresi beda :
Tabel 17. Hasil Regresi Beda

Regression Analysis: diff_Stack y versus diff_Tempera; diff_konsent


The regression equation is diff_Stack yang hilang = - 1,09 + 0,775 diff_Temperatur pendingin air + 0,118 diff_konsentrasi asam 20 cases used, 1 cases contain missing values Predictor Constant diff_Temperatur pendingin air diff_konsentrasi asam S = 3,56583 R-Sq = 16,4% Coef -1,0907 0,7746 0,1176 SE Coef 0,8237 0,5790 0,1365 T -1,32 1,34 0,86 P 0,203 0,199 0,401 VIF 1,069 1,069

R-Sq(adj) = 6,6%

Model Regresi Beda : y t y t 1 0 1 ( xt xt 1 ) t Berdasarkan analisis regresi stack yang hilang dengan Temperatur pendingin air dan konsentrasi asam tersebut diperoleh persamaan regresinya yaitu stack yang hilang = -1,09 + 0,775 temperatur pendingin air + 0,118 konsentrasi asam, yang berarti bahwa setiap kenaikan satu satuan temperatur pendingin air sebesar 1 satuan, maka stack yang hilang akan bertambah sebesar 0,775 satuan, setiap pertambahan konsentrasi asam sebesar 1 satuan, maka stack yang hilang akan bertambah sebesar koefisien dari 0,118 satuan. Nilai R-Sq(adj) = 6,6%, berarti bahwa model tersebut dapat menjelaskan kebaikan data sebesar 6,6%. Model tersebut jelek untuk mewakili data karena kurang dari standart kelayakan model yaitu 75%. Uji Asumsi Residual IIDN ( Identik, Independen, Distribusi Normal) Pengujian Residual Identik Untuk mengetahui adanya keidentikan antara stack yang hilang terhadap temperatur pendingin air dan konsentrasi asam menggunakan uji Glejser sebagai berikut: Hipotesis : H0 : (residual memenuhi asumsi identik, tidak ada heteroskedastisitas) H1 : minimal ada satu (terjadi heteroskedastisitas) Statistik Uji:

Daerah kritis: Tolak H0 jika | | 0,05

atau P value

JURUSAN STATISTIKA FMIPA | INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA

14

Tabel 18. ANOVA Hasil Regresi Beda


Analysis of Variance Source Regression Residual Error Total DF 2 17 19 SS 42,39 216,16 258,55 MS 21,20 12,72 F 1,67 P 0,218

Keputusan: Gagal Tolak H0 Kesimpulan: Tidak terjadi heteroskedastisitas atau residualnya memenuhi asumsi identik Pengujian Residual Independen Untuk mengetahui adanya independen antara pendapatan perkapita Indonesia (dalam Triliun) terhadap harga premium, harga solar, harga minyak bakar dan harga minyak tanah menggunakan uji Durbin Watson sebagai berikut: Hipotesis : H0 : (tidak terjadi autokorelasi) H0 : (terjadi autokorelasi) Daerah kritis : Gagal Tolak H0 bila dU<d<4-Du Statistik uji :
( )

Tabel 19. Durbin Watson Hasil Regresi Beda


Durbin-Watson statistic = 1,78345

dU<d<4-dU 1,41<1,78345 <4-1,41 1,41<1,7845<2,59 Kesimpulan : Gagal tolak H0 artinya residual memenuhi asumsi independen karena tidak terjadi autokorelasi. Pengujian Residual Distribusi Normal Analisis plot residual Normality Plot ini dilakukan untuk mengetahui adanya Distribusi Hipotesis : H0 : F(x) = F0 (x), Residual data berdistribusi Normal H1 : F(x) F0 (x), Residual data tidak berdistribusi Normal | ( ) ( )| Statistik Uji:

Keterangan : Fn(x) = Nilai distribusi kumulatif sanpel F0(x) = Nilai distribusi kumulatif yang ditetapkan, atau di bawah H0 P( distribusi normal
Daerah Kritis : Tolak H0 jika

) untuk

JURUSAN STATISTIKA FMIPA | INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA

15

Probability Plot of RESI3


Normal
99 Mean StDev N KS P-Value 8,215650E-16 3,373 20 0,203 0,038

95 90 80

Percent

70 60 50 40 30 20 10 5

-10

-5

0 RESI3

10

Gambar 4. Plot Normal setelah di Rergresi Beda

Kesimpulan: menunjukkan bahwa nilai KS sebesar 0,203 yang menunjukkan bahwa , maka gagal tolak H0, sehingga dapat dikatakan asumsi distribusi normal. P value sebesar 0,038 sehingga P value , maka tolak H0 sehingga dapat dikatakan tidak memenuhi asumsi distribusi normal.

JURUSAN STATISTIKA FMIPA | INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA

16

Anda mungkin juga menyukai