Anda di halaman 1dari 7

Bagian A (Konsep)

1. Metode regresi adalah menentukan pola hubungan (secara matematis) antara variabel
dependen dengan satu atau lebih variabel independen. Manfaat dari metode ini dapat
digunakan untuk menjelaskan atau memprediksi variabilitas dari variabel dependen
dengan menggunakan informasi dari satu atau lebih variabel independen melalui suatu
persamaan matematis. Persamaan matematis bisa saja berupa suatu garis atau kurva
yang diduga terlebih dahulu dari suatu Scatterplot. Scatter plot adalah suatu gambaran
awal atau sederhana dari hubungan variabel dependen dan independen.
Bila suatu model regresi digunakan tanpa suatu kualifikasi biasanya mewakili linier
regresi. Ada 2 macam pada metode regresi yaitu Regresi Linier sederhana dan Regresi
linier berganda
2. Dalam analisis regresi linier sederhana
a. Postulated modelnya adalah

Y 0 1 X1 i

atau secara matriks dapat ditulis


Y X
dimana
Y = variabel respon/ Dependen
Y= matriks respon berukuran n1
X1 = variabel predictor/ Independen
X= matriks prediktor berukuran n(p+1)
0 = Intercept Y populasi
= matriks parameter berukuran 1(p+1)
1 = Koefisien slope populasi
= matriks residual berukuran n1.
i = residual
Y 0 1 X i atau Yi b + b X ,
b. Model dugaan setiap pengamatan i
0
1 i
n

i 1
n

i 1
n

X iYi Y X i

b1

X
i 1

1
n

2
i

X Xi

X Y n XY

i 1

i i

i 1
n

i 1

S XY
S XX

nX 2

2
i

Y b X Y b X
i 1

i 1

Untuk mempermudah menghitung penaksir koefisien regresi maka persamaan normal diubah
ke bentuk matrik

i 1
n

X 1i

X 12i

i 1

X ki
i 1

i 1

X 1i X k1
i 1

1i

ki

b0

X 1i X k 1 b1

i 1

n
k

ki

i 1

i 1

Y
n

i 1

X
i 1

1i i

i 1

ki i

Dengan metode OLS koefisien model regresi dapat diestimasi secara matriks dengan
T
1
T

persamaan ( X X ) X Y

c. Ya, dikarenakan nilai E( Statistik)= E (Parameter)


Statistik merupakan besaran yang dihasilkan dari sampel yang digunakan untuk
menduga populasi dan Parameter merupakan besaran yang dihasilkan dari Populasi
E( b0 )= o dan E( b1 )= 1
d. Residual harus memenuhi syarat tertentu, yaitu identik (homoskedastisitas),
independen (tidak ada autokorelasi) dan berdistribusi Normal (0, 2). Jika tidak
memenuhi maka model regresi tersebut tidak sesuai diterapkan pada data. Solusi jika
syarat tidak terpenuhi adalah :
- Jika residual tidak identik dapat digunakan metode regresi terboboti.
- Jika residual tidak independen dapat digunakan metode generalized least square
atau generalized difference regression.
- Jika residual tidak berdistribusi normal dapat dilakukan transformasi variabel.
3. The best selection model adalah pemilihan model regresi terbaik dengan menentukan
variabel prediktor yang sesuai yaitu yang menghasilkan parameter signifikan, R 2 tinggi,
MSE rendah, serta model yang memenuhi semua asumsi.
4. Multikolinieritas dalam analisis regresi adalah adanya korelasi yang signifikan pada
variabel independen. Multikolinieritas dapat mengganggu analisis regresi yaitu dapat
menghasilkan tanda koefisien regresi yang tidak sesuai dengan tanda koefisien korelasi,
serta menghasilkan R2 tinggi namun parameter tidak signifikan.
Multikolinieritas dapat dideteksi dari matriks korelasi, nilai VIF, atau kesesuaian tanda
koefisien regresi dengan koefisien korelasi.
Multikolinieritas dapat diatasi dengan metode principal component regression (PCR),
ridge regression, atau menghilangkan variabel yang menyebabkan multikolinieritas.
5. Model polinomial adalah model yang menggunakan prediktor yang berpangkat lebih dari
satu.
MODEL SECARA UMUM :

Y 0 Z 0 1Z1 2 Z 2 ... p Z p

(*)
Contoh model polinomial orde 3 Misal p=3; Z1=X; Z2=X2; Z3=X3; 2 11 dan 2 111 ,
Y 0 1 X 1 11 X 2 111 X 3
maka model (*) menjadi
6. Model linear memiliki dua sifat yaitu regresi sederhana dan regresi berganda dengan
kurva yang dihasilkan membentuk garis lurus, sedangkan untuk model non linear dalam
parameternya bersifat kuadratik dan kubik dengan kurva yang dihasilkan membentuk
garis lengkung.
Model linier intrinsik merupakan model yang dapat di ubah bentuknya menjadi linier,
yaitu dengan cara mentransformasikan variabel. Salah satu metodenya adalah metode
exponensial
Bentuk persamaan matematis model regresi linear Y 0 1 X 1 2 X 2 .
Bentuk persamaan matematis model regresi non linear ada beberapa jenis, diantaranya :
1. Polinomial, contoh :

y 0 1 x 2 x 2 (kuadratik)

y 0 1 x 2 x 2 3 x 3
2. Exponensial, contoh :

y 0 e 1 x

(kubik)

Bagian B (Permasalahan)
B1. Permasalahan Program Pemberian Beasiswa di Perguruan Tinggi
1. Model regresi yang terbentuk umtuk program pemberian beasiswa di perguruan tinggi

adalah Y 15,8 0,961 X 1 17,6 D1 27,1 D2 .

a. Interpretasi dari Y 15,8 0,961 X 1 17,6 D1 27,1 D2 adalah Jika uang kiriman orang tua
naik satu satuan maka pengeluaran mahasiswa per bulan cenderung naik 0,961 satuan.
b. Untuk mengetahui apakah pengeluaran mahasiswa berbeda secara signifikan dilakukan
dengan melihat uji signifikansi parameter.
Hipotesis :
H0 : 1=0 (pengeluaran mahasiswa dan mahasiswi sama)
H1 : 1o (pengeluaran mahasiswa dan mahasiswi berbeda).
Hasil uji signifikansi parameter :
Predictor
Constant
X1
D1
D2

Coef
-15.77
0.96069
17.601
27.13

SE Coef
34.86
0.05217
5.427
11.15

T
-0.45
18.41
3.24
2.43

P
0.659
0.000
0.007
0.032

Statistika Uji : P value


Daerah Kritis : P-value untuk D1= 0.007 bernilai kurang dari 0,05 sehingga Tolak H0
Kesimpulan :pengeluaran mahasiswa berbeda signifikan dengan pengeluaran mahasiswi.
c.

Untuk mengetahui apakah kepemilikan motor berpengaruh pada pengeluaran mahasiswa


dilakukan dengan melihat uji signifikansi parameter.
Hipotesis :
H0: 2=0 (kepemilikan sepeda motor tidak berpengaruh terhadap pengeluaran
mahasiswa)
H0: 2o (kepemilikan sepeda motor berpengaruh terhadap pengeluaran mahasiswa).
Hasil uji signifikansi parameter :
Predictor
Constant
X1
D1
D2

Coef
-15.77
0.96069
17.601
27.13

SE Coef
34.86
0.05217
5.427
11.15

T
-0.45
18.41
3.24
2.43

P
0.659
0.000
0.007
0.032

Statistika Uji : P value


Daerah Kritis : P-value untuk D2= 0.032 bernilai kurang dari 0,05 sehingga Tolak H0
Kesimpulan : kepemilikan sepeda motor berpengaruh terhadap pengeluaran mahasiswa.
d.

Model persamaan regresi untuk mahasiswa yang tidak memiliki sepeda motor :
Y 15,8 0,961 X 1

Model persamaan regresi untuk mahasiswa yang memiliki sepeda motor :


Y 15,8 0,961 X 1 27,1

Model persamaan regresi untuk mahasiswi yang tidak memiliki sepeda motor :
Y 15,8 0,961 X 1 17,6

Model persamaan regresi untuk mahasiswi yang memiliki sepeda motor :


Y 15,8 0,961 X 1 17,6 27,1

B2. Pemilihan Model Terbaik


1. Metode Best Subsets
menentukan semua kemungkinan persamaan regresi, kemudian membandingkan
seluruh model yang mungkin dibuat, yang bisa dilihat sebagai acuan kriteria model
terbaik adalah dengan melihat pada :
SSR
2
a. Nilai R2 maksimum. R = SST 100
SSR
Df
2
regresi
b. Nilai R2 terkoreksi maksimum. R adj =1 SST 100
Df total
JKS p
c. Statistik Uji, Cp Mallows. CpMallow = 2 ( n2 p )
s

Dari Data terlampir sebanyak 25 data dengan variable Y dan 4 buah predictor
X1,X2,X3 dan X4 maka dengan Metode Best Subsets didapatkan hasil sebagai
berikut
Tabel Model Regresi, R2, R2 adj, dan Cp mallow
Banyak Variabel
1

3
4

Model
y=f ( x1 )
y=f ( x2 )
y=f ( x3 )
y=f ( x 4 )
y=f ( x1 , x2 )
y=f ( x1 , x3 )
y=f ( x1 , x 4 )
y=f ( x2 , x3 )
y=f ( x2 , x 4 )
y=f ( x3 , x 4 )
y=f ( x1 , x2 , x 3)
y=f ( x1 , x2 , x 4 )
y=f ( x1 , x3 , x 4 )
y=f ( x1 , x2 , x 3 , x 4 )

R
14,7
9,3
22,5
1,9
17,5
42,4
14,7
36,8
9,7
31,7
44,1
18,2
44,7
45,3

R adj
11
5,4
19,1
0,0
10,1
37,2
6,9
31,0
1,5
25,4
36,1
6,5
36 , 8
34,3

Dari seluruh kemungkinan model regresi dalam tabel diatas dipilih satu model terbaik
dari tiap-tiap ukuran banyaknya variabel independen, yaitu dengan kriteria R 2
maksimum, R2adj maksimum, dan nilai Cp mallow yang mendekati parameter.

Dari hasil perhitungan di atas dapat disimpulkan bahwa model terbaik yang dapat kita
sarankan adalah ketika model memuat jumlah variabel independen sebanyak 3 yaitu
dengan model Y= f(X1, X3, X4, ) dengan R2 44,67%, R2 adj 36,8% dan nilai Cpmallows
yang mendekati parameter. Namun jika dibandingkan model 3 variabel independen
dengan model 4 variabel independen, nilai R 2 bertambah 0,6% dan nilai Cpmallows juga
sudah sesuai dengan banyaknya parameter, tapi dari nilai R 2 adj terjadi penurunan 2,5%
yang artinya dengan penambahan 1 variabel independen justru menyebabkan R 2 adj
turun (meskipun R2 bertambah), maka model terbaik yang dipilih dari metode Best
Subsets adalah model dengan 3 variabel independen Y=f(X1, X3, X4)

2. Metode Forward
1..Meregresikan variabel respon, Y, dengan setiap varia bel prediktor, misal X1, X2, ... ,
Xk. Kemudian dipilih model yang mempunyai nilai R 2 tertinggi. Misal m del
b + b X .
tersebut adalah yang memuat prediktor X , yaitu Y
a

2. Korelasi paling tinggi dihasilkan oleh Y dengan X3 sehingga X3 digunakan sebagai


prediktor terlebih dahulu. Dari hasil uji signifikansi parameter diperoleh p-value
kurang dari 0,05 sehingga X3 signifikan.
3. Selanjutnya dimasukkan variabel dengan korelasi tertinggi kedua yaitu X1. Diperoleh
p-value yang kurang dari 0,05 untuk X1 dan X3 sehingga X1 dan X3 signifikan.
4. Selanjutnya dimasukkan variabel dengan korelasi tertinggi ketiga yaitu X4.
Diperoleh p-value yang kurang dari 0,05 untuk X1 dan X3, dan p-value lebih dari
0,05 untuk X4. Jadi X4 tidak perlu dimasukkan dalam model
Y 1, 4 0,898 X 1 0, 494 X 3
5. sehingga model akhirnya adalah :

B3. Permasalahan Proses Produksi


a. Matriks X yang terbentuk dari data proses produksi :
1
1

1
1

1
1

1
1

1
1

128
129
121
120
127
132
128
123
122
126
129
125

0
1
0
0
1
0
0
1
0
0
1
0

0
0
1

0
0

1
0

1
0

0
1

b. Postulated model : Y 0 1 X 1 1 Z 1 2 Z 2 .
Interpretasi Jika kecepatan motor naik satu putaran per jam maka waktu kerusakan
bertambah sebesar 1.
c. SS (b1 , d1 , d 2 | b0 ) 3860 ,6

SS (b1 | b0 , d 1 , d 2 ) SS (b1 , d1 , d 2 | b0 ) SS (d1 , d 2 | b0 )


3860 ,6 638,2
3222 ,4

SS ( d1 , d 2 | b0 , b1 ) SS (b1 , d1 , d 2 | b0 ) SS (b1 | b0 )
3860 ,6 2620 ,2
1240 ,4

d. Uji secara overall


Hipotesis:
H0 : 1=1=2=0
H1 : minimal ada satu 1, 1 atau 2 0.
Hasil uji signifikansi parameter :
Source
Regression
Residual Error
Total

DF
3
8
11

SS
2826.7
898.0
3724.7

MS
942.2
112.2

F
8.39

P
0.007

Statistika Uji : P value


Daerah Kritis : P-value untuk D1= 0.007 bernilai kurang dari 0,05 sehingga Tolak H0
Kesimpulan : minimal ada satu prediktor yang berpengaruh signifikan.
Uji secara Individu
Hipotesis 1,1 dan 2
H0 : 1 =0
H 1 : 1 0

H0 : 1= 0
H1 : 1 0.

H0 : 2=0
H1 : 2 0.

Hasil uji signifikansi parameter :


Predictor
Constant
X1
Z1
Z2

Coef
-383.1
3.9929
11.011
10.996

SE Coef
112.1
0.8922
7.610
7.505

T
-3.42
4.48
1.45
1.47

P
0.009
0.002
0.186
0.181

Statistika Uji : P value


Daerah Kritis :
P-value untuk X1= 0.002 bernilai KURANG dari 0,05 sehingga Tolak H0
P-value untuk Z1= 0.186 bernilai LEBIH dari 0,05 sehingga Gagal Tolak H0
P-value untuk Z2= 0.181 bernilai LEBIH dari 0,05 sehingga Gagal Tolak H0
Kesimpulan :
X1 berpengaruh terhadap Y secara signifikan, sedangkan Z1dan Z2 tidak berpengaruh
terhadap Y secara signifikan.
e. Untuk mengetahui apakah shif berpengaruh terhadap waktu kerusakan dilakukan dengan
melihat uji signifikansi parameter.
Hipotesis :
H0 : 1= 2=0
H1 : minimal ada satu 1atau20
Hasil uji signifikansi parameter :
Source
Regression
Residual Error
Total

DF
2
9
11

SS
578.7
3146.0
3724.7

MS
289.3
349.6

F
0.83

P
0.468

Statistika Uji : P value


Daerah Kritis :
P-value = 0,468 bernilai LEBIH dari 0,05 sehingga Gagal Tolak H0
Kesimpulan :
shift tidak berpengaruh terhadap waktu kerusakan.
f. Untuk mengetahui apakah ada perbedaan antara shif pagi dan shif siang dengan
melihat nilai p value, dimana value bernilai LEBIH dari 0,05 sehingga Gagal Tolak H0
yang artinya shif pagi dan shif siang tidak ada perbedaan
Predictor
Constant
Z1
Z2

Coef
118.000
17.00
9.00

SE Coef
9.348
13.22
13.22

T
12.62
1.29
0.68

P
0.000
0.231
0.513

g. Hipotesis
H0 : 1=0
H1 :1 0
Artinya jika pada statistika uji P-value bernilai LEBIH dari 0,05 sehingga Gagal Tolak
H0 dan jika P-value bernilai KURANG dari 0,05 sehingga Tolak H0
h. Langkah menguji shift siang dan shif malam
-Membuat Hipotesis
-Membuat Statistika Uji
-Daerah kritis
-Kesimpulan