1.
Pendahuluan
Jumlah Kuadrat Ekstra tidak hanya digunakan untuk uji parsial parameter
regresi, tetapi juga berkaitan erat dengan perhitungan koefisien determinasi atau
kuadrat korelasi parsial yang dapat digunakan untuk menguji kesesuaian model
yang digunakan dengan data (Kutner et al, 2004). Analisis error yang rinci dan
dekomposisi serta interpretasi geometrinya akan lebih memperkaya penelitian ini.
Disamping itu penurunan rumus dan keterkaitan antara satu dan lainnya akan
dijelaskan secara rinci.
2.
2.1
Tinjauan Pustaka
Model Regresi Linier Ganda
Model regresi linier ganda berbentuk (Kutner et al, 2004):
= 0 + 1 1 + 2 2 + + 1 ,1 + , = 1,2,
(2.1)
dimana 1 , 2 , , 1 ; ; 0 , 1 , , 1 ; dan masing-masing merupakan
peubah-peubah bebas pada pengamatan ke-i; peubah terikat; parameter regresi;
banyaknya parameter dan error berdistribusi (0, 2 )
Model regresi linier ganda dalam bentuk matriks adalah
=
+
(2.2)
(1)
(1) (1)1
(1)
2.2
2
= =1 + =1
(2.8)
=1
atau = +
Tabel 2.1 ANAVA regresi linier secara umum dengan parameter
Sumber Keragaman
dk
Regresi
= ( ) 2
Sisa
= ( )
Total
= 2
=
1
E(RK)
2 + konstanta nonnegatif
2
2.3
1 ,, 1
1
1 ,, 1
(2.12)
=
(2.15)
1 ,, 1 , +1 ,, 1
1
1 ,, 1
1 ,, 1 , +1 ,, 1
(2.16)
(2.18)
,, 1 1 ,2 ,, 1
1 ,, 1
,, 1 1 ,2 ,, 1
(2.20)
2 1,, 1 2 1,, 1
1 2 1,, 1
(2.22)
= 12 =
(2.23)
2
2
2
2
2
2
(2.24)
1 , +1 ,,(1)
1 ,, (1) , +1 , ( 1)
1 ,, (1) , +1 , ( 1)
(2.25)
2
1
Akar kuadrat dari koefisien determinasi parsial disebut koefisien korelasi parsial.
2.7 Memilih Persamaan Regresi
Apa yang sebenarnya disebut model regresi terbaik bergantung sebahagian pada
tujuan yang diinginkan dalam membuat model (Tiro, 2002). Kata yang terbaik belum
tentu tunggal dan masing-masing mempunyai keunggulan dan kelemahan. Kesederhanaan
dan keefektifan model merupakan pertimbangan yang akan selalu diperhatikan dalam
pemilihan model. Makin besar 1 makin besar pula (). Ini berarti bahwa bila
kemampuan dua atau lebih model sama atau hampir sama dalam menggambarkan
persoalan yang hendak dibahas maka akan cenderung dipilih yang paling sedikit
mengandung peubah bebas di dalamnya atau paling sederhana (Sembiring, 1995).
2.8 Metode Seleksi Maju
Secara esensial, metode ini bekerja dengan cara memasukkan peubah bebas satu
demi satu menurut urutan besar pengaruhnya terhadap model, kemudian menguji
signifikansi parameter regresi dan proses berhenti bila semua peubah bebas yang
memenuhi syarat telah masuk ke dalam model yang dibangun (Sembiring, 1995).
Perhatikan bahwa apakah pengaruh (korelasi) positif atau negatif tidak dipersoalkan
karena yang diperhatikan hanyalah eratnya hubungan antara suatu peubah bebas dengan
. Salah satu keuntungannya ialah dapat melihat proses pembentukan model itu tahap
demi tahap dimulai dari yang pertama sekali (Sembiring, 1995).
3.
3.1
Metodologi Penelitian
Sumber Data
Jenis data yang digunakan adalah data primer melalui penyebaran kuesioner secara
langsung. Dengan mempertimbangkan waktu survei dan biaya yang dibutuhkan, maka
jumlah responden untuk survei ini ditetapkan berjumlah 20% dari total populasi. Dalam
hal ini populasinya yaitu mahasiswa FMIPA Unhas angkatan 2012-2013 yang berjumlah
806 orang, dimana terbagi menjadi beberapa program studi (subpopulasi) yaitu
Matematika, Statistika, Fisika, Geofisika, Kimia dan Biologi, yang masing-masing
berjumlah 99, 127, 122, 104, 139 dan 215 orang. Jumlah responden dari tiap program
studi ditentukan berdasarkan proporsinya masing-masing. Cara ini dianggap dapat
mewakili populasi karena responden menyebar di subpopulasi. Setelah ditentukan jumlah
responden di masing-masing program studi, responden perorangan dipilih dengan cara
mewawancarai responden siapapun yang ditemui di lapangan.
3.2 Identifikasi Peubah
: Indeks Prestasi Kumulatif (IPK) mahasiswa
1 : Rata-rata nilai rapor mahasiswa sewaktu SMA
2 : Nilai Ujian Nasional (UN) mahasiswa
3 : Biaya hidup mahasiswa dalam sebulan (Rp)
4 : Total waktu yang dihabiskan mahasiswa untuk organisasi (jam/bulan)
5 : Total waktu yang dihabiskan mahasiswa untuk belajar di luar perkuliahan
(jam/bulan)
3.3 Metode Analisis
1. Melakukan pengambilan data primer.
2. Melakukan tabulasi data.
3. Menentukan matriks korelasi dari semua peubah yang terlibat dalam model.
Peubah bebas yang memiliki korelasi maksimum terhadap peubah terikat, menjadi
kandidat pertama yang dimasukkan ke dalam model regresi. Uji F (individu)
merupakan syarat untuk melihat pengaruh peubah bebas ini.
4. Menentukan kuadrat korelasi parsial dari semua peubah yang tersisa tanpa
mengikutsertakan peubah yang telah masuk ke dalam model regresi. Peubah bebas
yang memiliki kuadrat korelasi parsial terbesar terhadap peubah terikat
menjadi kandifdat berikutnya yang dimasukkan ke dalam model regresi.
5. Melakukan uji parameter keseluruhan dan uji parameter parsial (individu) dengan
menggunakan Jumlah Kuadrat Ekstra untuk mengetahui signifikansi dari peubah
yang telah masuk ke dalam model.
6. Ulangi langkah (3) hingga semua peubah yang memenuhi syarat masuk ke dalam
model.
4.
4.1
= 0 + 1
= 0 + 1
2
X
.
Gambar
X
.
3.
(i)
1 3 2
1 2 1 2
3 2 =
dimana
3 2 1 2 13 2
1 213 2
3 2 2 3
12 2 12 2 3
1 3 1 2 2 3
12 1 2 12 2 3
; 1 2 =
1 2 1 2
12 2 12 1 2
dan
bahwa rumus (ii) ini jauh lebih praktis dibandingkan rumus (i).
4.4 Rataan Kuadrat Error
Salah satu patokan yang baik digunakan dalam menilai kesesuaian suatu model
dengan data ialah RKE 2 , makin kecil nilai 2 , makin baik modelnya. 2 kemungkinan
akan membesar bila penurunan dalam JKE akibat pemasukan suatu peubah tambahan ke
dalam model tidak dapat mengimbangi penurunan dalam derajat kebebasan (sebesar 1).
Bila model telah jenuh (telah mengandung semua peubah yang diperlukan) maka
penambahan peubah baru akan membuat nilai 2 berfluktuasi disekitar nilai 2 , seperti
diperlihatkan pada Gambar 4.2 berikut.
2
2
0
4.5
1.
2.
3.
Karakteristik
Matematika
Statistika
Fisika
Program Studi
Geofisika
Kimia
Biologi
Jumlah
2012
Angkatan
2013
Jumlah
Laki-Laki
Jenis Kelamin
Perempuan
Jumlah
Frekuensi
20
25
24
21
28
43
161
79
82
161
81
80
161
b)
Asumsi Data
Dengan menggunakan bantuan software (SPSS) diperoleh hasil berikut.
Collinearity Statistics
Model
R Square
.462a
Adjusted R
Std. Error of
Durbin-
Model
Square
the Estimate
Watson
Tolerance
VIF
(Constant)
Jam Belajar
.981
1.020
Nilai Rapor
.990
1.010
Nilai UN
.913
1.096
Biaya Hidup
.924
1.082
Jam Organisasi
.895
1.117
.214
.188
.27104
1.185
Pada Gambar 4,1, terlihat pola data menyebar secara merata di sekitar garis lurus
sehingga model regresi memenuhi asumsi distribusi normal. Kemudian pada Gambar 4.2,
dapat dilihat titik-titik menyebar secara acak, tidak membentuk suatu pola, ini berarti
tidak terjadi heteroskedastisitas (homokedastisitas). Pada Tabel 4.2, diperoleh nilai
Durbin-Watson sebesar 1,185 yang berarti tidak terjadi autokorelasi pada error.
Kemudian pada Tabel 4.3, dapat dilihat nilai VIF pada kelima peubah bebas tidak jauh
dari angka 1 dengan nilai Tolerance mendekati 1, sehingga diindikasikan tidak terjadi
multikolinieritas antara peubah bebas tersebut. Berdasarkan hasil-hasil tersebut dapat
disimpulkan bahwa data yang diperoleh memenuhi asumsi model regresi linier berganda.
c)
Analisis Data
Langkah 1
Memeriksa matriks korelasi antarpeubah yang ditunjukkan pada Tabel 4.2 berikut:
X1
X2
X3
X4
X5
Y
X2
X3
X4
X5
1
-0.1226
-0.2105
-0.1006
0.10089
1
-0.2148
0.0211
0.21305
1
-0.0241
-0.266
1
0.24216
dk
1
159
160
12,1104
1
2
3
5
,
0,023
0,0274
0,0598
0,26
0,048
-0,166
0,245
,
3,5882
9,689
10,0562
Dari Tabel 4.6, tampak bahwa 1 memiliki kuadrat korelasi parsial terbesar dengan
ketika 4 dikontrol, begitu juga dengan masuknya. Dengan demikian peubah 1
memenuhi syarat untuk masuk ke dalam model sehingga diperoleh model regresi terbaik
dengan dua peubah bebas 1 dan 4 : = 2,7304 + 0,00761 0,00144 .
Perhitungan nilai-nilai
21 4 dan menggunakan rumus yang
melibatkan Jumlah Kuadrat Ekstra (2.25) dan (2.16) sebagai berikut:
1 4
4
1 4 1 ,4
:
1
21 4 = 21 4 =
1 =
4 1 ,4
= 0,0675
(4 )
4 (1 ,4 ) (1 ,4 )
: 1613 =
1
=
=
11,437
Nilai 1 ini lebih besar dari = (0.95,1,158) = 3,9 sehingga tolak 0 yang
artinya 1 0, atau 1 berpengaruh signifikan terhadap peubah terikat .
Langkah 3
Tabel 4.7 2 ( = 2, 3 dan 5) serta nilai masuk
2
3
5
1 4
1 4
0,036
0,176
0,233
1 4
0,0013
0,0309
0,0543
F masuk
0,208
5,0077
9,0079
Dari Tabel 4.7, tampak bahwa 5 memiliki korelasi terbesar dengan , sehingga 5
memenuhi syarat masuk ke dalam model, menghasilkan persamaan regresi dengan 3
peubah bebas yaitu = 2,6649 + 0,007131 0,001374 + 0,001475 .
Nilai 5 lebih besar dari = (1;1,157 ) = 3,9, sehingga tolak 0 yang berarti
5 0 atau 5 berpengaruh signifikan terhadap peubah terikat .
Langkah 4
Tabel 4.8 2 1 4 5 ( = 2 dan 3) serta nilai masuk
2
3
1 4
0,065
0,177
1 4
0,0042
0,0312
F masuk
0,6569
5,0258
Dari Tabel 4.8, tampak bahwa 3 memiliki korelasi terbesar dengan , begitu juga
dengan nilai masuknya, sehingga 3 memenuhi syarat masuk ke dalam model, dengan
persamaan = 2,5513 + 0,00721 + 1,01 107 3 0,00124 + 0,00145 .
2
2.9845
= 14,4985 = 0,2061
2
1
160
1 2 = 1
1
156
2 = =
2 = 1
0,2061 = 0,1857
dk
4
140
144
10,1228
5.
5.1
Namun hasil yang diperoleh belum maksimal dikarenakan pengaruh dari empat
faktor ini hanya mampu dijelaskan oleh regresi sekitar 20,61% (kurang dari 50%),
selebihnya sekitar 79,39% dipengaruhi faktor-faktor lain yang belum dimasukkan
dalam penelitian ini. Oleh karena itu data yang diperoleh kurang sesuai dianalisis
dengan teknik ini.
5.2 SARAN
Penelitian ini juga membahas mengenai faktor-faktor yang mempengaruhi prestasi
akademik mahasiswa FMIPA Unhas angkatan 2012-2013, dimana peubah bebas adalah
nilai rapor SMA, nilai UN, biaya hidup, total waktu untuk organisasi dan total waktu
untuk belajar. Namun hasil analisis yang diperoleh belum maksimal, oleh karena itu bagi
pembaca yang berminat dapat melakukan analisis dengan teknik lain yang lebih sesuai
atau melakukan penelitian dengan peubah-peubah bebas lain yang dianggap lebih
berkorelasi dengan prestasi akademik.
DAFTAR PUSTAKA
Dallal, Gerard E., Ph.D.1998.The Extra Sum of Squares Principle.[Online].Tersedia:
http://www.jerrydallal.com/LHSP/extra.htm [9 Januari 2015].
Daruyani dkk.2013.Faktor-Faktor yang Mempengaruhi Indeks Prestasi Mahasiswa FSM
Universitas Diponegoro Semester Pertama dengan Metode Regresi Logistik
Biner.Prosiding Seminar Nasional Statistika Universitas Diponegoro.
Gujarati, D.1995.Basic Econometrics 3rd edition.McGraw Hill, Inc.New York.
Gujarati, D.2003.Basic Econometrics 4th edition.McGraw Hill, Inc.New York.
Hildayati, M.2002.Penelusuran Faktor-Faktor yang Mempengaruhi Prestasi Akademik
Mahasiswa Semester I Universitas IBN Khaldun Bogor.Skripsi.Jurusan
Statistika-MIPA:IPB Bogor.
Kutner et al.2004.Apllied Linier Regression Models Fourth Edition.McGraw-Hill
Companies, Inc.New York.
Pahira.2003.Pemilihan Persamaan Regresi Linier Terbaik dengan Metode Langkah
Mundur dan Nilai Ekstrem Fungsi.Skripsi Strata Satu pada Program Studi
Statistik Universtas Hasanuddin:tidak diterbitkan.
Saeed, Bashiru I.I.2014.Model Equivalence in General Linear Models: Set-to-Zero,
Sum-to-Zero Restrictions and Extra Sum of Squares Method.International
Journal of Statistics and Probability.Volume 3, No. 4.
Sembiring, Dr. R.K.1995.Analisis Regresi.Bandung:ITB.
Sugiarto, 2002.Metode Statistika untuk Bisnis dan Ekonomi.Jakarta:PT Gramedia Pustaka
Utama.
Sugiyanto, C.1995.Ekonometrika Terapan.Yogyakarta:BPFE.
Tiro, Muhammad Arif.2002.Analisis Korelasi dan Regresi Edisi Kedua.Makassar:Badan
Penerbit Universitas Negeri Makassar.
Yuniati, Tina.2010.Pemilihan Model Regresi Linier Terbaik berdasarkan Modifikasi
Statistik CP Mallows. Skripsi Strata Satu pada Program Studi Matematika
Universitas
Sebelas
Maret
[Online].Tersedia:
http://eprints.uns.ac.id/6700/1/143631308201003061.pdf [1 Januari 2015].
10