Factors Affecting Statistics Student’s GPA Using Linear Regression with Dummy Variables
Abstract
Analysis of linear regression with dummy variable used to describe the relationship between the dependent
variable and independent variables, where the independent variable is quantitative and qualitative. This
study aimed to determine the effect of age (X1), attendance at library (X2), Learning Duration (X3), Number
of Literature (X4), Gender (D1), School Region (D2), Origin of School (D3), Parent’s Education (D4),
Parent’s Occupation (D5), Non-academic Activities (D6), Student’s Resident (D7), Student’s Learning Method
(D8) to the GPA value of statistics student in FMIPA University of Mulawarman using Linear Regression
Analysis with Dummy variable. The data used are primary data collected through surveys and interviews
using questionnaires. The number of samples in this study are 117 students. The results shows the factors
that affect the GPA value of statistics student in FMIPA University of Mulawarman is: Learning Duration
(X3), Number of Literature (X4), School Region (D2), Origin of school (D3), The occupation of Parent is Civil
Servant (D51) and Non-academic Activities (D6).
2. Menambah jumlah sampel atau 3. Karena adanya korelasi antar variabel bebas
memperbanyak jumlah sampel (n) sehingga apabila terjadi penambahan variabel
3. Melakukan transformasi data, beberapa contoh bebas tidak akan berpengaruh apa-apa
transformasi adalah: 4. Multikolinieritas juga terjadi bila terlalu
2
X 1 =X ; X 1= log ( X ); X 1= √ X banyak variabel bebas dimasukkan ke dalam
persamaan, artinya variabel bebas masih terus
dimasukkan kendati model telah sesuai. Hal
2. Heteroskedastisitas
ini mudah terjadi tanpa disadari, misalnya bila
Heteroskedastisitas terjadi jika varian dari terlalu banyak memasukkan variabel dummy.
residual suatu pengamatan ke pengamatan lain Untuk mendeteksi terjadinya gangguan
tidak terjadi ketidaksamaan. Model regresi yang multikolinieritas dapat dilakukan dengan
baik adalah tidak terjadi heteroskedastisitas. melakukan pengujian dengan uji korelasi parsial.
Dasar pengambilan keputusan antara lain Ketentuan pengambilan keputusan :
sebagai berikut: Jika nilai koefisien korelasi ( r ) ≥ 0,8, maka
1. Jika ada pola tertentu, seperti titik yang ada terjadi gangguan multikolinieritas
membentuk suatu pola tertentu yang teratur Jika nilai koefisien korelasi ( r ) < 0,8, maka
(bergelombang, melebar kemudian tidak terjadi gangguan multikolinieritas (Santoso,
menyempit), maka terjadi Heteroskedastisitas, 2002)
2. Jika tidak ada pola yang jelas, serta titik Cara lain untuk mengetahui terjadinya
melebar diatas dan dibawah angka 0 pada gangguan multikolinieritas adalah melihat
sumbu Y, maka tidak terjadi besarnya nilai VIF (Variance Inflation Factor)
Heteroskedastisitas. dan Nilai Toleransi (Tolerance Value).
Cara lain untuk mendeteksi Persamaan untuk menentukan nilai VIF
Heteroskedastisitas adalah dengan menggunakan adalah:
uji formal yakni uji Glejser. Adapun tahap-tahap 1 (11)
dalam uji Glejser yaitu : VIF=
(1−R2 )
1. Lakukan analisis regresi untuk menetukan Atau dapat ditulis seperti berikut
model regresi dan menentukan nilai residual εi
2. Setelah mendapatkan nilai residual εi dan 1
VIF= (12)
regresi OLS, selanjutnya meregresikan nilai Tolerance
|ε i| , terhadap variabel X yang diduga Apabila nilai Toleransi lebih dari 0,1 atau
σ mendekati 1 dan nilai VIF < 10, maka ini
mempunyai hubungan erat dengan i2
menunjukkan bahwa tidak terjadi masalah
sehingga model yang digunakan adalah : multikolinearitas antar variabel bebas (Santoso,
|ε i|=β 0 + β1 X 1 +β 2 X 2 +⋯+ β k X k +ε (10) 2003).
Hipotesis yang digunakan: Apabila terjadi gangguan multikolinieritas,
H 0 : Tidak terdapat masalah
maka gangguan yang terjadi dapat dihilangkan
dengan (Sembiring, 1995):
Heteroskedastisitas
a. Memperbanyak jumlah sampel,
H 1 : Terdapat masalah Heteroskedastisitas
b. Melakukan transformasi terhadap
Dengan kriteria pengambilan keputusan : hubungan fungsional, atau
H0 diterima jika Fhitung > Ftabel dan menolak c. Menghilangkan variabel bebas yang memiliki
kolinieritas tinggi.
H1 jika Fhitung < Ftabel, maka tidak terdapat
masalah Heteroskedastisitas (Gujarati, 1995) 4. Autokorelasi
Autokorelasi merupakan gejala terjadinya
3. Multikolinieritas korelasi diantara error pengamatan yang satu
Yang dimaksud dengan multikolinieritas dengan yang lain, karena data dipengaruhi oleh
adalah keadaan dimana variabel bebas yang satu data sebelumnya. Autokorelasi ini dapat dideteksi
dengan variabel bebas yang lain mempunyai dengan uji Durbin-Watson (Pratisto, 2004):
n
korelasi yang erat dalam persamaan regresi.
Masalah-masalah yang ditimbulkan oleh
∑ ( e t − et −1 )2
t =2
DW = ( 13)
multikolinieritas, yaitu : n
∑ e2
1. Koefisien regresi yang bertanda positif dalam t =1
t
D8 8
Tabel 8 Uji Simultan (Uji F)
0,18
Jumlah Mean
5
Model Rata- Df Squar F Sig.
0,49
rata e
4
Regressio 4,841 17 0,285 3,135 0,0
n
0,04
Residual 8,992 99 0,091
4
Total 4,778 116
0,68
2
0,47
Hipotesis
0 H0 : β 1=β 2 =β 3 =⋯=β 16 =β 17=0
0,04
(Secara simultan tidak ada pengaruh antara
4
0,71
variabel bebas (usia, frekuensi ke
8
perpustakaan, lama belajar, banyaknya
0,95 literatur, jenis kelamin, wilayah sekolah, asal
0 sekolah, pendidikan orang tua, pekerjaan
orang tua, kegiatan diluar akademik, tempat
Tabel 7. Koefisien Korelasi dan Determinasi tinggal, dan metode belajar) terhadap nilai
Adjusted R
Std. Error IPK ).
R R2 of the
Square
Estimate H : Minimal terdapat satu β i≠0 ,
1
Tabel 9. Koefisien pada Analisis Regresi dengan sebesar 0,192 dengan asumsi variabel yang
Metode Backward lain dianggap tetap.
Variabel B Std.Error t Sig. 7. Koefisien regresi D6 sebesar 0,116
Konstan 2,686 0,117 22,99 0,000 menyatakan bahwa, setiap mahasiswa yang
X3 0,035 0,010 3,477 0,001 mempunyai kegiatan diluar akademik maka
X4 0,017 0,010 1,171 0,039 akan mengurangi nilai rata-rata IPK
D2 0,134 0,057 2,355 0,020 mahasiswa statistika sebesar 0,116 dengan
D3 0,222 0,068 3,279 0,001 asumsi variabel yang lain dianggap tetap
D51 0,192 0,062 3,086 0,003
D6 -0,116 0,060 -1,936 0,045
Analisis Asumsi-Asumsi Dasar Model Regresi
Tabel 10. Koefisien Determinasi
Linier Berganda
Adjusted R Std. Error of Uji Kenormalan Residual Data
R R2
Square the Estimate Dasar pengambilan keputusan antara lain:
0,801 0,736 0,728 0,28883 a. Jika data menyebar disekitar garis diagonal
. dan mengikuti arah garis diagonal, maka
Interpretasi Model Regresi model regresi memenuhi asumsi normalitas.
Model regresi yang di dapat sebagai berikut : b. Jika data menyebar jauh dari diagonal dan
Y =2 , 686+0 , 035 X 3 +0 , 017 X 4 +0 , 134 D 2
tidak mengikuti garis diagonal, maka model
regresi tidak memenuhi asumsi normalitas.
=0 , 222 D 3 +0 , 192 D 51−0 ,116 D 6
Berdasarkan hasil penelitian untuk variabel
(17) bebas dan variabel terikat diperoleh grafik normal
Q-Q Plot of regresion standardized residual
Dari model regresi yang diperoleh dapat seperti pada gambar dibawah ini:
diinterpretasikan sebagai berikut:
1. Konstanta sebesar 2,686 menyatakan bahwa
jika variabel lama belajar, banyaknya literatur,
wilayah sekolah, asal sekolah, pekerjaan orang
tua yang PNS, dan kegiatan di luar akademik
dianggap tetap maka nilai rata-rata IPK
mahasiswa statistika sebesar 2,686.
2. Koefisien regresi X3 sebesar 0,035
menyatakan bahwa, setiap pertambahan 1 jam
waktu belajar seorang mahasiswa maka akan Gambar 1 Grafik Q-Q Plot of regresion
meningkatkan nilai rata-rata IPK mahasiswa standardized residual
statistika sebesar 0,035 dengan asumsi
variabel yang lain dianggap tetap. Dari Gambar 1 dapat dikatakan data yang
3. Koefisien regresi X4 sebesar 0,017 diperoleh berdistribusi normal. Hal ini tampak
menyatakan bahwa, setiap penambahan 1 dari sebaran titik-titik terdapat di sekitar sumbu
literatur penunjang perkuliahan mahasiswa diagonal dan berada di sepanjang sumbu diagonal
akan meningkatkan nilai rata-rata IPK pula.
mahasiswa statistika sebesar 0,017 dengan Adapun cara yang lain untuk menentukan
asumsi variabel yang lain dianggap tetap. kenormalan data dapat melihat nilai tabel tests of
4. Koefisien regresi D2 sebesar 0,134 normality pada alpha sebesar 5% dan dengan
menyatakan bahwa, setiap mahasiswa yang hipotesis sebagai berikut:
berasal dari sekolah di samarinda maka akan Tabel 12 Uji Kenormalan Resdidual Data
meningkatkan nilai rata-rata nilai IPK Kolmogorov-Smirnov
mahasiswa statistika sebesar 0,134 dengan p-value
asumsi variabel yang lain dianggap tetap. Unstandardized Residual 0,200
5. Koefisien regresi D3 sebesar 0,222 Berdasarkan hasil pengujian tersebut diperoleh
menyatakan bahwa, setiap mahasiswa yang nilai p-value = 2,00 lebih besar dari pada α = 0,05
berasal dari SMA maka akan meningkatkan sehingga H0 gagal ditolak dan dapat disimpulkan
nilai rata-rata IPK mahasiswa statistika bahwa error berdistribusi normal.
sebesar 0,222 dengan asumsi variabel yang
lain dianggap tetap.
6. Koefisien regresi D51 sebesar 0,192
menyatakan bahwa, jika pekerjaan orangtua Uji Heteroskedastisitas
mahasiswa adalah PNS maka nilai rata-rata Uji Heteroskedastisitas dilakukan untuk
IPK mahasiswa tersebut akan meningkat mengetahui homogenitas varians residual dari
model (17). Pengujian dilakukan melalui uji