M. Fathurahman
Staf Pengajar Program Studi Statistika FMIPA Universitas Mulawarman
e-mail : ifadin@yahoo.com
ABSTRACT
Regression analysis is frequentlyused to study forecasting and relation between some variables. In
studying forecasting and relation between some variables using regression, needed the best model. One of
methodsto choose the best regression model is Akaike’s Information Criterion (AIC). This Research aim to study
the best regression modelselected using AIC and appliedto the case of factors influence UNAS score of SMKN 1
Samarinda student.The best regression model obtained by AIC is Y = -0,0094 + 0,4541 X1 + 0,2178 X2 + 0,3291 X3,
with X1 is tryout score, X2 is competition test score, andX3 is examination school score and Y is UNAS score.
From this model knowable that the factors influence of UNAS score SMKN 1 Samarinda student is tryout score,
competition score, and examination school score.
PENDAHULUAN
Analisis regresi merupakan salah satu teknik analisis data dalam statistika yang seringkali
digunakan untuk mengkaji hubungan antara beberapa variabel dan meramal suatu variabel (Kutner,
Nachtsheim dan Neter, 2004).Jika suatu model regresi digunakan untuk tujuan peramalan, maka
diperlukan model terbaik.
Salah satu metode yang dapat digunakan untuk mendapatkan model regresi terbaik adalah
metodeAkaike’s Information Criterion/AIC (Widarjono, 2007).Metode ini mempunyai kelebihan
dibanding menggunakan metode koefisien determinasi (R2) yang banyak digunakan selama
ini.Kelebihan dari metode AIC adalah terutama pada pemilihan model regresi terbaik untuk tujuan
peramalan (forecasting), yaitu dapat menjelaskan kecocokan model dengan data yang ada (in-sample
forecasting) dan nilai yang terjadi di masa mendatang (out of sample forecasting). Adapun kelemahan
dari metodeR2, diantaranya adalah : (1) metode R2hanya digunakan untuk peramalan in sample yaitu
apakah prediksi model bisa sedekat mungkin dengan data yang ada, (2) tidak ada jaminan bahwa
dengan metode R2mampu meramalkan nilai di masa mendatang (out of sample) dengan baik, (3)
metode R2harus digunakan dengan syarat variabel tidak bebas (respon) harus sama, (4) nilai R2 tidak
pernah menurun, jika terus ditambahkan variabel prediktor di dalam model walaupun variabel
prediktor tersebut kurang atau tidak relevan (Widarjono, 2007).
Oleh karena itu penelitian ini mengkaji pemilihan model regresi terbaik menggunakan metode
AIC.Hasil kajian diaplikasikan pada kasus faktor-faktor yang mempengaruhi nilai Ujian Nasional
(UNAS) Sekolah Menengah Kejuruan Negeri (SMKN) 1 Samarinda.Kemudian penelitian ini dibatasi
pada analisis regresi linier, khususnya pada model regresi linier ganda.
ANALISIS REGRESI
Istilah “regresi” pertama kali dikemukakan oleh Sir Francis Galton (1822-1911), seorang
antropolog dan ahli meteorologi terkenal dari Inggris. Dalam makalahnya yang berjudul “Regression
towards mediocrity in hereditary stature”, yang dimuat dalam Journal of the Anthropological Institute,
volume 15, halaman 246 sampai dengan 263, tahun 1885.Galton menjelaskan bahwa biji keturunan
tidak cenderung menyerupai biji induknya dalam hal besarnya, namun lebih medioker (lebih
mendekati rata-rata) lebih kecil daripada induknya kalau induknya besar dan lebih besar daripada
induknya kalau induknya sangat kecil (Draper dan Smith, 1992).
Dalam analisis regresi, diperlukan suatu model yang digunakan untuk mengetahui hubungan
antara variabel tidak bebas (respon) dengan satu atau lebih variabel bebas (prediktor) dan untuk
melakukan peramalan terhadapvariabel respon.Model regresi dapat diperoleh dengan melakukan
Berdasarkan persamaan (2), (3) dan (4), maka diperoleh model regresi linier berganda sebagai
berikut:
y Xβ ε (5)
dengan:
y : vektor variabel respon berukuran n x 1.
X : matriks variabel prediktor berukurann x p, untuk p = k + 1.
: vektor parameter berukuran p x 1.
ε : vektor sisa berukuran n x 1.
Estimasi Parameter
Estimasi parameter ini bertujuan untuk mendapatkan model regresi yang akan digunakan dalam
analisis. Beerapa metode dapat digunakan untuk mengestimasi parameter model regresi, salah satu
diantaranya adalah metode kuadrat terkecil (ordinary least square), yaitu suatu metode estimasi yang
meminimumkan jumlah kuadrat sisa (Kutner et.al, 2004).
Menurut Sembiring (2003) estimator yang diperoleh dengan metode kuadrat terkecil
mempunyai sifat best linear unbiased estimator (BLUE) yaitu estimator yang linier, tidak bias dan
mempunyai variansi yang terkecil dari semua estimator linier tidak bias lainnya.
Berdasarkan persamaan (5), maka estimator kuadrat terkecil bagi adalah sebagai berikut:
βˆ ( X T X ) 1 X T y (6)
Pengujian Parameter
Pengujian parameter berguna untuk mengetahui ada atau tidaknya pengaruh variabel prediktor
terhadap variabel respon.
Pengujian parameter dalam analisis regresi linier berganda terdiri dari dua macam, yaitu
pengujian parameter secara serentak (simultan) dan secara individu (parsial).Berikut ini dijelaskan
kedua jenis pengujian parameter tersebut.
1.Pengujian parameter secara simultan.
Langkah-langkah pengujian ini adalah sebagai berikut (Sembiring, 2003):
H0 : 1 2 k
(Variabel prediktor secara simultan tidak berpengaruh terhadap variabel respon)
H1 : Paling tidak ada satu j tidak sama dengan nol, dengan j = 1, 2, …,k.
(Variabel prediktor secara simultan berpengaruh terhadap variabel respon)
Statistik uji yang digunakan adalah:
βˆ XT Y p
F T
εˆ εˆ n p
denganp adalah banyaknya parameter dalam model regresi.
Daerah kritik:
H0 ditolak bila F F ( , p , n p ) atau
H0 ditolak bila nilai probabilitas ≤ ߙ .
Metode AIC
Metode AIC adalah metode yang dapat digunakan untuk memilih model regresi terbaik yang
ditemukan oleh Akaike(Grasa, 1989).Metode ini didasarkan pada metode maximum likelihood
estimation (MLE).
Untuk menghitung nilai SIC digunakan rumus sebagai berikut:
n
uˆ
2
2k i
AIC e n i 1
(7)
n
dengan:
k = jumlah parameter yang diestimasi dalam model regresi
n = jumlah observasi
u = sisa
METODE
Data yang digunakan dalam penelitian ini adalah diperoleh dari hasil penelitian (Sahrul,
2009).Kemudian variabel-variabel yang digunakan adalah sebagai berikut:
1.Variabel respon adalah rata-rata nilai UNAS (Y).
2.Variabel prediktor adalah rata-rata nilai tryout (X1),nilai uji kompetensi (X2) dan rata-rata nilai ujian
sekolah(X3).
Untuk mengetahui ada atau tidaknya pengaruh variabel prediktor terhadap variabel respon,
maka dilakukan pengujian parameter secara simultan dan secara parsial.Hasil yang diperoleh adalah
seperti pada Tabel 2 dan Tabel 3 berikut.
Berdasarkan Tabel 2 di atas, dapat diketahui bahwa X1 dan X2 pada model 1 secara simultan
berpengaruh terhadap Y atau dapat dikatakan bahwa rata-rata nilai tryout dan nilai uji kompetensi
berpengaruh terhadap Rata-rata nilai UNAS. Hal ini ditunjukkan oleh nilai probabilitasnya (0,00)
kurang dari tingkat signifikansi ( = 0,05). Kemudian X1 dan X3 pada model 2 secara simultan
berpengaruh terhadap Y atau dapat dikatakan bahwa rata-rata nilai tryout dan rata-rata nilai ujian
sekolah berpengaruh terhadap Rata-rata nilai UNAS. Hal ini ditunjukkan oleh nilai probabilitasnya
(0,00) kurang dari tingkat signifikansi ( = 0,05). Selanjutnya X2 dan X3 pada model 3 secara simultan
berpengaruh terhadap Y atau dapat dikatakan bahwa nilai kompetensi dan rata-rata nilai ujian sekolah
berpengaruh terhadap Rata-rata nilai UNAS. Hal ini ditunjukkan oleh nilai probabilitasnya (0,00)
kurang dari tingkat signifikansi ( = 0,05). Kemudian X1, X2 dan X3 pada model 4 secara simultan
berpengaruh terhadap Y atau dapat dikatakan bahwa rata-rata nilai tryout, nilai kompetensi dan rata-
rata nilai ujian sekolah berpengaruh terhadap Rata-rata nilai UNAS. Hal ini ditunjukkan oleh nilai
probabilitasnya (0,00) kurang dari tingkat signifikansi ( = 0,05).
Tabel 3.Hasil pengujian parameter secara parsial
Mode
Variabel Koefisien t Prob.
l
1. Konstanta 2,5779 5,8867 0,0000
X1 0,6706 12,5843 0,0000
2. Konstanta 0,6921 0,7669 0,4483
X2 0,9215 8,1842 0,0000
3. Konstanta -2,9093 -1,9087 0,0645
X3 1,3802 7,2046 0,0000
Berdasarkan Tabel 3 di atas, terlihat bahwa secara parsial X1 berpengaruh terhadap Y atau dapat
dikatakan bahwa rata-rata nilai tryout berpengaruh terhadap rata-rata nilai UNAS. Hal ini ditunjukkan
oleh nilai probabilitasnya (0,00) kurang dari tingkat signifikansi ( = 0,05). Kemudian X2 pada model
2 secara parsial berpengaruh terhadap Y atau dapat dikatakan bahwa nilai uji kompetensi berpengaruh
terhadap rata-rata nilai UNAS. Hal ini ditunjukkan oleh nilai probabilitasnya (0,00) kurang dari
tingkat signifikansi ( = 0,05). Selanjutnya X3 pada model 3 secara parsial berpengaruh terhadap Y
atau dapat dikatakan bahwa rata-rata nilai ujian sekolah berpengaruh terhadap rata-rata nilai UNAS.
Hal ini ditunjukkan oleh nilai probabilitasnya (0,00) kurang dari tingkat signifikansi ( = 0,05).
Setelah dilakukan estimasi dan pengujian parameter, selanjutnya dilakukan pemilihan model
regresi terbaik menggunakan metode AIC.Hasil yang diperoleh adalah seperti pada Tabel 4 berikut.
KESIMPULAN
Berdasarkan hasil dan pembahasan, maka dapat disimpulkan bahwa model regresi terbaik yang
dapat digunakan untuk mengetahui hubungan antara rata-rata nilai UNAS siswa SMKN 1 Samarinda
dengan rata-rata nilai tryout dan nilai kompetensi dan rata-rata nilai ujian sekolahmenurut metode AIC
adalah:
Y = -0,0094 + 0,4541 X1 + 0,2178 X2 + 0,3291 X3
Dari model ini dapat diketahui bahwa faktor-faktor yang mempengaruhi nilai UNAS siswa
SMKN 1 Samarinda adalah nilai tryout, nilai kompetensi dan nilai ujian sekolah.
DAFTAR PUSTAKA
LAMPIRAN
No. X1 X2 X3 Y
1 8.59 8.18 8.04 8.17
2 8.6 8.65 8.53 8.4
3 8.29 8.7 8.14 8.57
4 9.82 8.98 8.19 8.95
5 8.89 8.85 8.03 8.6
6 8.28 8.18 8.11 8.53
7 9.89 8.5 8.51 9.1
8 8.79 8.28 8.17 8.47
9 8.89 8.6 8.31 8.52
10 8.62 7.45 7.61 8.07
11 7.18 7.33 7.46 7.72
12 8.52 8.25 8.33 8.2
13 8.61 7.93 8.14 8.13
14 7.76 7.65 7.73 7.73
15 8.84 8.4 8.35 8.5
16 9.57 8.53 8.47 9.3
17 8.83 8.48 8.17 9.13
18 8.5 8.3 7.9 8.53
19 6.41 6.08 7.61 6.97
20 8.64 8.03 8.26 8.27
21 8.91 8.08 7.94 8.57
22 6.94 7.38 7.62 7
23 6.81 7.5 7.36 6.88
24 7.46 7.78 7.72 7.55
25 7.44 7.6 7.84 7.68
26 8.09 8.15 8.24 8.17
27 8.2 8.09 8.16 8.13
28 8.72 8.08 8.25 8.23
29 7.76 7.67 8.08 7.38
30 7.06 7.64 8.05 7.75
31 7.74 7.65 7.55 7.58
32 7.24 7.93 7.5 7.9
33 7.78 7.85 7.56 7.48
34 7.82 7.9 7.5 7.48
35 7.54 7.73 7.58 7.38
36 7.58 7.95 7.58 7.53
37 7.97 7.58 7.54 7.75
Sumber : Sahrul (2009) diolah.