Analisis regresi pada umumnya digunakan untuk keperluan uji hipotesis yang
berkaitan dengan prediksi dan eksplanasi. Contoh pemakaian analisis regresi untuk keperluan
prediksi adalah penggunaan skor tes SNMPTN untuk memprediksikan/meramalkan
keberhasilan belajar calon mahasiswa di perguruan tinggi. Sedangkan pemakaian analisis
regresi untuk keperluan eksplanasi adalah untuk mengungkapkan faktor-faktor yang
menentukan suatu fenomena. Misalnya, untuk mengungkapkan faktor-faktor yang
mempengaruhi prestasi belajar seseorang. Permasalahan yang pertama tentang prediksi dan
permasalahan yang kedua tentang eksplanasi, keduanya bisa diselesaikan dengan teknik
analisis regresi. Pada dasarnya teknik ini berusaha menganalisis peranan setiap ubahan
(prediktor) dalam menentukan besarnya varians dari suatu ubahan yang ada pada fenomena
yang diteliti (ubahan kriterium).
Seperti pada teknik korelasi, teknik analisis regresi menggunakan asumsi adanya
hubungan yang linier atau berupa garis lurus antara variabel prediktor dengan variabel
kriterium. Teknik analisis regresi yang menggunakan asumsi hubungan linier disebut regresi
linier. Adapun bentuk umum persamaan garis regresi Y atas X, dimana X adalah ubahan
prediktor adalah :
Y = a + b X regresi sederhana dengan sebuah ubahan X
Y = a + b1.X1 + b2.X2 + .+bn.Xn
Pada prinsipnya teknik analisis regresi ini adalah menentukan suatu garis lurus (garis
regresi/garis prediksi) yang paling tepat diantara penyebaran titik-titik ploting (scatter-plot).
Garis regresi yang tepat ini harus memenuhi syarat sebagai berikut:
1. Berupa garis lurus atau memenuhi persamaan linier
2. Jumlah kuadrat penyimpangan skor pengamatan dan skor yang diramalkan adalah
Y Y^ 2
minimum
= minimum (metode least square).
Y= a + bx
a = intersep/ konstanta
= harga Y bila X = 0
b = Slope/ koef. arah = tg arah
Berdasarkan konsep kuadrat terkecil (least square) inilah, maka koefisien a dan b dapat
dihitung.
Rumus :
n . X 2
( Y ) ( X 2 ) ( X ) ( XY )
a=
n . X 2
n . XY ( X ) ( XY )
b=
xy
b= x 2
Contoh :
Akan diteliti mengenai peranan motivasi (X) terhadap prestasi belajar (Y) pada
sekelompok siswa yang terdiri dari 30 orang. Dari tiap-tiap siswa yang diteliti tersebut dicatat
tentang dua karakteristik, yaitu motivasi (X) dan prestasi belajarnya (Y). Adapun datanya
disajikan dalam tabel berikut.
Resp.
X2
Y2
XY
1
2
3
4
34
38
34
40
32
36
31
38
1156
1444
1156
1600
1024
1296
961
1444
1088
1368
1054
1520
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
n= 30
30
40
40
34
35
39
33
32
42
40
42
42
41
32
34
36
37
36
37
39
40
33
34
36
37
38
1105
29
35
33
30
32
36
31
31
36
37
35
38
37
30
30
30
33
32
34
35
36
32
32
34
32
34
1001
dst
dst
dst
41.029
33.599
37.094
Berdasarkan data-data diatas, maka koefisien a dan b dapat dihitung sebagai berikut:
X
n . X 2
( Y ) ( X 2 ) ( X ) ( XY )
a=
1.105
2
30.(41.029)
( 1001 ) ( 41.029 ) ( 1.105 )( 37.094 )
a=
n . X 2
n . XY ( X ) ( XY )
b=
atau b=
1.105
30.( 41.029)
30.(37.094)( 1.105 ) (1.001 )
b=
xy
x2
= 0,68
^
bentuk dasarnya : Y = +.X) dengan Y hasil pengamatan ( Y =a+bx .
H0 : = 0 tidak berarti
H0 : Pop. b 0
H0 : 0 berarti
Untuk uji kelinieran diperlukan adanya beberapa pengulangan atau kelompok data x.
Tiap kelompok terdiri atas beberapa data x yang berharga sama, sementara harga-harga Y
pasangannya tetap seperti pasangan data semula.
Dengan pengelompokan data x yang berharga sama tersebut, akan diperoleh bahwa
pada kelompok pertama, ada n, buah data x yang masing-masing harganya sama yaitu x1
berpasangan dengan Y yang umumnya harganya berbeda-beda. Pada kelompok dua, ada n2
buah data x yang masing-masing harganya sma yaitu x2 berpasangan dengan Y yang
harganya berbeda-beda dan begitu seterusnya. Seluruhnya ada k buah kelompok yang dalam
tiap kelompoknya harga-harga x nya sama besar. Berdasarkan data dimuka, maka
pengelompokkan harga-harga x yang sama tersebut dapat dilihat pada table berikut:
X
30
32
32
33
33
34
34
34
34
34
35
36
36
36
37
37
37
38
38
39
39
40
40
40
40
40
41
42
42
42
Kelompok
1
2
Ni
1
2
5
6
1
3
10
11
12
1
3
Y
29
31
30
31
32
32
31
30
30
32
32
30
32
34
33
34
32
36
34
36
35
38
35
33
37
36
37
36
35
38
Berdasarkan data pengelompokan harga-harga yang telah disajikan pada table diatas,
maka uji kelinieran dan keberartian regresi dapat dilakukan terlebih dahulu menghitung
jumlah kuadrat (jk) untuk berbagai sumber variasi. Sumber variasi tersebut adalah total atau
jk (T), regresi (a), regresi (bIa), sisa atau resida, tuna cocok dan galat atau kekeliruan (error).
Jk untuk berbagai sumber variasi tersebut berturut-turut diberi symbol dengan jk (T), jk (a),
jk (bIa), jk (s) atau jk res, jk (TC) dan jk (G) atau jk (E), dan dapat dihitung dengan rumusrumus sebagai berikut :
Jk ( T )= Y 2
2
( Y )
Jk ( a )=
n
( Y )
Dalam persamaan umum dipersatukan manjadi Jk total Jk tot =Y = Y n
2
Jk ( bIa )=b . xy
( X ) (Y )
Jk reg =b . y biasa disebut jk regresi
n
Jk (G) = JK (E) =
Y 2
xi
(Y )2
Jk res =Jk G
Setiap sumber variasi tersebut memiliki derajat kebebasan atau dk, yang besarnya
berturut-turut n untuk total, 1 untuk regresi (a), 1 untuk regresi (bIa), (n-2) untukn sisa/
residu, (k-2) untuk tuna cocok dan (n-k) untuk galat/ error. Selanjutnya dapat ditentukan
harga rerata jumlah kuadrat atau Rjk untuk masing-masing sumber variasi yakni dengan cara
membagi jk oleh dk-nya masing-masing.
s 2 G atau
sis atau
disusun dalam daftar analisis varians (ANAVA) untuk regresi linier sederhana (Tabel
Rangkuman Regresi).
Besaran-besaran yang ada dalam dftar anava tersebut, khususnya pada kolom Rjk,
digunakan untuk menguji hipotesis :
1. Koefisien arah regresi tidak berarti melawan hipotesis tandingan bahwa koefisien arah
regresi berarti H0 : Pop bi = 0 VS Ha : Pop bi.
2. Bentuk regresi linier, melawan hipotesis tandingan bahwa bentuk regresi non linier.
Kedua hipotesis diatas diuji dengan menggunakan statistic F yang dibentuk oleh
perbandingan dua Rjk.
Untuk menguji hipotesis (1) dipakai statistic F=
s 2 reg /
reg/ s
res
F( 1 )(1 ;n2)
s 2 TC /
s 2 E yang selanjutnya
dk
Total
Jk
Y 2
Regresi (a)
Jk (a)
Rjk
Y 2
Jk (a)
F
-
Regresi (bIa)
Jk (bIa)
Residu / sisa
n-2
Jk res
Tuna cocok
k-2
Galat /Error
n-k
Jk (TC)
Jk (E)
Jk res
n2
Jk (TC )
k2
S TC2
S E2
S res 2=
S TC2=
S E 2=
S reg2
Sres 2
Jk ( E)
nk
Berdasarkan rumus-rumus diatas, maka berdasarkan data yang telah disajikan dimuka
^
selanjutnya akan diuji apakah persamaan garis regresi Y =8,24 +0,68 x tersebut memiliki
bentuk linier dan koefisien arah regresi yang berarti ataukah tidak.
Jk total=Jk ( T )= Y 2=33,599
Y
1.001
Jk (a) =
= 33.400,03
Jk (bIa) = b.
xy
= 0,68
( X ) ( Y )
n
37.094
( 1.105 ) (1.001)
30
= 151,75
Jk (G) = Jk (E) =
xi
(Y )2
Y
2
29 2
}{
( 31+ 30)
292
+ 312 +302
1
2
36 2+ 352+ 382
(36+35+ 38)2
3
} {
+
312 +322
(31+30)
+ .
2
Jk res
Selanjutnya harga-harga tersebut diatas dimasukkan dalam tabel anava sebagai berikut :
^
Anava untuk regresi linier Y =8,24 +0,68 x
Sumber Variasi
Total
Regresi (a)
Regresi (bIa)
Residu / sisa
Tuna cocok
Galat /Error
dk
Jk
33,599
33,400,03
151,75
47,22
9,55
37,67
30
1
1
28
10
18
Rjk
151,75
1,69
0,96
2,09
F( 1 ) ;(1,28)
F( 1 ) ;(1,28)
< Fhitung
= 2,43
=4,20
F
89,79
0,45
F( 1 ) ;(10,18)
H0 : diterima
KETELITIAN PREDIKSI :
Kesalahan prediksi dapat dinyatakan dengan simppangan baku dari Y untuk harga x
tertentu. Jadi, regresi
Y^ =a+bx
merupakan taksiran terhadap regresi Y= + x dalam populasi, dimana n buah pasangan data
yang dipakai untuk menentukan
Y^ =a+bx
Y^ =a+bx
(Error). Perbedaan ini merupakan galas (error)cyang apabila dihitung Jk-nya kemudian dibagi
dengan dk yaitu (n-2), maka akan diperoleh varians galas (error) taksiran Y untuk x tertentu,
2
yang dilambangkan dengan S y . x , dan dapat dihitung dengan rumus sebagai berikut :
S 2 y . x=
(Y Y^ )2
n2
Varians
S2 y . x
Jk residu
2 y . x
dalam populasi
y. x
sama besar.
Variansnya homogen (disebut : homoscedasticity)
2. Distribusi Y untuk tiap kelompok harga x tertentu adalah normal, dengan rata-rata
(+x).
Pengujian dua asumsi ini dapat dilakukan dengan menggunakan scatter plot (scatter
diagram).
S a2
dan
varians untuk koefisien arah regresi b, yaitu Sb. Adapun rumusnya sebagai berikut :
S a2=S y. x 2
^
X
1
+
n
^2
X
( X )2
2
x
n
S b2=
S y . x2
2
2 ( X )
x
n