Anda di halaman 1dari 12

STATISTIKA SESI 12

BAB VIII
KORELASI DAN REGRESI SEDERHANA

8.1 Sifat-Sifat yang dimiliki r2

1. Nilai r2 selalu non-negatif, sebab merupakan rasio dari jumlah kuadrat.

r2 =
∑ ^y 2i ,∑ y2i ≥ 0,
2
∑ ^y i ≥ 0
∑ y 2i
2. Nilai terkecil 0 dan terbesar 1, yaitu 0 ≤ r2 ≤ 1.
r2 = 0, berarti tak ada hubungannya antara X dan Y.
Garis regresi Y = a + bX tak tepat/cocok untuk meramalkan Y. Kalau r 2 = 1, garis regresi
tepat/cocok secara sempurna (perfect fit). Jadi sangat cocok untuk meramalkan Y, kalau X sudah
diketahui nilainya. Dalam hal ini, variasi (naik turunnya) Y, seluruhnya (100%) disebabkan oleh
X. Dalam prakteknya jarang terjadi.

Contoh soal 1 :

X = upah harian karyawan suatu perusahaan (ribuan Rp)

Y = konsumsi harian karyawan suatu perusahaan (ribuan Rp)

X 21 19 23 25 20
Y 20.1 18.5 22.7 23 20.4

^ = a + bX , berapa ramalan Y, kalau X = 10.


a.) Dengan persamaan regresi Y
b.) Hitung r & r2, apa artinya masing -masing.
1
c.) Hitung S2e = ∑ e 2i
n−2
d.) Hitung Sb = standard eror perkiraan dari b
Se
= 2 (Sb perkiraan dari σ b)
√∑ x i

Pemecahan :
X Y X2 Y2 XY x y xy x2 y2
21 20,1 441 404,01 422,1 -0,6 -0,9 0,54 0,36 0,81
19 18,5 361 342,25 351,5 -2,6 -2,5 6,5 6,76 6,25
23 22,7 529 515,29 522,1 1,4 1,74 2,436 1,96 3,0276
25 23 625 529 575 3,4 2,04 6,936 11,56 4,1616
20 20,4 400 416,16 408 -1,6 -0,6 0,96 2,56 0,36
X Y X2 Y2 XY x y xy x2 y2
15 11,3 225 127,69 169,5 3,8 3,21 12,198 14,44 10,3041
22 15 484 225 330 -0,6 -1,4 0,84 0,36 1,96
18 17,8 324 316,84 320,4 -2,7 -2,3 6,21 7,29 5,29
20 20,4 400 416,16 408 3,2 1,15 3,68 10,24 1,3225
25 28 625 784 700 0,4 2,11 0,844 0,16 4,4521
21 25 441 625 525 -3,3 -4,1 13,53 10,89 16,81
17 14,1 289 198,81 239,7 1,7 -3,6 -6,12 2,89 12,96
13 21,4 169 457,96 278,2 2,4 2,24 5,376 5,76 5,0176
25 22 625 484 550 -1,8 -3,9 7,02 3,24 15,21
14 19,2 196 368,64 268,8 1,8 -2,3 -4,14 3,24 5,29
20 15 400 225 300 2,7 2,28 6,156 7,29 5,1984
27 17,7 729 313,29 477,9 -2,2 1,04 -2,288 4,84 1,0816
13 23,6 169 556,96 306,8 2,2 -1,1 -2,42 4,84 1,21
28 18,8 784 353,44 526,4 3,1 3,11 9,641 9,61 9,6721
16 12,9 256 166,41 206,4 -2,3 -3,4 7,82 5,29 11,56
∑ 2 2
∑X ∑Y ∑Y ∑ XY ∑x ∑y ∑ xy ∑x ∑ y2
X2
386, 847 7825,9 113,5 121,947
402 7885,8 8,4 -7,18 75,719
9 2 1 8 6

402 X = X – X́
X́ = = 20,1
20
386,9 ^ –Y
Y=Y
Y^ = =
20
19,34

n ∑ xi y i−∑ x i ∑ y i
B =
n ∑ x 2i −¿ ¿ ¿ ¿

20 (7.885,8 )−( 402 ) (386,9)


=
20 ( 8.472 )−(402)2

157.716−155.533,8 2.182,2
=
169.440−161.604
= 7.836

= 0,2784

a=Y^ −b X́
¿ 19,34 – 5,5975 (x)
¿ 13,747
a) Y^ = a + bX = 5,4095 + 0,7405 X
^ = 13,747 + 0,2784 (10)
Jika X = 10, ramalan Y = Y
= 13,747 + 2,784
= 16,531
Jadi kalau upah harian mencapai Rp 10.000,-, maka konsumsi diramalkan akan mencapai
Rp 16.531.
n ∑ X i Y i− ∑ X i Y i
b) r= 2
√ n ∑ X −¿ ¿¿ ¿ ¿
i

2 2
= √ n ∑ X −¿ ¿¿ ¿ = √ 20 ( 8472 )−( 402 ) = √ 7836 = 88,5
2 2
= √ n ∑ Y −¿ ¿ ¿ ¿ = √ 20 ( 7825,91 )−( 386,9 ) = √ 6826,59 = 82,6
i

2.182,2
r= = 0,30
( 88,5 ) (82,6)
r = koefisien korelasi untuk mengukur kuatnya hubungan antara X dan Y, r = 0,30 berarti
hubungan sangat tidak kuat.
r2 = 0,09 ini berarti bahwa variasi Y, sebanyak 9% disebabkan oleh pengaruh linear X, sedangkan
sisanya 91% disebabkan oleh faktor lain.

1 1
S2e = 2 2 2
c) ∑e i = {∑ yi – b2∑ x i }
n−2 3

∑ y2i = ∑ Y 2i – ( ∑Yi)2 /n = 2007 – (105)2 / 20


= 2007 – 551,25 = 1455,75

∑ x 2i = ∑ X 2i – ( ∑Xi) / n = 2356 – (108)2 / 20


= 2356 – 583,2 = 1772,8
1
S2e = { 1455,75 – (0,7405)2 (1772,8) }
3
1
= ( 1455,75 – 972,10) = 157,88
3
Se 12,57
d) Sb = = √157,88 = = 0,299
√∑ x √1772,8 42,10
2
i
Contoh Soal 2 :
X = pendapatan bulanan karyawan swasta (ribuan rp)
Y = Konsumsi bulanan (ribuan rp)

X 120 100 110 160 220 150 250 280 230 240
Y 100 90 95 135 150 130 155 170 150 160

a) Hitung a, b dan tulis pinjaman regresi linear Y = a + bx (dengan metode kuadrat terkecil). Apa
arti b ?
b) Hitung Var (a), Sa !
Hitung Var (b), Sb !
c) Hitung r2 ! Apa arti r2 ?

Pemecahan :

X Y X2 Y2 XY
120 100 14.400 10.000 12.000
100 90 10.000 8.100 9.000
110 95 12.100 9.025 10.450
160 135 25.600 18.225 21.600
220 150 48.400 22.500 33.000
150 130 22.500 16.900 19.500
250 155 62.500 24.025 38.750
280 170 78.400 28.900 47.600
230 150 52.900 22.500 37.500
240 165 57.600 27.225 39.600
∑ Xi ∑ Yi ∑ X 2i ∑ Y 2i ∑ XY
1.860 1.340 384.485 187.400 266.000

1
X́ = ∑ X i= 1860/10 = 180
n

1
Ý = ∑ Y i = 1340/10 = 134
n

2
∑ X 2i = ∑ (X i − X́ ) = ∑ ( X i −2 X i X + X́ 2)

= ∑ X 2i – 2 X́ ∑ X i + n X́ 2

= ∑ X i2−2
∑ X i −X i + n ∑ X i ∑ X i
n nn
= ∑ X 2i −¿ ¿
∑Y 2i = ∑ Y 2i – (∑ Y i )2 /n
∑ X i∑ Y i
∑XiYi = ∑ ( X i− X́ )( Y i−Ý ) =∑ X i Y i−
n

Catatan ! ∑ X 2i , ∑Y 2i dan ∑ X i Y i , bisa juga dihitung secara langsung dengan rumus

2 2
∑ ( X i− X́ ) , ∑ ( Y i −Ý ) dan ∑ ( X i− X́ )( Y i−Ý )

∑ X 2i = 384400 – 18602 /10 = 384400 – 345960 = 384440

∑ X i Y i = 266000 – (1860) (1340) /100

= 266000 – 249240

= 16760

∑ xi y i 16760
b = = 2 = 0,4360042 = 0,436
∑ X 38440
i

a = Ý – b X́ = 134 – 0,4360042 (186)

= 134 – 81,096774 = 52,903226

a) Ŷ = a + bX = 52,903226 + 0,436 X
b = 0,436 artinya kalau pendapatan bulanan naik Rp 1.000, maka konsumsi bulanan akan naik Rp
436.

b) Var (a) =S
2 ∑ X 2i , S 2= ∑ e 2i = ∑ y 2i −b 2 ∑ x 2i
e e
n ∑ X 2i n−2 8

∑ y2i = 187400 – (1340) /10 2

b 2 ∑ x 2i 2
= (0,4360042) 38440 = 7307,431
7840−7307,431
S2e = = 66,571125
8
384400
Var (a) = 66,571125
10(38440)
= 66,571125
Sa = √ Var (a) = 8,159113
Var (b) = S2e / ∑ x 2i
= 66,571125 / 38400 = 0,0017318
Sb = √ Var ( b ) = 0,0416149
2
∑ XiY i ( 16760)2 280897600
c) R 2
= = = 301369600 = 0,9320701
∑ xi2 ∑ y 2i ( 38440 ) (7840)

Artinya, besarnya sumbangan pendapatan (X) terhadap variasi (naik turunnya) konsumsi (Y)
sebesar 93% sedangkan sisanya sebesar 7% disebabkan oleh faktor lainnya.
Gambar : Garis Regresi Sampel

Y
Y^ i=52,903226+ 0,436 X i

III
(y)
a = 0,436

52,903226
x
170


BAB IX
ANALISIS REGRESI

Analisis regresi merupakan teknik analisis yang khas untuk penelitian korelasi. Analisis korelasi
adalah analisis yang berusaha untuk melihat apakah antara dua variabel atau lebih ada hubungan atau
tidak, mengukur kekuatan hubungannya, membuat ramalan yang didasarkan kepada kuat lemahnya
hubungan tersebut. Teknik anlisis ini berguna untuk mempelajari variabel-variabel yang mempunyai
hubungan berdasarkan teori yang dibangun sebelumnya sehingga arah pertalian diharapkan dapat
ditemukan.

9.1 Analisis Regresi sederhana

Jika skala pengukuran data dari dua variabel yang akan dianalisis merupakan interval atau rasio maka
untuk menjelaskan hubungan antara kedua variabel tersebut dapat dilakukan dengan menggunakan regresi
sederhana. Misalkan kedua variabel tersebut adalah X dan Y, maka hubungan antara Y dan X atau biasa
disebut dengan regresi Y atas X. Variabel X disebut variabel bebas (predictor) dan Y disebut variabel tak
bebas (criterion). Hubungan tersebut dinyatakan dalam suatu persamaan matematika sebagai berikut :
Model : Y = α +βX + ∈ (populasi)

Fungsi Taksiran : Y = a + bX (sampel)

Dimana a = konstanta b = koefisien regresi, yang dapat diperoleh dari data sampel. Untuk keperluan itu
dibutuhkan pasangan data (X,Y) sebanyak n, misalkan sebagai berikut:

NO
SUBYE X Y
K
1 X1 Y1
2 X2 Y2
3 X3 Y3
4 X4 Y4
, , ,
, , ,
, , ,
n Xn Yn

Dengan persyaratan sampel yang terpilih adalah sampel random dari populasinya normal, dan homogen.
Dari perhitungan melalui pasangan data (X,Y) dapat ditentukan :
(1) Persamaan atau modal regresi Y atas X
(2) Linearitas dan signifikasi regresi Y atas X
(3) Koefisien korelasi dan koefisien determinasi

Contoh :
Apabila kita membahas hubugan antara kompetensi (X) dan kinerja pegawai (Y). Untuk itu kita ambil
sampel acak sebanyak 12 orang sebagai berikut :

No
X Y
Subyek
1 45 6
2 50 19
3 30 23
4 50 20
5 55 10
6 50 25
7 63 30
8 48 15
9 35 6
10 26 19
11 45 29
No
X Y
Subyek
12 60 21

Pertanyaan :
a. Tentukan persamaan regresi Y atas X
b. Lakukan pengujian
(i) Linearitas regresi Y atas X
(ii) Signifikasi/keberartian dan koefisien determinasi Y dan X
c. Hitung koefisien korelasi dan koefisien determinasi Y dan X

Penyelesaian :
Untuk menjawab persoalan regresi sederhana di atas, terlebih dahulu membuat tabel persiapan atau tabel
kerja. Tabel ini berguna untuk memudahkan dalam menghitung jumlah kuadrat dan jumlah hasil kali
variabel X dan Y (terutama untuk pemula), sebagai berikut:

No
X X2 Y Y2 XY
Subyek
1 45 2025 6 36 270
2 50 2500 19 361 950
3 30 900 23 529 690
4 50 2500 20 400 1000
5 55 3025 10 100 550
6 50 2500 25 625 1250
7 63 3969 30 900 1890
8 48 2304 15 225 720
9 35 1225 6 36 210
10 26 676 19 361 494
11 45 2025 29 841 1305
12 60 3600 21 441 1260
Jumlah 557 27249 223 4855 10589

9.1.1 Menentukan persamaan regresi Y atas X (Y = a +bX)

Dari tabel di atas, dapat ditentukan persamaan atau model regresi sebagai berikut :
Y = a + bX

b=
∑ xy
∑ x2
^ −b X́
a=Y
dimana,
∑X = 557, ∑X2 = 27,249, X́ 1 = 46,42
∑Y = 223, ∑Y2 = 4,855, Y^ = 18,6

∑XY = 10.589

( 557 ) (223)
∑xy = ∑XY – ¿ ¿ = 10.589 – = 238,08
12
(∑ X )2 (557)2
∑x2 = ∑X2 – = 27.249 – = 1.394,92
n 12
(223)2
∑y2 = ∑Y2 – ¿ ¿ ¿ = 4.855 - = 710,92
12
238,08
b = = 0,1706
1.394,92
a = 18,6 – (0,1706)(46,42) = 10,680
Persamaan regresi Y atas X adalah : Y = 10,680 +0,1706 X

9.1.2 Uji Linieritas dan Signifikansi Regresi Y atas X

Pengujian linieritas dan signifikansi regresi Y atas X dilakukan dengan langkah-langkah sebagai
berikut :
(i) Menghitung jumlah Kuadrat (JK) Beberapa Sumber Varians
JK (T) = ∑y2 = 4.855
JK (a) = ¿ ¿ = 4.144,083
JK (b/a)= b∑xy = (0,1706)(238,08) = 40,616
JK(S) = JK(T) – JK(a) – JK (b/a) = 4.855 - 4.144,083 - 40,616 = 670,301
i=12
JK (G) = ∑ {∑ Yi – ¿ ¿ }
2

i=1

Untuk itu data terlebih dahulu diurut menurut variabel X

X 2 3 3 4 4 4 5 5 5 5 6 6
Y 1 2 6 6 2 1 2 2 1 1 2 3

(35)2 (64) 2
JK (G) = (62 + 292 – ) + (252+202+192 – ) = 243,833
2 3
JK (Tc) = JK (S) – JK(G) = 670,301 – 243,833 = 426,468
(ii) Menentukan Derajat Bebas (db) Beberapa Sumber Varians
db (T) = n = 12
db (a) = 1
db (b/a) = 1
db (S) = n-2 = 12 – 2 = 10
db (G) = n - k = 12 - 10 = 2 (k = 10)
db (Tc) = k - 2 = 12 – 2 = 10
(iii) Menghitung Rata – rata Jumlah Kuadrat (RJK)
JK ( a) 4144,083
RJK (a) = = = 4144,083
db (a) 1
JK (b/a) 40,616
RJK (b/a) = = = 40,616
db(b /a) 1
JK ( S) 670,301
RJK (S) = = = 67,030
db( S) 10
JK (G) 243,833
RJK (G) = = = 121,92
db(G) 2
JK (Tc) 426,468
RJK (Tc) = = = 42,647
db (Tc) 10
(iv) Menentukan Fhitung
Fhitung yang akan ditentukan adalah berkaitan dengan uji lineritas dan uji signifikasi regresi.

Uji Lineritas Regresi Y atas X

Ho : Y = α + β X (regresi linear)
H1 : Y ≠ α + β X (regresi tak linear)
RJK (Tc) 42,647
Fhit (Tc) = = = 0.350
RJK (G) 121,92
Ftab (0.05 : 10;3) = 8,78 dan Ftab (0.01:10;3) = 27.23
Sehingga Fhit (Tc) lebih kecil atau sama dengan F tab, ini berarti Ho diterima. Demikian regresi Y
atas X adalah linear.
9.1.3 Koefisien Korelasi dan Uji Signifikansi Koefisien Korelasi X dan Y

Koefisien korelasi adalah koefisien yang memperlihatkan tingkat keeratan hubungan antara
variabel X dan Y.

(i) Koefisien Korelasi antara X dan Y

xy 238,08
rxy = ∑ =
√ ¿¿ ¿ √( 1394,92 ) (710,92) = 0,239
Jadi koefisien korelasi antara X dan Y adalah 0,239
(ii) Uji Signifikansi Koefisien Korelasi X dan Y
Ho : ρ ≤ 0
H1 : ρ > 0
rxy √ n−2 0,239 √ 10
thitung = = = 0,778
√1−r 2 xy √ 1−(0.239) 2
0,778 √12−2
= = 5,21
√(1−0.777)
ttab (0.95:10) = 1.81 dan ttab (0.99 : 10) = 2.76
Sehingga thitung > ttab atau Ho ditolak. Ini berarti bahwa korelasi antara X dan Y adalah sangat
signifikan. Karena koefisien korelasi adalah positif, maka dapat dikatakan bahwa koefisien
korelasi antara X dan Y bersifat positif dan sangat signifikan artinya, makin tinggi kompetensi
makin tinggi pula kinerja pegawai yang dapat dicapai.
(iii) Koefisien Determinasi
Koefisien Determinasi adalah sebuah koefisien yang memperlihatkan besarnya variasi yang
ditimbulkan oleh variabel bebas (predictor) yang dinyatakan dengan presentase. Koefisien
Determinasi didefinisikan sebagai kuadrat dari koefisien korelasi. Sehingga untuk hasil analisis di
atas, koefisien determinasi antara X dan Y adalah kuadrat dari r xy = 0,239, yaitu r2xy =0,239.
Koefisien mengandung makna bahwa 23,9% variasi kinerja pegawai dapat dijelaskan oleh
kompetensi.

Anda mungkin juga menyukai