Anda di halaman 1dari 15

REGRESI DAN KORELASI SEDERHANA

2.1. PENDAHULUAN

Analisa pasangan variabel membutuhkan data yang terdiri dari 2 kelompok hasil obscrv asi atau pengukuran. Data yang dapanliperoleh dari pelbagai bidang kegiatan yang menghasilkan pasangan observasi sebanyak n, dinyatakan sebagai (Xi; v»

Di dalam penelitian ilmiah, selain ingin menunjukkan hubungan antara dua variabel atau lebih dan mengukur hubungan itu, juga ingin dapat meramalkan sesuatu, yaitu menentukan nilai suatu variabel sesudah mengetahui nilai-nilai variabel yang lain. Untuk dapat meramal, hams diketahui dulu hubungan antara variabel-variabel itu. Yang berhubungan dengan peramalan dan kesalahan peramalan, dinamakan proses regresi, Sedangkan pengukuran hubungan antara variabel, dinamakan proses korelasi.

Definisi :

Regresi dan korelasi sederhana adalah suatu eara untuk mengetahui hubungan antara satu variabel dengan satu variabel yang lain.

Jika pasangan observasi pengukuran (x; y) digambarkan di atas kertas berskala hitung, akan diperoleh serangkaian titik-titik koordinat yang menghubungkan kedua hasil observasi,

45

y

Penggambaran demikian dinamakan diagram pencar (scatter diagram).

Dari diagram pencar dapat ditarik suatu garis yang menggambarkan nilai rata-rata y terhadap x, sehingga diperoleh persamaan garis regresi.

y





nllal-nilai observasi • ~ (sample points)





• •

• •













Ol~--------------------~X

Gb.l.1. Scatter Diagram

nllal-nilal observasi (sample points)

~







O·~----------------------x

Gb.1.2. S.D. dengan Garis Lengkung

y



nllal-nllal observasi

~ (sample points) •

. ~ .



O~----------------------------x

Gb.l.3. Scatter Diagram dengan garis linear

Biasanya yang sering digunakan dan mudah untuk perhitungan, digunakan persamaan garis linear dari Scatter Diagram dengan garis lurus seperti di atas.

Persamaan garis linear :

dimana: Jl

y/x

A

B

II/ = A + BX I'"'yx

= rata-rata populasi y terhadap x = jarak antara 0 dengan sumbu Y = koefisien regresi / kemiringan

46

1\

Y = a + bx

2.2. METODE KUADRAT MINIMUM (Least Squares)

Prosedur statistik untuk memperoleh garis lurus dengan "kesesuaian terbaik" (best fitting) untuk serangkaian titik dari pasangan data bisa kita peroleh dengan meminimumkan penyimpangan (deviasi) titik-titik dari garis yang akan kita buat. .

Rata-rata populasi y terhadap x biasanya tidak diketahui, sehingga digunakan suatu garis penduga (garis regresi).

Persamaan garis penduga :

dim ana : y = penduga untuk Ily/x

a = penduga untuk nilai A b = penduga untuk nilai B

y

~ = A + BX

o~-------------------------

x

Gb.1.S. Persamaan Garis Linear

Dengan prinsip kuadrat minimum (principle of least squares), dapat dibuat suatu garis lurus yang memiliki "kesesuaian terbaik", yaitu pilih sebuah garis dengan "kesesuaian terbaik" yang meminimumkan jumlah kuadrat penyimpangan nilai yang diamati dengan yang diramalkan. Atau meminimumkan :

n

SSE = L (y, - ~, )2

i=l

Istilah SSE menyatakan jumlah kuadrat penyimpangan, yang biasa disebut jumlah kuadrat kesalahan (sum of squares for error). Kalau disubstitusikan rumus persamaan garis regresi dalam rumus SSE. maka :

n

SSE = L l v. - (a + bx) F i=l

47

Rumus Kuadrat Terkecil untuk a dan b

SS

b = _ ___:_XY_

SS

x

dan

a = y - bx

dimana:

n n '

SS = I (x - x)" = I x2 - ----

x i= 1 I i= 1 I

n

(I i=1

n

n

SS = I (x - x)(y - y)

xv i=l I I

n = I xy - --------

i=1 I I

n n

( I X, )<.I y)

i=1 1=1

n

Contoh 2.1 :

Tabel 2.1. Pengeluaran iklan dan volwne penjualan untuk suatu pcrusahaan sclama I (l bulan yang dipilih secara random

Pengeluaran untuk iklan Volume pengeluaran
Bulan x (x Rp 10.000.(00) y (x Rp 10.000.000)
1 1,2 101
2 0,8 92
3 LO 110
4 1,3 120
5 0,7 90
6 O,R R2
7 1.0 93
8 0,6 75
9 0,9 91
10 U 105 Buatlah persamaan garis regresi dari data di atas.

48

Tabel 2.2. Perhitungan dari data Tabel 2.1.
YI XI X2 X.YI y2
I
101 1.2 1,44 121,1 10,201
92 0,8 0,64 73,6 8,464
110 1,0 1,00 110,0 12,100
120 1,3 1,69 156,0 14,400
90 0,7 0,49 63,0 8,100
82 0,8 0.64 65,6 6,724
93 1,0 1,00 93,0 8,649
75 0,6 0,36 45,0 5,625
91 0,9 0,81 881,9 8,281
102 1,1 1,21 115.5 11,025
Jumlah 959 9,4 9.28 924,8 93.569
Rata-Rata 95,9 0.94 0.928 92,48 9,3569
n
(L XI )2 (9,4)2
n i=l
SS = L xc_ = 9.28- = 0.44
x i=1 ' n 10 Penyelesaian :

Langkah pertama adalah membuat tabel data perhitungan yang dibutuhkan untuk mencari nilai-nilai a dan b. seperti pada tabel di bawah ini.

n n
(L x) ( L y)
n i=l I i=1 (9,4)(959)
SS = L xy- = 924,8- = 23,34
XY • 1 I I n 10
- 1=
n n
~1 YI L
- 959 i=l 9.4
y= = = 95.9 X= = = 0.94
n 10 n 10 Jadi :

SS b = __ X-,-Y - = --- = 52.5676 = 52.57

23.34

SS 0.444

x

49

a = y - bi = 95,9 - (52,5676)(0,94) = 46,49

dan :

maka persamaan regresi adalah :

y = a + bx atau ~ = 46,49 + 52,57x

Misalkan perusahaan menganggarkan Rp 10.000.000 untuk pengeluaran iklan pada satu bulan, maka volume penjualan yang diramalkan adalah :

A

Y = a + bx = 46,49 + (52,57)(1,0) = 99,06

atau kalau dalam rupiah, volume penjualan = Rp 990.600.000.

2.3. STANDARD ERROR OF ESTIMATE

Kalau sampel memiliki jumlah n yang cukup besar, pengukuran dispersi titik -titik koordinat dari garis duga regresinya dapat dieari dari :

SSE

S2 = ; dimana (n-2) adalah derajat kebebasan (degrees offreedom)

11-2

Rumus Menghitung SSE

SSE = SS - bSS

y xy

dimana:

n

(I y,)2

n n ~l

SS = I (y - y)2 = L y2 - ----

y i=l 1 i=l 1 n

n SS = I x.y - -------

xy i=l"

n n

(I x)(I

i=l i=l

n

Contoh 2.2.:

Untuk data pada Tabel 2.1. hitung dan taksirlah standard error populasinya.

50

Penyelesaian :

Dalam contoh 2.1, telah kita peroleh nilai SSxy = 23,34 dan nilai koefisien regresi (b) = 52,57. Sekarang kita hitung dulu nilai SS dan SSE seperti rumus di atas.

y

(959)2

SS = 93,569 - = 1.600,9

y 10

SSE = SS - bSS

y xy

= 1.600.9 - (52,5676)(23,34) = 373,97

maka :

373,97

S2 = --- = = 46,76

n-2 8

SSE

s = V46.76 = 6.84

s' dan s. merupakan taksiran untuk a2 dan a.

2.4. INFERENSI MENGENAI KEMIRINGAN (B) DARI SUATU GARIS

Inferensi awal yang dikehendai dalam mempelajari hubungan antara y dn x adalah mengenai adanya eksistensi hubungan kedua variabel. Yaitu, apakah data itu menyajikan bukti yang cukup untuk menunjukkan bahwa x menyumbangkan (memberikan) informasi untuk peramalan y dalam lingkup pengamatan? atau cukup besarkah kemungkinan bahwa kalau y dan x sama sekali tidak mempunyai hubungan.

Diasumsikan berkenaan dengan distribusi kemungkinan (probabilistik) y untuk suatu nilai x tertentu. dapat ditunjukkan bahwa baik a maupun b keduanya disdistribusikan secara normal dalam pengambilan sampel secara berulang dan bahwa nilai yang diharapkan (nilai rerata) dan varian dari b adalah :

E (b) = B

dan

S2 = _

b

SSx

Karena nilai a2 yang sebenamya tidak diketahui, dapat diganti dengan varians yang diperkirakan untuk nilai b. yaitu S2.

s

S2 = _

b

s = -..,.--

..JSSx

dan

SS

x

Dengan mensubstitusikan (mengganti) s untuk a dalam statistik normal, maka pendugaan dan pengujian hipotesis dapat menggunakan distribusi ttest.

51

Hipotesis Nol Hipotesis Altematif

H : B = 0

o

Pengujian Hipotesis Mengenai Kemiringan suatu Garis

ditentukan oleh peneliti, tcrgantung pada nilai b yang diinginkan untuk dideteksi

Statistik Tes (Uji)

b-B

t = 0 dengan db = n - 2

Sb

Interval nilai B :

prb - t(a/Z.n-2) • Sb < B < b + tCa/Z;n-Z) • Sb )

Bila t, atau t ~ t b I --> koefisien regresi nyata.

est "himng 13 e

Contoh 2.3. :

Dengan menggunakan data pada Tabel 2.1.. buatlah uji hipotesis untuk menunjukkan bahwa b tidak sama dengan nol dengan ex = 0.05.

Penyelesaian :

Pertama-tama kita tentukan bentuk uji hipotesisnya. Karena disini kita diarahkan ke dalam suatu bentuk statement tertentu, digunakan uji hipotesis altematif dua arah (B * 0). Kalau uji hipotesis satu arah, pengujian diarahkan untuk membuktikan (B > 0) atau (B < 0).

Hipotesis nol Hipotesis alt.

t'abel = tCa/2.n-Z)

H : B = 0

o

H:B*O

I

= 2.306

s 6.84

s - - = 1O.26jo

b - ~ - '\)0.444

b-B b-O

t,es[ = --- = ---

Sb s,

52.57

= = 5.12

10,265

52

Karena tlesl > ttahel maka kita tolak hipotesis nol : B = 0 dan menyimpulkan bahwa ada bukti yang menunjukkan bahwa pengeluaran biaya iklan memberikan infonnasi untuk digunakan dalam peramalan volume penjualan bruto bulanan (hipotesis alt diterima : B ± 0).

Contoh 2.4. :

Hitunglah interval nilai B dengan selang keyakinan 95 % dengan menggunakan data pada Tabel 2.1.

Penyelesaian :

b - t(aJ2;n-2) .Sb < B < u + t(aJ2;n-2) .Sb

52.57 - 2.309 . < B < 52.57 + 2,309 . 28.90 < B < 76,24

Dengan kata lain, kenaikan volume penjualan bulanan untuk kenaikan setiap unit (Rp 10.000.(00) pengeluaran iklan berada dalam selang dari 28,90 sampai 76,24, atau dalam unit yang asli untuk y. dari Rp 289.000.000 sampai Rp 762.400.000.

53

*r>O

derajat hubungan antara dua variabel menunjukkan hal yang berlawangan (koefisien korelasi negatit). Pada grafik, garis regresinya miring ke atas kanan.

derajat hubungan antara dua variabelmenunjukkan hal yang sejajar atau paralel (koefisien korelasi positip). Pada grafik, garis regresinya miring ke bawah kanan.

tidak ada hubungan sanla sekali antara dua variabel. Pada grafik, tidak ada korelasi linear.

2.5. KORELASI DAN KOEFISIEN KORELASI

Koefisien korelasi adalah suatu angka yang menunjukkan tinggi rendalmya derajat hubungan antara dua variabel atau lebih. Koefisien korelasi besarnya sudah tertentu, yaitu variasi antara 1 dan + 1.

Not e : * r < 0

*1"=0

Rumus Koefisien Korelasi

ss

xy

,. =

Contoh 2.5. :

Hitunglah koefisien korelasi untuk data pengeluaran iklan dan volume penjualan pada Tabel2.l.

Penyelesaian :

Telah kita ketahui bahwa nilai-nilai :

SS = 23,34

xy

SSx = 0.444

SSy = 1.600.9

Maka nilai koefisien korelasi :

23,34

,. = ~r=:======::=::==::,,=

\j 0,444 (1.600,0)

0,88

r =

Ini berarti koefisien korelasinya positip, atau dengan kata lain hubungan antara pengeluaran iklan berjalan paralel dengan volume penjualan. Jadi, semakin tinggi dana yang dikeluarkan untuk iklan, semakin besar pula volume penjualan.

54

n

2.6. GARIS REGRESI X TERHADAP Y

Kita bisa membuat suatu garis linear rata-rata X terhadap Y (J..lx/y) dengan membuat suatu garis penduga (garis regresi) rata-rata x terhadap y :

~ = a' + b'y

dimana:

dan

(I x - b'I y)

a'=-----

Maka hubungan antara koefisien regresi dan koefisien korelasi :

,.2 = b.b'

55

1. Apa yang dimaksud dengan analisis regresi sederhana ?

2. Jelaskan kenapa dan bagaimana kita membuat suatu diagram titik (Scatter diagram) ?

3. Apa kegunaan dari analisis korelasi ?

4. Apa yang dimaksud dengan metode least square ?

5. Diketahui sehimpunan data:

X 13 16 14 11 17 9 13

Y 6.2 8.6 7.2 4.5 9.0 3.5 6.5

17 18 12

9.3 9.5 5.7

LATIHAN SOAL

a. Tentukan persamaan garis regresinya !

b. Dugalah nilai Y untuk X = 10. 15. dan 20.

6. Diketahui sehimpunan data :

/ X 56 48 42 58 40 39 50

Y 45 38.5 34.5 46.1 33.3 32.1 40.4

a. Carilah persamaan garis regresinya !

b. Hitung stand art error dari analisis anda !

c. Carilah interval perkiraan Y dengan (J. = 0.05 untuk X = 44.

7. Jika dari suatu data diketahui nilai SS = 15; SS = 0.4; dan SS = 1500. Carilah nilai

") x )-

koefisien korelasi. Apa yang dapat saudara simpulkan dari hasil perlritungan saudara !

8. Dari sehimpunan data:

X 3 7 4 2

Y 11 18 9 4

o 7

4 6

1 3

2 8

a. Buatlah suatu uji hipotesis untuk menunjukkan bahwa koefisien regresi (b) lebih besar dari nol dengan (J. = 0.05.

b. Apa yang dapat saudara simpulkan dari hasil analisis saudara.

56

a. time series

b. ANOYA

c. regresi

d. korelasi

SOAL-SOAL MULTIPLE CHOICE

1. Analisis untuk melihat keeratan hubungan antar variabel :

2. Prinsip pendugaan persamaan regresi adalah :

a. merninimalkan jW111ah kuadrat error

b. meminimalkan jU1111ah kuadrat variabel

c. meminimalkan kerniringan persamaan regresi

3. Yariabe1 dalam suatu eksperimen yang mudah dikendalikan dikenal sebagai variabe1 :

a. respon c. dependen

b. independen d. a dan b benar

"

4. Jika B = 0, maka garis regresi populasi dimana Y = A + B X akan :

a. membentuk sudut 45° c. sejajar sumbu X

b. sejajar SW11bu Y d. berhimpit SW11bu Y

5. Dari hasi1 analisis variabe1 dim ana X adalah harga barang (dalarn rupiah) dan Y adalah jU1111ah penawaran (unit), dipero1eh ni1ai koefisien korelasi r = 0,893. Hubungan kedua variabe1 dapat disimpulkan sebagai berikut :

a. kenaikan harga barang akan diikuti oleh penurunan penawaran

b. penurunan harga akan diikuti oleh peningkatan penawaran

c. kenaikan harga akan diikuti oleh peningkatan penawaran

d. tidak ada hubungan antara kenaikan harga dengan jW111ah penawaran

"

6. Gunakan soal no. 5. Jika hubungan X dan Y dinyatakan dalam persamaan garis Y = 55

+ l,25X, maka penawaran 180 unit barang dicapai pada harga :

a. Rp. 100 c. Rp 280

b. Rp. 100.000 d. Rp 280.000

7. Nilai mid-test (X) dan ujian akhir (Y) dari 9 mahasiswa ada1ah :

X 77 50 71 72 81 94 99 67

Y 82 66 78 34 47 85 99 68

maka persamaan regresinya adalah :

a. ~ = 21 + 0,87X

b. ~ = 12 + 0,78X

"

c. Y = 2,1 + 0,87X

d. ~ = 1.2 + 0,78X

57

,----------- --_ - __

10. Dua variabel X dan Y diukur pada skala interval. untuk 60 pasang data (x,:y) diperoleh hasil sebagai berikut :

x = 10 Y = 20

SS = 6

x

SS = 144

xy

8. Gunakan soal no. 7. Dugaan nilai akhir bagi mahasiswa yang mendapat nilai mid-test = 85 adalah :

a. 78 c. 68

b. 76 d. 94

9. Bila koefisien korelasi suatu persamaan regresi mendekati nilai +1, maka :

a. garis regresi turun dari kanan ke kiri

b. kedua variabel mempunyai hubungan kausal

c. garis regresi naik dari kiri ke kanan

d. b dan c benar

Kalau nilai Y = 22, maka nilai X yang diramalkan menurut garis regresi X terhadap Y sama dengan :

a. 10,5 c. 82

b. 18,0 d. 28

11. Untuk 25 pasangan data (x,:y) berlaku :

x = 10 Y = 1.5 SSx = 2 SSy = 6

Jadi, untuk data ini koefisien korelasi X terhadap Y adalah :

a. 0,3 c. 0,9

b. 0,1 d. salah semua

b = 0,3

12. Variabel X dan variabel Y kedua-duanya diukur pada skala interval. Untuk 200 pasangan data (x,;Y) berlaku :

y = 30

SS = 10 SS = 5

x y

Kalau X = 15, maka nilai Y yang diramalkan menurut garis regresi Y terhadap X sama dengan :

a. -20

b. -40

c.

25 10

x = 20

d.

(Data di bawah ini digunakan untuk soal no.l i sid no. 17) Diketahui data sebagai berikut :

X 1 234 5

Y 1 123 3

13. Koefisien regresi (b) X dan Y adalah :

a. 0,6 c. 0,1

b. 0,2 d. 0,4

58

14. Koefisien kore1asi (r) data terse but ada1ah :
a. 0,35 c. 0,55
b. 0,95 d. 1
15. Rata-rata X adalah :
a. 3 c. 3,5
b. 5 d. 5,55
16. Rata-rata Y adalah :
a. 0,2 c. 2
b. 1,2 d. ')')
-,-
17. Standar deviasi X ada1ah :
a. 1,76 c. 1,58
b. 1,2 d. 0,98
18. Standard deviasi Y ada1ah :
a. 1,76 c. 1,2
b. 1 d. 0,98 19. Diketahui varians regresi sebesar (s) 93,1864 digunakan untuk menguji apakah ada hubungan linear antara besarnya pendapatan (Y) dengan banyaknya konsumsi yang dike1uarkan (X), Diketahui pu1ajum1ah kuadarat untuk variabe1 X sebesar 10.378.461,18. Maka dapat kita tentukan :

a. Sb = 0,005

b. Sb = 0,67

c. d.

Sb = 0,003 Sb = 0,004

20. Berdasakan soal no. 19, tindak 1anjut dilakukan pengujian hipotesis dengan ex = 5 %, maka bisa disimpulkan :

a. tidak terdapat hubungan linear antara kedua variabe1

b. ada hubungan linear antara kedua variabel

c. Hipotesis no1 Ho : B = ° diterima

d. a dan c benar

59

Anda mungkin juga menyukai