BAB V
ANALISIS REGRESI DAN KORELASI
Sehingga sampel yang berukuran n itu terdiri atas n buah pasang data.
Contoh 5.1 :
Jika xi menyatakan banyak pengunjung ke suatu toko swalayan dan yi diartikan
orang-orang diantara pengunjung itu yang berbelanja di toko tersebut misalnya,
maka akan diteliti kumpulan data seperti dalam daftar berikut :
345 175
419 203
378 196
353 189
435 241
361 197
394 212
436 232
Hal-hal yang akan dipelajari mengenai kumpulan data yang terdiri atas
dua variabel yaitu :
a. Mempelajari derajat asosiasi antara kedua variabel. Bagian ini
dalam statistika dikenal dengan nama ANALISIS KORELASI.
Hubungan korelasional ini tidak menjelaskan apakah suatu variabel
menjadi penyebab dari variabel yang lainnya.
b. Mempelajari hubungan yang ada di antara variabel-variabel
sehingga dari hubungan yang diperoleh dapat menaksir variabel yang
satu apabila harga variabel lainnya diketahui. Bagian ini dikenal dengan
nama ANALISIS REGRESI.
Contoh 5.2 :
a. Dari data yang tertera dalam daftar di atas, dapat dicari
hubungan yang ada antara pengunjung dan yang belanja. Jika pada
suatu hari ada 390 pengunjung, dari hubungan yang diperoleh dapat
diperkirakan ada berapa yang akan belanja di toko itu. Selain daripada
itu, juga dapat ditentukan berapa kuat jumlah pembeli ditentukan oleh
adanya pengunjung
b. Diketahui bahwa produk nasional kotor ditentukan oleh produk-
produk. Lainnya, antara lain jasa, Jika data selama waktu-waktu tertentu
diketahui, hubungan antara produk-produk nasional kotor dan jasa dapat
dihitung. Dari hubungan ini, produk nasional kotor dapat diperkirakan
jika jasa dapat diketahui.
3
. .
. .
. .
. .
Gambar 5.1 : Diagram pencar dari data pada Tabel 6.2
Y a bX ………(5.1)
n n
Yi an b X i
i 1 i 1
n n n
.............. (5.2)
X Y a X
i 1
i i
i 1
i b X i
i 1
2
Pasangan persamaan dengan dua anu a dan b ini, bentuk rumus 6.3, disebut
persamaan-persamaan normal untuk bentuk regresi dalam rumus 6.1. Setelah
diselesaikan, akan didapat harga-harga a ddan b yang dicari, yakni:
n n n n
Yi X i2 X i X iYi
a i 1 i 1 i 1 i 1
2
n
n
n X i2 X i
i 1 i 1
n n n
.............. (5.3)
n X iYi X i Yi
b i 1 i 1 i 1
2
n
n
n X i2 X i
i 1 i 1
X
i 1
i 1086
n
Y 1044
i 1
i
X
i 1
i
2
39700
n
X Y 36.665
i 1
i i
1044.39700 - 1086.36665
a
30.38700 - 1086 2
a 1, 6
30.36665 - 1086.1044
b
30.39700 - 1086 2
b 0,88
Sehingga garis regresi linear yang dimaksud mempunyai persamaan :
Y 1, 6 0,88 X
Dengan menggunakan persamaan yang diperoleh ini dapat diperkirakan berapa
orang diantara pengunjung itu yang akan berbelanja, apabila jumlah pengunjung
dapat diketahui. Apabila rata-rata perjam ada 40 orang yang berkunjung ke
Y = 1,6 + (0,88)(40)
= 36,81 orang yang berbelanja.
1
d. Hiperbola dengan persamaan : Y
a bX
Contoh :
1. Harga beras tidak saja hanya ditentukan oleh adanya persediaan, tetapi juga
oleh harga bensin, upah buruh dan sebagainya.
2. Produksi telur ayam tidak saja bergantung pada banyaknya ayam petelur
yang ada saja, tetapi juga dari banyak makanan yang diberikan, umur
ayam dan barangkali masih ada faktor lainnya.
Y atas X 1 , X 2 ,..., X k yang paling sederhana ialah yang dikenal dengan nama
regresi linear berganda. Persamaan umum untuk regresi linear berganda ini
adalah :
Y a0 a1 X 1 ... ak X k
Y a0 a1 X 1 a2 X 2
Yi na0 a1 X1i a2 X 2i
i 1 i 1 i 1
n n n n
Y X
i 1
i 2i a0 X 2i a1 X 1i X 2i a2 X 22i
i 1 i 1 i 1
hubungan antara variabel-variabel itu. Ukuran yang digunakan untuk itu adalah
koefisien korelasi.
Untuk keperluan analisis tentang korelasi ini, seperti biasa akan
dibedakan antara statistik (ialah koefisien korelasi untuk data dalam sampel) dan
parameter (untuk menyatakan koefisien korelasi populasi. Koefisien korelasi
untuk sampel, jadi merupakan statistik, akan dinyatakan dengan r sedangkan
parameternya dengan (baca : rho).
Dalam bagian berikut ini akan diuraikan bagaimana r dihitung dan
selanjutnya akan diberikan penjelasan mengenai pengujian derajat asosiasi.
a. Koefisien Korelasi
Karena ternyata korelasi dan regresi berhubungan erat, maka
untuk menentukan ukuran asosiasi atau koefisien korelasi, perlu
terpenuhi syarat-syarat :
1) Koefisien korelasi harus besar apabila derajat asosiasi
tinggi dan harus kecil apabila derajat asosiasi rendah.
2) Koefisien korelasi harus bebas daripada satuan yang
digunakan untuk mengukur variabel.
Untuk mencapai kedua syarat di atas, maka untuk menentukan
koefisien korelasi r biasa digunakan statistik :
X
n
i X Yi Y
r i 1
n 1 S x S y
n n n
n X iYi X i Yi
r i 1 i 1 i 1
n 2 n
2
n n
2
n X i X i i i
n Y Y
i 1 i 1 i 1 i 1
r = +1 r = -1
Contoh :
Berikut data gaji tentara (data fiktif, tahun 95) beserta pengeluarannya
untuk keperluan rekreasi bersama keluarga.
0,00-0,99 1 1
1,00-1,99 2 3 1 6
2,00-2,99 1 2 10 2 15
3,00-3,99 5 6 5 1 1 1 19
4,00-4,99 2 4 3 2 1 12
5,00-5,99 1 10 6 2 19
6,00-6,99 2 5 2 2 11
7,00-7,99 1 1 2
Jumlah 4 10 19 14 19 12 7 85
Dari daftar dapat dilihat bahwa ada 4 tentara dengan gaji Rp. 300.000
sampai dengan Rp. 400.000 sebulannya, dengan pengeluaran untuk
wisata masing-masing 1 orang Rp. 0 sampai dengan Rp. 99.000.
Sekarang persoalannya adalah bagaimana menentukan koefisen korelasi
antara keduanya ?
Untuk itu dipergunakan rumus berikut :
n f uv f x u f y v
r
2
2
n f x u 2 f xu n f uv 2 - f uv
dimana :
u = koding untuk variabel X
v = koding untuk variabel Y
fx = frekuensi kelas interval dari variabel X
fy = frekuensi kelas interval dari variabel Y
f = frekuensi dalam tiap sel
n = banyak data.
Sekarang dipergunakan peerumusan di atas.
Gaji tentara
x 34,5 44,5 54,5 64,5 74,5 84,5 94,5
Y u -3 -2 -1 0 1 2 3 fy fyv fyv2 Fuv
0,495 -3 1 1 -3 9 9
16
1,495 -2 2 3 1 6 -12 24 26
2,495 -1 1 2 10 2 15 -15 15 17
3,495 0 5 6 5 1 1 1 19 0 0 8
4,495 1 2 4 3 2 1 12 12 12 8
5,495 2 1 10 6 2 19 38 76 56
6,495 3 2 5 2 2 11 33 99 45
7,495 4 1 1 2 8 32 20
fx 4 10 19 14 19 12 7 85 61 267 181
fxu -12 -20 -19 0 19 24 24 21
fxu2 36 40 19 0 19 48 63 63
sama
fuv 24 16 10 0 38 48 45 45
r = 0,77
Angka ini menyatakan kuatnya hubungan antara gaji bulanan tentara dan
pengeluaran untuk pariwisata.
c. Korelasi Rank
Ada kalanya ingin diketahui korelasi antara dua variabel tidak
berdasarkan pada pasangan data dimana nilai sebenarnya diketahui.
Umpamanya saja, kita telah melakukan penelitian mengenai tingkatan
17
n
6 di2
r 1 i 1
n n 1
2
Rank A 1 2 3 5 4 6 8 9 7 10
Rank B 2 3 1 4 5 6 9 7 8 10
di -1 -1 2 1 -1 0 -1 2 -1 0 Jml
di2 1 1 4 1 1 0 1 4 1 0 14
6.14
r 1
10(100 1)
r' = 0,015
d. Korelasi Berganda
Korelasi berganda merupakan korelasi dari beberapa variabel
bebas secara serentak dengan variabel terikat
Misalkan ada k variabel bebas, X 1 , X 2 ,..., X k dan satu variabel terikat
dengan
x y X Y n
X1 Y
1 1
x y X Y
X Y k
k k
n
Y
2
y2 Y 2 n
e. Korelasi Parsial
Korelasi parsial adalah korelasi antara sebuah variabel tak bebas
dengan sebuah variabel bebas tertentu dengan variabel-variabel bebas
lain dianggap tetap / konstan.
Koefisien korelasi parsial dinyatakan dengan perumusan :
Untuk dua variabel bebas :
19
5.6 SOAL-SOAL
Y = 185 + 1,46 X
21
2) Negatif
m. Hasil penelitian sesuatu hal menghasilkan r = 0. Apakah ini
berarti bahwa antara variabel-variabel yang diteliti itu tidak terdapat
hubungan ?
n. Tafsiran apakah yang dapat diperoleh jika dikatakan bahwa
koefisien korelasi antara banyak kecelakaan di pabrik tiap tahun dan
umur pegawai di pabrik itu sebesar r = -0,65
o. Untuk soal h di atas, carilah korelasi antara NEM matematika
SMU dengan nilai ujian statistika.
p. Dua orang ahli disuruh mencoba kecap yang dihasilkan oleh 12
perusahaan kecap. Untuk kecap yang paling enak, oleh setiap ahli diberi
nomor satu, yang kurang enak diberi nomor dua dan seterusnya.
Hasilnya diberikan dalam daftar berikut :
Ahli A 10 3 5 4 1 8 7 6 2 9 11 12
Ahli B 8 6 1 12 3 11 2 5 7 4 10 9